KR20200098578A - Cas9 변이체 및 사용 방법 - Google Patents
Cas9 변이체 및 사용 방법 Download PDFInfo
- Publication number
- KR20200098578A KR20200098578A KR1020207019496A KR20207019496A KR20200098578A KR 20200098578 A KR20200098578 A KR 20200098578A KR 1020207019496 A KR1020207019496 A KR 1020207019496A KR 20207019496 A KR20207019496 A KR 20207019496A KR 20200098578 A KR20200098578 A KR 20200098578A
- Authority
- KR
- South Korea
- Prior art keywords
- cas9
- sequence
- bacillus
- variant
- seq
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/101—Plasmid DNA for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Abstract
변이체 Cas 시스템 및 이러한 시스템을 포함하는 요소, 예를 들어 비제한적인 예로서 Cas 엔도뉴클레아제 변이체, Cas 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체, 및 Cas 엔도뉴클레아제 변이체와 상호작용할 수 있는 가이드 폴리뉴클레오타이드 및 가이드 RNA 요소를 위한 조성물 및 방법이 제공된다. 세포의 게놈에서 표적 서열의 게놈 변형을 위한 조성물 및 방법이 제공된다. 상기 방법 및 조성물은 세포 또는 유기체의 게놈 내에 표적 서열을 변형시키거나 변경하기 위한 효과적인 시스템을 제공하기 위해 Cas9 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템을 사용한다.
Description
본 출원은 그 전체가 참조로 본원에 포함된, 2017년 12월 15일 출원된 미국 가출원 제62/599,176호의 이익을 주장한다.
기술분야
본 발명은 분자 생물학의 분야에 관한 것이고, 특히 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템의 조성물, 및 세포의 게놈을 변형시키기 위한 조성물 및 이의 방법에 관한 것이다.
전자로 제출된 서열 목록의 참조
본 서열 목록의 공식 사본은 2018년 11월 29일 작성되고 크기가 476 킬로바이트이며 본 명세서와 동시에 제출된 파일명 20181129_NB41317PCT_ST25.txt의 ASCII 형식의 서열 목록으로서 EFS-웹을 통해 전자로 제출되었다. 이러한 ASCII 형식의 서류에 포함된 서열 목록은 본 명세서의 일부이며, 그 전체가 참조로 본원에 포함된다.
재조합 DNA 기술은 표적화된 게놈 위치에서 DNA 서열을 삽입하고/하거나 특정한 내인성 염색체 서열을 변형할 수 있도록 하였다. 부위 특이적 재조합 시스템을 사용한 부위 특이적 통합 기술뿐만 아니라 다른 유형의 재조합 기술이 다양한 유기체에서 관심 유전자의 표적화된 삽입을 생성하기 위해 사용되어 왔다. Cas 시스템의 부위 특이적 성질을 고려할 때, 포유류 세포에서를 포함하여 이 시스템에 기초한 게놈 변형/조작 기법이 기재되어 있다(예를 들어, Hsu et al., 2014 참조). Cas-기반 게놈 조작은, 의도된 대로 작용할 때, crRNA의 DNA-표적화 영역(즉, 가변 표적화 도메인)이 게놈에서 원하는 표적 부위와 상동성인 재조합 crRNA(또는 균등하게 기능적인 가이드 폴리뉴클레오타이드)를 설계하고, 숙주 세포에서 crRNA를 (임의의 편리하고 통상적인 수단을 통해) Cas 엔도뉴클레아제와 기능적 복합체로 조합함으로써, 복잡한 게놈 내에 사실상 임의의 특정 위치를 표적화하는 능력을 부여한다.
Cas-기반 게놈 조작 기법이 다수의 상이한 숙주 세포 유형에 적용되지만, 이 기법은 알려진 제한을 갖는다. 예를 들어, 비제한적인 예로서 바실러스 종과 같은 소정의 숙주 세포를 형질전환하는 것의 효율은 여전히 낮고 비싸다.
따라서, 원핵생물 또는 진핵생물 세포에서 게놈 표적 부위를 변형/변경하기 위한 더 효과적인, 효율적인 또는 달리 더 튼튼한 또는 가요성인 Cas-기반 게놈 변형 방법 및 조성물을 개발할 필요성이 남아 있다.
비제한적인 예로서 Cas 엔도뉴클레아제 변이체, 가이드 폴리뉴클레오타이드, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체, 가이드 RNA/Cas 엔도뉴클레아제 시스템, 특히 HNH 및 RuvC 도메인 밖에 위치한 적어도 하나의 아미노산 변형을 포함하는 Cas9 엔도뉴클레아제 변이체를 포함하는, 변이체 Cas 시스템 및 이러한 시스템을 포함하는 요소에 대한 조성물 및 방법이 제공되고, 선택적으로 Cas9 엔도뉴클레아제 변이체는 적어도 하나의 아미노산 변형을 갖지 않는 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성을 갖는다.
Cas9 엔도뉴클레아제 변이체, 가이드 폴리뉴클레오타이드 및 적어도 하나의 Cas9 엔도뉴클레아제 변이체 및 적어도 하나의 가이드 RNA를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템의 직접적인 전달을 위한 것뿐만 아니라, 원핵생물 또는 진핵생물 세포의 게놈에서의 표적 서열의 게놈 변형을 위한, 유전자 편집을 위한 그리고 유기체의 게놈으로 또는 게놈으로부터 관심 폴리뉴클레오타이드를 삽입하거나 결실시키기 위한 조성물 및 방법이 또한 제공된다.
본 발명의 일 구현예에서, Cas9 엔도뉴클레아제 변이체는 서열 번호 2에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편이고, 변이체의 아미노산 위치는 상기 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다. 상기 Cas9 엔도뉴클레아제 변이체는 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택된 적어도 하나의 아미노산 치환을 가질 수 있다. Cas9 엔도뉴클레아제 변이체는 이의 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 가질 수 있다. Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 가질 수 있다.
본 발명의 일 구현예에서, Cas9 엔도뉴클레아제 변이체는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편이고, 상기 변이체는 서열 번호 2의 아미노산 서열과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
본 발명의 일 구현예에서, Cas9 엔도뉴클레아제 변이체는 Cas9 엔도뉴클레아제 변이체이고, 개선된 특성은 개선된 형질전환 효율이고, 상기 변이체, 또는 이의 활성 단편은 또한 개선된 편집 효율을 갖는다.
본 발명의 일 구현예에서, 상기 조성물은 본원에 개시된 Cas9 엔도뉴클레아제 변이체, 또는 이의 기능적 단편을 포함하는 조성물이다. 상기 조성물은 가이드 폴리뉴클레오타이드/Cas9 엔도뉴클레아제 복합체, 가이드 RNA/Cas9 엔도뉴클레아제 복합체 및 상기 Cas9 엔도뉴클레아제 변이체를 포함하는 융합 단백질로 이루어진 군으로부터 선택될 수 있다.
본 발명의 일 구현예에서, 폴리뉴클레오타이드는 본원에 개시된 임의의 하나의 Cas9 엔도뉴클레아제 변이체를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드이다.
본 발명의 일 구현예에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN)는 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 PGEN이고, 여기서 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹(nicking)하거나 풀거나(unwinding) 절단할 수 있다.
본 발명의 일 구현예에서, 상기 방법은 세포의 게놈에서 표적 부위를 변형시키는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 적어도 하나의 PGEN을 도입하는 단계 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계를 포함하고, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택된다.
본 발명의 일 구현예에서, 상기 방법은 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법을 포함하고, 상기 방법은 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 적어도 하나의 PGEN 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계를 포함하고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함한다.
본 발명의 일 구현예에서, 상기 방법은 세포의 게놈에서 표적 부위를 변형시키는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 적어도 하나의 PGEN 및 적어도 하나의 공여 DNA를 도입하는 단계를 포함하고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함한다.
본 발명의 일 구현예에서, 상기 방법은 Cas9 엔도뉴클레아제 변이체의 적어도 하나의 특성을 개선하는 방법을 포함하고, 상기 방법은 모 Cas9 엔도뉴클레아제에서 적어도 하나의 아미노산 변형을 도입하여 상기 Cas9 엔도뉴클레아제 변이체를 생성하는 단계를 포함하고, 상기 적어도 하나의 아미노산 변형은 모 Cas9 엔도뉴클레아제의 RuvC 및 HNH 도메인 밖에 위치하고, 상기 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 특성의 개선을 보여준다. 적어도 하나의 아미노산 변형은 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 위치에서 아미노산 치환일 수 있고, 변이체의 아미노산 위치는 상기 모 Cas9 엔도뉴클레아제의 아미노산 서열과의 관련성에 의해 넘버링된다. 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택될 수 있다.
본원에 기재된 방법에 의해 생산된 원핵생물 및 진핵생물 세포의 게놈에서 변형된 표적 서열을 갖거나 뉴클레오타이드 서열에서의 변형을 갖는 발현 카세트, 재조합 DNA, 핵산 작제물, 원핵생물 및 진핵생물 세포가 또한 제공된다. 본 발명의 방법 및 조성물의 추가 구현예가 본원에 기재된다.
도면의 간단한 설명 및 서열 목록
본 발명은 본 출원의 일부를 형성하는 다음의 상세한 설명 및 첨부 도면 그리고 서열 목록으로부터 더욱 완전하게 이해될 수 있다. 본원에 첨부된 서열 설명 및 서열 목록은 37 C.F.R. §§ 1.821 내지 1.825에 명시된 바와 같이 특허 출원에서 뉴클레오타이드 및 아미노산 서열 공개를 규제하는 규칙을 따른다. 서열 설명은 참조로 본원에 포함된 37 C.F.R. §§ 1.821 내지 1.825에 정의된 바와 같은 아미노산에 대한 3 철자 코드를 함유한다.
도면
도 1은 Cas9 폴리펩타이드 및 이의 Cas9 단백질 도메인의 개략적 표시를 도시한다. RuvC 뉴클레아제 도메인은 검정 채움으로 도시되고, 십자 방격은 브리지 나선을 나타내고, 사선 점선 채움은 REC I 도메인을 나타내고, 중간 회색 채움은 REC II 도메인을 나타내고, 밝은 회색 채움은 HNH 뉴클레아제 도메인을 나타내고, 볼 채움은 PAM 인식 도메인을 나타낸다. (Jinek M., Jiang F.,Taylor D.W. et al. 2014, Science 343, 1247997로부터 조정됨). 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 Y155 변형은 REC1 도메인에 위치한다.
도 2는 Cas9 엔도뉴클레아제의 1차 아미노산 구조로 맵핑된 도메인 구조를 도시한다. 본원에 기재된 (REC1 도메인에서) Cas9 Y155 엔도뉴클레아제 변이체의 Y155 변형의 위치가 화살표로 표시된다.
도 3은 Cas9 엔도뉴클레아제의 1차 아미노산 구조로 맵핑된 도메인 구조를 도시한다. 본원에 기재된 Cas9 엔도뉴클레아제 F86-F98 변이체의 F86 및 F98 변형의 위치가 화살표로 표시된다.
하기 서열은 37 C.F.R. §§ 1.821 내지 1.825("뉴클레오타이드 서열 및/또는 아미노산 서열 공개를 포함하는 특허 출원의 요건 - 서열 규칙[Requirements for Patent Applications Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures - the Sequence Rules]")를 따르며, 세계 지적 재산권 기구(WIPO: World Intellectual Property Organization) 표준 ST.25 (2009) 및 유럽 특허 조약(EPC: European Patent Convention) 및 특허 협력 조약(PCT: Patent Cooperation Treaty) 규칙 5.2 및 49.5(a-bis), 및 시행 세칙의 제208조 및 부칙 C의 서열 목록 요건과 일치한다. 뉴클레오타이드 및 아미노산 서열 데이터에 사용되는 부호 및 포맷은 37 C.F.R. § 1.822에 기재된 개시된 규칙을 따른다.
서열 번호 1은 스트렙토코커스 피오제네스(Streptococcus pyogenes) Cas9의 아미노산 서열을 기재한다.
서열 번호 2는 스트렙토코커스 피오제네스 Cas9의 야생형 Cas9 단백질을 암호화하는 바실러스 코돈 최적화된 Cas9 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 3은 N-말단 NLS의 아미노산 서열을 기재한다.
서열 번호 4는 C-말단 NLS의 아미노산 서열을 기재한다.
서열 번호 5는 데카-히스티딘 태그의 아미노산 서열을 기재한다.
서열 번호 6은 6 aprE 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 7은 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 8-9, 12-13, 38-39, 41-42, 50-51, 54-55, 59-60, 67-68, 71-72, 79-80, 88-89, 91-92, 111-112, 119-120, 138-139, 145-146, 151-152, 156-157은 프라이머의 뉴클레오타이드 서열을 기재한다.
서열 번호 10은 pKB320 골격의 뉴클레오타이드 서열을 기재한다.
서열 번호 11은 pKB320의 뉴클레오타이드 서열을 기재한다.
서열 번호 14는 플라스미드 RSP1의 뉴클레오타이드 서열을 기재한다.
서열 번호 15는 플라스미드 RSP2의 뉴클레오타이드 서열을 기재한다.
서열 번호 16 내지 27은 각각 플라스미드 FSP1, FSP2, FSP3, FSP4, FSP5, FSP6, FSP7, RSP3, FSP8, pRF694, pRF801 및 pRF806의 뉴클레오타이드 서열을 기재한다.
서열 번호 28은 바실러스 리케니포르미스(Bacillus licheniformis)의 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 29는 바실러스 리케니포르미스의 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 30은 serA1 오픈 리딩 프레임의 뉴클레오타이드 서열을 기재한다.
서열 번호 31은 바실러스 리케니포르미스의 표적 부위 1 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 32는 가변 표적화 도메인 1을 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 33은 CER 도메인을 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 34는 표적 부위 1을 표적화하는 gRNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 35는 spac 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 36은 t0 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 37은 바실러스 리케니포르미스의 serA1 상동성 아암 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 40은 바실러스 리케니포르미스의 serA1 상동성 아암 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 43은 ts1 gRNA 발현 카세트를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 44는 serA1 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 45는 바실러스 리케니포르미스의 rghR1 오픈 리딩 프레임의 뉴클레오타이드 서열을 기재한다.
서열 번호 46은 바실러스 리케니포르미스의 표적 부위 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 47은 바실러스 리케니포르미스의 표적 부위 2 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 48은 가변 표적화 도메인 2를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 49는 표적 부위 2를 표적화하는 가이드 RNA(gRNA)의 뉴클레오타이드 서열을 기재한다.
서열 번호 50은 바실러스 리케니포르미스로부터의 rghR1의 상동성 아암 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 53은 바실러스 리케니포르미스로부터의 rghR1의 상동성 아암 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 56은 ts2 발현 카세트를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 57은 rghR1 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 58은 Cas9 Y155H 변이체의 아미노산 서열을 기재한다.
서열 번호 61은 pRF827의 뉴클레오타이드 서열을 기재한다.
서열 번호 62는 Cas9 Y155H 변이체 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 63은 pRF856의 뉴클레오타이드 서열을 기재한다.
서열 번호 64는 pBL.comK-syn의 뉴클레오타이드 서열을 기재한다.
서열 번호 65는 바실러스 리케니포르미스로부터의 표적 부위 1 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 66은 표적 부위 1 편집된 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 69는 바실러스 리케니포르미스로부터의 표적 부위 2 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 70은 표적 부위 2 편집된 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 73은 야로위아 코돈 최적화된 Cas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 74는 SV40 NLS의 뉴클레오타이드 서열을 기재한다.
서열 번호 75는 야로위아 FBA1 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 76은 야로위아 Cas9 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 77은 pZufCas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 78은 Cas9-SV40 융합의 뉴클레오타이드 서열을 기재한다.
서열 번호 81은 Cas9-SV40 PCR 산물의 뉴클레오타이드 서열을 기재한다.
서열 번호 82-83은 각각 pBAD/HisB 및 pRF48의 뉴클레오타이드 서열을 기재한다.
서열 번호 84는 E. 콜라이 최적화된 Cas9 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 85-86은 각각 pKO3 및 pRF97의 뉴클레오타이드 서열을 기재한다.
서열 번호 87은 Cas9 Y155H 암호화 합성 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 90은 pRF97-Y155H 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 93은 pRF861의 뉴클레오타이드 서열을 기재한다.
서열 번호 94는 E. 콜라이로부터의 nac 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 95는 nac 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 96은 nac 표적 부위 1+ PAM E. 콜라이의 뉴클레오타이드 서열을 기재한다.
서열 번호 97은 nac 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 98은 nac 표적 부위 1 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 99는 N25 파지 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 100은 nac 표적 부위 1 gRNA 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 101은 nac 표적 부위 2 gRNA 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 102는 nac 상류 결실 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 103은 nac 하류 결실 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 104는 nac 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 105는 5' pRF97 또는 pRF861 동일성의 뉴클레오타이드 서열을 기재한다.
서열 번호 106은 3' pRF97 또는 pRF861 동일성의 뉴클레오타이드 서열을 기재한다.
서열 번호 107은 nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 108은 nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 109는 pRF97-카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 110은 pRF861-카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 113은 pRF97-nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 114는 pRF97-nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 115는 pRF861-nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 116은 pRF861-nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 117은 이. 콜라이로부터의 야생형(WT) nac 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 118은 편집된 nac 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 121은 스트렙토코커스 피오제네스 Cas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 122는 Cas9 Y155H 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 123은 Cas9 Y155N 변이체의 아미노산 서열을 기재한다.
서열 번호 124는 Cas9 Y155N 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 125는 Cas9 Y155E 변이체의 아미노산 서열을 기재한다.
서열 번호 126은 Cas9 Y155E 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 127은 Cas9 Y155F 변이체의 아미노산 서열을 기재한다.
서열 번호 128은 Cas9 Y155F 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 129는 Cas9 F86A-F98A 변이체의 아미노산 서열을 기재한다.
서열 번호 130은 F86A-F98A 합성 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 131은 F86A F98A에 대한 pRF801 골격의 뉴클레오타이드 서열을 기재한다.
서열 번호 132는 pRF801 골격 정방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 133은 pRF801 골격 역방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 134는 F86A-F98A 합성 정방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 135는 F86A-F98A 합성 역방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 136은 바실러스 F86A F98A 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 137은 pRF866의 뉴클레오타이드 서열을 기재한다.
서열 번호 140은 RNR2p 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 141은 2-미크론 복제 기원 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 142는 KanMX 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 143은 SNR52p 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 144는 pSE087 플라스미드의 뉴클레오타이드 서열을 기재한다.
서열 번호 147은 표적화 sgRNA + T(6) 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 148은 50 bp 상류 상동성 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 149는 URA3 표적화 sgRNA + T(6) 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 150은 50 bp 하류 상동성 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 153은 2-미크론 복제 기원 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 154는 154 암피실린 내성 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 155는 RNR2 종결자의 뉴클레오타이드 서열을 기재한다.
본 발명은 본 출원의 일부를 형성하는 다음의 상세한 설명 및 첨부 도면 그리고 서열 목록으로부터 더욱 완전하게 이해될 수 있다. 본원에 첨부된 서열 설명 및 서열 목록은 37 C.F.R. §§ 1.821 내지 1.825에 명시된 바와 같이 특허 출원에서 뉴클레오타이드 및 아미노산 서열 공개를 규제하는 규칙을 따른다. 서열 설명은 참조로 본원에 포함된 37 C.F.R. §§ 1.821 내지 1.825에 정의된 바와 같은 아미노산에 대한 3 철자 코드를 함유한다.
도면
도 1은 Cas9 폴리펩타이드 및 이의 Cas9 단백질 도메인의 개략적 표시를 도시한다. RuvC 뉴클레아제 도메인은 검정 채움으로 도시되고, 십자 방격은 브리지 나선을 나타내고, 사선 점선 채움은 REC I 도메인을 나타내고, 중간 회색 채움은 REC II 도메인을 나타내고, 밝은 회색 채움은 HNH 뉴클레아제 도메인을 나타내고, 볼 채움은 PAM 인식 도메인을 나타낸다. (Jinek M., Jiang F.,Taylor D.W. et al. 2014, Science 343, 1247997로부터 조정됨). 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 Y155 변형은 REC1 도메인에 위치한다.
도 2는 Cas9 엔도뉴클레아제의 1차 아미노산 구조로 맵핑된 도메인 구조를 도시한다. 본원에 기재된 (REC1 도메인에서) Cas9 Y155 엔도뉴클레아제 변이체의 Y155 변형의 위치가 화살표로 표시된다.
도 3은 Cas9 엔도뉴클레아제의 1차 아미노산 구조로 맵핑된 도메인 구조를 도시한다. 본원에 기재된 Cas9 엔도뉴클레아제 F86-F98 변이체의 F86 및 F98 변형의 위치가 화살표로 표시된다.
하기 서열은 37 C.F.R. §§ 1.821 내지 1.825("뉴클레오타이드 서열 및/또는 아미노산 서열 공개를 포함하는 특허 출원의 요건 - 서열 규칙[Requirements for Patent Applications Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures - the Sequence Rules]")를 따르며, 세계 지적 재산권 기구(WIPO: World Intellectual Property Organization) 표준 ST.25 (2009) 및 유럽 특허 조약(EPC: European Patent Convention) 및 특허 협력 조약(PCT: Patent Cooperation Treaty) 규칙 5.2 및 49.5(a-bis), 및 시행 세칙의 제208조 및 부칙 C의 서열 목록 요건과 일치한다. 뉴클레오타이드 및 아미노산 서열 데이터에 사용되는 부호 및 포맷은 37 C.F.R. § 1.822에 기재된 개시된 규칙을 따른다.
서열 번호 1은 스트렙토코커스 피오제네스(Streptococcus pyogenes) Cas9의 아미노산 서열을 기재한다.
서열 번호 2는 스트렙토코커스 피오제네스 Cas9의 야생형 Cas9 단백질을 암호화하는 바실러스 코돈 최적화된 Cas9 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 3은 N-말단 NLS의 아미노산 서열을 기재한다.
서열 번호 4는 C-말단 NLS의 아미노산 서열을 기재한다.
서열 번호 5는 데카-히스티딘 태그의 아미노산 서열을 기재한다.
서열 번호 6은 6 aprE 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 7은 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 8-9, 12-13, 38-39, 41-42, 50-51, 54-55, 59-60, 67-68, 71-72, 79-80, 88-89, 91-92, 111-112, 119-120, 138-139, 145-146, 151-152, 156-157은 프라이머의 뉴클레오타이드 서열을 기재한다.
서열 번호 10은 pKB320 골격의 뉴클레오타이드 서열을 기재한다.
서열 번호 11은 pKB320의 뉴클레오타이드 서열을 기재한다.
서열 번호 14는 플라스미드 RSP1의 뉴클레오타이드 서열을 기재한다.
서열 번호 15는 플라스미드 RSP2의 뉴클레오타이드 서열을 기재한다.
서열 번호 16 내지 27은 각각 플라스미드 FSP1, FSP2, FSP3, FSP4, FSP5, FSP6, FSP7, RSP3, FSP8, pRF694, pRF801 및 pRF806의 뉴클레오타이드 서열을 기재한다.
서열 번호 28은 바실러스 리케니포르미스(Bacillus licheniformis)의 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 29는 바실러스 리케니포르미스의 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 30은 serA1 오픈 리딩 프레임의 뉴클레오타이드 서열을 기재한다.
서열 번호 31은 바실러스 리케니포르미스의 표적 부위 1 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 32는 가변 표적화 도메인 1을 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 33은 CER 도메인을 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 34는 표적 부위 1을 표적화하는 gRNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 35는 spac 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 36은 t0 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 37은 바실러스 리케니포르미스의 serA1 상동성 아암 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 40은 바실러스 리케니포르미스의 serA1 상동성 아암 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 43은 ts1 gRNA 발현 카세트를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 44는 serA1 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 45는 바실러스 리케니포르미스의 rghR1 오픈 리딩 프레임의 뉴클레오타이드 서열을 기재한다.
서열 번호 46은 바실러스 리케니포르미스의 표적 부위 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 47은 바실러스 리케니포르미스의 표적 부위 2 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 48은 가변 표적화 도메인 2를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 49는 표적 부위 2를 표적화하는 가이드 RNA(gRNA)의 뉴클레오타이드 서열을 기재한다.
서열 번호 50은 바실러스 리케니포르미스로부터의 rghR1의 상동성 아암 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 53은 바실러스 리케니포르미스로부터의 rghR1의 상동성 아암 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 56은 ts2 발현 카세트를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 57은 rghR1 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 58은 Cas9 Y155H 변이체의 아미노산 서열을 기재한다.
서열 번호 61은 pRF827의 뉴클레오타이드 서열을 기재한다.
서열 번호 62는 Cas9 Y155H 변이체 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 63은 pRF856의 뉴클레오타이드 서열을 기재한다.
서열 번호 64는 pBL.comK-syn의 뉴클레오타이드 서열을 기재한다.
서열 번호 65는 바실러스 리케니포르미스로부터의 표적 부위 1 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 66은 표적 부위 1 편집된 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 69는 바실러스 리케니포르미스로부터의 표적 부위 2 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 70은 표적 부위 2 편집된 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 73은 야로위아 코돈 최적화된 Cas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 74는 SV40 NLS의 뉴클레오타이드 서열을 기재한다.
서열 번호 75는 야로위아 FBA1 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 76은 야로위아 Cas9 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 77은 pZufCas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 78은 Cas9-SV40 융합의 뉴클레오타이드 서열을 기재한다.
서열 번호 81은 Cas9-SV40 PCR 산물의 뉴클레오타이드 서열을 기재한다.
서열 번호 82-83은 각각 pBAD/HisB 및 pRF48의 뉴클레오타이드 서열을 기재한다.
서열 번호 84는 E. 콜라이 최적화된 Cas9 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 85-86은 각각 pKO3 및 pRF97의 뉴클레오타이드 서열을 기재한다.
서열 번호 87은 Cas9 Y155H 암호화 합성 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 90은 pRF97-Y155H 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 93은 pRF861의 뉴클레오타이드 서열을 기재한다.
서열 번호 94는 E. 콜라이로부터의 nac 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 95는 nac 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 96은 nac 표적 부위 1+ PAM E. 콜라이의 뉴클레오타이드 서열을 기재한다.
서열 번호 97은 nac 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 98은 nac 표적 부위 1 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 99는 N25 파지 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 100은 nac 표적 부위 1 gRNA 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 101은 nac 표적 부위 2 gRNA 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 102는 nac 상류 결실 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 103은 nac 하류 결실 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 104는 nac 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 105는 5' pRF97 또는 pRF861 동일성의 뉴클레오타이드 서열을 기재한다.
서열 번호 106은 3' pRF97 또는 pRF861 동일성의 뉴클레오타이드 서열을 기재한다.
서열 번호 107은 nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 108은 nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 109는 pRF97-카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 110은 pRF861-카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 113은 pRF97-nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 114는 pRF97-nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 115는 pRF861-nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 116은 pRF861-nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 117은 이. 콜라이로부터의 야생형(WT) nac 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 118은 편집된 nac 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 121은 스트렙토코커스 피오제네스 Cas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 122는 Cas9 Y155H 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 123은 Cas9 Y155N 변이체의 아미노산 서열을 기재한다.
서열 번호 124는 Cas9 Y155N 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 125는 Cas9 Y155E 변이체의 아미노산 서열을 기재한다.
서열 번호 126은 Cas9 Y155E 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 127은 Cas9 Y155F 변이체의 아미노산 서열을 기재한다.
서열 번호 128은 Cas9 Y155F 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 129는 Cas9 F86A-F98A 변이체의 아미노산 서열을 기재한다.
서열 번호 130은 F86A-F98A 합성 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 131은 F86A F98A에 대한 pRF801 골격의 뉴클레오타이드 서열을 기재한다.
서열 번호 132는 pRF801 골격 정방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 133은 pRF801 골격 역방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 134는 F86A-F98A 합성 정방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 135는 F86A-F98A 합성 역방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 136은 바실러스 F86A F98A 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 137은 pRF866의 뉴클레오타이드 서열을 기재한다.
서열 번호 140은 RNR2p 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 141은 2-미크론 복제 기원 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 142는 KanMX 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 143은 SNR52p 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 144는 pSE087 플라스미드의 뉴클레오타이드 서열을 기재한다.
서열 번호 147은 표적화 sgRNA + T(6) 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 148은 50 bp 상류 상동성 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 149는 URA3 표적화 sgRNA + T(6) 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 150은 50 bp 하류 상동성 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 153은 2-미크론 복제 기원 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 154는 154 암피실린 내성 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 155는 RNR2 종결자의 뉴클레오타이드 서열을 기재한다.
변이체 Cas 시스템 및 이러한 시스템을 포함하는 요소, 예를 들어 비제한적인 예로서 Cas 엔도뉴클레아제 변이체, Cas 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체, 및 Cas 엔도뉴클레아제 변이체와 상호작용할 수 있는 가이드 폴리뉴클레오타이드 및 가이드 RNA 요소를 위한 조성물 및 방법이 제공된다. Cas 엔도뉴클레아제 변이체, 가이드 RNA 및 가이드 RNA/Cas 엔도뉴클레아제 복합체의 직접적인 전달을 위한 조성물 및 방법이 또한 제공된다. 본 발명은 세포 게놈에서의 표적 서열의 게놈 변형, 유전자 편집 및 세포 게놈 내로의 관심 폴리뉴클레오타이드의 삽입을 위한 조성물 및 방법을 추가로 포함한다.
본 명세서는 읽기 쉽도록 여러 부문으로 구성되어 있지만, 독자는 한 부문의 서술이 다른 부문에도 적용될 수 있음을 이해할 것이다. 이러한 방식으로, 본 명세서의 상이한 부문에 사용된 표제가 제한적인 것으로 해석되어서는 안 된다.
본원에 제공된 표제는 본 명세서를 전체로 참조하여 가질 수 있는 본 조성물 및 방법의 다양한 양태 또는 구현예의 제한이 아니다. 따라서, 바로 아래에 정의된 용어는 본 명세서를 전체로 참조하여 더욱 완전하게 정의된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 조성물 및 방법이 속하는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에서 기술되는 것과 유사하거나 동등한 임의의 방법 및 재료가 본 조성물 및 방법의 실시 또는 시험에 사용될 수도 있지만, 대표적인 예시적인 방법 및 재료가 이제 기술된다.
본 명세서에서 언급된 모든 간행물 및 특허는, 각각의 개별 간행물 또는 특허가 구체적으로 그리고 개별적으로 참조로 포함되는 것으로 표시되듯이 그리고 이 간행물이 언급될 때 관련되는 방법 및/또는 재료를 개시하고 기재하기 위해 참조로 본원에 포함되듯이, 참조로 본원에 포함된다.
Cas 유전자 및 단백질
CRISPR(클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부: clustered regularly interspaced short palindromic repeat) 유전자위는, 예를 들어, 박테리아 및 고세균 세포에 의해 외래 DNA를 파괴하는 데 사용되는 DNA 절단 시스템의 성분을 암호화하는 소정의 유전자위를 지칭한다(Horvath and Barrangou, 2010, Science 327:167-170; WO2007/025097; 2007년 3월 1일 공개됨). CRISPR 유전자위는 다양한 Cas(CRISPR-연관된(associated)) 유전자에 의해 플랭킹될 수 있는, 짧은 가변 DNA 서열(소위 '스페이서')에 의해 분리된 짧은 다이렉트 반복부(CRISPR 반복부)를 포함하는 CRISPR 배열로 이루어질 수 있다. 주어진 CRISPR 유전자위에서 CRISPR-연관된 유전자의 수는 종들 간에 달라질 수 있다. 다중아단위 효과기 복합체(I형, III형 및 IV형 아형)를 갖는 클래스 1 시스템, 및 단일 단백질 효과기(II형 및 V형 아형을 포함하며, 비제한적인 예로서 Cas9, Cpf1, C2c1, C2c2, C2c3를 포함)를 갖는 클래스 2 시스템을 포함하는 여러 CRISPR/Cas 시스템이 기술되었다. 클래스 1 시스템(참조로 본원에 포함되는 Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13:1-15; Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13; Haft et al., 2005, Computational Biology, PLoS Comput Biol 1(6): e60. doi:10.1371 /journal .pcbi. 0010060 및 2013년 11월 23일 공개된 WO 2013/176772 A1). 박테리아로부터의 II형 CRISPR/Cas 시스템은 crRNA(CRISPR RNA) 및 tracrRNA(전사-촉진 CRISPR RNA)를 사용하여 Cas 엔도뉴클레아제를 이의 DNA 표적으로 유도한다. crRNA는 이중 가닥 DNA 표적의 한 가닥에 상보적인 스페이서 영역 및 tracrRNA(전사-촉진 CRISPR RNA)와 염기 쌍을 이루어 Cas 엔도뉴클레아제가 DNA 표적을 절단하도록 유도하는 RNA 듀플렉스를 형성하는 영역을 포함한다. 스페이서는 Cas1 및 Cas2 단백질을 수반하는 완전히 이해되지 않은 과정을 통해 획득된다. 모든 II형 CRISPR/Cas 유전자위는 cas9 유전자 외에 cas1 및 cas2 유전자를 포함한다(Chylinski et al., 2013, RNA Biology 10:726-737; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15). II형 CRISPR-Cas 유전자위는 각각의 CRISPR 배열 내 반복부와 부분적으로 상보적인 tracrRNA를 암호화할 수 있고, Csn1 및 Csn2와 같은 다른 단백질을 포함할 수 있다. cas1 및 cas2 유전자 부근에 있는 cas9의 존재는 II형 유전자위의 특징이다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15). I형 CRISPR-Cas(CRISPR-연관된(associated)) 시스템은 침입하는 바이러스 DNA에 대해 방어하기 위해 단일 CRISPR RNA(crRNA) 및 Cas3과 함께 기능하는 Cascade(항바이러스 방어에 대한 CRISPR-연관된 복합체)라 칭하는 단백질의 복합체로 이루어진다(Brouns, S.J.J. et al. Science 321:960-964; Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13:1-15, 본원에 그 전문이 포함됨).
본원에서 용어 "Cas 유전자"는 일반적으로 플랭킹 CRISPR 유전자위에 커플링되거나 회합되거나 가까이 있거나, 또는 그 부근에 있는 유전자를 지칭한다. 용어 "Cas 유전자", "cas 유전자", "CRISPR-연관된(associated)(Cas) 유전자" 및 "클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부-연관된 유전자"는 본원에서 상호 교환적으로 사용된다.
용어 "Cas 단백질" 또는 "Cas 폴리펩타이드"는 Cas(CRISPR-연관된(associated)) 유전자에 의해 암호화된 폴리펩타이드를 지칭한다. Cas 단백질은 Cas 엔도뉴클레아제를 포함한다.
Cas 단백질은 박테리아 또는 고세균 단백질일 수 있다. 본원에서 I형 내지 III형 CRISPR Cas 단백질은 통상적으로 원핵생물 기원이며, 예를 들어, I형 및 III형 Cas 단백질은 박테리아 또는 고세균 종으로부터 유래될 수 있는 반면, II형 Cas 단백질(즉, Cas9)은 박테리아 종으로부터 유래될 수 있다. 다른 양태에서, Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 동족체, 또는 변형된 버전 중 하나 이상을 포함한다. Cas 단백질은 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-HD, Cas5, Cas7, Cas8, Cas10, 또는 이들의 조합 또는 복합체를 포함한다.
용어 "Cas 엔도뉴클레아제"는, 적합한 폴리뉴클레오타이드 성분과의 복합체인 경우, 특정 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단할 수 있는 Cas 폴리펩타이드(Cas 단백질)를 지칭한다. Cas 엔도뉴클레아제는 (예를 들어, 세포의 게놈에서의 표적 부위에서) 이중 가닥 DNA에서의 특정 표적 부위의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하고 절단하는 가이드 폴리뉴클레오타이드에 의해 유도된다. 본원에 기재된 Cas 엔도뉴클레아제는 하나 이상의 뉴클레아제 도메인을 포함한다. 본원에 기재된 공여 DNA 삽입 방법에 사용된 Cas 엔도뉴클레아제는 단일 또는 이중 가닥 절단을 표적 부위에서의 DNA로 도입하는 엔도뉴클레아제이다. 대안적으로, 엔도뉴클레아제는 DNA 절단 또는 닉킹 활성이 결여될 수 있지만, 적합한 RNA 성분과 복합체를 형성할 때 여전히 DNA 표적 서열에 특이적으로 결합할 수 있다.
본원에 사용된 바와 같이, "Cas9"(이전에 Cas5, Csn1 또는 Csx12라고 지칭됨) 또는 "Cas9 엔도뉴클레아제"라고 지칭되거나 "Cas9 엔도뉴클레아제 활성"을 갖는 폴리펩타이드는 DNA 표적 서열의 전부 또는 일부에 특이적으로 결합하고, 선택적으로 이를 닉킹하거나 절단하기 위해 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드와 복합체를 형성하는 Cas 엔도뉴클레아제를 지칭한다. Cas9 엔도뉴클레아제는 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인을 포함하며, 이들 각각은 표적 서열에서 단일 DNA 가닥을 절단할 수 있다(도메인 둘 다의 공동 작용은 DNA 이중 가닥 절단으로 이어지는 반면, 하나의 도메인의 활성은 닉(nick)으로 이어짐). 일반적으로, RuvC 도메인은 서브도메인 I, II 및 III을 포함하며, 여기서 도메인 I은 Cas9의 N 말단 근처에 위치하고, 서브도메인 II 및 III은 HNH 도메인을 플랭킹하는 단백질의 중간에 위치한다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15, Hsu et al, 2013, Cell 157:1262-1278). Cas9 엔도뉴클레아제는 통상적으로 II형 CRISPR 시스템으로부터 유래되는데, 이 시스템은 적어도 하나의 폴리뉴클레오타이드 성분과의 복합체인 Cas9 엔도뉴클레아제를 사용하는 DNA 절단 시스템을 포함한다. 예를 들어, Cas9는 CRISPR RNA(crRNA) 및 전사-촉진 CRISPR RNA(tracrRNA)와의 복합체일 수 있다. 다른 예에서, Cas9는 단일 가이드 RNA와의 복합체일 수 있다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15).
Cas 엔도뉴클레아제의 "기능적 단편", "기능적으로 동등한 단편" 및 "기능적 동등 단편"은 본원에서 상호 교환적으로 사용되며, 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단(표적 부위에서 단일 또는 이중 가닥 절단을 도입)하는 능력이 유지되는 Cas 엔도뉴클레아제의 일부 또는 하위서열을 지칭한다.
본 발명의 Cas 엔도뉴클레아제의 "기능적 변이체", "기능적으로 동등한 변이체" 및 "기능적 동등 변이체"라는 용어는 본원에서 상호 교환적으로 사용되며, 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단하는 능력이 유지되는 본 발명의 Cas 엔도뉴클레아제의 변이체를 지칭한다.
특정 표적 DNA 서열에 대한 본원의 Cas 단백질의 결합 활성 및/또는 엔도뉴클레오리틱 활성을 결정하는 것은 본원에 참조로 개시된 미국 특허 제8697359호에 개시된 바와 같이 당해 분야에 공지된 임의의 적합한 분석법에 의해 평가될 수 있다. 예를 들어, 숙주 세포/유기체에서 Cas 단백질과 적합한 RNA 성분을 발현한 후, 삽입-결실(indel)의 존재에 대해 예측되는 DNA 표적 부위를 조사함으로써 결정이 이루어질 수 있다(이러한 특별한 분석법에서 Cas 단백질은 엔도뉴클레오리틱 활성[단일 또는 이중 가닥 절단 활성]을 가질 것이다). 예측되는 표적 부위에서 삽입-결실의 존재를 조사하는 것은, 예를 들어, DNA 시퀀싱 방법을 통해 또는 표적 서열의 기능 상실을 분석하여 삽입-결실의 형성을 추정함으로써 수행될 수 있다. 다른 예에서, Cas 단백질 활성은, 표적 부위 또는 그 부근의 서열에 상동성인 서열을 포함하는 공여 DNA를 제공한 숙주 세포/유기체에서 Cas 단백질과 적합한 RNA 성분을 발현시킴으로써 결정할 수 있다. (공여 서열과 표적 서열 사이의 성공적인 HR에 의해 예측되는 바와 같은) 표적 부위에서의 공여 DNA 서열의 존재는 표적화가 일어났음을 나타낼 것이다.
"Cas 엔도뉴클레아제 변이체"라고도 칭하는 Cas 엔도뉴클레아제의 변이체는 모 Cas 엔도뉴클레아제의 변이체를 지칭하고, 여기서 Cas 엔도뉴클레아제 변이체는 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드(예컨대, 본원에 기재된 가이드 폴리뉴클레오타이드)와 회합될 때 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단하는 능력을 보유한다. Cas 엔도뉴클레아제 변이체는 본원에 기재된 Cas 엔도뉴클레아제 변이체를 포함하고, 여기서 Cas 엔도뉴클레아제 변이체는 (표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) Cas 엔도뉴클레아제 변이체가 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 모 Cas 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 감소된 타깃오프 절단, 또는 임의의 이들의 조합을 갖는 방식으로 모 Cas 엔도뉴클레아제와 다르다.
본원에 사용된 바와 같이, 용어 "형질전환 효율"은 Cas9 변이체가 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 PGEN 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 형질전환된 세포의 수를 모(야생형) Cas9가 동일한 표적 부위를 변형시킬 수 있는 PGEN의 Cas 엔도뉴클레아제 성분으로서 PGEN 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 형질전환된 세포의 수로 나눈 것으로 정의된다. 이 수에 100을 곱해 %로 표현할 수 있다.
1(또는 100%)의 형질전환 효율은 Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수가 WT Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수와 거의 동일하거나 동일하다는 것을 나타낸다. 이 경우에, Cas9 변이체는 이의 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 특성을 갖지 않을 것이다. 반대로, 1 초과의 형질전환 효율은 Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수가 WT Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수보다 크다는 것을 나타낸다. 이 경우에, Cas9 변이체는 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 특성, 예를 들어 개선된 형질전환 효율을 갖는다.
본원에 사용된 바와 같이, 용어 "편집 효율" 또는 "DNA 편집 효율"은 본원에서 상호 교환적으로 사용되며, Cas9 변이체가 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 PGEN 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 DNA 편집을 포함하는 세포(편집된 세포)의 수를 모(야생형) Cas9가 동일한 표적 부위를 변형시킬 수 있는 PGEN의 Cas 엔도뉴클레아제 성분으로서 PGEN 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 편집된 세포의 수로 나눈 것으로 정의된다. 이 수에 100을 곱해 %로 표현할 수 있다.
1(또는 100%)의 DNA 편집 효율은 Cas9 변이체가 사용될 때 얻은 편집된 세포의 수가 WT Cas9 변이체가 사용될 때 얻은 편집된 세포의 수와 거의 동일하거나 동일하다는 것을 나타낸다. 이 경우에, Cas9 변이체는 이의 모 cas9 엔도뉴클레아제와 비교할 때 개선된 특성을 갖지 않을 것이다. 반대로, 1 초과의 DNA 편집 효율은 Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수가 모(WT) Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수보다 크다는 것을 나타낸다. 이 경우에, Cas9 변이체는 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 특성, 예를 들어 개선된 편집 효율을 갖는다.
Cas 엔도뉴클레아제 변이체는 모 Cas 엔도뉴클레아제의 아미노산 서열과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함할 수 있다.
변이체 Cas 엔도뉴클레아제 유전자(변이체 cas 유전자)는 모 Cas 엔도뉴클레아제 뉴클레오타이드 서열과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 뉴클레오타이드 서열을 포함할 수 있다.
본원에서 모 Cas 엔도뉴클레아제의 비제한적인 예는 임의의 하기 속으로부터의 Cas 엔도뉴클레아제일 수 있다: 아에로피룸(Aeropyrum), 피로바쿨룸(Pyrobaculum), 술폴로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로아르쿨라(Haloarcula), 메타노박테리움(Methanobacterium), 메타노코커스(Methanococcus), 메타노사르시나(Methanosarcina), 메타노피러스(Methanopyrus), 피로코커스(Pyrococcus), 피크로필러스(Picrophilus), 써니오플라스니아(Thernioplasnia), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobacterium), 스트렙토마이세스(Streptomyces), 아퀴펙스(Aquifex), 포르피로모나스(Porphyromonas), 클로로비움(Chlorobium), 써머스(Thermus), 바실러스(Bacillus), 리스테리아(Listeria), 스타필로코커스(Staphylococcus), 클로스트리디움(Clostridium), 써모아나에로박터(Thermoanaerobacter), 마이코플라스마(Mycoplasma), 푸소박테리움(Fusobacterium), 아자쿠스(Azarcus), 크로모박테리움(Chromobacterium), 네이세리아(Neisseria), 니트로소모나스(Nitrosomonas), 디설포비브리오(Desulfovibrio), 게오박터(Geobacter), 미로코커스(Myrococcus), 캄필로박터(Campylobacter), 볼리넬라(Wolinella), 아시네토박터(Acinetobacter), 에르위니아(Erwinia), 에스케리치아(Escherichia), 레지오넬라(Legionella), 메틸로코커스(Methylococcus), 파스퇴렐라(Pasteurella), 포토박테리움(Photobacterium), 살모넬라(Salmonella), 잔토모나스(Xanthomonas), 예시니아(Yersinia), 스트렙토코커스(Streptococcus), 트레포네마(Treponema), 프란시셀라(Francisella) 또는 써모토가(Thermotoga). 더욱이, 본원에서 모 Cas 엔도뉴클레아제는 미국 출원 공보 제2010/0093617호(본원에서 참조로 포함됨)에 개시된 바와 같은, 예를 들어 임의의 서열 번호 462 내지 465, 467 내지 472, 474 내지 477, 479 내지 487, 489 내지 492, 494 내지 497, 499 내지 503, 505 내지 508, 510 내지 516, 또는 517 내지 521에 의해 암호화될 수 있다.
더욱이, 본원에서 모 Cas9 엔도뉴클레아제는 예를 들어 스트렙토코커스(예를 들어, S. 피오제네스(pyogenes), S. 뉴모니애(pneumoniae), S. 써모필러스(thermophilus), S. 아갈락티아(agalactiae), S. 파라상귀니스(parasanguinis), S. 오랄리스(oralis), S. 살리바리우스(salivarius), S. 마카카(macacae), S. 디스갈락티애(dysgalactiae), S. 안지노서스(anginosus), S. 콘스텔라투스(constellatus), S. 슈도포르시누스(pseudoporcinus), S. 뮤탄스(mutans)), 리스테리아(예를 들어, L. 인노쿠아(innocua)), 스피로플라즈마(Spiroplasma)(예를 들어, S. 아피스(apis), S. 시르피디콜라(syrphidicola)), 펩토스트렙토코카세(Peptostreptococcaceae), 아토포비움(Atopobium), 포르피로모나스(Porphyromonas)(예를 들어, P. 카토니아(catoniae)), 프레보텔라(Prevotella)(예를 들어, P. 인테르메디아(intermedia)), 베일로넬라(Veillonella), 트레포네마(Treponema)(예를 들어, T. 소크란스키(socranskii), T. 덴티콜라(denticola)), 카프노사이토파가(Capnocytophaga), 피네골디아(Finegoldia)(예를 들어, F. 마그나(magna)), 코리오박테리아세아에(Coriobacteriaceae)(예를 들어, C. 박테리움(bacterium)), 올세넬라(Olsenella)(예를 들어, O. 프로푸사(profusa)), 헤모필루스(Haemophilus)(예를 들어, H. 스푸토룸(sputorum), H. 피트마니아에(pittmaniae)), 파스퇴렐라(Pasteurella)(예를 들어, P. 베티아에(bettyae)), 올리비박터(Olivibacter)(예를 들어, O. 시티엔시스(sitiensis)), 에필리토니모나스(Epilithonimonas)(예를 들어, E. 테낙스(tenax)), 메소니아(Mesonia)(예를 들어, M. 모빌리스(mobilis)), 락토바실루스(Lactobacillus)(예를 들어, L. 플란타룸(plantarum)), 바실루스(예를 들어, B. 세레우스(cereus)), 아퀴마리나(Aquimarina)(예를 들어, A. 무엘레리(muelleri)), 크리세오박테리움(Chryseobacterium)(예를 들어, C. 파루스트레(palustre)), 박테로이데스(Bacteroides)(예를 들어, B. 그라미니솔벤스(graminisolvens)), 네이세리아(예를 들어, N. 메닝기티디스(meningitidis)), 프란시셀라(Francisella)(예를 들어, F. 노비시다(novicida)) 또는 플라보박테리움(Flavobacterium)(예를 들어, F. 프리기다리움(frigidarium), F. 솔리(soli)) 종으로부터 유래될 수 있다. 일 양태에서, S. 피오제네스 모 Cas9 엔도뉴클레아제가 본원에 기재된다. 다른 예로서, 모 Cas9 엔도뉴클레아제는 Chylinski et al. (RNA Biology 10:726-737)(본원에 참조로 포함됨)에 개시된 임의의 Cas9 단백질일 수 있다.
본원에서 모 Cas9 엔도뉴클레아제의 서열은, 예를 들어, 참조로 포함되는 진뱅크(GenBank) 등록번호 G3ECR1(S. 써모필러스), WP_026709422, WP_027202655, WP_027318179, WP_027347504, WP_027376815, WP_027414302, WP_027821588, WP_027886314, WP_027963583, WP_028123848, WP_028298935, Q03JI6(S. 써모필러스), EGP66723, EGS38969, EGV05092, EHI65578(S. 슈도포르시누스), EIC75614(S. 오랄리스), EID22027(S. 콘스텔라투스), EIJ69711, EJP22331(S. 오랄리스), EJP26004(S. 안지노서스), EJP30321, EPZ44001(S. 피오제네스), EPZ46028(S. 피오제네스), EQL78043(S. 피오제네스), EQL78548(S. 피오제네스), ERL10511, ERL12345, ERL19088(S. 피오제네스), ESA57807(S. 피오제네스), ESA59254(S. 피오제네스), ESU85303(S. 피오제네스), ETS96804, UC75522, EGR87316(S. 디스갈락티애), EGS33732, EGV01468(S. 오랄리스), EHJ52063(S. 마카카), EID26207(S. 오랄리스), EID33364, EIG27013(S. 파라상귀니스), EJF37476, EJO19166(스트렙토코커스 종 BS35b), EJU16049, EJU32481, YP_006298249, ERF61304, ERK04546, ETJ95568(S. 아갈락티아), TS89875, ETS90967(스트렙토코커스 종 SR4), ETS92439, EUB27844(스트렙토코커스 종 BS21), AFJ08616, EUC82735(스트렙토코커스 종 CM6), EWC92088, EWC94390, EJP25691, YP_008027038, YP_008868573, AGM26527, AHK22391, AHB36273, Q927P4, G3ECR1 또는 Q99ZW2(S. 피오제네스)에 개시된 Cas9 아미노산 서열 중 임의의 것을 포함할 수 있다. 대안적으로, 본원의 Cas9 단백질은, 예를 들어, (본원에 참조로 포함된) 미국 출원 공개 제2010/0093617호에 개시된 바와 같은 서열 번호 462(S. 써모필러스), 474(S. 써모필러스), 489(S. 아갈락티아), 494(S. 아갈락티아), 499(S. 뮤탄스), 505(S. 피오제네스) 또는 518(S. 피오제네스) 중 임의의 것에 의해 암호화될 수 있다.
소정의 아미노산이 서로 유사한 구조적 특징 및/또는 전하 특징을 공유함(즉, 보존)을 고려하면, Cas9에서의 각 위치에서의 아미노산은 개시된 서열에서 제공된 것과 같거나, 다음과 같이 보존된 아미노산 잔기로 치환될 수 있다("보존적 아미노산 치환"):
1. 다음과 같은 작은 지방족의 비극성 또는 약간 극성인 잔기가 서로를 대체할 수 있다: Ala (A), Ser (S), Thr(T), Pro (P), Gly (G);
2. 다음과 같은 극성의 음으로 하전된 잔기 및 그들의 아미드가 서로를 대체할 수 있다: Asp (D), Asn (N), Glu (E), Gln (Q);
3. 다음과 같은 극성의 양으로 하전된 잔기가 서로를 대체할 수 있다: His (H), Arg (R), Lys (K);
4. 다음과 같은 지방족의 비극성 잔기가 서로를 대체할 수 있다: Ala (A), Leu (L), Ile (I), Val (V), Cys (C), Met (M); 및
5. 다음과 같은 큰 방향족 잔기가 서로를 대체할 수 있다: Phe (F), Tyr (Y), Trp (W).
단편 및 변이체는 부위 지정 돌연변이유발 및 합성 제조와 같은 방법을 통해 수득될 수 있다. 엔도뉴클레아제 활성을 측정하는 방법은, 예컨대, 비제한적인 예로서 본원에 참조로 포함되는, 2013년 5월 1일 출원된 PCT/US13/39011, 2016년 5월 12일 출원된 PCT/US16/32073, 2016년 5월 12일 출원된 PCT/US16/32028에 잘 알려져 있다.
일 구현예에서, Cas 엔도뉴클레아제 변이체는 본원에 기재된 Cas9 엔도뉴클레아제 변이체이다. 본원에 사용된 바와 같이, "Cas9 엔도뉴클레아제 변이체" 또는 "Cas9 변이체"는 Cas9 엔도뉴클레아제 변이체가 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 본원에 기재된 단일 가이드 폴리뉴클레오타이드(예컨대, 가이드 폴리뉴클레오타이드)와 회합될 때 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단하는 능력을 보유하는 모 Cas9 엔도뉴클레아제의 변이체를 지칭한다. Cas9 엔도뉴클레아제 변이체는 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하고, 여기서 Cas 엔도뉴클레아제 변이체는 (표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) Cas9 엔도뉴클레아제 변이체가 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 감소된 타깃오프 절단, 또는 임의의 이들의 조합을 갖는 방식으로 모 Cas9 엔도뉴클레아제와 다르다.
본원에 기재된 Cas9 엔도뉴클레아제 변이체는 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드와 회합될 때 이중 가닥 DNA 표적 부위에 결합하고 이를 닉킹할 수 있는 변이체를 포함하는 반면, 모 Cas 엔도뉴클레아제는 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드와 회합될 때 표적 부위에서 이중 가닥 파괴(절단)에 결합하고 만들 수 있다.
본원에 기재된 바와 같이, (표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) HNH 및 RuvC 도메인 밖에 적어도 하나의 아미노산 변형을 갖는 Cas9 엔도뉴클레아제 변이체가 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대, 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 또는 이들의 조합을 가질 수 있다는 것이 놀랍게도 그리고 예상치 못하게 발견되었다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인, 및 HNH 및 RuvC 도메인 밖에 위치한 적어도 하나의 아미노산 변형(적어도 하나의 아미노산의 결실, 치환 또는 삽입)을 포함한다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 포함한다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 이의 HNH 및 RuvC 도메인 밖에 아미노산 변형을 갖고, 여기서 상기 Cas9 엔도뉴클레아제는 상기 아미노산 변형을 포함하지 않는 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율 및/또는 DNA 편집 효율을 갖고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 상기 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체를 형성할 수 있다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 동일성을 갖고, 155번 위치에서의 적어도 하나의 아미노산 치환을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
155번 위치에서의 Cas9 엔도뉴클레아제 변이체 치환은 각각 Cas9 Y155H 변이체(서열 번호 58), Cas9 Y155N 변이체(서열 번호 123), Cas9 Y155E 변이체(서열 번호 125 및 Cas9 Y155F 변이체(서열 번호 127)를 생성시키는 Y155H, Y155N, Y155E, Y155F로 이루어진 군으로부터 선택될 수 있다. Cas9 Y155 변이체를 암호화하는 DNA 서열은 당해 분야에 널리 공지된 바와 같이 특정 숙주 유기체에서의 발현을 위해 최적화될 수 있다. Cas9Y155 변이체 단백질을 암호화하는 DNA 서열의 예는 서열 번호 122, 124, 126 및 128에 기재되어 있다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 동일성을 갖고, 86번 위치에서의 하나 및 98번 위치에서의 다른 하나인 적어도 2개의 아미노산 치환을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
86번 위치에서의 Cas9 엔도뉴클레아제 변이체 치환은 Cas9 F86A 변이체를 생성시키는 F86A 치환일 수 있다.
89번 위치에서의 Cas9 엔도뉴클레아제 변이체는 Cas9 F98A 변이체를 생성시키는 F98A 치환일 수 있다.
Cas9 엔도뉴클레아제 변이체는 서열 번호 129에 기재된 Cas9 F86A-F98A 변이체를 생성시키는 F86A 치환과 같은 86번 위치에서의 제1 치환 및 F98A 치환과 같은 98번 위치에서의 제2 치환인 적어도 2개의 치환을 포함할 수 있다.
Cas9 엔도뉴클레아제 변이체는 적어도 3개의 치환을 포함할 수 있고, 적어도 3개의 치환은 F86A 치환과 같은 86번 위치에서의 제1 치환, F98A 치환과 같은 98번 위치에서의 제2 치환 및 Y155H, Y155N, Y155E, Y155F로 이루어진 군으로부터 선택된 제3 치환을 포함한다.
Cas9 Y155 변이체를 암호화하는 DNA 서열은 당해 분야에 널리 공지된 바와 같이 특정 숙주 유기체에서의 발현을 위해 최적화될 수 있다. Cas9Y155 변이체 단백질을 암호화하는 DNA 서열의 예는 서열 번호 122, 124, 126 및 128에 기재되어 있다. Cas9F86A-F98A 변이체 단백질을 암호화하는 DNA 서열의 예는 서열 번호 130에 기재되어 있다.
(표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) 86번, 98번 및 155번 위치, 또는 임의의 이들의 조합으로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개 또는 적어도 3개의 치환을 포함하는 Cas9 엔도뉴클레아제 변이체는 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 또는 이들의 조합을 가질 수 있다.
86번, 98번 및 155번 위치(또는 임의의 조합)로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개 또는 적어도 3개의 치환은 당업자에게 공지된 임의의 다른 아미노산 변형과 조합될 수 있다. 일 양태에서, 본원에 기재된 86번, 98번 및 155번 위치로 이루어진 군으로부터 선택된 임의의 하나의 치환(또는 임의의 하나의 이들의 조합)은 Cas9 엔도뉴클레아제가 닉카아제로서 작용하게 하도록 당업자에게 공지된 HNH 및 RuvC 도메인에 위치한 임의의 아미노산 치환과 조합될 수 있다(Trevino A. E. and Feng Zhang, 2014, Methods in Enzymology, volume 546 pg 161-174). "닉카아제" Cas9(Cas9n)는 HNH 또는 RuvC 도메인 내에 핵심 촉매 잔기에서 알라닌 치환에 의해 생성될 수 있고, SpCas9 D10A는 RuvC를 불활성화하는 반면(Jinek, M, et al, 2012, Science, 337(6096), 816-821), N863A는 HNH를 불활성화하는 것으로 밝혀졌다(Nishimasu et al., 2014; Shen et al 2014 Nature Methods 11, 399-402). H840A 돌연변이(Shen et al 2014 Nature Methods 11, 399-402)는 또한 Cas9를 닉킹 효소로 전환시킨다고 보고되었지만, 이 돌연변이체는 N863A와 비교될 때 포유류 세포에서 감소된 활성 수준을 가졌다(Nishimasu et al. 2014, Cell, 156(5), 935-949).
일 양태에서, Cas9(N863A), Cas9(D10A) 및/또는 Cas9(H840A)는 본원에 기재된 86번, 98번 및 155번 위치(또는 임의의 조합)로 이루어진 군으로부터 선택된 적어도 하나의 치환을 포함하도록 추가로 변형될 수 있어, 선택적으로 각각 변형된 Cas9(N863A), Cas9(D10A) 및/또는 Cas9(H840A)의 특성을 개선시킨다.
일 양태에서, 본원에 기재된 86번, 98번 및 155번 위치(또는 임의의 이들의 조합)로 이루어진 군으로부터 선택된 치환들 중 어느 하나는 D10A, H840A 또는 N863A 및 H840A로 이루어진 군으로부터 선택된 아미노산 치환과 조합될 수 있다.
일 양태에서, 변이체의 아미노산 위치가 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는 155번 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율, 증가된 DNA 편집 효율, 또는 이들의 조합으로부터 선택된 적어도 하나의 개선된 특성을 갖는다.
일 양태에서, 변이체의 아미노산 위치가 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는 155번 위치에서 Y155H 치환을 갖는 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율을 갖는다. 일 양태에서, 이 증가된 형질전환 효율은 원핵생물 숙주 세포, 예컨대 비제한적인 예로서 바실러스 종 또는 에스케리치아 콜라이(E. 콜라이) 숙주 세포에서 관찰된다.
일 양태에서, 변이체의 아미노산 위치가 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는 155번 위치에서 Y155H 치환을 갖는 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율 및 증가된 DNA 편집 효율을 갖는다. 일 양태에서, 이 증가된 형질전환 효율 및 증가된 DNA 편집 효율은 원핵생물 숙주 세포, 예컨대 비제한적인 예로서 바실러스 종 또는 에스체리치아 콜라이(E. 콜라이) 숙주 세포에서 관찰된다.
본원에 기재된 Cas9 변이체의 개선된 특성은 증가된 형질전환 효율을 포함하고, 여기서 모 Cas 엔도뉴클레아제와 비교할 때 형질전환 효율은 모 Cas 엔도뉴클레아제와 비교할 때 적어도 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배 이하로 증가된다.
본원에 기재된 Cas9 변이체의 개선된 특성은 증가된 DNA 편집 효율을 포함하고, 여기서 모 Cas 엔도뉴클레아제와 비교할 때 DNA 편집 효율은 모 Cas 엔도뉴클레아제와 비교할 때 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 210%, 220%, 230% 또는 250%, 또는 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배 이하 증가한다.
본원에 기재된 Cas 엔도뉴클레아제 변이체는 본원에 추가로 기재된 바와 같은 원핵생물 및 진핵생물 세포 및 유기체의 게놈 변형에 사용될 수 있다.
개시된 방법에서 사용하기 위한 Cas 엔도뉴클레아제, 또는 이의 기능적 단편 또는 변이체는 유전적으로 변형된 숙주 세포(예를 들어, 박테리아 세포, 곤충 세포, 진균 세포, 효모 세포 또는 인간-유래 세포주)가 Cas 단백질을 암호화하는 핵산 서열을 발현하도록 변형된 재조합 원천으로부터 단리될 수 있다. 대안적으로, Cas 단백질은 무세포 단백질 발현 시스템을 사용하여 생산되거나 합성적으로 생산될 수 있다.
본원에 기재된 Cas9 Y155 엔도뉴클레아제 변이체를 포함하는 Cas 엔도뉴클레아제는 Cas 폴리펩타이드의 변형된 형태를 포함할 수 있다. Cas 폴리펩타이드의 변형된 형태는 Cas 단백질의 자연 발생 뉴클레아제 활성을 감소시키는 아미노산 변화(예를 들어, 결실, 삽입 또는 치환)를 포함할 수 있다. 예를 들어, 일부 경우에, 본원에 기재된 Cas9 Y155 엔도뉴클레아제 변이체를 포함하는 Cas 단백질의 변형된 형태는 상응하는 야생형 Cas 폴리펩타이드의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만을 갖는다(2014년 3월 6일 공개된 미국 특허 출원 US20140068797 A1). 일부 경우에, Cas 폴리펩타이드의 변형된 형태는 실질적인 뉴클레아제 활성을 갖지 않으며, 촉매적으로 "불활성화된 Cas" 또는 "탈활성화된 Cas(dCas)"로 지칭된다. 불활성화된 Cas/탈활성화된 Cas는 탈활성화된 Cas 엔도뉴클레아제(dCas)를 포함한다. 본원에 기재된 Cas9 Y155 엔도뉴클레아제 변이체로부터 기원하는 것을 포함하는 촉매적으로 불활성인 Cas는 본원에 기재된 바와 같은 이종 서열에 융합될 수 있다.
본원에 기재된 Cas 엔도뉴클레아제 및 가이드 폴리뉴클레오타이드를 발현하는 재조합 DNA 작제물(이의 기능적 단편, 박테리아-, 진균-, 식물-, 미생물- 또는 포유류-코돈 최적화된 Cas 단백질을 포함)은 유기체의 게놈으로 안정하게 통합될 수 있다. 예를 들어, 미생물의 게놈에 안정하게 통합된 Cas 유전자를 포함하는 미생물이 생산될 수 있다.
본원에 기재된 Cas 엔도뉴클레아제(예컨대, 비제한적인 예로서 본원에 기재된 Cas9 엔도뉴클레아제 Y155 변이체)는 당해 분야에 공지된 방법(예컨대, 2016년 11월 24일 공개된 WO2016/186946(본원에 참조로 포함됨)의 실시예 2에 기재된 것)에 의해 발현되고 정제될 수 있다.
Cas 단백질 융합
본원에 기재된 Cas 엔도뉴클레아제, 또는 Cas 엔도뉴클레아제 변이체는 하나 이상의 이종 단백질 도메인(예를 들어, Cas 폴리펩타이드 이외의 1개, 2개, 3개 이상의 도메인)을 포함하는 융합 단백질의 일부일 수 있다. 이러한 융합 단백질은 임의의 추가적인 단백질 서열, 및 선택적으로 임의의 2개의 도메인들 사이, 예컨대, Cas 폴리펩타이드와 제1 이종 도메인 사이의 링커 서열을 포함할 수 있다. Cas 폴리펩타이드에 융합될 수 있는 단백질 도메인의 예는 제한 없이 에피토프 태그(예를 들어, 히스티딘[His], V5, FLAG, 인플루엔자 혈구응집소[HA], myc, VSV-G, 티오레독신[Trx]), 리포터(예를 들어, 글루타티온-5-트랜스퍼라아제[GST], 홀스래디쉬 퍼옥시다아제[HRP], 클로람페니콜 아세틸트랜스퍼라아제[CAT], 베타-갈락토시다아제, 베타-글루쿠로니다아제[GUS], 루시퍼라아제, 녹색 형광 단백질[GFP], HcRed, DsRed, 청록색 형광 단백질[CFP], 황색 형광 단백질[YFP], 청색 형광 단백질[BFP]) 및 메틸라아제 활성, 탈메틸라아제 활성, 전사 활성화 활성(예를 들어, VP16 또는 VP64), 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성 중 하나 이상을 갖는 도메인을 포함한다. Cas 엔도뉴클레아제는 DNA 분자 또는 다른 분자에 결합하는 단백질, 예컨대 말토스 결합 단백질(MBP: maltose binding protein), S-태그, Lex A DNA 결합 도메인(DBD), GAL4A DNA 결합 도메인 및 단순 포진 바이러스(HSV: herpes simplex virus) VP16과 또한 융합될 수도 있다.
Cas 엔도뉴클레아제는 이종 조절 요소, 예컨대 핵 국재화 서열(NLS: nuclear localization sequence)을 포함할 수 있다. 이종 NLS 아미노산 서열은 본원의 세포의 핵에서 검출 가능한 양으로 Cas 엔도뉴클레아제의 축적을 유도하기에 충분한 강도일 수 있다. NLS는 염기성의, 양으로 하전된 잔기(예를 들어, 라이신 및/또는 아르기닌)의 하나(1부분(monopartite)) 이상(예를 들어, 2부분(bipartite))의 짧은 서열(예를 들어, 2 내지 20개의 잔기)을 포함할 수 있으며, Cas 아미노산 서열 중 어디에도 위치할 수 있지만 단백질 표면 상에 노출되어야 한다. NLS는, 예를 들어, 본원의 Cas 단백질의 N 말단 또는 C 말단에 작동 가능하게 연결될 수 있다. 2개 이상의 NLS 서열이 Cas 단백질에 연결될 수 있는데, 예를 들어, Cas 단백질의 N 말단과 C 말단 모두에 연결될 수 있다. Cas 유전자는 Cas 코돈 영역 상류의 SV40 핵 표적화 신호 및 Cas 코돈 영역 하류의 2부분 VirD2 핵 국재화 신호에 작동 가능하게 연결될 수 있다(Tinland et al. (1992) Proc. Natl. Acad. Sci. USA 89:7442-6). 본원의 적합한 NLS 서열의 비제한적 예는 미국 특허 제6660830호 및 제7309576호에 개시된 것들을 포함하며, 둘 다 본원에 참조로 포함된다. 이종 NLS 아미노산 서열은 식물, 바이러스 및 포유류 핵 국재화 신호를 포함한다.
촉매적으로 활성인 및/또는 불활성인 Cas 엔도뉴클레아제는 이종 서열에 융합될 수 있다(2014년 3월 6일 공개된 미국 특허 출원 US20140068797 A1). 적합한 융합 상대는 직접 표적 DNA 상에 또는 표적 DNA와 결합된 폴리펩타이드(예를 들어, 히스톤 또는 다른 DNA-결합 단백질) 상에 작용하여 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩타이드를 포함하지만, 이에 한정되는 것은 아니다. 추가적인 적합한 융합 상대는 메틸트랜스퍼라아제 활성, 탈메틸라아제 활성, 아세틸트랜스퍼라아제 활성, 탈아세틸라아제 활성, 키나아제 활성, 포스파타아제 활성, 유비퀴틴 리가아제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성을 제공하는 폴리펩타이드를 포함하지만, 이에 한정되는 것은 아니다. 추가의 적합한 융합 상대는 표적 핵산의 증가된 전사를 직접적으로 제공하는 폴리펩타이드(예를 들어, 전사 활성인자 또는 이의 단편, 전사 활성인자를 모집하는 단백질 또는 이의 단편, 소분자/약물 반응성 전사 조절인자 등)를 포함하지만, 이에 한정되는 것은 아니다. 촉매적으로 불활성인 Cas9 엔도뉴클레아제는 또한 이중 가닥 파괴를 생성하기 위해 FokI 뉴클레아제에 융합될 수 있다(Guilinger et al. Nature biotechnology, volume 32, number 6, June 2014).
가이드 폴리뉴클레오타이드
본원에 사용된 바와 같이, 용어 "가이드 폴리뉴클레오타이드"는 Cas 엔도뉴클레아제와 복합체를 형성할 수 있고, Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단할 수 있게 하는 폴리뉴클레오타이드 서열을 지칭한다. 가이드 폴리뉴클레오타이드는 단일 분자 또는 이중 분자일 수 있다. 가이드 폴리뉴클레오타이드 서열은 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다. 선택적으로, 가이드 폴리뉴클레오타이드는 적어도 하나의 뉴클레오타이드, 포스포디에스테르 결합 또는 연결 변형, 예컨대, 잠김 핵산(LNA: Locked Nucleic Acid), 5-메틸 dC, 2,6-디아미노퓨린, 2'-플루오로 A, 2'-플루오로 U, 2'-O-메틸 RNA, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18(헥사에틸렌 글리콜 사슬) 분자에 대한 연결, 또는 고리화를 초래하는 5'에서 3'으로의 공유 연결을 포함할 수 있지만, 이에 한정되는 것은 아니다. 단독으로 리보핵산을 포함하는 가이드 폴리뉴클레오타이드는 "가이드 RNA" 또는 "gRNA"라고도 지칭된다.
가이드 폴리뉴클레오타이드는 cr뉴클레오타이드 서열 및 tracr뉴클레오타이드 서열을 포함하는 이중 분자(듀플렉스 가이드 폴리뉴클레오타이드라고도 함)일 수 있다. cr뉴클레오타이드는 표적 DNA에서의 뉴클레오타이드 서열에 혼성화될 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인(Variable Targeting domain) 또는 VT 도메인이라고 칭함) 및 Cas 엔도뉴클레아제 인식(CER: Cas endonuclease recognition) 도메인의 일부인 제2 뉴클레오타이드 서열(tracr 메이트 서열이라고도 칭함)을 포함한다. tracr 메이트 서열은 상보성 영역을 따라 tracr뉴클레오타이드에 혼성화될 수 있고, 함께 Cas 엔도뉴클레아제 인식 도메인 또는 CER 도메인을 형성할 수 있다. CER 도메인은 Cas 엔도뉴클레아제 폴리펩타이드와 상호작용할 수 있다. 듀플렉스 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드는 RNA, DNA, 및/또는 RNA-DNA-조합 서열일 수 있다. (2015년 3월 19일 공개된 미국 특허 출원 US20150082478 및 2015년 2월 26일 공개된 US20150059010, 둘 다 본원에 참조로 포함됨). 일부 구현예에서, 듀플렉스 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 분자는 "crDNA"(연속된 DNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "crRNA"(연속된 RNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "crDNA-RNA"(DNA와 RNA 뉴클레오타이드의 조합으로 구성되는 경우)로 지칭된다. cr뉴클레오타이드는 박테리아 및 고세균에서 자연적으로 발생하는 crRNA의 단편을 포함할 수 있다. 박테리아 및 고세균에서 자연적으로 발생하고 본원에 개시된 cr뉴클레오타이드에 존재할 수 있는 crRNA의 단편의 크기는 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 이상의 뉴클레오타이드 범위를 가질 수 있지만, 이들 범위로 제한되는 것은 아니다. 일부 구현예에서, tracr뉴클레오타이드는 "tracrRNA"(연속된 RNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "tracrDNA"(연속된 DNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "tracrDNA-RNA"(DNA와 RNA 뉴클레오타이드의 조합으로 구성되는 경우)로 지칭된다. 특정 구현예에서, RNA/Cas9 엔도뉴클레아제 복합체를 유도하는 RNA는 듀플렉스 crRNA-tracrRNA를 포함하는 듀플렉스화된 RNA이다.
일 양태에서, 가이드 폴리뉴클레오타이드는 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 PGEN을 형성할 수 있는 가이드 폴리뉴클레오타이드이고, 여기서 상기 가이드 폴리뉴클레오타이드는 표적 DNA에서 뉴클레오타이드 서열에 상보적인 제1 뉴클레오타이드 서열 도메인(VT 도메인) 및 상기 Cas 엔도뉴클레아제 폴리펩타이드와 상호작용하는 제2 뉴클레오타이드 서열 도메인을 포함한다.
일 양태에서, 가이드 폴리뉴클레오타이드는 본원에 기재된 가이드 폴리뉴클레오타이드이고, 여기서 제1 뉴클레오타이드 서열 도메인(VT 도메인) 및 제2 뉴클레오타이드 서열 도메인은 DNA 서열, RNA 서열, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일 양태에서, 가이드 폴리뉴클레오타이드는 본원에 기재된 가이드 폴리뉴클레오타이드이고, 여기서 제1 뉴클레오타이드 서열 및 제2 뉴클레오타이드 서열 도메인은 안정성을 향상시키는 RNA 골격 변형, 안정성을 향상시키는 DNA 골격 변형 및 이들의 조합으로 이루어진 군으로부터 선택된다(문헌[Kanasty et al., 2013, Common RNA-backbone modifications, Nature Materials 12:976-977] 참조).
가이드 폴리뉴클레오타이드는 적어도 하나의 tracrRNA에 (비공유로) 연결된 키메라성 비자연 발생 crRNA를 포함하는 이중 RNA 분자를 포함한다. 키메라성 비자연 발생 crRNA는 자연에서 함께 발견되지 않는 영역을 포함하는 crRNA를 포함한다(즉, 이들은 서로 이종임). 예를 들어, 비자연 발생 crRNA는 자연 발생 스페이서 서열이 이종 가변 표적화 도메인에 대해 교환되는 crRNA이다. 비자연 발생 crRNA는 제2 뉴클레오타이드 서열(tracr 메이트 서열이라고도 칭함)에 연결된 표적 DNA에서 뉴클레오타이드 서열에 혼성화할 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 칭함)을 포함하여서 제1 서열과 제2 서열은 자연에서 함께 연결되는 것으로 발견되지 않는다.
가이드 폴리뉴클레오타이드는 또한 tracr뉴클레오타이드 서열에 연결된 cr뉴클레오타이드 서열을 포함하는 단일 분자(단일 가이드 폴리뉴클레오타이드라고도 함)일 수 있다. 단일 가이드 폴리뉴클레오타이드는 표적 DNA에서의 뉴클레오타이드 서열에 혼성화할 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 칭함) 및 Cas 엔도뉴클레아제 폴리펩타이드와 상호작용하는 Cas 엔도뉴클레아제 인식 도메인(CER 도메인)을 포함한다. "도메인"은 RNA, DNA, 및/또는 RNA-DNA 조합 서열일 수 있는 연속된 뉴클레오타이드 스트레치를 의미한다. 단일 가이드 폴리뉴클레오타이드의 VT 도메인 및/또는 CER 도메인은 RNA 서열, DNA 서열, 또는 RNA-DNA-조합 서열을 포함할 수 있다. cr뉴클레오타이드 및 tracr뉴클레오타이드로부터의 서열들로 구성되는 단일 가이드 폴리뉴클레오타이드는 "단일 가이드 RNA"(연속된 RNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "단일 가이드 DNA"(연속된 DNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "단일 가이드 RNA-DNA"(RNA와 DNA 뉴클레오타이드의 조합으로 구성되는 경우)로 지칭될 수 있다. 단일 가이드 폴리뉴클레오타이드는 Cas 엔도뉴클레아제와 복합체를 형성할 수 있으며, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템이라고도 칭함)는 Cas 엔도뉴클레아제를 게놈 표적 부위로 지시하여 Cas 엔도뉴클레아제가 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일 또는 이중 가닥 파괴를 도입)하게 할 수 있다.
용어 "가변 표적화 도메인" 또는 "VT 도메인"은 본원에서 상호 교환적으로 사용되며, 이중 가닥 DNA 표적 부위의 한 가닥(뉴클레오타이드 서열)에 혼성화할 수 있는(상보적인) 뉴클레오타이드 서열을 포함한다. 제1 뉴클레오타이드 서열 도메인(VT 도메인)과 표적 서열 사이의 상보성%는 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 63%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%일 수 있다. 가변 표적화 도메인은 적어도 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개 또는 30개 뉴클레오타이드의 길이일 수 있다.
가변 표적화 도메인은 12개 내지 30개, 12개 내지 29개, 12개 내지 28개, 12개 내지 27개, 12개 내지 26개, 12개 내지 25개, 12개 내지 26개, 12개 내지 25개, 12개 내지 24개, 12개 내지 23개, 12개 내지 22개, 12개 내지 21개, 12개 내지 20개, 12개 내지 19개, 12개 내지 18개, 12개 내지 17개, 12개 내지 16개, 12개 내지 15개, 12개 내지 14개, 12개 내지 13개, 13개 내지 30개, 13개 내지 29개, 13개 내지 28개, 13개 내지 27개, 13개 내지 26개, 13개 내지 25개, 13개 내지 26개, 13개 내지 25개, 13개 내지 24개, 13개 내지 23개, 13개 내지 22개, 13개 내지 21개, 13개 내지 20개, 13개 내지 19개, 13개 내지 18개, 13개 내지 17개, 13개 내지 16개, 13개 내지 15개, 13개 내지 14개, 14개 내지 30개, 14개 내지 29개, 14개 내지 28개, 14개 내지 27개, 14개 내지 26개, 14개 내지 25개, 14개 내지 26개, 14개 내지 25개, 14개 내지 24개, 14개 내지 23개, 14개 내지 22개, 14개 내지 21개, 14개 내지 20개, 14개 내지 19개, 14개 내지 18개, 14개 내지 17개, 14개 내지 16개, 14개 내지 15개, 15개 내지 30개, 15개 내지 29개, 15개 내지 28개, 15개 내지 27개, 15개 내지 26개, 15개 내지 25개, 15개 내지 26개, 15개 내지 25개, 15개 내지 24개, 15개 내지 23개, 15개 내지 22개, 15개 내지 21개, 15개 내지 20개, 15개 내지 19개, 15개 내지 18개, 15개 내지 17개, 15개 내지 16개, 16개 내지 30개, 16개 내지 29개, 16개 내지 28개, 16개 내지 27개, 16개 내지 26개, 16개 내지 25개, 16개 내지 24개, 16개 내지 23개, 16개 내지 22개, 16개 내지 21개, 16개 내지 20개, 16개 내지 19개, 16개 내지 18개, 16개 내지 17개, 17개 내지 30개, 17개 내지 29개, 17개 내지 28개, 17개 내지 27개, 17개 내지 26개, 17개 내지 25개, 17개 내지 24개, 17개 내지 23개, 17개 내지 22개, 17개 내지 21개, 17개 내지 20개, 17개 내지 19개, 17개 내지 18개, 18개 내지 30개, 18개 내지 29개, 18개 내지 28개, 18개 내지 27개, 18개 내지 26개, 18개 내지 25개, 18개 내지 24개, 18개 내지 23개, 18개 내지 22개, 18개 내지 21개, 18개 내지 20개, 18개 내지 19개, 19개 내지 30개, 19개 내지 29개, 19개 내지 28개, 19개 내지 27개, 19개 내지 26개, 19개 내지 25개, 19개 내지 24개, 19개 내지 23개, 19개 내지 22개, 19개 내지 21개, 19개 내지 20개, 20개 내지 30개, 20개 내지 29개, 20개 내지 28개, 20개 내지 27개, 20개 내지 26개, 20개 내지 25개, 20개 내지 24개, 20개 내지 23개, 20개 내지 22개, 20개 내지 21개, 21개 내지 30개, 21개 내지 29개, 21개 내지 28개, 21개 내지 27개, 21개 내지 26개, 21개 내지 25개, 21개 내지 24개, 21개 내지 23개, 21개 내지 22개, 22개 내지 30개, 22개 내지 29개, 22개 내지 28개, 22개 내지 27개, 22개 내지 26개, 22개 내지 25개, 22개 내지 24개, 22개 내지 23개, 23개 내지 30개, 23개 내지 29개, 23개 내지 28개, 23개 내지 27개, 23개 내지 26개, 23개 내지 25개, 23개 내지 24개, 24개 내지 30개, 24개 내지 29개, 24개 내지 28개, 24개 내지 27개, 24개 내지 26개, 24개 내지 25개, 25개 내지 30개, 25개 내지 29개, 25개 내지 28개, 25개 내지 27개, 25개 내지 26개, 26개 내지 30개, 26개 내지 29개, 26개 내지 28개, 26개 내지 27개, 27개 내지 30개, 27개 내지 29개, 27개 내지 28개, 28개 내지 30개, 28개 내지 29개, 또는 29개 내지 30개의 연속된 뉴클레오타이드의 스트레치를 포함할 수 있다.
가변 표적화 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열, 또는 임의의 이들의 조합으로 구성될 수 있다. VT 도메인은 원핵생물 또는 진핵생물 DNA로부터 유래된 표적 서열에 상보적일 수 있다.
용어 (가이드 폴리뉴클레오타이드의) "Cas 엔도뉴클레아제 인식 도메인" 또는 "CER 도메인"은 본원에서 상호 교환적으로 사용되며, Cas 엔도뉴클레아제 폴리펩타이드와 상호작용하는 뉴클레오타이드 서열을 포함한다. CER 도메인은 tracr뉴클레오타이드 메이트 서열 다음에 tracr뉴클레오타이드 서열을 포함한다. CER 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열(예를 들어, 그 전체가 본원에 참조로 포함된, 2015년 2월 26일 공개된 US 2015-0059010 A1 참조), 또는 임의의 이들의 조합으로 구성될 수 있다.
단일 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드를 연결하는 뉴클레오타이드 서열은 RNA 서열, DNA 서열, 또는 RNA-DNA 조합 서열을 포함할 수 있다. 일 구현예에서, 단일 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드를 연결하는 뉴클레오타이드 서열("루프"라고도 칭함)은 적어도 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개, 71개, 72개, 73개, 74개, 75개, 76개, 77개, 78개, 78개, 79개, 80개, 81개, 82개, 83개, 84개, 85개, 86개, 87개, 88개, 89개, 90개, 91개, 92개, 93개, 94개, 95개, 96개, 97개, 98개, 99개 또는 100개의 뉴클레오타이드의 길이일 수 있다. 루프는 3개 내지 4개, 3개 내지 5개, 3개 내지 6개, 3개 내지 7개, 3개 내지 8개, 3개 내지 9개, 3개 내지 10개, 3개 내지 11개, 3개 내지 12개, 3개 내지 13개, 3개 내지 14개, 3개 내지 15개, 3개 내지 20개, 3개 내지 30개, 3개 내지 40개, 3개 내지 50개, 3개 내지 60개, 3개 내지 70개, 3개 내지 80개, 3개 내지 90개, 3개 내지 100개, 4개 내지 5개, 4개 내지 6개, 4개 내지 7개, 4개 내지 8개, 4개 내지 9개, 4개 내지 10개, 4개 내지 11개, 4개 내지 12개, 4개 내지 13개, 4개 내지 14개, 4개 내지 15개, 4개 내지 20개, 4개 내지 30개, 4개 내지 40개, 4개 내지 50개, 4개 내지 60개, 4개 내지 70개, 4개 내지 80개, 4개 내지 90개, 4개 내지 100개, 5개 내지 6개, 5개 내지 7개, 5개 내지 8개, 5개 내지 9개, 5개 내지 10개, 5개 내지 11개, 5개 내지 12개, 5개 내지 13개, 5개 내지 14개, 5개 내지 15개, 5개 내지 20개, 5개 내지 30개, 5개 내지 40개, 5개 내지 50개, 5개 내지 60개, 5개 내지 70개, 5개 내지 80개, 5개 내지 90개, 5개 내지 100개, 6개 내지 7개, 6개 내지 8개, 6개 내지 9개, 6개 내지 10개, 6개 내지 11개, 6개 내지 12개, 6개 내지 13개, 6개 내지 14개, 6개 내지 15개, 6개 내지 20개, 6개 내지 30개, 6개 내지 40개, 6개 내지 50개, 6개 내지 60개, 6개 내지 70개, 6개 내지 80개, 6개 내지 90개, 6개 내지 100개, 7개 내지 8개, 7개 내지 9개, 7개 내지 10개, 7개 내지 11개, 7개 내지 12개, 7개 내지 13개, 7개 내지 14개, 7개 내지 15개, 7개 내지 20개, 7개 내지 30개, 7개 내지 40개, 7개 내지 50개, 7개 내지 60개, 7개 내지 70개, 7개 내지 80개, 7개 내지 90개, 7개 내지 100개, 8개 내지 9개, 8개 내지 10개, 8개 내지 11개, 8개 내지 12개, 8개 내지 13개, 8개 내지 14개, 8개 내지 15개, 8개 내지 20개, 8개 내지 30개, 8개 내지 40개, 8개 내지 50개, 8개 내지 60개, 8개 내지 70개, 8개 내지 80개, 8개 내지 90개, 8개 내지 100개, 9개 내지 10개, 9개 내지 11개, 9개 내지 12개, 9개 내지 13개, 9개 내지 14개, 9개 내지 15개, 9개 내지 20개, 9개 내지 30개, 9개 내지 40개, 9개 내지 50개, 9개 내지 60개, 9개 내지 70개, 9개 내지 80개, 9개 내지 90개, 9개 내지 100개, 10개 내지 20개, 20개 내지 30개, 30개 내지 40개, 40개 내지 50개, 50개 내지 60개, 70개 내지 80개, 80개 내지 90개, 또는 90개 내지 100개의 뉴클레오타이드 길이일 수 있다.
다른 양태에서, 단일 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드를 연결하는 뉴클레오타이드 서열은 테트라루프 서열, 예컨대, GAAA 테트라루프 서열을 포함할 수 있지만, 이에 한정되는 것은 아니다.
단일 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 단일 가이드 RNA를 포함한다. 용어 "단일 가이드 RNA" 및 "sgRNA"는 본원에서 상호 교환적으로 사용되며, tracrRNA(전사-촉진 CRISPR RNA)에 융합된 (tracrRNA에 혼성화하는 tracr 메이트 서열에 연결된) 가변 표적화 도메인을 포함하는 crRNA(CRISPR RNA)인, 2개의 RNA 분자의 합성 융합과 관련된다. 자연에서 함께 발견되지 않는(즉, 이들은 서로 이종성임) 영역을 포함하는 키메라성 비자연 발생 가이드 RNA. 예를 들어, 제1 뉴클레오타이드 서열 및 제2 뉴클레오타이드 서열이 자연에서 함께 연결되는 것으로 발견되지 않도록, Cas 엔도뉴클레아제를 인식할 수 있는 제2 뉴클레오타이드 서열에 연결된 표적 DNA에서 뉴클레오타이드 서열에 혼성화할 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 칭함)을 포함하는 키메라성 비자연 발생 가이드 RNA.
키메라성 비자연 발생 가이드 RNA는 II형 Cas 엔도뉴클레아제, 예컨대 본원에 기재된 Cas9 엔도뉴클레아제 변이체와 복합체를 형성할 수 있는 II형 CRISPR/Cas 시스템의 crRNA 및/또는 tracrRNA를 포함할 수 있고, 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 지시하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일-이중 가닥 파괴를 도입)하게 할 수 있다.
가이드 폴리뉴클레오타이드의 생산 및 안정화
가이드 폴리뉴클레오타이드는 가이드 폴리뉴클레오타이드(예컨대, 비제한적인 예로서 Hendel et al. 2015, Nature Biotechnology 33, 985-989), 시험관내 생성된 가이드 폴리뉴클레오타이드, 및/또는 자가-스플라이싱 가이드 RNA(예컨대, 비제한적인 예로서 Xie et al. 2015, PNAS 112:3570-3575)를 화학적으로 합성하는 것을 포함하여 당해 분야에 공지된 임의의 방법에 의해 생산될 수 있다.
Cas9-매개 DNA 표적화를 수행하기 위한 진핵생물 세포에서의 가이드 RNA와 같은 RNA 성분을 발현하는 방법은 정확히 정의되고 변형되지 않은 5'- 및 3'-말단을 갖는 RNA의 전사를 허용하는 RNA 중합효소 III(Pol III) 프로모터를 사용하는 것이었다(DiCarlo et al., Nucleic Acids Res. 41: 4336-4343; Ma et al., Mol. Ther. Nucleic Acids 3:e161). 상기 전략은 옥수수 및 대두를 포함하는 몇몇 상이한 종의 세포에서 성공적으로 적용되었다(2015년 3월 19일 공개된 US20150082478). 5' 캡을 갖지 않는 RNA 성분을 발현하는 방법이 기술되었다(2016년 2월 18일 공개된 WO2016/025131).
일부 양태에서, 당해 핵산(예를 들어, 가이드 폴리뉴클레오타이드, 가이드 폴리뉴클레오타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산; Cas 단백질을 암호화하는 핵산; crRNA, crRNA를 암호화하는 뉴클레오타이드 또는 tracrRNA 또는 tracrRNA를 암호화하는 뉴클레오타이드, VT 도메인을 암호화하는 뉴클레오타이드, CPR 도메인을 암호화하는 뉴클레오타이드 등)은 추가적인 원하는 특징(예를 들어, 변형된 또는 조절된 안정성; 세포이하 표적화; 추적, 예를 들어, 형광 표지; 단백질 또는 단백질 복합체에 대한 결합 부위; 등)을 제공하는 변형 또는 서열을 포함한다. 가이드 폴리뉴클레오타이드, VT 도메인 및/또는 CER 도메인의 뉴클레오타이드 서열 변형은 5' 캡, 3' 폴리아데닐화 꼬리, 리보스위치 서열, 안정성 조절 서열, dsRNA 듀플렉스를 형성하는 서열, 가이드 폴리뉴클레오타이드를 세포이하 위치로 표적화하는 변형 또는 서열, 추적을 제공하는 변형 또는 서열, 단백질에 대한 결합 부위를 제공하는 변형 또는 서열, 잠김 핵산(LNA), 5-메틸 dC 뉴클레오타이드, 2,6-디아미노퓨린 뉴클레오타이드, 2'-플루오로 A 뉴클레오타이드, 2'-플루오로 U 뉴클레오타이드; 2'-O-메틸 RNA 뉴클레오타이드, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18 분자에 대한 연결, 5'에서 3'으로의 공유 연결, 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택될 수 있지만, 이에 한정되는 것은 아니다. 이러한 변형은 적어도 하나의 추가적인 유리한 특징을 가져올 수 있고, 여기서 추가적인 유리한 특징은 변형된 또는 조절된 안정성, 세포이하 표적화, 추적, 형광 표지, 단백질 또는 단백질 복합체에 대한 결합 부위, 상보적인 표적 서열에 대한 변형된 결합 친화도, 세포 분해에 대한 변형된 저항성 및 증가된 세포 투과성의 군으로부터 선택된다.
용어 "5'-캡" 및 "7-메틸구아닐레이트(m7G) 캡"은 본원에서 상호 교환적으로 사용된다. 7-메틸구아닐레이트 잔기는 진핵생물에서 메신저 RNA(mRNA)의 5' 말단에 위치한다. RNA 중합효소 II(Pol II)는 진핵생물에서 mRNA를 전사한다. 메신저 RNA 캡핑은 일반적으로 다음과 같이 일어난다: mRNA 전사체의 가장 말단 5' 포스페이트기가 RNA 말단 포스파타아제에 의해 제거되어 2개의 말단 포스페이트를 남긴다. 구아노신 모노포스페이트(GMP)가 구아닐릴 트랜스퍼라아제에 의해 전사체의 말단 포스페이트에 부가되어 전사체 말단에 5'-5' 트리포스페이트-연결된 구아닌을 남긴다. 마지막으로, 이 말단 구아닌의 7-질소가 메틸 트랜스퍼라아제에 의해 메틸화된다.
유도된 Cas 시스템
본원에 사용된 바와 같이, 용어 "가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체", "가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템", "가이드 폴리뉴클레오타이드/Cas 복합체", "가이드 폴리뉴클레오타이드/Cas 시스템", "유도된 Cas 시스템", "폴리뉴클레오타이드-유도된 엔도뉴클레아제", "PGEN"은 본원에서 상호 교환적으로 사용되며, 복합체를 형성할 수 있는 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 Cas 엔도뉴클레아제를 지칭하며, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 지시하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일 또는 이중 가닥 파괴를 도입)하게 할 수 있다. 본원에서 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 Cas 단백질(들), 또는 이의 단편 및 변이체, 및 임의의 공지된 CRISPR 시스템의 적합한 폴리뉴클레오타이드 성분(들)을 포함할 수 있다(Horvath and Barrangou, 2010, Science 327:167-170; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15; Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13). Cas 엔도뉴클레아제는 표적 서열에서 DNA 듀플렉스를 풀고, Cas 단백질과의 복합체인 폴리뉴클레오타이드(예컨대, 비제한적인 예로서 crRNA 또는 가이드 RNA)에 의한 표적 서열의 인식에 의해 매개되는 것처럼 적어도 하나의 DNA 가닥을 선택적으로 절단한다. 통상적으로 Cas 엔도뉴클레아제에 의한 이러한 표적 서열의 인식 및 절단은 정확한 프로토스페이서-인접 모티프(PAM: protospacer-adjacent motif)가 DNA 표적 서열의 3' 말단에 위치하거나 인접한 경우 발생한다. 대안적으로, 본원의 Cas 단백질은 DNA 절단 또는 닉킹 활성이 없을 수 있지만, 적합한 RNA 성분과 복합체를 형성한 경우 여전히 DNA 표적 서열에 특이적으로 결합할 수 있다.
DNA 표적 서열의 가닥 둘 다를 절단할 수 있는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 통상적으로 이의 엔도뉴클레아제 도메인 모두를 기능적 상태(functional state)로 가지는 Cas 단백질을 포함한다(예를 들어, 야생형 엔도뉴클레아제 도메인 또는 각각의 엔도뉴클레아제 도메인에서 일부 또는 모든 활성을 보유하는 이들의 변이체). 따라서, 야생형 Cas 단백질(예를 들어, 본원에 개시된 Cas 단백질) 또는 Cas 단백질의 각각의 엔도뉴클레아제 도메인에서 일부 또는 모든 활성을 보유하는 이의 변이체는 DNA 표적 서열의 가닥 둘 다를 절단할 수 있는 Cas 엔도뉴클레아제의 적절한 예이다.
DNA 표적 서열의 한 가닥을 절단할 수 있는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 본원에서 닉카아제 활성(예를 들어, 부분 절단 능력)을 갖는 것을 특징으로 할 수 있다. Cas 닉카아제는 통상적으로, Cas가 DNA 표적 서열 중 한 가닥만 절단하도록 하는(즉, 닉을 형성하도록 하는) 하나의 기능적 엔도뉴클레아제 도메인을 포함한다. 예를 들어, Cas9 닉카아제는 (i) 돌연변이체, 기능장애 RuvC 도메인 및 (ii) 기능적 HNH 도메인(예를 들어, 야생형 HNH 도메인)을 포함할 수 있다. 다른 예로서, Cas9 닉카아제는 (i) 기능적 RuvC 도메인(예를 들어, 야생형 RuvC 도메인) 및 (ii) 돌연변이체, 기능장애 HNH 도메인을 포함할 수 있다. 다른 예로서, Cas9 닉카아제는 (i) 기능적 RuvC 도메인(예를 들어, 야생형 RuvC 도메인) 및 (ii) 돌연변이체, 기능장애 HNH 도메인을 포함할 수 있다.
본원에서 사용하기에 적합한 Cas9 닉카아제의 비제한적인 예는 문헌[Gasiunas et al. (Proc. Natl. Acad. Sci. U.S.A. 109:E2579-E2586), Jinek et al. (Science 337:816-821), Sapranauskas et al. (Nucleic Acids Res. 39:9275-9282)] 및 미국 특허 출원 공개 제2014/0189896호(본원에 참조로 포함됨)에 의해 개시된다.
예를 들어, 본원의 Cas9 닉카아제는 Asp-31 치환(예를 들어, Asp-31-Ala)(돌연변이체 RuvC 도메인의 예), 또는 His-865 치환(예를 들어, His-865-Ala), Asn-882 치환(예를 들어, Asn-882-Ala), 또는 Asn-891 치환(예를 들어, Asn-891-Ala)(돌연변이체 HNH 도메인의 예)을 갖는 S. 써모필러스 Cas9를 포함할 수 있다. 또한, 예를 들어, 본원의 Cas9 닉카아제는 Asp-10 치환(예를 들어, Asp-10-Ala), Glu-762 치환(예를 들어, Glu-762-Ala), 또는 Asp-986 치환(예를 들어, Asp-986-Ala)(돌연변이체 RuvC 도메인의 예), 또는 His-840 치환(예를 들어, His-840-Ala), Asn-854 치환(예를 들어, Asn-854-Ala), 또는 Asn-863 치환(예를 들어, Asn-863-Ala)(돌연변이체 HNH 도메인의 예)을 갖는 S. 피오제네스 Cas9를 포함할 수 있다. S. 피오제네스 Cas9에 관하여, 3개의 RuvC 서브도메인은 일반적으로 각각 1번 내지 59번, 718번 내지 769번 및 909번 내지 1098번 아미노산 잔기에 위치하고, HNH 도메인은 775번 내지 908번 아미노산 잔기에 위치한다(Nishimasu et al., Cell 156:935-949).
본원의 Cas9 닉카아제는 개시된 발명의 숙주 세포에서 다양한 목적을 위해 사용될 수 있다. 예를 들어, Cas9 닉카아제는 적합한 공여 폴리뉴클레오타이드를 갖는 DNA 표적 부위 서열에서 또는 그 부근에서 HR을 촉진하도록 사용될 수 있다. 닉킹된 DNA는 NHEJ 과정에 대한 기질은 아니지만 HR 과정에 의해 인식되므로, 특정 표적 부위에서 DNA를 닉킹하는 것은 그 자리가 적합한 공여 폴리뉴클레오타이드로 HR을 더 잘 수용할 수 있게 해야 한다.
DNA 표적화의 특이성을 증가시키기 위해 한 쌍의 Cas 닉카아제가 사용될 수 있다. 일반적으로, 이는, RNA 성분이 상이한 가이드 서열과 회합되어 있기 때문에, 원하는 표적화를 위한 영역에서 반대 가닥 상의 가까운 DNA 서열을 표적화하고 닉킹하는 2개의 Cas 닉카아제를 제공함으로써 수행될 수 있다. 각각의 DNA 가닥의 이러한 가까운 절단은 이중 가닥 파괴(즉, 단일-가닥 오버행을 갖는 DSB)를 생성하고, 이는 이어서 비상동 말단 연결, NHEJ(돌연변이로 이어지는 불완전한 복구 경향이 있음) 또는 HR인 상동성 재결합을 위한 기질로서 인정된다. 이러한 구현예에서 각각의 닉은 예를 들어 서로 적어도 약 5개, 10개, 15개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개 또는 100개(또는 5개와 100개 사이의 임의의 정수)의 염기만큼 이격될 수 있다. 본원의 1개 또는 2개의 Cas 닉카아제 단백질이 Cas 닉카아제 쌍에서 사용될 수 있다. 예를 들어, 돌연변이체 RuvC 도메인을 갖지만 기능적 HNH 도메인을 갖는 Cas9 닉카아제(즉, Cas9 HNH+/RuvC-)(예를 들어, 스트렙토코커스 피오제네스 Cas9 HNH+/RuvC-)가 사용될 수 있다. 각각의 Cas9 닉카아제(예를 들어, Cas9 HNH+/RuvC-)는 각각의 닉카아제를 각각의 특정 DNA 부위로 표적화하는 가이드 RNA 서열을 갖는 본원의 적합한 RNA 성분들을 사용하여 서로 가까운(100개 이하의 염기 쌍만큼 이격된) 특정 DNA 부위로 지시될 수 있다.
소정의 구현예에서 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 임의의 가닥을 절단하지 않는다. 이러한 복합체는 모든 뉴클레아제 도메인이 돌연변이체 기능장애인 Cas 단백질을 포함할 수 있다. 예를 들어, DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 임의의 가닥을 절단하지 않는 본원의 Cas9 단백질은 돌연변이체 기능장애 RuvC 도메인 및 돌연변이체 기능장애 HNH 도메인 둘 다를 포함할 수 있다. 이러한 Cas9 단백질의 비제한적인 예는 상기 개시된 RuvC 및 HNH 뉴클레아제 도메인 돌연변이 중 임의의 것(예를 들어, Asp-10 치환, 예컨대 Asp-10-Ala 및 His-840 치환, 예컨대 His-840-Ala을 갖는 S. 피오제네스 Cas9)이 포함된다. 표적 DNA 서열에 결합하지만 이를 절단하지 않는 본원의 Cas 단백질은 유전자 발현을 조절하는 데 사용될 수 있으며, 예를 들어, 이 경우 Cas 단백질은 전사 인자(또는 이의 일부)(예를 들어, 억제물질 또는 활성물질, 예컨대, 본원에 개시된 것들 중 임의의 것)와 융합될 수 있다. 예를 들어, Asp-10 치환(예를 들어, Asp-10-Ala) 및 His-840 치환(예를 들어, His-840-Ala)을 갖는 S. 피오제네스 Cas9를 포함하는 Cas9는 VP16 또는 VP64 전사 활성인자 도메인에 융합될 수 있다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 본원에 기재된 Cas 엔도뉴클레아제 변이체, 또는 이의 활성 단편을 포함할 수 있고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있다.
일 양태에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체이고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체는 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 이의 모 Cas 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대, 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 감소된 오프타깃 절단, 또는 임의의 이들의 조합을 갖는다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체이고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 이의 HNH 및 RuVC 도메인 밖의 위치에서 적어도 하나의 아미노산 치환을 갖는 본원에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체일 수 있고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 155번 위치에서 적어도 하나의 아미노산 치환을 갖는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체일 수 있고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 86번 위치에서 제1 아미노산 치환 및 98번 위치에서 제2 아미노산 치환의 적어도 2개의 아미노산 치환을 갖는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
용어 "가이드 RNA/Cas 엔도뉴클레아제 복합체", "가이드 RNA/Cas 엔도뉴클레아제 시스템", "가이드 RNA/Cas 복합체", "가이드 RNA/Cas 시스템", "gRNA/Cas 복합체", "gRNA/Cas 시스템", "RNA-유도된 엔도뉴클레아제", "RGEN"은 본원에서 상호 교환적으로 사용되며, 복합체를 형성할 수 있는 적어도 하나의 RNA 성분 및 적어도 하나의 Cas 엔도뉴클레아제를 지칭하고, 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 지시하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일 또는 이중 가닥 파괴를 도입)하게 할 수 있다.
본원에 기재된 유도된 Cas 시스템은 하나 이상의 발현 작제물로부터 숙주 세포에서 발현될 수 있다. 일부 양태에서, 본원에 기재된 Cas 엔도뉴클레아제 변이체는 원핵생물 또는 진핵생물 세포에서의 Cas 단백질의 발현을 지시하는 발현 카세트로부터 발현될 수 있고, 가이드 폴리뉴클레오타이드는 원핵생물 또는 진핵생물 세포에서의 가이드 폴리뉴클레오타이드의 발현을 지시하는 제2 발현 카세트로부터 발현될 수 있다.
본 발명은 원핵생물 또는 진핵생물 세포/유기체에서 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 가이드 RNA/Cas 시스템을 발현하기 위한 발현 작제물을 추가로 제공한다.
발현 카세트 및 재조합 DNA 작제물
본원에 개시된 폴리뉴클레오타이드는 관심 유기체에서의 발현을 위해 발현 카세트(DNA 작제물이라고도 칭함)에 제공될 수 있다. 본원에 사용된 바와 같이, 용어 "발현"은 전구체 또는 성숙 형태의 기능적 최종 산물(예컨대, crRNA, tracrRNA, mRNA, 가이드 RNA 또는 폴리펩타이드(단백질))의 생산을 지칭한다. 용어 "발현"은 폴리펩타이드의 생산에 관여된 임의의 단계를 포함하며, 이것은 전사, 전사 후 변형, 번역, 번역 후 변형 및 분비를 포함하지만, 이에 한정되는 것은 아니다.
발현 카세트는 본원에 개시된 바와 같은 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다.
"작동 가능하게 연결된"은 2개 이상의 요소들 사이에 기능적 연결을 의미하도록 의도된다. 예를 들어, 관심 폴리뉴클레오타이드와 조절 서열(예를 들어, 프로모터) 사이의 작동적 연결은 관심 폴리뉴클레오타이드의 발현을 허용하는 기능적 연결이다(즉, 관심 폴리뉴클레오타이드는 프로모터의 전사 제어 하에 있음). 작동 가능하게 연결된 요소는 연속 또는 불연속일 수 있다. 작동 가능하게 연결되었다는 것은 2개의 단백질 암호화 영역의 연결을 지칭하도록 사용될 때 암호화 영역이 동일한 리딩 프레임에 있다는 것이 의도된다.
본원에 개시된 발현 카세트는 5'-3' 방향으로 숙주 세포(예를 들어, 진핵생물 세포)에서 기능적인 전사, 전사 및 번역 개시 영역(즉, 프로모터), 관심 폴리뉴클레오타이드, 및 전사 및 번역 종결 영역(즉, 종결 영역)을 포함할 수 있다. 발현 카세트는 또한 본원에서 그 외 기재된 조절 영역의 전사 조절 하에 있는 폴리뉴클레오타이드의 삽입을 위해 복수의 제한 부위 및/또는 재조합 부위가 제공된다. 조절 영역(즉, 프로모터, 전사 조절 영역 및 번역 종결 영역) 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 자연적/유사할 수 있다. 대안적으로, 조절 영역 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 이종일 수 있다. 본원에 사용된 바와 같이, 폴리뉴클레오타이드 또는 폴리펩타이드 서열과 관련하여 "이종"은 외래 종으로부터 기원한 서열이거나, 동일한 종 유래이면 의도적인 인간 중재에 의해 조성물에서의 이의 자연적인 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형된다. 예를 들어, 이종 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터는 폴리뉴클레오타이드가 유래된 종과 상이한 종 기원이거나, 동일한/유사한 종 유래이면 하나 또는 둘 다는 이의 원래의 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형되거나, 프로모터는 작동 가능하게 연결된 폴리뉴클레오타이드에 대해 자연적인 프로모터가 아니다. 본원에 사용된 바와 같이, 달리 기재되지 않는 한, 키메라성 폴리뉴클레오타이드는 암호화 서열에 이종인 전사 개시 영역에 작동 가능하게 연결된 암호화 서열을 포함한다.
소정의 구현예에서, 본원에 개시된 폴리뉴클레오타이드는 본원에서 그 외 개시되거나 당해 분야에 공지된 바대로 관심 폴리뉴클레오타이드 서열 또는 발현 카세트의 임의의 조합에 의해 포개질 수 있다. 포개진 폴리뉴클레오타이드는 초기 폴리뉴클레오타이드와 동일한 프로모터에 작동 가능하게 연결될 수 있거나, 별도의 프로모터 폴리뉴클레오타이드에 작동 가능하게 연결될 수 있다.
발현 카세트는 상응하는 종결 영역과 함께 관심 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함할 수 있다. 종결 영역은 전사 개시 영역에 자연적일 수 있거나, 작동 가능하게 연결된 관심 폴리뉴클레오타이드에 또는 프로모터 서열에 자연적일 수 있거나, 숙주 유기체에 자연적일 수 있거나, 또 다른 원천으로부터 유래(즉, 외래 또는 이종)될 수 있다. 편리한 종결 영역은 원핵생물 리보솜 RNA 오페론으로부터의 람다 파지 t0 종결 영역 또는 강한 종결자와 같은 파지 서열로부터 이용 가능하다. 편리한 종결 영역은 옥토핀 합성효소 및 노팔린 합성효소 종결 영역과 같은 A. 투메파시엔스의 Ti-플라스미드로부터 이용 가능하다. 또한 문헌[Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al. (1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell 2:1261-1272; Munroe et al. (1990) Gene 91:151-158; Ballas et al. (1989) Nucleic Acids Res. 17:7891-7903; 및 Joshi et al. (1987) Nucleic Acids Res. 15:9627-9639]을 참조한다.
적절한 경우, 관심 폴리뉴클레오타이드는 형질전환된 또는 표적화된 유기체에서 증가된 발현을 위해 최적화될 수 있다. 예를 들어, 폴리뉴클레오타이드는 개선된 발현을 위한 유기체-바람직한 코돈을 사용하도록 합성되거나 변경될 수 있다.
추가적인 서열 변형은 세포 숙주에서 유전자 발현을 향상시키는 것으로 공지되어 있다. 이들은 가짜 폴리아데닐화 신호를 암호화하는 서열, 엑손-인트론 스플라이스 부위 신호, 트랜스포존-유사 반복부 및 유전자 발현에 유해할 수 있는 다른 이러한 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 세포에서 발현되는 공지된 유전자를 참조하여 계산되는 주어진 세포 숙주에 대해 평균인 수준으로 조정될 수 있다. 가능한 경우, 서열은 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
발현 카세트는 5' 리더 서열을 추가로 함유할 수 있다. 이러한 리더 서열은 번역을 향상시키도록 작용할 수 있다. 5' 비번역된 영역과 상호 교환적으로 사용되는 5' 리더 서열은 널리 공지되고 잘 규명된 박테리아 UTR, 예컨대 바실러스 서브틸리스 aprE 유전자 또는 바실러스 리케니포르미스 amyl 유전자 또는 임의의 박테리아 리보솜 단백질 유전자로부터의 것에서 나올 수 있다. 번역 리더는 당해 분야에 공지되어 있고, 피코르나바이러스 리더, 예를 들어, EMCV 리더(뇌심근염 5' 비암호화 영역)(Elroy-Stein et al. (1989) Proc. Natl. Acad. Sci. USA 86:6126-6130); 포티바이러스 리더, 예를 들어, TEV 리더(담배 식각 바이러스(Tobacco Etch Virus))(Gallie et al. (1995) Gene 165(2):233-238), MDMV 리더(옥수수 위축 모자이크 바이러스(Maize Dwarf Mosaic Virus))(Johnson et al. (1986) Virology 154:9-20) 및 인간 면역글로불린 중쇄 결합 단백질(BiP)(Macejak et al. (1991) Nature 353:90-94); 알팔파 모자이크 바이러스의 코트 단백질 mRNA(AMV RNA 4)로부터의 비번역된 리더(Jobling et al. (1987) Nature 325:622-625); 담배 모자이크 바이러스 리더(TMV(tobacco mosaic virus leader))(Gallie et al. (1989) in Molecular Biology of RNA, ed. Cech (Liss, New York), pp. 237-256); 및 옥수수 황색얼룩 반점 바이러스 리더(MCMV(maize chlorotic mottle virus leader))(Lommel et al. (1991) Virology 81:382-385)를 포함한다. 또한, 문헌[Della-Cioppa et al. (1987) Plant Physiol. 84:965-968]을 참조한다. 번역을 향상시키는 것으로 공지된 다른 방법, 예를 들어 인트론 등을 또한 사용할 수 있다.
발현 카세트를 제조할 때에, 다양한 DNA 단편은 적절한 배향으로, 그리고 적절한 바대로, 적절한 리딩 프레임에서 DNA 서열을 제공하도록 조작될 수 있다. 이를 위해, 어댑터 또는 링커는 DNA 단편을 연결하도록 사용될 수 있거나, 다른 조작은 편리한 제한 부위, 필요치 않은 DNA의 제거, 제한 부위의 제거 등을 제공하도록 관여될 수 있다. 이 목적을 위해, 시험관내 돌연변이유발, 프라이머 보수, 제한, 어닐링, 재치환, 예를 들어 전이 및 전환이 관여될 수 있다.
일부 구현예에서, 가이드 뉴클레오타이드 및/또는 Cas 단백질을 암호화하는 뉴클레오타이드 서열은 제어 요소, 예를 들어 전사 제어 요소, 예컨대 프로모터에 작동 가능하게 연결된다. 전사 제어 요소는 진핵생물 세포, 예를 들어 식물, 포유류 세포 또는 진균 세포; 또는 원핵생물 세포(예를 들어, 박테리아 또는 고세균 세포) 중 어느 하나에서 기능성일 수 있다. 일부 구현예에서, 가이드 뉴클레오타이드 및/또는 Cas 단백질을 암호화하는 뉴클레오타이드 서열은 원핵생물 및 진핵생물 세포 둘 다에서 가이드 뉴클레오타이드 및/또는 Cas 단백질을 암호화하는 뉴클레오타이드 서열의 발현을 허용하는 다수의 제어 요소에 작동 가능하게 연결된다.
적합한 진핵생물 프로모터(진핵생물 세포에서 기능적인 프로모터)의 비제한적인 예는 사이토메갈로바이러스(CMV) 급초기, 단순 포진 바이러스(HSV) 티미딘 키나제, 초기 및 후기 SV40, 레트로바이러스로부터의 긴 말단 반복부(LTR: long terminal repeat) 및 마우스 메탈로티오네인-I로부터의 것을 포함한다. 발현 카세트는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 함유할 수 있다. 발현 카세트는 또한 진핵생물 세포에서 가이드 뉴클레오타이드 및/또는 Cas 단백질을 핵으로 지시하도록 하나 이상의 핵 국재화 서열(NLS 서열)을 함유할 수 있다. 발현 카세트는 또한 발현을 증폭시키기 위한 적절한 서열을 포함할 수 있다. 발현 카세트는 또한 Cas 단백질에 융합되어 키메라성 폴리펩타이드를 생성시키는 단백질 태그(예를 들어, 6x His 태그, 혈구응집소 태그, 녹색 형광 단백질 등)를 암호화하는 뉴클레오타이드 서열을 포함할 수 있다.
진균 숙주에서의 전사를 위해, 유용한 프로모터의 비제한적인 예는 아스퍼질러스 오리자에 TAKA 아밀라아제, 리조무코르 미에헤이 아스파르트산 단백질가수분해효소, 아스퍼질러스 니게르 중성 α-아밀라아제, 아스퍼질러스 니게르 산 안정 α-아밀라아제, 아스퍼질러스 니게르 글루코아밀라아제, 리조무코르 미에헤이 리파아제, 아스퍼질러스 오리자에 알칼리 프로테아제, 아스퍼질러스 오리자에 트리오스 포스페이트 아이소머라제, 아스퍼질러스 니둘란스 아세트아미다제 등을 암호화하는 유전자로부터 유래된 것을 포함한다. Cas 엔도뉴클레아제를 암호화하는 유전자가 E. 콜라이와 같은 박테리아 종에서 발현될 때, 적합한 프로모터는 예를 들어 T7 프로모터 및 파지 람다 프로모터를 포함하는 박테리오파지 프로모터로부터 선택될 수 있다. 앞서와 비슷한 방식으로, 효모 종에서의 발현에 적합한 프로모터의 예는 사카로마이세스 세레비시아에 및 피치아 파스토리스 AOX1 또는 AOX2 프로모터의 Gal 1 및 Gal 10 프로모터를 포함하지만, 이에 한정되는 것은 아니다. 사상균 숙주 세포에서의 발현은 대개 T. 레세이로부터의 내인성, 유도성 프로모터인 cbh1, 또는 구성적 해당성 프로모터(glycolytic promoter)(예를 들어, pki)를 수반한다. 예를 들어, 문헌[Liu et al. 2008]을 참조한다.
박테리아 숙주에서 DNA 서열(예컨대, 비제한적인 예로서 본원에 기재된 Cas 엔도뉴클레아제 변이체를 암호화하는 DNA 서열)의 전사를 지시하기 위한 프로모터의 비제한적인 예는 이. 콜라이의 lac 오페론의 프로모터, 스트렙토마이세스 코엘리컬러 아가라제 유전자 dagA 또는 celA 프로모터, 바실러스 리케니포르미스 아밀라아제 유전자(amyL)의 프로모터, 바실러스 스테아로써모필루스 말토제닉 아밀라아제 유전자(amyM)의 프로모터, 바실러스 아밀로리쿼파시엔스 아밀라아제(amyQ)의 프로모터, 바실러스 서브틸리스 xylA 및 xylB 유전자의 프로모터 등를 포함한다.
발현 카세트는 선형 DNA에, 원형 DNA에, 재조합 DNA에, 플라스미드 또는 벡터에 포함될 수 있다.
본원에 사용된 바와 같이 "재조합"은 예를 들어 화학적 합성에 의한, 또는 유전자 조작 기술에 의한 단리된 핵산 분절의 조작에 의한, 분리되었을 2개의 서열 분절의 인공 조합을 지칭한다. 용어 "재조합"은, 생물학적 성분 또는 조성물(예를 들어, 세포, 핵산, 폴리펩타이드/효소, 벡터 등)과 관련하여 사용될 때, 생물학적 성분 또는 조성물이 자연에서 발견되지 않는 상태로 있음을 나타낸다. 환언하면, 생물학적 성분 또는 조성물은 인간 개입에 의해 그의 자연 상태로부터 변형되었다. 예를 들어, 재조합 세포는 그의 자연적 모(즉, 비-재조합) 세포에서는 발견되지 않는 하나 이상의 유전자를 발현하는 세포, 하나 이상의 자연적 유전자를 그의 자연적 모 세포와는 상이한 양으로 발현하는 세포, 및/또는 하나 이상의 자연적 유전자를 그의 자연적 모 세포와는 상이한 조건 하에 발현하는 세포를 포함한다. 재조합 핵산은 하나 이상의 뉴클레오타이드에 의해 자연적 서열과 다를 수 있고/있거나, 이종 서열(예컨대, 이종 프로모터, 비자연적 또는 변이체 신호 서열을 암호화하는 서열 등)에 작동 가능하게 연결될 수 있고/있거나, 인트론 서열이 없을 수 있고/있거나 단리된 형태로 있을 수 있다. 재조합 폴리펩타이드/효소는 하나 이상의 아미노산에 의해 자연적 서열과 상이할 수 있고/있거나, 이종 서열과 융합될 수 있고/있거나, 절두될 수 있거나 아미노산의 내부 결실을 가질 수 있고/있거나, 자연적 세포에서 발견되지 않는 방식으로 (예컨대, 폴리펩타이드를 암호화하는 발현 벡터의 세포에서의 존재로 인해 폴리펩타이드를 과발현시키는 재조합 세포로부터) 발현될 수 있고/있거나, 단리된 형태로 있을 수 있다. 일부 구현예에서, 재조합 폴리뉴클레오타이드 또는 폴리펩타이드/효소는 이의 야생형 대응물과 동일하지만, (예를 들어, 단리된 또는 농후화된 형태의) 비자연적 형태로 있는 서열을 갖는다는 것이 강조된다.
본원에 사용된 바와 같이, "재조합 DNA 작제물" 또는 "재조합 DNA"는 핵산 단편의 인공 조합을 포함하는 발현 카세트를 지칭한다. 재조합 DNA 작제물은 본원에 개시된 바대로 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다.
예를 들어, 재조합 DNA 작제물은 상이한 원천으로부터 유래된 조절 서열 및 암호화 서열을 포함할 수 있다. 이러한 작제물은 자체적으로 사용되거나 벡터와 함께 사용될 수 있다. 벡터가 사용되는 경우, 벡터의 선택은 당업자에게 널리 공지된 바와 같이 숙주 세포로 벡터를 도입하기 위해 사용되는 방법에 따라 달라진다. 예를 들어, 플라스미드 벡터가 사용될 수 있다. 당업자는 숙주 세포를 성공적으로 형질전환시키고 선택하고 증식시키기 위해 벡터에 존재해야 하는 유전 요소를 잘 알고 있다. 당업자는 또한 상이한 독립적인 형질전환 이벤트가 상이한 발현 수준 및 발현 패턴으로 일어날 수 있고(Jones et al., (1985) EMBO J 4:2411-2418; De Almeida et al., (1989) Mol Gen Genetics 218:78-86), 이에 따라 원하는 발현 수준 및 발현 패턴을 디스플레이하는 세포주를 얻기 위해 여러 이벤트가 통상적으로 선별됨을 또한 인식할 것이다. 이러한 선별은 표준 분자 생물학적 분석법, 생화학적 분석법, 및 DNA의 서던 분석, mRNA 발현의 노던 분석, PCR, 실시간 정량 PCR(qPCR), 역전사 PCR(RT-PCR), 단백질 발현의 면역블로팅 분석, 효소 또는 활성 분석법, 및/또는 표현형 분석을 비롯한 기타 분석법에 의해 달성될 수 있다.
본원에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기법은 당해 분야에 널리 공지되어 있고, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)]에 보다 자세히 기술되어 있다.
일 양태에서, 재조합 DNA 작제물은 본원에 개시된 바와 같은 Cas9 엔도뉴클레아제 변이체에 작동 가능하게 연결된 이종 5' 및 3' 조절 서열을 포함한다. 이 조절 서열은 숙주 세포(예컨대, 박테리아 또는 진균 세포)에서 기능적인 전사 및 번역 개시 영역(즉, 프로모터), 핵 국재화 신호, 및 전사 및 번역 종결 영역(즉, 종결 영역)을 포함하지만, 이에 한정되는 것은 아니다.
일 양태에서, 재조합 DNA 작제물은 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 암호화하는 DNA를 포함하고, 상기 Cas9 엔도뉴클레아제 변이체는 이종 조절 요소, 예컨대 핵 국재화 서열(NLS)에 작동 가능하게 연결되거나 이를 포함한다.
일 양태에서, 본원의 발현 카세트 또는 재조합 DNA는 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터 및 본 발명의 가이드 RNA에 작동 가능하게 연결된 프로모터를 포함한다. 프로모터는 원핵생물 또는 진핵생물 세포/유기체에서 작동 가능하게 연결된 뉴클레오타이드 서열의 발현을 유도할 수 있다.
용어 "플라스미드" 또는 "벡터"는 종종 세포의 중심 대사의 일부가 아니며, 보통 이중 가닥 DNA 형태인 유전자를 보유하는 선형 또는 원형 염색체외 요소를 지칭한다. 이러한 요소는 임의의 원천으로부터 유래된 단일 또는 이중 가닥 폴리뉴클레오타이드의, 선형 또는 원형 형태의, 자율적 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있고, 다수의 뉴클레오타이드 서열은 세포로 관심 폴리뉴클레오타이드를 도입할 수 있는 고유의 구조에 연결되거나 재조합된다.
표적 부위
용어 "표적 부위", "표적 서열", "표적 부위 서열", "표적 DNA", "표적 유전자위", "게놈 표적 부위", "게놈 표적 서열", "게놈 표적 유전자위" 및 "프로토스페이서"는 본원에서 상호 교환적으로 사용되며, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체가 인식하고 결합하고 선택적으로 닉킹하거나 절단할 수 있는 세포 게놈에서의 폴리뉴클레오타이드 서열, 예컨대 비제한적인 예로서 염색체, 에피솜, 유전자이식 유전자위, 또는 임의의 다른 DNA 분자(염색체 DNA, 엽록체 DNA, 미토콘드리아 DNA, 플라스미드 DNA를 포함)에서의 뉴클레오타이드 서열을 지칭한다.
표적 부위가 세포 게놈에서의 내인성 부위일 수 있거나, 대안적으로, 표적 부위가 세포에 이종이어서 세포의 게놈에서 자연 발생하지 않을 수 있거나, 표적 부위가 자연에서 일어나는 곳과 비교하여 이종 게놈 위치에서 확인될 수 있다. 본원에 사용된 바와 같이, 용어 "내인성 표적 서열" 및 "자연적 표적 서열"은 세포 게놈에 내인성이거나 자연적이고 세포 게놈에서의 그 표적 서열의 내인성 또는 자연적 위치에 있는 표적 서열을 지칭하도록 본원에서 상호 교환적으로 사용된다. "인공 표적 부위" 또는 "인공 표적 서열"은 본원에서 상호 교환적으로 사용되며, 세포 게놈 내로 도입된 표적 서열을 지칭한다. 이러한 인공 표적 서열은 세포 게놈에서 서열이 내인성 또는 자연적 표적 서열과 동일할 수 있지만, 세포 게놈에서의 상이한 위치(즉, 비내인성 또는 비자연적 위치)에 위치할 수 있다.
"변경된 표적 부위", "변경된 표적 서열", "변형된 표적 부위", "변형된 표적 서열"은 본원에서 상호 교환적으로 사용되며, 변경되지 않은 표적 서열과 비교할 때 적어도 하나의 변경을 포함하는 본원에 개시된 바와 같은 표적 서열을 지칭한다. 이러한 "변경"은 예를 들어 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.
Cas 엔도뉴클레아제에 대한 표적 부위는 매우 특이적이고 종종 정확한 뉴클레오타이드 위치로 정의될 수 있는 반면, 일부 경우에는 원하는 게놈 변형을 위한 표적 부위는 단지 DNA 절단이 일어나는 부위, 예를 들어 게놈으로부터 결실될 게놈 유전좌위 또는 영역보다 더 광범위하게 정의될 수 있다. 따라서, 소정의 경우에, Cas/가이드 RNA DNA 절단의 활성을 통해 일어나는 게놈 변형은 표적 부위"에서 또는 그 근처에서" 일어나는 것으로 기재된다.
"표적 부위를 변형하기 위한" 및 "표적 부위를 변경하기 위한" 방법은 본원에서 상호 교환적으로 사용되며, 변경된 표적 부위를 생성하는 방법을 지칭한다.
선별 가능한 마커 표현형을 사용하지 않고 표적 부위에서 또는 그 근처에서 변경된 게놈을 갖는 세포를 확인하기 위해 다양한 방법이 이용 가능하다. 비제한적인 예로서 PCR 방법, 시퀀싱 방법, 뉴클레아제 소화, 서던 블롯, 및 이들의 임의의 조합을 포함하여 이러한 방법은 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 검출하는 것으로 볼 수 있다.
표적 DNA 서열(표적 부위)의 길이는 변할 수 있으며, 예를 들어, 길이가 적어도 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개 이상의 뉴클레오타이드 길이인 표적 부위를 포함한다. 표적 부위는 회문구조일 수도 있는데, 즉 한 가닥 상에 있는 서열이 상보적 가닥 상에서 반대 방향으로 동일하게 해독되는 것이 추가로 가능하다. 닉/절단 부위는 표적 서열 내에 있을 수 있거나, 닉/절단 부위는 표적 서열의 외부에 있을 수 있다. 또 다른 변형에서, 절단은 무딘 말단 절단부를 생성하기 위해 서로 바로 마주 보는 뉴클레오타이드 위치에서 발생할 수 있거나, 다른 경우에 "점착성 말단(sticky ends)"이라고도 불리는, 5' 오버행 또는 3' 오버행일 수 있는 단일 가닥 오버행을 생성하도록 절개가 엇갈릴 수 있다. 게놈 표적 부위의 활성 변이체가 사용될 수도 있다. 이러한 활성 변이체는 주어진 표적 부위와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있고, 활성 변이체는 생물학적 활성을 보유함으로써 Cas 엔도뉴클레아제에 의해 인식되고 절단될 수 있다.
엔도뉴클레아제에 의한 표적 부위의 단일 또는 이중 가닥 파괴를 측정하기 위한 분석법은 당해 분야에 공지되어 있고, 일반적으로 인식 부위를 함유하는 DNA 기질에서 물질의 전체 활성 및 특이성을 측정한다.
포로토스페이서 인접 모티프(PAM)
본원의 "프로토스페이서 인접 모티프"(PAM)는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제(PGEN) 시스템에 의해 인식(표적화)되는 표적 서열에 인접한 짧은 뉴클레오타이드 서열(프로토스페이서)을 지칭한다. 표적 DNA 서열 다음에 PAM 서열이 없는 경우 Cas 엔도뉴클레아제는 표적 DNA 서열을 성공적으로 인식하지 않을 수 있다. 본원의 PAM의 서열과 길이는 사용되는 Cas 단백질 또는 Cas 단백질 복합체에 따라 다를 수 있다. PAM 서열은 임의의 길이일 수 있지만, 통상적으로 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 뉴클레오타이드의 길이이다.
본원의 PAM은 통상적으로 사용되는 PGEN의 유형을 고려하여 선택된다. 본원의 PAM 서열은 예를 들어 Cas가 유래될 수 있는 본원에 개시된 임의의 종으로부터 유래된 본원에 기재된 Cas9 변이체와 같은 Cas를 포함하는 PGEN에 의해 인식되는 것일 수 있다. 소정의 구현예에서, 이러한 PAM 서열은 S. 피오제네스, S. 써모필러스, S. 아갈락티아, N. 메닝기티디스, T. 덴티콜라 또는 F. 노비시다로부터 유래된 Cas9를 포함하는 RGEN에 의해 인식되는 것일 수 있다. 예를 들어, 본원에 기재된 Cas9 Y155 변이체를 포함하는 S. 피오제네스로부터 유래된 적합한 Cas9는 NGG의 PAM 서열(N은 A, C, T 또는 G일 수 있음)을 갖는 게놈 서열을 표적화하는 데 사용될 수 있다. 다른 예로서, 적합한 Cas9는 다음과 같은 PAM 서열을 갖는 DNA 서열을 표적화하는 경우 다음의 종 중 임의의 것으로부터 유래될 수 있다: S. 써모필러스(NNAGAA), S. 아갈락티아(NGG, NNAGAAW[W는 A 또는 T임], NGGNG), N. 메닝기티디스(NNNNGATT), T. 덴티콜라(NAAAAC) 또는 F. 노비시다(NG)(여기서, 이러한 모든 특정 PAM 서열에서 N은 A, C, T 또는 G임). 본원에 유용한 Cas9/PAM의 다른 예는 문헌[Shah et al. (RNA Biology 10:891-899) 및 Esvelt et al. (Nature Methods 10:1116-1121)(본원에 참조로 포함됨)에 개시된 것을 포함한다.
유도된 Cas 단백질 시스템의 사용
본원에 제공된 조성물 및 방법은 매우 다양한 숙주 세포를 사용한다. 본원에 사용된 바와 같이, "숙주 세포"는 핵산에 대한 또는 게놈 변형 시스템(예컨대, 본원에 기재된 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템)에 대한 수혜자로서 사용되는 임의의 세포 유형(예컨대, 비제한적인 예로서 생체내 또는 시험관내 세포, 진핵생물 세포, 원핵생물 세포, 또는 단세포 집합체로서 배양된 다세포 유기체(예를 들어, 세포주)로부터의 세포)을 지칭한다. 용어 "숙주 세포"는 본원에 기재된 핵산 또는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체에 의해 형질전환된, 형질주입된 또는 형질도입된 원래의 세포의 자손을 포함한다. "재조합 숙주 세포"("유전자 변형된 숙주 세포"라고도 칭함)는 이종 핵산, 예를 들어 재조합 DNA 작제물이 도입되거나, 게놈 변형 시스템, 예컨대 본원에 기재된 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템이 도입되고 이를 포함하는 숙주 세포이다. 예를 들어, 해당 박테리아 숙주 세포는 외인성 핵산(예를 들어, 플라스미드 또는 재조합 DNA 작제물)의 적합한 박테리아 숙주 세포로의 도입에 의해 유전자 변형된 박테리아 숙주 세포를 포함하고, 해당 진핵생물 숙주 세포는 외인성 핵산의 적합한 진핵생물 숙주 세포로의 도입에 의해 유전자 변형된 진핵생물 숙주 세포(예를 들어, 진균, 포유류 생식 세포 또는 식물 세포)를 포함한다.
일부 구현예에서, 숙주 세포는 고세균 세포, 박테리아 세포, 진핵생물 세포, 진핵생물 단세포 유기체, 체세포, 생식 세포, 줄기 세포, 식물 세포, 조류 세포, 동물 세포, 무척추동물 세포, 척추동물 세포, 어류 세포, 개구리 세포, 조류 세포, 곤충 세포, 포유류 세포, 돼지 세포, 소 세포, 염소 세포, 양 세포, 설치류 세포, 래트 세포, 마우스 세포, 비인간 영장류 세포 및 인간 세포로 이루어진 군으로부터 선택된다. 일부 경우에, 세포는 시험관내이다. 일부 경우에, 세포는 생체내이다.
본원에 기재된 가이드 폴리뉴클레오타이드/Cas 시스템은 유전자 표적화를 위해 사용될 수 있다.
용어 "유전자 표적화", "표적화" 및 "DNA 표적화"는 본원에서 상호 교환적으로 사용된다. 본원의 DNA 표적화는 세포의 염색체 또는 플라스미드에서와 같은 특정 DNA 서열에서의 녹아웃, 편집 또는 녹인의 특이적 도입일 수 있다. 일반적으로, DNA 표적화는 본원에서 Cas 엔도뉴클레아제가 적합한 폴리뉴클레오타이드 성분과 회합된 세포에서의 특정 DNA 서열에서 하나의 가닥 또는 두 가닥을 절단함으로써 수행될 수 있다. 단일 또는 또는 이중 가닥 파괴가 DNA에서 유도되면, 세포의 DNA 복구 메커니즘이 활성화되어 표적 부위에서 변형을 야기할 수 있는 비상동 말단 연결(NHEJ: nonhomologous end-joining) 또는 상동 직접 복구(HDR: Homology-Directed Repair) 과정을 통해 파괴를 복구한다.
용어 "녹아웃", "유전자 녹아웃" 및 "유전적 녹아웃"은 본원에서 상호 교환적으로 사용된다. 녹아웃은 본원에 기재된 Cas9 엔도뉴클레아제 변이체와 같은 Cas 엔도뉴클레아제로 표적화함으로써 부분적으로 또는 완전히 작동하지 않게 된 세포의 DNA 서열을 나타내며; 녹아웃 이전의 이러한 DNA 서열은, 예를 들어, 아미노산 서열을 암호화할 수 있었거나 조절 기능(예를 들어, 프로모터)을 가졌을 수 있다.
본원에 기재된 바와 같이, 유도된 Cas 엔도뉴클레아제는 DNA 표적 서열을 인식하고, 이에 결합하고, 단일 가닥 파괴(닉) 또는 이중 가닥 파괴를 도입할 수 있다. 단일 또는 이중 가닥 파괴가 DNA에서 유도되면, 세포의 DNA 복구 메커니즘이 활성화되어 파괴를 복구한다. 오류가 발생하기 쉬운 DNA 복구 메커니즘은 이중 가닥 파괴 부위에서 돌연변이를 생성할 수 있다. 파괴된 말단을 하나로 합치는 가장 일반적인 복구 메커니즘은 비상동 말단 연결(NHEJ) 경로이다(Bleuyard et al., (2006) DNA Repair 5:1-12). 염색체의 구조적 완전성은 통상적으로 복구에 의해 보존되지만, 결실, 삽입 또는 다른 재배열(예컨대, 염색체 전위)이 가능하다(Siebert and Puchta, 2002, Plant Cell 14:1121-31; Pacher et al., 2007, Genetics 175:21-9).
녹아웃은 삽입-결실(표적 DNA 서열에서의 NHEJ를 통한 뉴클레오타이드 염기의 삽입 또는 결실)에 의해, 또는 표적화 부위에서의 또는 그 근처에서의 서열의 기능을 감소시키거나 완전히 파괴하는 서열의 특이적 제거에 의해 생성될 수 있다. 본원에서 용어 "삽입-결실"은 염색체 또는 에피솜에서의 표적 DNA 서열에서의 뉴클레오타이드 염기의 삽입(insertion) 또는 결실(deletion)을 지칭한다. 이러한 삽입 또는 결실은, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 염기일 수 있다. 소정의 구현예에서 삽입-결실은 더욱 커서, 적어도 약 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개 또는 100개 염기일 수 있다. 삽입-결실이 유전자의 오픈 리딩 프레임(ORF: open reading frame) 내에 도입되면, 때때로 삽입-결실은 프레임이동 돌연변이를 생성하여 ORF에 의해 암호화되는 단백질의 야생형 발현을 방해한다.
일 구현예에서, 본 발명은 세포의 게놈에서 표적 부위를 변형시키는 방법을 기재하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 도입하는 단계(여기서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체(PGEN)를 형성할 수 있음) 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계(여기서, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택됨)를 포함한다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템은 적어도 하나의 폴리뉴클레오타이드 변형 주형과 조합되어 사용되어 관심 게놈 뉴클레오타이드 서열의 편집(변형)을 가능하게 한다.
"변형된 뉴클레오타이드" 또는 "편집된 뉴클레오타이드"는 비변형된 뉴클레오타이드 서열과 비교할 때 적어도 하나의 변경을 포함하는 관심 뉴클레오타이드 서열을 지칭한다. 이러한 "변경"은 예를 들어 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.
용어 "폴리뉴클레오타이드 변형 주형"은 편집될 뉴클레오타이드 서열과 비교할 때 적어도 하나의 뉴클레오타이드 변형을 포함하는 폴리뉴클레오타이드를 포함한다. 뉴클레오타이드 변형은 적어도 하나의 뉴클레오타이드 치환, 부가 또는 결실일 수 있다. 선택적으로, 폴리뉴클레오타이드 변형 주형은 적어도 하나의 뉴클레오타이드 변형에 플랭킹한 상동 뉴클레오타이드 서열을 더 포함할 수 있고, 플랭킹한 상동 뉴클레오타이드 서열은 편집될 원하는 뉴클레오타이드 서열에 충분한 상동성을 제공한다.
일 구현예에서, 본 발명은 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드, 본원에 기재된 적어도 하나의 Cas9 엔도뉴클레아제 변이체 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계(여기서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체(PGEN)를 형성할 수 있고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함함)를 포함하고, 선택적으로 편집된 뉴클레오타이드 서열을 포함하는 적어도 하나의 세포를 선택하는 단계를 추가로 포함한다.
편집될 뉴클레오타이드는 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위 내에 또는 외부에 위치할 수 있다. 일 구현예에서, 적어도 하나의 뉴클레오타이드 변형은 본원에 기재된 Cas9 엔도뉴클레아제 변이체와 같은 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위에서의 변형이 아니다. 다른 구현예에서, 편집될 적어도 하나의 뉴클레오타이드와 게놈 표적 부위 사이에는 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 30개, 40개, 50개, 100개, 200개, 300개, 400개, 500개, 600개, 700개, 900개 또는 1000개의 뉴클레오타이드가 존재한다.
세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법은 2017년 4월 27 공개된 WO2017/070029 및 2017년 4월 27 공개된 WO2017/070032에 기재된 바와 같은 비기능적 유전자 산물에 대한 기능을 복구함으로써 외인성 선택 가능한 마커의 사용이 없는 방법일 수 있다.
용어 "녹인", "유전자 녹인", "유전자 삽입" 및 "유전적 녹인"은 본원에서 상호 교환적으로 사용된다. 녹인은 (적절한 공여 DNA 폴리뉴클레오타이드가 또한 사용되는, 상동 재조합(HR)에 의해) Cas 단백질에 의한 표적화에 의한 세포에서의 특정 DNA 서열에서의 DNA 서열의 치환 또는 삽입을 나타낸다. 녹인의 예는 유전자의 암호화 영역에서 이종 아미노산 암호화 서열의 특이적 삽입, 또는 유전자위에서 전사 조절 요소의 특이적 삽입을 들 수 있다.
Cas 엔도뉴클레아제에 대한 표적 부위에서 삽입된 관심 폴리뉴클레오타이드를 갖는 세포 또는 유기체를 얻기 위해 다양한 방법 및 조성물을 사용할 수 있다. 이러한 방법은 상동 재조합(HR)을 사용하여 표적 부위에서 관심 폴리뉴클레오타이드의 통합을 제공할 수 있다. 본원에 기재된 하나의 방법에서, 관심 폴리뉴클레오타이드는 공여 DNA 작제물을 통해 유기체 세포로 도입된다. 본원에 사용된 바와 같이, "공여 DNA"는 Cas 엔도뉴클레아제의 표적 부위로 삽입될 관심 폴리뉴클레오타이드를 포함하는 DNA 작제물이다. 공여 DNA 작제물은 관심 폴리뉴클레오타이드를 플랭킹한 제1 상동성 영역 및 제2 상동성 영역을 더 포함한다. 공여 DNA의 제1 상동성 영역 및 제2 상동성 영역은 세포 또는 유기체 게놈의 표적 부위에 존재하거나 이를 플랭킹한 제1 게놈 영역 및 제2 게놈 영역에 대해 각각 상동성을 공유한다.
공여 DNA는 가이드 폴리뉴클레오타이드로 테더링될 수 있다. 테더링된 공여 DNA는, 게놈 편집, 유전자 삽입 및 표적화된 게놈 조절에 유용한, 표적과 공여 DNA의 공동 국재화를 허용할 수 있고, 내인성 HR 기구의 기능이 매우 약해질 것으로 예상되는 유사분열 후 세포를 표적화하는 데에도 유용할 수 있다(Mali et al., 2013, Nature Methods Vol. 10: 957-963).
에피솜 DNA 분자가 이중 가닥 파괴에 결찰될 수 있는데, 예컨대 염색체 이중 가닥 파괴로 T-DNA가 통합될 수도 있다(Chilton and Que, (2003) Plant Physiol 133:956-65; Salomon and Puchta, (1998) EMBO J 17:6086-95). 예를 들어, 이중 가닥 파괴의 성숙에 관여된 엑소뉴클레아제 활성에 의해 이중 가닥 파괴 주위의 서열이 변경되면, 비분열 체세포에서의 상동 염색체, 또는 DNA 복제 후 자매 염색분체와 같은 상동 서열이 이용 가능한 경우 유전자 전환 경로는 원래의 구조를 복구할 수 있다(Molinier et al., 2004, Plant Cell 16:342-52). 이소성 및/또는 후성적 DNA 서열이 상동 재조합을 위한 DNA 복구 주형으로서 작용할 수도 있다(Puchta, (1999) Genetics 152:1173-81).
상동성 직접 복구(HDR)는 이중 가닥 및 단일 가닥 DNA 파괴를 복구하는 세포에서의 메커니즘이다. 상동성 직접 복구는 상동 재조합(HR) 및 단일 가닥 어닐링(SSA: ingle-strand annealing)을 포함한다(Lieber. 2010 Annu. Rev. Biochem. 79:181-211). 가장 일반적인 형태의 HDR은 상동 재조합(HR)이라고 하며, 공여 DNA와 수용 DNA 간의 가장 긴 서열 상동성 요건을 갖는다. 다른 형태의 HDR은 단일 가닥 어닐링(SSA) 및 절단 유도 복제를 포함하며, 이들은 HR에 비해 더 짧은 서열 상동성을 필요로 한다. 닉(단일 가닥 파괴)에서의 상동성 직접 복구는 이중 가닥 파괴에서의 HDR과 다른 메커니즘을 통해 일어날 수 있다(Davis and Maizels. PNAS (0027-8424), 111 (10), p. E924-E932).
"상동성"이란 유사한 DNA 서열을 의미한다. 예를 들어, 공여 DNA에서 발견되는 "게놈 영역에 대한 상동 영역"은 세포 또는 유기체 게놈에서의 주어진 "게놈 영역"과 유사한 서열을 갖는 DNA 영역이다. 상동성 영역은 절단된 표적 부위에서의 상동 재조합을 촉진시키는 데 충분한 임의의 길이일 수 있다. 예를 들어, 상동성 영역이 대응 게놈 영역과 상동 재조합을 겪는 데 충분한 상동성을 갖도록 상동성 영역은 적어도 5개 내지 10개, 5개 내지 15개, 5개 내지 20개, 5개 내지 25개, 5개 내지 30개, 5개 내지 35개, 5개 내지 40개, 5개 내지 45개, 5개 내지 50개, 5개 내지 55개, 5개 내지 60개, 5개 내지 65개, 5개 내지 70개, 5개 내지 75개, 5개 내지 80개, 5개 내지 85개, 5개 내지 90개, 5개 내지 95개, 5개 내지 100개, 5개 내지 200개, 5개 내지 300개, 5개 내지 400개, 5개 내지 500개, 5개 내지 600개, 5개 내지 700개, 5개 내지 800개, 5개 내지 900개, 5개 내지 1000개, 5개 내지 1100개, 5개 내지 1200개, 5개 내지 1300개, 5개 내지 1400개, 5개 내지 1500개, 5개 내지 1600개, 5개 내지 1700개, 5개 내지 1800개, 5개 내지 1900개, 5개 내지 2000개, 5개 내지 2100개, 5개 내지 2200개, 5개 내지 2300개, 5개 내지 2400개, 5개 내지 2500개, 5개 내지 2600개, 5개 내지 2700개, 5개 내지 2800개, 5개 내지 2900개, 5개 내지 3000개, 5개 내지 3100개 이상의 염기 길이를 포함할 수 있다. "충분한 상동성"은 2개의 폴리뉴클레오타이드 서열이 상동 재조합 반응을 위한 기질로서 작용하기에 충분한 구조적 유사성을 갖는다는 것을 나타낸다. 구조적 유사성은 각각의 폴리뉴클레오타이드 단편의 전체 길이뿐만 아니라 폴리뉴클레오타이드의 서열 유사성을 포함한다. 서열 유사성은 전체 서열 길이에 걸친 서열 동일성 백분율 및/또는 100%의 서열 동일성을 갖는 연속된 뉴클레오타이드와 같은 국재화된 유사성 및 서열 길이의 일부에 걸친 서열 동일성 백분율을 포함하는 보존된 영역에 의해 기술될 수 있다.
표적 및 공여 폴리뉴클레오타이드가 공유하는 상동성 또는 서열 동일성의 양은 변할 수 있으며, 총 길이 및/또는 약 1 내지 20 bp, 20 내지 50 bp, 50 내지 100 bp, 75 내지 150 bp, 100 내지 250 bp, 150 내지 300 bp, 200 내지 400 bp, 250 내지 500 bp, 300 내지 600 bp, 350 내지 750 bp, 400 내지 800 bp, 450 내지 900 bp, 500 내지 1000 bp, 600 내지 1250 bp, 700 내지 1500 bp, 800 내지 1750 bp, 900 내지 2000 bp, 1 내지 2.5 kb, 1.5 내지 3 kb, 2 내지 4 kb, 2.5 내지 5 kb, 3 내지 6 kb, 3.5 내지 7 kb, 4 내지 8 kb, 5 내지 10 kb, 또는 표적 부위의 전체 길이까지를 포함하는 범위의 단위 적분 값을 갖는 영역을 포함한다. 이들 범위는 범위 내의 모든 정수를 포함하며, 예를 들어 1 내지 20 bp 범위는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20 bp를 포함한다. 상동성의 양은 2개의 폴리뉴클레오타이드의 전체 정렬된 길이에 걸친 서열 동일성 백분율에 의해 기술될 수도 있는데, 이는 적어도 약 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성 백분율을 포함한다. 충분한 상동성은 폴리뉴클레오타이드 길이, 전체 서열 동일성 백분율 및 선택적으로 연속된 뉴클레오타이드의 보존된 영역 또는 국소 서열 동일성 백분율의 임의의 조합을 포함하며, 예를 들어 충분한 상동성은 표적 유전자위의 영역과 적어도 80%의 서열 동일성을 갖는 75 내지 150 bp의 영역으로서 기술될 수 있다. 충분한 상동성은 또한 높은 엄격성 조건 하에 특이적으로 혼성화하는 2개의 폴리뉴클레오타이드의 예측된 능력에 의해 기술될 수 있고, 예를 들어, 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols, (Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.); 및 Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, (Elsevier, New York)]을 참조한다.
본원에 사용된 바와 같이, "게놈 영역"은 표적 부위의 어느 한 측에 존재하거나 대안적으로 표적 부위의 일부를 또한 포함하는 세포 게놈에서의 염색체의 분절이다. 게놈 영역이 대응 상동성 영역과 상동 재조합을 겪는 데 충분한 상동성을 갖도록 게놈 영역은 적어도 5개 내지 10개, 5개 내지 15개, 5개 내지 20개, 5개 내지 25개, 5개 내지 30개, 5개 내지 35개, 5개 내지 40개, 5개 내지 45개, 5개 내지 50개, 5개 내지 55개, 5개 내지 60개, 5개 내지 65개, 5개 내지 70개, 5개 내지 75개, 5개 내지 80개, 5개 내지 85개, 5개 내지 90개, 5개 내지 95개, 5개 내지 100개, 5개 내지 200개, 5개 내지 300개, 5개 내지 400개, 5개 내지 500개, 5개 내지 600개, 5개 내지 700개, 5개 내지 800개, 5개 내지 900개, 5개 내지 1000개, 5개 내지 1100개, 5개 내지 1200개, 5개 내지 1300개, 5개 내지 1400개, 5개 내지 1500개, 5개 내지 1600개, 5개 내지 1700개, 5개 내지 1800개, 5개 내지 1900개, 5개 내지 2000개, 5개 내지 2100개, 5개 내지 2200개, 5개 내지 2300개, 5개 내지 2400개, 5개 내지 2500개, 5개 내지 2600개, 5개 내지 2700개, 5개 내지 2800개, 5개 내지 2900개, 5개 내지 3000개, 5개 내지 3100개 이상의 염기를 포함할 수 있다.
주어진 게놈 영역과 공여 DNA에서 발견되는 대응 상동성 영역 사이의 구조적 유사성은 상동 재조합이 일어날 수 있게 하는 임의의 서열 동일성 정도일 수 있다. 예를 들어, 공여 DNA의 "상동성 영역"과 유기체 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 그 서열이 상동 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성일 수 있다.
공여 DNA 상의 상동성 영역은 표적 부위에 플랭킹한 임의의 서열과 상동성을 가질 수 있다. 일부 경우에 상동성 영역은 표적 부위에 바로 플랭킹한 게놈 서열과 상당한 서열 상동성을 공유하지만, 상동성 영역은 표적 부위에 추가로 5' 또는 3'일 수 있는 영역과 충분한 상동성을 갖도록 설계될 수 있음이 인식된다. 상동성 영역은 또한 하류 게놈 영역을 따라 표적 부위의 단편과 상동성을 가질 수 있다.
일 구현예에서, 제1 상동성 영역은 표적 부위의 제1 단편을 추가로 포함하고, 제2 상동성 영역은 표적 부위의 제2 단편을 포함하며, 제1 단편 및 제 2 단편은 상이하다.
본원에 사용된 바와 같이, "상동 재조합"은 상동성 부위에서 2개의 DNA 분자 간의 DNA 단편의 교환을 포함한다. 상동 재조합의 빈도는 여러 인자에 영향을 받는다. 상이한 유기체는 상동 재조합의 양 및 상동 재조합과 비상동 재조합의 상대 비율이 다르다. 일반적으로, 상동성 영역의 길이는 상동 재조합 이벤트의 빈도에 영향을 미치고: 상동성 영역이 길수록 빈도는 더 높다. 상동 재조합을 관찰하는 데 필요한 상동성 영역의 길이는 또한 종에 따라 다르다. 많은 경우에, 적어도 5 kb의 상동성이 이용되었지만, 상동 재조합은 25 내지 50 bp만큼의 적은 상동성으로 관찰되었다. 예를 들어, 문헌[Singer et al., (1982) Cell 31:25-33; Shen and Huang, (1986) Genetics 112:441-57; Watt et al., (1985) Proc. Natl. Acad. Sci. USA 82:4768-72, Sugawara and Haber, (1992) Mol Cell Biol 12:563-75, Rubnitz and Subramani, (1984) Mol Cell Biol 4:2253-8; Ayares et al., (1986) Proc. Natl. Acad. Sci. USA 83:5199-203; Liskay et al., (1987) Genetics 115:161-7]을 참조한다.
예를 들어, 상동 재조합(HR)을 통한 원핵생물 및 진핵생물 세포 또는 유기체의 게놈의 변경은 유전자 조작을 위한 강력한 도구이다. 상동 재조합은 식물(Halfter et al., (1992) Mol Gen Genet 231:186-93) 및 곤충(Dray and Gloor, 1997, Genetics 147:689-99)에서 입증되었다. 상동 재조합은 다른 유기체에서도 이루어졌다. 예를 들어, 기생 원생동물 리슈마니아에서의 상동 재조합에 적어도 150 내지 200 bp의 상동성이 필요했다(Papadopoulou and Dumas, (1997) Nucleic Acids Res 25:4278-86). 사상균 아스퍼질러스 니둘란스(Aspergillus nidulans)에서, 50 bp만큼의 적은 플랭킹 상동성으로 유전자 대체가 이루어졌다(Chaveroche et al., (2000) Nucleic Acids Res 28:e97). 표적화된 유전자 대체는 섬모 테트라하이메나 써모필라(Tetrahymena thermophila)에서도 입증되었다(Gaertig et al., (1994) Nucleic Acids Res 22:5391-8). 포유류에서, 상동 재조합은 배양물에서 성장하고, 형질전환되고, 선택되고 마우스 배아로 도입될 수 있는 다능성 배아 줄기 세포주(ES: embryonic stem cell line)를 사용하여 마우스에서 가장 성공적이었다(Watson et al., 1992, Recombinant DNA, 2nd Ed., WH Freeman & Co.에서 배포한 Scientific American Books).
DNA 이중 가닥 파괴는 상동 재조합 경로를 자극하는 효과적인 인자로 보인다(Puchta et al., (1995) Plant Mol Biol 28:281-92; Tzfira and White, (2005) Trends Biotechnol 23:567-9; Puchta, (2005) J Exp Bot 56:1-14). DNA 파괴제를 사용하여, 식물에서의 인공적으로 작제된 상동 DNA 반복부 사이에 상동 재조합의 2배 내지 9배 증가가 관찰되었다(Puchta et al., (1995) Plant Mol Biol 28:281-92). 옥수수 원형질체에서, 선형 DNA 분자를 이용한 실험은 플라스미드 간의 향상된 상동 재조합을 입증하였다(Lyznik et al., (1991) Mol Gen Genet 230:209-18).
일 양태에서, 본 발명은 세포의 게놈에서 표적 부위를 변형시키는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드, 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체 및 적어도 하나의 공여 DNA를 도입하는 단계(여기서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체(PGEN)를 형성할 수 있고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함함)를 포함하고, 선택적으로, 상기 관심 폴리뉴클레오타이드가 상기 표적 부위에서 또는 그 근처에서 통합된 적어도 하나의 세포를 확인하는 단계를 추가로 포함한다.
일 양태에서, 본 발명은 바실러스 숙주 세포의 게놈을 변형시키는 방법을 포함하고, 상기 방법은
변형되는 적어도 하나의 표적 서열을 포함하는 바실러스 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 제공하는 단계(여기서, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있음); 및
적어도 하나의 바실러스 숙주 세포를 확인하는 단계(여기서, 적어도 하나의 게놈 표적 서열은 변형됨)를 포함한다. 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택될 수 있다.
일 양태에서, 본 발명은 E. 콜라이 숙주 세포의 게놈을 변형시키는 방법을 포함하고, 상기 방법은
변형되는 적어도 하나의 표적 서열을 포함하는 E. 콜라이 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 제공하는 단계(여기서, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있음); 및
적어도 하나의 E. 콜라이 숙주 세포를 확인하는 단계(여기서, 적어도 하나의 게놈 표적 서열은 변형됨)를 포함한다.
일 양태에서, 본 발명은 사카로마이세스 세레비시아에 숙주 세포의 게놈을 변형시키는 방법을 포함하고, 상기 방법은
변형되는 적어도 하나의 표적 서열을 포함하는 사카로마이세스 세레비시아에 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 제공하는 단계(여기서, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있음); 및
적어도 하나의 사카로마이세스 세레비시아에 숙주 세포를 확인하는 단계(여기서, 적어도 하나의 게놈 표적 서열은 변형됨)를 포함한다.
가이드 RNA/Cas 엔도뉴클레아제 시스템에 대한 추가 용도는 기술되어 있고(본원에 참조로 포함되는 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1, 2015년 2월 26일 공개된 WO2015/026886 A1, 2015년 2월 26일 공개된 US 2015-0059010 A1, 2014년 7월 7일 출원된 미국 출원 62/023246 및 2014년 8월 13일 출원된 미국 출원 62/036,652 참조), 관심 뉴클레오타이드 서열(예컨대, 조절 요소)의 변형 또는 대체, 관심 폴리뉴클레오타이드의 삽입, 유전자 녹아웃, 유전자 녹인, 스플라이싱 부위의 변형 및/또는 대안적인 스플라이싱 부위의 도입, 관심 단백질, 아미노산 및/또는 단백질 융합체를 암호화하는 뉴클레오타이드 서열의 변형, 및 관심 유전자로의 역위 반복부의 발현에 의한 유전자 침묵화를 포함하지만, 이에 한정되는 것은 아니다.
다중화
본원의 표적화 방법은 예를 들어 2개 이상의 DNA 표적 부위가 표적화되는 방식으로 수행될 수 있다. 이러한 방법은 선택적으로 다중 방법으로 특징지어질 수 있다. 소정의 구현예에서 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 표적 부위가 동시에 표적화될 수 있다. 통상적으로 다중 방법은 복수의 상이한 RNA 성분들이 제공되며 각각이 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체를 고유의 DNA 표적 부위로 유도하도록 설계된 본원의 표적화 방법에 의해 수행된다.
본원에 기재된 Cas9 엔도뉴클레아제 변이체는 (일방 및 다중 이중 가닥 파괴 및 닉을 통한) 표적화된 게놈 편집 및 (Cas9 또는 sgRNA로의 후성학적 효과기 도메인의 테더링을 통한) 표적화된 게놈 조절에 사용될 수 있다. 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 RNA-유도된 재조합효소로서 기능하도록 또한 조작될 수 있으며, RNA 테더를 통해 다중 단백질과 핵산 복합체의 조립을 위한 스캐폴드의 역할을 할 수 있다(Mali et al. 2013 Nature Methods Vol. 10: 957-963).
복합 형질 유전좌위
관심 폴리뉴클레오타이드 및/또는 형질은, 둘 다 본원에 참조로 포함되는 2013년 3월 14일 공개된 W02012/129373 및 2013년 1월 24일 공개된 PCT/US13/22891에 기재된 바와 같이, 복합 형질 유전자위에 함께 쌓일 수 있다. 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 시스템과 같은 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템은 단일 또는 이중 가닥 파괴를 생성하는 데 효율적인 시스템을 제공하고, 복합 형질 유전자위에 형질이 쌓이도록 할 수 있다.
폴리뉴클레오타이드, 폴리펩타이드, 발현 카세트, 재조합 DNA, 또는 유도된 Cas 단백질 시스템의 임의의 하나의 성분의 도입
본원에 개시된 폴리뉴클레오타이드, 폴리펩타이드, 발현 카세트 또는 재조합 DNA는 당해 분야에 공지된 임의의 방법을 사용하여 유기체로 도입될 수 있다. 가이드 폴리뉴클레오타이드/Cas 시스템의 어느 하나의 성분, 가이드 폴리뉴클레오타이드/Cas 복합체 자체뿐만 아니라 폴리뉴클레오타이드 변형 주형(들) 및/또는 공여 DNA(들)가 당해 분야에 공지된 임의의 방법에 의해 세포로 도입될 수 있다.
"도입"은, 성분(들)이 유기체 세포의 내부로의 또는 세포 자체로의 접근을 획득하는 방식으로의, 유기체, 예컨대 세포 또는 유기체, 폴리뉴클레오타이드 또는 폴리펩타이드 또는 폴리뉴클레오타이드-단백질 복합체(예컨대, RGEN 또는 PGEN)로의 제시를 의미하려는 것이다. 그 방법 및 조성물은 폴리뉴클레오타이드 또는 폴리펩타이드가 유기체의 적어도 하나의 세포의 내부로의 접근을 획득하는 한 유기체 또는 세포로 서열을 도입하기 위한 특정 방법에 의존하지 않는다. 도입은 핵산이 세포의 게놈으로 혼입될 수 있는 진핵생물 또는 원핵생물 세포로의 핵산의 혼입에 대한 언급을 포함하며, 핵산, 단백질 또는 폴리뉴클레오타이드-단백질 복합체(PGEN, RGEN)의 세포로의 일시적인(직접적인) 제공에 대한 언급을 포함한다.
비제한적인 예로서 자연 능력(WO2017/075195, WO2002/14490 및 WO2008/7989에 기재된 바와 같음), 마이크로주사(Crossway et al., (1986) Biotechniques 4:320-34 및 미국 특허 제6,300,543호), 분열조직 형질전환(미국 특허 제5,736,369호), 전기천공(Riggs et al., (1986) Proc. Natl. Acad. Sci. USA 83:5602-6), 안정한 형질전환 방법, 일시적인 형질전환 방법, 탄도 입자 가속화(입자 충돌)(미국 특허 제4,945,050호; 제5,879,918호; 제5,886,244호; 제5,932,782호), 휘스커 매개 형질전환(Ainley et al. 2013, Plant Biotechnology Journal 11:1126-1134; Shaheen A. and M. Arshad 2011 Properties and Applications of Silicon Carbide (2011), 345-358 Editor(s): Gerhardt, Rosario. Publisher: InTech, Rijeka, Croatia. CODEN: 69PQBP; ISBN: 978-953-307-201-2), 아그로박테리움-매개 형질전환(미국 특허 제5,563,055호 및 제5,981,840호), 직접적인 유전자 전달(Paszkowski et al., (1984) EMBO J 3:2717-22), 바이러스-매개 도입(미국 특허 제5,889,191호, 제5,889,190호, 제5,866,785호, 제5,589,367호 및 제5,316,931), 형질주입, 형질도입, 세포-침투 펩타이드, 메조포러스 실리카 나노입자(MSN: mesoporous silica nanoparticle)-매개 직접 단백질 전달, 국소 도포, 유성 교잡, 유성 교배, 및 임의의 이들의 조합을 포함하는, 세포 또는 유기체로 폴리뉴클레오타이드, 폴리펩타이드, 발현 카세트, 재조합 DNA 또는 폴리뉴클레오타이드-단백질 복합체(PGEN, RGEN)를 도입하는 방법이 당해 분야에 공지되어 있다. 안정한 형질전환은 유기체로 도입된 뉴클레오타이드 작제물이 유기체의 게놈으로 통합되며 이의 자손에 의해 유전될 수 있음을 의미하려는 것이다. 일시적인 형질전환은 폴리뉴클레오타이드가 (직접적으로 또는 간접적으로) 유기체로 도입되고 유기체의 게놈으로 통합되지 않거나 폴리펩타이드가 유기체로 도입됨을 의미하려는 것이다. 일시적인 형질전환은 도입된 조성물이 단지 일시적으로 유기체에서 발현되거나 존재함을 나타낸다.
가이드 폴리뉴클레오타이드(가이드 RNA, cr뉴클레오타이드 + tracr뉴클레오타이드, 가이드 DNA 및/또는 가이드 RNA-DNA 분자)는 단일 가닥 또는 이중 가닥 폴리뉴클레오타이드 분자로서 세포로 직접적으로(일시적으로) 도입될 수 있다. 가이드 RNA(또는 crRNA + tracrRNA)는 또한 상기 세포에서 가이드 RNA(crRNA+tracrRNA 분자)를 전사할 수 있는 특정 프로모터에 작동 가능하게 연결된 가이드 RNA(또는 crRNA + tracrRNA)를 암호화하는 이종 핵산 단편을 포함하는 재조합 DNA 분자를 도입하여 간접적으로 세포로 도입될 수 있다. 특정 프로모터는 정확히 정의된, 비변형된 5'- 및 3'-말단을 갖는 RNA의 전사를 허용하는 RNA 중합효소 III 프로모터일 수 있지만, 이에 한정되는 것은 아니다(Ma et al., 2014, Mol. Ther. Nucleic Acids 3:e161; DiCarlo et al., 2013, Nucleic Acids Res. 41: 4336-4343; WO2015026887, 2015년 2월 26일 공개). 세포에서 가이드 RNA를 전사할 수 있는 임의의 프로모터가 사용될 수 있고, 가이드 RNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 열 충격/열 유도성 프로모터를 포함한다.
본원의 Cas 엔도뉴클레아제는 당해 분야에 공지된 임의의 방법을 사용하여 Cas 폴리펩타이드 자체(Cas 엔도뉴클레아제의 직접적인 전달이라고 칭함), Cas 단백질을 암호화하는 mRNA, 및/또는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체 자체를 직접적으로 도입함으로써 세포로 도입될 수 있다. Cas 엔도뉴클레아제는 또한 Cas 엔도뉴클레아제를 암호화하는 재조합 DNA 분자를 도입함으로써 간접적으로 세포로 도입될 수 있다. 엔도뉴클레아제는 당해 분야에 공지된 임의의 방법을 사용하여 세포로 일시적으로 도입되거나 숙주 세포의 게놈으로 혼입될 수 있다. 엔도뉴클레아제 및/또는 유도된 폴리뉴클레오타이드의 세포로의 흡수는 2016년 5월 12일 공개된 WO2016/073433에 기술된 바와 같이 세포 투과 펩타이드(CPP: Cell Penetrating Peptide)로 촉진될 수 있다. 세포에서 본원의 Cas 엔도뉴클레아제 변이체를 발현할 수 있는 임의의 프로모터가 사용될 수 있고, Cas 엔도뉴클레아제를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 열 충격/열 유도성 프로모터를 포함한다.
세포로 폴리뉴클레오타이드 변형 주형을 직접적으로 전달하는 것은 입자 매개 전달을 통해 달성될 수 있고, 임의의 다른 직접적인 전달 방법, 예컨대 비제한적인 예로서 원형질체로의 폴리에틸렌 글리콜(PEG)-매개 형질주입, 휘스커 매개 형질전환, 전기천공, 입자 충돌, 세포-침투 펩타이드, 또는 메조포러스 실리카 나노입자(MSN)-매개 직접 단백질 전달은 진핵생물 세포와 같은 세포에서 폴리뉴클레오타이드 변형 주형을 전달하기 위해 성공적으로 사용될 수 있다.
공여 DNA는 당해 분야에 공지된 임의의 수단에 의해 도입될 수 있다. 공여 DNA는, 예를 들어, 아그로박테리움-매개 형질전환 또는 바이올리스틱 입자 충돌을 포함하는, 당해 분야에 공지된 임의의 형질전환 방법에 의해 제공될 수 있다. 공여 DNA는 세포에 일시적으로 존재할 수 있거나, 바이러스성 레플리콘을 통해 도입될 수 있다. Cas 엔도뉴클레아제 및 표적 부위의 존재 하에, 공여 DNA는 식물과 같은 유기체의 형질전환된 게놈으로 삽입된다.
본원에 기재된 유도된 Cas 시스템 성분들 중 임의의 하나의 직접적인 전달은 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체 성분을 수용하는 세포의 농후화 및/또는 가시화를 촉진할 수 있는 다른 mRNA의 직접적인 전달(공동-전달)이 동반될 수 있다. 예를 들어, 표현형 마커를 암호화하는 mRNA(예컨대, 비제한적인 예로서 전사 활성제, 예컨대 CRC(Bruce et al. 2000 The Plant Cell 12:65-79)와 함께 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 성분(및/또는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체 자체)의 직접적인 동시전달은 2017년 4월 27일 공개된 WO2017/070029 및 2017년 4월 27일 공개된 WO 2017/070032에 기재된 바대로 비기능적 유전자 산물로 기능을 복구함으로써 외인성 선택 가능한 마커의 사용 없이 세포의 선택 및 농후화가 가능하게 할 수 있다.
본원에 기재된 바와 같은 가이드 RNA/Cas 엔도뉴클레아제 복합체(RGEN)를 세포로 도입하는 것은 가이드 RNA/Cas 엔도뉴클레아제 복합체를 리보뉴클레오타이드-단백질로서 세포로 도입하는 것을 포함한다. 리보뉴클레오타이드-단백질은 본원에 기재된 바와 같이 세포로 도입되기 전에 조립될 수 있다. 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오타이드 단백질을 포함하는 성분은 시험관내 조립되거나 (본원에 기재된 바대로 게놈 변형에 표적화된) 세포로 도입되기 전에 당해 분야에 공지된 임의의 수단에 의해 조립될 수 있다.
식물, 진균 및 박테리아 세포는 식물, 진균 및 박테리아 세포가 RGEN 리보핵단백질의 직접 전달 및/또는 RGEN 성분의 직접 전달에 대한 장벽으로 작용할 수 있는 세포벽을 포함한다는 점에서 인간 및 동물 세포와 다르다.
식물, 진균 및 박테리아 세포로의 RGEN 리보핵단백질의 직접 전달은 입자 매개 전달(입자 충격)을 통해 달성될 수 있다. 본원에 기재된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대 비제한적인 예로서 원형질체로의 폴리에틸렌 글리콜(PEG) 매개 형질감염, 전기천공, 세포 침투 펩타이드 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 단백질 전달이 진균 및 박테리아 세포에 RGEN 리보핵단백질을 전달하기 위해 성공적으로 사용될 수 있음을 구상할 수 있다.
RGEN 리보핵단백질의 직접 전달은 세포의 게놈에서의 표적 부위에서의 게놈 편집 후 복합체가 빠르게 분해되고, 복합체가 세포에 일시적으로만 존재할 수 있게 한다. 이러한 RGEN 복합체의 일시적인 존재는 표적 이탈 효과의 감소로 이어질 수 있다. 이와 반대로, 플라스미드 DNA 서열을 통한 RGEN 성분(가이드 RNA, Cas9 엔도뉴클레아제)의 전달은 표적 이탈 효과를 가중시킬 수 있는 이러한 플라스미드로부터의 RGEN의 일정한 발현을 초래할 수 있다(Cradick, T. J. et al (2013) Nucleic Acids Res 41:9584-9592; Fu, Y et al (2014) Nat. Biotechnol. 31:822-826).
직접적인 전달은 본원에 기재된 가이드 RNA/Cas 엔도뉴클레아제 복합체(RGEN)(예컨대, 적어도 하나의 가이드 RNA, 적어도 하나의 Cas9 엔도뉴클레아제 변이체) 중 임의의 하나의 성분을 비제한적인 예로서 금 입자, 텅스텐 입자 및 탄화규소 휘스커 입자와 같은 마이크로입자를 포함하는 입자 전달 매트릭스와 조합함으로써 달성될 수 있다(또한 2017년 4월 27일 공개된 WO2017/070029 및 2017년 4월 27일 공개된 WO 2017/070032(본원에 그 전문이 참조로 포함됨) 참조).
일 양태에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(RGEN)는 복합체이고, 여기서 가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성하는 가이드 RNA 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 각각 RNA 및 단백질로서 세포로 도입된다.
일 양태에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 복합체이고, 여기서 가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성하는 가이드 RNA 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 시험관내 예비조립되고, 리보뉴클레오타이드-단백질 복합체로서 세포로 도입된다.
핵산 및 단백질은 유도된 Cas 시스템의 어느 한 성분 또는 모든 성분(단백질 및/또는 핵산)의 흡수를 촉진하기 위해 분자, 예컨대 세포 침투 펩타이드 및 나노캐리어를 사용하는 방법을 비롯한 임의의 방법에 의해 세포에 제공될 수 있다(참조로 본원에 포함된 2011년 2월 20일 공개된 US20110035836).
세포, 유기체
현재 개시된 Cas 엔도뉴클레아제 변이체, 폴리뉴클레오타이드, 펩타이드, 가이드 폴리뉴클레오타이드, Cas 엔도뉴클레아제, 폴리뉴클레오타이드 변형 주형, 공여 DNA, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템 및 이의 임의의 하나의 조합은 세포로 도입될 수 있다.
세포는 인간, 비인간, 동물, 박테리아, 균류, 곤충, 효모, 비통상적인 효모, 미생물 및 식물 세포뿐만 아니라 본원에 기재된 방법에 의해 생산된 식물 및 종자를 포함하지만, 이에 한정되는 것은 아니다.
본원에 개시된 방법 및 조성물에 사용되는 미생물 세포는 임의의 진균 숙주 세포, 사상균 세포 및 박테리아 세포일 수 있다. 본원에 사용된 바와 같이, 용어 "진균 세포", "진균", "진균 숙주 세포" 등은 본원에 사용된 바와 같이 문 자낭균류(Ascomycota), 담자균류(Basidiomycota), 호상균류(Chytridiomycota) 및 접합균류(Zygomycota)(Hawksworth et al., 1995에 의해 정의된 바와 같음) 및 난균류(Hawksworth et al., 1995) 및 모든 불완전 진균(Hawksworth et al., 1995)을 포함한다. 소정의 구현예에서, 진균 숙주 세포는 효모 세포이고, 여기서 용어 "효모"는 자낭홀씨생산 효모(엔도마이세탈레스(Endomycetales)), 담자균류 효모 및 불완전 균류(Fungi Imperfecti)(블라스토마이세테스(Blastomycetes))에 속하는 효모를 의미한다. 이와 같이, 효모 숙주 세포는 칸디다(Candida), 한세누라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피치아(Pichia), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces) 또는 야로위아(Yarrowia) 세포를 포함한다. 효모의 종은 사카로마이세스 칼스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 세레비시아에(Saccharomyces cerevisiae), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 도우글라시(Saccharomyces douglasii), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 오비포르미스(Saccharomyces oviformis), 클루이베로마이세스 락티스(Kluyveromyces lactis) 및 야로위아 리폴리티카(Yarrowia lipolytica)를 포함하지만, 이에 한정되는 것은 아니다.
본원에서 용어 "비통상적인 효모"는 사카로마이세스(예컨대, S. 세레비시아에) 또는 스키조사카로마이세스 효모 종이 아닌 임의의 효모를 지칭한다. (문헌[Non-Conventional Yeasts in Genetics, Biochemistry and Biotechnology: Practical Protocols" (K. Wolf, K.D. Breunig, G. Barth, Eds., Springer-Verlag, Berlin, Germany, 2003]을 참조한다). 비통상적인 효모는 야로위아(Yarrowia), 피치아(Pichia), 쉬반니오마이세스(Schwanniomyces), 클루이베로마이세스(Kluyveromyces), 아르술라(Arxula), 트리코스포론(Trichosporon), 칸디다(Candida), 유스틸라고(Ustilago), 토룰롭시스(Torulopsis), 자이고사카로마이세스(Zygosaccharomyces), 트리고놉시스(Trigonopsis), 크립토코커스(Cryptococcus), 로도토룰라(Rhodotorula), 파피아(Phaffia), 스포로볼로마이세스(Sporobolomyces) 및 파치솔렌(Pachysolen)으로 이루어진 군으로부터 선택된 속의 구성원을 포함한다. 비통상적인 효모는 상동 재조합(HR)에 의해 매개되는 복구 과정보다 비상동 말단 연결(NHEJ) DNA 복구 과정을 선호하는 효모를 포함한다. 이러한 계통(HR보다 NHEJ 선호)에 따른 비통상적인 효모의 정의는 본원에 참조로 포함되는 Chen 등(PLoS ONE 8:e57952)에 의해 추가로 개시되어 있다. 본원에서 용어 "효모"는 주로 단세포 형태로 존재하는 진균 종을 지칭한다. 효모는 본원에서 대안적으로 "효모 세포"로 지칭될 수 있다. 야로위아 종의 적합한 예는 Y. 리폴리티카이다. 피치아 종의 적합한 예는 P. 파스토리스, P. 메타놀리카(methanolica), P. 스티피티스, P. 아노말라(anomala) 및 P. 앙구스타(angusta)를 포함한다. 쉬반니오마이세스 종의 적합한 예는 S. 카스텔리이(castellii), S. 알루비우스(alluvius), S. 호미니스(hominis), S. 옥시덴탈리스(occidentalis), S. 카프리오티이(capriottii), S. 에트첼시이(etchellsii), S. 폴리모르푸스(polymorphus), S. 슈도폴리모르푸스(pseudopolymorphus), S. 반리자(vanrijiae) 및 S. 야마다에(yamadae)를 포함한다. 클루이베로마이세스 종의 적합한 예는 K. 락티스, K. 마르시아누스(marxianus), K. 프라길리스(fragilis), K. 드로소필라룸(drosophilarum), K. 써모톨레란스(thermotolerans), K. 파세올로스포루스(phaseolosporus), K. 바누데니이(vanudenii), K. 왈티이(waltii), K. 아프리카누스(africanus) 및 K. 폴리스포루스(polysporus)를 포함한다. 아르술라 종의 적합한 예는 A. 아데니니보란스(adeninivorans) 및 A. 테레스트레(terrestre)를 포함한다. 트리코스포론 종의 적합한 예는 T. 쿠타네움(cutaneum), T. 카피타툼(capitatum), T. 인킨(inkin) 및 T. 비메리(beemeri)를 포함한다. 칸디다 종의 적합한 예는 C. 알비칸스(albicans), C. 아스칼라피다룸(ascalaphidarum), C. 암피시아에(amphixiae), C. 안타르티카(antarctica), C. 아르젠티아(argentea), C. 아틀란티카(atlantica), C. 아트모스패리카(atmosphaerica), C. 블랏타에(blattae), C. 브로멜리아세아룸(bromeliacearum), C. 카르포필라(carpophila), C. 카르바잘리스(carvajalis), C. 세람비시다룸(cerambycidarum), C. 차울리오데스(chauliodes), C. 코리달리(corydali), C. 도스세이(dosseyi), C. 듀블리니엔시스(dubliniensis), C. 얼가텐시스(ergatensis), C. 프룩투스(fructus), C. 글라브라타(glabrata), C. 퍼멘타티(fermentati), C. 귈리어몬디이(guilliermondii), C. 해뮬로니이(haemulonii), C. 인섹타멘스(insectamens), C. 인섹토룸(insectorum), C. 인터메디아(intermedia), C. 제프레시이(jeffresii), C. 케피르(kefyr), C. 케로세네아에(keroseneae), C. 크루세이(krusei), C. 루시타니아에(lusitaniae), C. 릭소소필라(lyxosophila), C. 말토사(maltosa), C. 마리나(marina), C. 멤브라니파시엔스(membranifaciens), C. 밀러리(milleri), C. 모기이(mogii), C. 올레오필라(oleophila), C. 오레고넨시스(oregonensis), C. 파라프실로시스(parapsilosis), C. 퀴어시트루사(quercitrusa), C. 루고사(rugosa), C. 사케(sake), C. 쉐하테아(shehatea), C. 템노칠라에(temnochilae), C. 테누이스(tenuis), C. 테아에(theae), C. 톨러란스(tolerans), C. 트로피칼리스(tropicalis), C. 츠시이아에(tsuchiyae), C. 시놀라보란티움(sinolaborantium), C. 소자에(sojae), C. 수브하쉬이(subhashii), C. 비스와나치이(viswanathii), C. 유틸리스(utilis), C. 우바투벤시스(ubatubensis) 및 C. 젬플리니나(zemplinina)를 포함한다. 유스틸라고 종의 적합한 예는 U. 아베나에(avenae), U. 에스쿨렌타(esculenta), U. 호르데이(hordei), U. 마이디스(maydis), U. 누다(nuda) 및 U. 트리티치(tritici)를 포함한다. 토룰롭시스 종의 적합한 예는 T. 게오차레스(geochares), T. 아지마(azyma), T. 글라브라타(glabrata) 및 T. 칸디다를 포함한다. 자이고사카로마이세스 종의 적합한 예는 Z. 바일리이(bailii), Z. 비스포루스(bisporus), Z. 시드리(cidri), Z. 퍼멘타티(fermentati), Z. 플로렌티누스(florentinus), Z. 콤부차엔시스(kombuchaensis), Z. 렌투스(lentus), Z. 멜리스(mellis), Z. 미크로엘립소이데스(microellipsoides), Z. 엠라키이(mrakii), Z. 슈도룩시이(pseudorouxii) 및 Z. 룩시이(rouxii)를 포함한다. 트리고놉시스 종의 적합한 예는 T. 바리아빌리스(variabilis)를 포함한다. 크립토코커스 종의 적합한 예는 C. 라우렌티이(laurentii), C. 알비두스(albidus), C. 네오포르만스(neoformans), C. 가티이(gattii), C. 유니구툴라투스(uniguttulatus), C. 아델리엔시스(adeliensis), C. 아에리우스(aerius), C. 알비도시밀리스(albidosimilis), C. 안타르크티쿠스(antarcticus), C. 아쿠아티쿠스(aquaticus), C. 아테르(ater), C. 부타넨시스(bhutanensis), C. 콘소르티오니스(consortionis), C. 쿠르바투스(curvatus), C. 페놀리쿠스(phenolicus), C. 스킨네리(skinneri), C. 테레우스(terreus) 및 C. 비쉬니아치(vishniacci)를 포함한다. 로도토룰라 종의 적합한 예는 R. 아체니오룸(acheniorum), R. 툴라(tula), R. 아쿠타(acuta), R. 아메리카나(americana), R. 아라우카리아에(araucariae), R. 아르티카(arctica), R. 아르메니아카(armeniaca), R. 아우란티아카(aurantiaca), R. 아우리쿨라리아에(auriculariae), R. 바카룸(bacarum), R. 벤티카(benthica), R. 비오우르게이(biourgei), R. 보고리엔시스(bogoriensis), R. 브론치알리스(bronchialis), R. 부포니이(buffonii), R. 칼립토게나에(calyptogenae), R. 충나멘시스(chungnamensis), R. 클라디엔시스(cladiensis), R. 코랄리나(corallina), R. 크레솔리카(cresolica), R. 크로세아(crocea), R. 사이클로클라스티카(cycloclastica), R. 다이레넨시스(dairenensis), R. 디플루엔스(diffluens), R. 에베르글라디엔시스(evergladiensis), R. 페룰리카(ferulica), R. 폴리오룸(foliorum), R. 프라가리아(fragaria), R. 푸지사넨시스(fujisanensis), R. 푸트로넨시스(futronensis), R. 겔라티노사(gelatinosa), R. 글라시알리스(glacialis), R. 글루티니스(glutinis), R. 그라실리스(gracilis), R. 그라미니스(graminis), R. 그린베르그시이(grinbergsii), R. 히말라옌시스(himalayensis), R. 힌눌레아(hinnulea), R. 히스톨리티카(histolytica), R. 힐로필라(hylophila), R. 인카르나타(incarnata), R. 인게니오사(ingeniosa), R. 자바니카(javanica), R. 코이쉬카웬시스(koishikawensis), R. 락토사(lactosa), R. 라멜리브라치아에(lamellibrachiae), R. 라린기스(laryngis), R. 리그노필라(lignophila), R. 리니(lini), R. 론기스시마(longissima), R. 루드위기이(ludwigii), R. 리시노필라(lysinophila), R. 마리나(marina), R. 마르티니아에-프라간티스(martyniae-fragantis), R. 마트리텐시스(matritensis), R. 멜리(meli), R. 미누타(minuta), R. 무실라기노사(mucilaginosa), R. 니텐스(nitens), R. 노쏘파기(nothofagi), R. 오리자에(oryzae), R. 파시피카(pacifica), R. 팔리다(pallida), R. 페네아우스(peneaus), R. 필릴라(philyla), R. 필로플라나(phylloplana), R. 필라티이(pilatii), R. 필리마나에(pilimanae), R. 피니콜라(pinicola), R. 플리카타(plicata), R. 폴리모르파(polymorpha), R. 사이크로페놀리카(psychrophenolica), R. 사이크로필라(psychrophila), R. 푸스툴라(pustula), R. 레티노필라(retinophila), R. 로사세아(rosacea), R. 로술라타(rosulata), R. 루베파시엔스(rubefaciens), R. 루벨라(rubella), R. 루베센스(rubescens), R. 루브라(rubra), R. 루브로루고사(rubrorugosa), R. 루풀라(rufula), R. 루틸라(rutila), R. 산구이네아(sanguinea), R. 산니에이(sanniei), R. 사르토리이(sartoryi), R. 실베스트리스(silvestris), R. 심플렉스(simplex), R. 시넨시스(sinensis), R. 슬루피아에(slooffiae), R. 순키이(sonckii), R. 스트라미네아(straminea), R. 수베리콜라(subericola), R. 수가니이(suganii), R. 타이와넨시스(taiwanensis), R. 타이와니아나(taiwaniana), R. 테르페노이달리스(terpenoidalis), R. 테레아(terrea), R. 텍센시스(texensis), R. 토쿄엔시스(tokyoensis), R. 울자마에(ulzamae), R. 바닐리카(vanillica), R. 부일레미니이(vuilleminii), R. 야로위이, R. 윤나넨시스(yunnanensis) 및 R. 졸티이(zsoltii)를 포함한다. 파피아 종의 적합한 예는 P. 로도지마(rhodozyma)를 포함한다. 스포로볼로마이세스 종의 적합한 예는 S. 알보루베센스(alborubescens), S. 반나엔시스(bannaensis), S. 베이징엔시스(beijingensis), S. 비스초피아에(bischofiae), S. 클라바투스(clavatus), S. 코프로스마에(coprosmae), S. 코프로스미콜라(coprosmicola), S. 코랄리누스(corallinus), S. 디메나에(dimmenae), S. 드라코필리(dracophylli), S. 에론가투스(elongatus), S. 그라실리스(gracilis), S. 이노시토필루스(inositophilus), S. 존소니이(johnsonii), S. 코알라에(koalae), S. 마그니스포루스(magnisporus), S. 노보제알란디쿠스(novozealandicus), S. 오도루스(odorus), S. 파타고니쿠스(patagonicus), S. 프로덕투스(productus), S. 로세우스(roseus), S. 사시콜라(sasicola), S. 쉬바타누스(shibatanus), S. 신굴라리스(singularis), S. 수브룬네우스(subbrunneus), S. 시메트리쿠스(symmetricus), S. 시지기이(syzygii), S. 타우포엔시스(taupoensis), S. 츠가에(tsugae), S. 잔투스(xanthus) 및 S. 윤나넨시스를 포함한다. 파키솔렌 종의 적합한 예는 P. 탄노필루스(P. tannophilus)를 포함한다.
본원에 사용된 바와 같이, 용어 "사상균 세포"는 아문 유마이코티나(Eumycotina)의 모든 사상 형태를 포함한다. 사상균 속의 적합한 세포는 아크레모늄(Acremonium), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 베르칸데라(Bjerkandera), 세리포리옵시스(Ceriporiopsis), 크리소포륨(Chrysoporium), 코프리누스(Coprinus), 코리올루스(Coriolus), 코리나스쿠스(Corynascus), 카에르토뮴(Chaertomium), 크립토코커스(Cryptococcus), 필로바시듐(Filobasidium), 푸사리움(Fusarium), 기베렐라(Gibberella), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 무코르(Mucor), 마이셀리오프토라(Myceliophthora), 무코르, 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로마이세스(Paecilomyces), 페니실리움(Penicillium), 파네로카에테(Phanerochaete), 플레비아(Phlebia), 피로마이세스(Piromyces), 플뢰로투스(Pleurotus), 스키탈듐(Scytaldium), 스키조필룸(Schizophyllum), 스포로트리춤(Sporotrichum), 탈라로마이세스(Talaromyces), 테르모아스쿠스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 트라메테스(Trametes) 및 트리쵸데르마(Trichoderma)의 세포를 포함하지만, 이에 한정되는 것은 아니다.
사상균 종의 적합한 세포들은 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 푸미가투스(Aspergillus fumigatus), 아스퍼질러스 포에티두스(Aspergillus foetidus), 아스퍼질러스 자포니쿠스(Aspergillus japonicus), 아스퍼질러스 니두란스(Aspergillus nidulans), 아스퍼질러스 니게르(Aspergillus niger), 아스퍼질러스 오리자에(Aspergillus oryzae), 크리소스포리움 루크노웬스(Chrysosporium lucknowense), 푸사리움 박트리디오이데스(Fusarium bactridioides), 푸사리움 세레아리스(Fusarium cerealis), 푸사리움 크룩웰렌스(Fusarium crookwellense), 푸사리움 쿨모룸(Fusarium culmorum), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 그라미눔(Fusarium graminum), 푸사리움 헤테로스포룸(Fusarium heterosporum), 푸사리움 네군디(Fusarium negundi), 푸사리움 옥시스포룸(Fusarium oxysporum), 푸사리움 렉티쿠라툼(Fusarium reticulatum), 푸사리움 로세움(Fusarium roseum), 푸사리움 삼부시눔(Fusarium sambucinum), 푸사리움 사르코크로움(Fusarium sarcochroum), 푸사리움 스포로트리키오이데스(Fusarium sporotrichioides), 푸사리움 술푸레움(Fusarium sulphureum), 푸사리움 토루로숨(Fusarium torulosum), 푸사리움 트리코테시오이데스(Fusarium trichothecioides), 푸사리움 베네나툼(Fusarium venenatum), 베르칸데라 아두스타(Bjerkandera adusta), 세리포리옵시스 아네이리나(Ceriporiopsis aneirina), 세리포리옵시스 아네이리나, 세리포리옵시스 카레기에아(Ceriporiopsis caregiea), 세리포리옵시스 길베센스(Ceriporiopsis gilvescens), 세리포리옵시스 파노신타(Ceriporiopsis pannocinta), 세리포리옵시스 리불로사(Ceriporiopsis rivulosa), 세리포리옵시스 서브루파(Ceriporiopsis subrufa), 세리포리옵시스 서브베르미스포라(Ceriporiopsis subvermispora), 코프리누스 시네레우스(Coprinus cinereus), 코프리누스 히르수투스(Coriolus hirsutus), 후미콜라 인솔렌스(Humicola insolens), 후미콜라 라누지노사(Humicola lanuginosa), 무코르 미에헤이, 마이셀리오프토라 써모필라(Myceliophthora thermophila), 뉴로스포라 크라싸(Neurospora crassa), 뉴로스포라 인테르메디아(Neurospora intermedia), 페니실리움 푸르푸로게눔(Penicillium purpurogenum), 페니실리움 카네센스(Penicillium canescens), 페니실리움 소리툼(Penicillium solitum), 페니실리움 푸니쿠로숨(Penicillium funiculosum), 파네로채테 크리소스포리움(Phanerochaete chrysosporium), 플레비아 라디아테(Phlebia radiate), 플뢰로투스 에린기(Pleurotus eryngii), 타라로마이세스 플라부스(Talaromyces flavus), 티에라비아 테레스트리스(Thielavia terrestris), 트라메테스 빌로사(Trametes villosa), 트라메테스 베르시칼라(Trametes versicolor), 트리코데르마 하르지아눔(Trichoderma harzianum), 트리코데르마 코닌지(Trichoderma koningii), 트리코데르마 롱지브라키아툼(Trichoderma longibrachiatum), 트리코데르마 레세이이(Trichoderma reesei) 및 트리코데르마 비리데(Trichoderma viride)를 포함하지만, 이에 한정되지는 않는다.
소정의 구현예에서, 미생물 숙주 세포는 박테리아 세포, 예를 들어, 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 아밀로리쿼파시엔스(Bacillus amyloliquefaciens), 바실러스 브레비스(Bacillus brevis), 바실러스 서르쿨란스(Bacillus circulans), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리케니포르미스, 바실러스 메가테리움(Bacillus megaterium), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 서브틸리스 또는 바실러스 투린기엔시스, 또는 예를 들어, 스트렙토마이세스 리비단스(Streptomyces lividans) 또는 스트렙토마이세스 무리누스(Streptomyces murinus)와 같은 스트렙토마이세스, 또는 예를 들어 E. 콜라이 또는 슈도모나스 종과 같은 그람 음성 박테리아이다.
전술된 종에 대해, 본 발명 및 원천 종은 이것이 공지된 종 명칭과 무관하게 이러한 유기체의 완전한 상태 및 불완전한 상태 둘 다, 및 이의 다른 분류학상 등가물, 예를 들어 무성생식형을 포괄한다고 이해된다. 당업자는 이러한 원천 종의 적절한 등가물의 식별을 용이하게 인식할 것이다.
상기 언급된 종의 균주는 다수의 배양 수집, 예컨대 미국 균주 보존 센터(ATCC: American Type Culture Collection), 독일 생물 자원 센터(DSM: Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH), Centraalbureau Voor Schimmelcultures(CBS) 및 미국 농무성 특허 균주 보존 센터(Agricultural Research Service Patent Culture Collection), Northern Regional Research Center(NRRL)에서 공중에 용이하게 접근 가능하다.
본원에 기재된 Cas9 엔도뉴클레아제 변이체는 미생물 세포에서 상동 재조합을 위한 방법 및/또는 미생물 세포에서 게놈 편집을 위한 방법에 사용될 수 있다. 미생물 세포(예를 들어, 사상균 세포)의 게놈에서 표적 부위에서 하나 이상의 짧은 상동성 아암을 갖는 공여 DNA를 삽입하기 위한 가이드 RNA/Cas 엔도뉴클레아제 시스템을 사용하는 방법이 개시되어 있다(2017년 2월 2일 공개된 WO2017/019867). 미생물 세포의 게놈의 변형이 표현형 효과를 가져올 때, 표현형 마커인(또는 표현형 마커를 암호화하는) 관심 폴리뉴클레오타이드를 포함하는 공여 DNA가 종종 사용된다. 흔히 특정 배양 조건 하에 이것을 함유하는 진균 세포를 확인하거나 이를 또는 이에 반하여 선택할 수 있게 하는 임의의 선택 가능한 또는 선별 가능한 마커를 포함하여 임의의 편리한 표현형 마커가 사용될 수 있다. 따라서, 본 발명의 일부 양태에서, 원하는 게놈 변형을 갖는 미생물 세포의 확인은 표적 부위에서 변형을 갖는 세포를 선택하는 조건 하에 Cas9 엔도뉴클레아제 변이체 및 가이드 폴리뉴클레오타이드(그리고 선택적으로 공여 DNA)를 받은 미생물 세포 집단을 배양하는 것을 포함한다. 진균 세포에서의 효소 활성의 증가 또는 감소, 예를 들어 항생제 내성의 획득 또는 영양요구성 마커의 증가/감소를 평가하는 것을 포함하는 임의의 유형의 선택 시스템(선택 가능한 마커라고도 칭함)을 사용할 수 있다.
본원에 사용된 바와 같이, 용어 "식물"은 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 덩어리, 및 식물 또는 식물 부분, 예컨대 배아, 꽃가루, 난세포, 종자, 잎, 꽃, 가지, 과일, 속씨, 이삭, 속대, 껍질, 줄기, 뿌리, 뿌리 끝, 꽃밥, 낟알 등에서 온전한 식물 세포를 지칭한다. 본원에 사용된 바와 같이 "낟알"이란 종의 성장 또는 생식 이외의 목적을 위해 상업적 재배업자에 의해 생산되는 성숙 종자를 의도한다. 재생된 식물의 자손, 변이체 및 돌연변이체는 이 부분들이 재생된 식물의 게놈 변형, 예컨대 형질전환 또는 게놈 편집으로부터 생긴 것을 포함하는 한 본 발명의 범위 내로 포함된다.
외떡잎 식물 및 쌍떡잎 식물 또는 식물 부분을 포함하는 임의의 식물 또는 식물 부분이 사용될 수 있다.
사용될 수 있는 외떡잎 식물의 예는 옥수수(제아 메이스(Zea mays)), 벼(오리자 사티바(Oryza sativa)), 호밀(세칼레 세레알레(Secale cereale)), 수수(소르검 비칼라(Sorghum bicolor), 소르검 불가레(Sorghum vulgare)), 기장(예컨대, 펄 밀렛(페니세툼 글라쿰(Pennisetum glaucum)), 프로소 밀렛(파니쿰 밀리아세움(Panicum miliaceum)), 조(세타리아 이탈리카(Setaria italica)), 손가락조(엘류신 코라카나(Eleusine coracana)), 밀(트리티쿰 종, 트리티쿰 아에스티붐(Triticum aestivum), 트리티쿰 모노코컴(Triticum monococcum)), 사탕수수(사카룸(Saccharum) 종), 귀리(아베나(Avena)), 보리(호르데움(Hordeum)), 스위치그래스(파니쿰 비르가툼(Panicum virgatum)), 파인애플(아나나스 코모수스(Ananas comosus)), 바나나(무사(Musa) 종), 야자, 관상용 식물, 잔디 및 기타 풀을 포함할 수 있지만, 이에 한정되는 것은 아니다.
용어 "쌍떡잎식물(dicotyledonous)" 또는 "쌍떡잎 식물(dicot)"은 "디코틸레도네아에(dicotyledoneae)"로도 공지된 속씨 식물의 하위강을 지칭하며, 전체 식물, 식물 기관(예컨대, 잎, 줄기, 뿌리 등), 종자, 식물 세포 및 그 자손에 대한 언급을 포함한다. 사용될 수 있는 쌍떡잎 식물의 예는 대두(글리신 맥스(Glycine max)), 브라시카(Brassica) 종(카놀라)(브라시카 나푸스(Brassica napus), B. 캄페스트리스(campestris), 브라시카 라파(Brassica rapa), 브라시카 준세아(Brassica. juncea)), 알팔파(메디카고 사티바(Medicago sativa)), 알팔파(메디카고 사티바(Medicago sativa)), 담배(니코티아나 타바쿰(Nicotiana tabacum)), 애기장대(아라비돕시스 탈리아나(Arabidopsis thaliana)), 해바라기(헬리안투스 안누우스(Helianthus annuus)), 목화(고시피움 아르보레움(Gossypium arboreum), 고시피움 바르바덴스(Gossypium barbadense)) 및 땅콩(아라키스 하이포가에아(Arachis hypogaea)), 토마토(솔라눔 라이코페르시쿰(Solanum lycopersicum)), 감자(솔라눔 투베로섬(Solanum tuberosum))을 포함하지만, 이에 한정되는 것은 아니다.
사용될 수 있는 식물은 잇꽃(카르타무스 팅토리우스(Carthamus tinctorius)), 고구마(이포모에아 바타투스(Ipomoea batatus)), 카싸바(마니호트 에스쿨렌타(Manihot esculenta)), 커피(커피나무 종), 코코넛(코코스 누시페라(Cocos nucifera)), 시트러스 나무(시트러스 종), 코코아(테오브로마 카카오(Theobroma cacao)), 차(카멜리아 시넨시스(Camellia sinensis)), 바나나(무사(Musa) 종), 아보카도(페르시아 아메리카나(Persea americana)), 무화과(피쿠스 카시카(Ficus casica)), 구아바(프시디움 구아자바(Psidium guajava)), 망고(망기페라 인디카(Mangifera indica)), 올리브(올레아 유로파에아(Olea europaea)), 파파야(카리카 파파야(Carica papaya)), 캐슈(아나카르디움 옥시덴탈레(Anacardium occidentale)), 마카다미아(마카다미아 인테그리폴리아(Macadamia integrifolia)), 아몬드(프루누스 아미그달루스(Prunus amygdalus)), 사탕무(베타 불가리스(Beta vulgaris)), 야채, 관상용 식물 및 침엽수를 포함한다.
야채는 토마토(라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)), 상추(예를 들어, 락투카 사티바(Lactuca sativa)), 그린 빈(파세올러스 불가리스(Phaseolus vulgaris)), 리마 콩(파세올러스 리멘시스(Phaseolus limensis)), 완두콩(라티루스(Lathyrus) 종), 및 쿠쿠미스(Cucumis) 속의 구성원, 예컨대 오이(C. 사티부스(sativus)), 캔탈로프(C. 칸탈루펜시스(cantalupensis)) 및 머스크 멜론(C. 멜로(melo))을 포함한다. 관상용 식물은 진달래(로도덴드론(Rhododendron) 종), 수국(마크로필라 하이드랑게아(Macrophylla hydrangea)), 히비스커스(히비스커스 로사사넨시스(Hibiscus rosasanensis)), 장미(로자(Rosa) 종), 튤립(튤리파(Tulipa) 종), 수선화(나르시서스(Narcissus) 종), 페튜니아(페튜니아 하이브리다(Petunia hybrida)), 카네이션(디안투스 카리오필러스(Dianthus caryophyllus)), 포인세티아(유포르비아 풀케리마(Euphorbia pulcherrima)) 및 국화를 포함한다.
본 발명의 실시에서 이용될 수 있는 침엽수는, 예를 들어, 소나무, 예컨대 테다 소나무(피너스 태다(Pinus taeda)), 슬래시 소나무(피너스 엘리오티이(Pinus elliotii)), 폰데로사 소나무(피너스 폰데로사(Pinus ponderosa)), 로지폴 소나무(피너스 콘토르타(Pinus contorta)) 및 몬테레이 소나무(피너스 라디아타(Pinus radiata)); 미송(슈도추가 멘지에시이(Pseudotsuga menziesii)); 미국 솔송나무(추가 카나덴시스(Tsuga canadensis)); 시트카 가문비나무(피세아 글라우카(Picea glauca)); 미국삼나무(세쿠오이아 셈페르비렌스(Sequoia sempervirens)); 전나무, 예컨대 유럽 전나무(애비스 아마빌리스(Abies amabilis)) 및 발삼 전나무(애비스 발사메아(Abies balsamea)); 및 개잎갈나무, 예컨대 미국 삼나무(투자 플리카타(Thuja plicata)) 및 알래스카 측백나무(카매사이파리스 누트카텐시스(Chamaecyparis nootkatensis))를 포함한다.
용어 "식물"은 전체 식물, 식물 기관, 식물 조직, 종자, 식물 세포, 종자 및 그 자손을 포함한다. 식물 세포는 제한 없이 종자로부터의 세포, 현탁액 배양물, 배아, 분열부, 캘러스 조직, 잎, 뿌리, 어린 싹, 배우체, 포자체, 꽃가루 및 미포자를 포함한다. 식물 부분은 비제한적인 예로서 뿌리, 줄기, 어린 싹, 잎, 꽃가루, 종자, 종양 조직 및 다양한 형태의 세포 및 배양물(예를 들어, 단일 세포, 원형질체, 배아 및 캘러스 조직)을 포함하는 분화 및 미분화 조직을 포함한다. 식물 조직은 식물에, 또는 식물 기관, 조직 또는 세포 배양물에 있을 수 있다. 용어 "식물 기관"은 형태학적으로 및 기능적으로 구별되는 식물 부분을 구성하는 식물 조직 또는 조직들의 군을 지칭한다. 용어 "게놈"은 유기체 또는 바이러스의 각각의 세포 또는 세포 소기관에 존재하는 유전 물질(유전자 및 비암호화 서열)의 전체 보체; 및/또는 한쪽 부모로부터 (반수체) 단위로서 유전된 완전한 염색체 세트를 지칭한다. "자손"은 식물의 임의의 후속 세대를 포함한다.
본원에 사용된 바와 같이, 용어 "식물 부분"은 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 덩어리, 및 식물 또는 식물 부분, 예컨대 배아, 꽃가루, 난세포, 종자, 잎, 꽃, 가지, 과일, 속씨, 이삭, 속대, 껍질, 줄기, 뿌리, 뿌리 끝, 꽃밥 등에서 온전한 식물 세포뿐만 아니라 그 부분 자체를 지칭한다. 낟알은 종의 성장 또는 생식 이외의 목적을 위해 상업적 재배업자에 의해 생산되는 성숙 종자를 의미하려는 것이다. 재생된 식물의 자손, 변이체 및 돌연변이체는 또한 이 부분들이 도입된 폴리뉴클레오타이드를 포함하는 한 본 발명의 범위 내로 포함된다.
유전자이식 식물은, 예를 들어, 형질전환 단계에 의해 도입된 이종 폴리뉴클레오타이드를 그 게놈 내에 포함하는 식물을 포함한다. 이종 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대대로 전달되도록 게놈 내에 안정하게 통합될 수 있다. 이종 폴리뉴클레오타이드는 단독으로 또는 재조합 DNA 작제물의 일부로서 게놈으로 통합될 수 있다. 유전자이식 식물은 그 게놈 내에 하나 초과의 이종 폴리뉴클레오타이드를 포함할 수도 있다. 각각의 이종 폴리뉴클레오타이드는 유전자이식 식물에 상이한 형질을 부여할 수 있다. 이종 폴리뉴클레오타이드는 외래 종으로부터 기원하는 서열을 포함할 수 있거나, 동일 종으로부터 유래하는 경우, 그 자연적인 형태로부터 실질적으로 변형될 수 있다. 유전자이식체는 초기에 그렇게 변경된 유전자이식체뿐만 아니라 초기의 유전자이식체로부터 유성 교배 또는 무성 번식에 의해 생성된 것들을 비롯하여, 이종 핵산의 존재에 의해 유전형이 변경된 임의의 세포, 세포주, 캘러스, 조직, 식물 부분 또는 식물을 포함할 수 있다. 종래의 식물 육종 방법, 외래 폴리뉴클레오타이드의 삽입을 초래하지 않는 본원에 기재된 게놈 편집 절차, 또는 자연적으로 발생하는 이벤트, 예컨대, 무작위 타가 수정, 비-재조합 바이러스 감염, 비-재조합 박테리아 형질전환, 비-재조합 전위, 또는 자연 돌연변이에 의한 (염색체 또는 염색체외) 게놈의 변경은 유전자이식으로 간주되지 않는다.
번식성 식물은 생존 가능한 웅성 및 자성 생식세포를 생산하는 식물이며, 자가 수정한다. 이러한 자가 수정 식물은 임의의 다른 생식세포 식물 및 그 안에 함유된 유전 물질의 기여 없이 자손 식물을 생산할 수 있다.
정의
"대립유전자" 또는 "대립유전자 변이체"는 염색체 상의 주어진 유전자위를 차지하는 몇 가지 대안적 유전자 형태 중 하나이다. 염색체 상의 주어진 유전자위에 존재하는 모든 대립 유전자가 동일한 경우, 그 유기체는 그 유전자위에서 동형접합성이다. 염색체 상의 주어진 유전자위에 존재하는 대립유전자가 상이한 경우, 그 유기체는 그 유전자위에서 이형접합성이다. 폴리뉴클레오타이드의 대립유전자 변이체는 유전자의 대립유전자 변이체에 의해 암호화된 폴리펩타이드이다.
"암호화 서열"은 특정 아미노산 서열을 암호화하는 폴리뉴클레오타이드 서열을 지칭한다. 암호화 서열의 경계는 일반적으로 오픈 리딩 프레임에 의해 결정되며, 이는 시작 코돈, 예컨대 ATG, GTG 또는 TTG로 시작하고 정지 코돈, 예컨대 TAA, TAG 또는 TGA로 끝난다. 암호화 서열은 게놈 DNA, cDNA, 합성 DNA 또는 이들의 조합일 수 있다.
"조절 서열"은 암호화 서열의 상류에(5' 비암호화 서열), 내에 또는 하류(3' 비암호화 서열)에 위치하며, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, 5' 비번역 서열, 3' 비번역 서열, 인트론, 폴리아데닐화 표적 서열, RNA 가공 부위, 효과기 결합 부위 및 줄기-루프 구조를 포함하지만, 이에 한정되는 것은 아니다.
"코돈 변형 유전자" 또는 "코돈 선호 유전자" 또는 "코돈 최적화 유전자"는 숙주 세포의 선호되는 코돈 사용의 빈도를 모방하도록 설계된 코돈 사용 빈도를 갖는 유전자이다. 유전자를 코돈 최적화하도록 이루어진 핵산 변경은 "동의어"이며, 이는 이들이 모 유전자의 암호화된 폴리펩타이드의 아미노산 서열을 변경시키지 않는다는 것을 의미한다. 그러나, 자연적 유전자 및 변이체 유전자 둘 다는 특정 숙주 세포에 대해 코돈 최적화될 수 있으며, 이와 관련하여 이와 같은 제한은 의도되지 않는다. 코돈 선호 유전자를 합성하는 방법들은 당해 분야에서 이용 가능하다. 예를 들어, 본원에 참조로 포함된 미국 특허 제5,380,831호, 및 제5,436,391호, 및 문헌[Murray et al. (1989) Nucleic Acids Res. 17:477-498]을 포함한다.
추가적인 서열 변형은 숙주 유기체에서 유전자 발현을 향상시키는 것으로 공지되어 있다. 이들은, 예를 들어, 가짜 폴리아데닐화 신호를 암호화하는 하나 이상의 서열, 하나 이상의 엑손-인트론 스플라이스 부위 신호, 하나 이상의 트랜스포존-유사 반복부 및 유전자 발현에 유해할 수 있는 기타 이러한 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 세포에서 발현되는 공지된 유전자를 참조하여 계산되는 주어진 숙주 유기체(예컨대, 식물)에 대해 평균인 수준으로 조정될 수 있다. 가능한 경우, 서열은 하나 이상의 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
용어 "보존된 도메인" 또는 "모티프"는 진화적으로 관련된 단백질의 정렬된 서열을 따라 특정 위치에 보존된 아미노산 세트를 의미한다. 다른 위치에서의 아미노산은 상동 단백질 간에 변할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 활성에 필수적인 아미노산을 나타낸다. 이들은 단백질 상동체 패밀리의 정렬된 서열에서 높은 보존 정도에 의해 확인되기 때문에, 새로 결정된 서열을 가진 단백질이 이전에 확인된 단백질 패밀리에 속하는지를 결정하기 위한 식별자 또는 "서명"으로 사용될 수 있다.
본원에 사용된 바와 같이, "핵산"은 폴리뉴클레오타이드를 의미하고 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 가닥 중합체 또는 이중 가닥 중합체를 포함한다. 핵산은 또한 단편 및 변형된 뉴클레오타이드를 포함할 수 있다. 따라서, 용어 "폴리뉴클레오타이드", "핵산 서열", "뉴클레오타이드 서열" 및 "핵산 단편"은 선택적으로 합성, 비천연 또는 변경된 뉴클레오타이드 염기를 함유하는 단일 또는 이중 가닥인 RNA 및/또는 DNA 및/또는 RNA-DNA의 중합체를 나타내기 위해 상호 교환적으로 사용된다. (보통 이의 5'-모노포스페이트 형태로 발견되는) 뉴클레오타이드는 다음과 같이 단일 문자 표시에 의해 지칭된다: 아데노신 또는 데옥시아데노신에 대해서(각각 RNA 또는 DNA에 있어서) "A", 시토신 또는 데옥시시토신에 대해서 "C", 구아노신 또는 데옥시구아노신에 대해서 "G", 유리딘에 대해서 "U", 데옥시티미딘에 대해서 "T", 퓨린(A 또는 G)에 대해서 "R", 피리미딘(C 또는 T)에 대해서 "Y", G 또는 T에 대해서 "K", A 또는 C 또는 T에 대해서 "H", 이노신에 대해서 "I", 및 임의의 뉴클레오타이드에 대해서 "N"(예를 들어, DNA 서열을 지칭하는 경우 N은 A, C, T 또는 G일 수 있고; RNA 서열을 지칭하는 경우 N은 A, C, U, 또는 G일 수 있다).
본원에 사용된 바와 같이 용어 "증가된"은 증가된 분량 또는 활성이 비교되는 분량 또는 활성보다 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100%, 또는 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배 높은 분량 또는 활성을 지칭할 수 있다. 용어 "증가된", "더 높은" 및 "개선된"은 본 명세서에서 상호 교환적으로 사용된다. 용어 "증가된"은 단백질, 예컨대 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 형질전환 또는 유전자 편집 효율을 규명하기 위해 사용될 수 있다.
일 양태에서, 증가는 본원에 기재된 Cas9 변이체, 예컨대 비제한적인 예로서 Cas9 Y155 변이체 또는 Cas9 F86A+F98A 변이체가 PGEN의 일부로서 사용될 때, 이의 모 (야생형) Cas9를 대신에 포함함을 제외하고는 동일한 PGEN과 비교한 원핵생물 또는 진핵생물 세포의 형질전환 효율의 증가이고, 여기서 형질전환 효율의 증가는 적어도 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배이다.
일 양태에서, 증가는 본원에 기재된 Cas9 변이체, 예컨대 비제한적인 예로서 Cas9 Y155 변이체 또는 Cas9 F86A+F98A 변이체가 PGEN의 일부로서 사용될 때, 이의 모 (야생형) Cas9를 대신에 포함함을 제외하고는 동일한 PGEN과 비교한 원핵생물 또는 진핵생물 세포의 DNA 편집 효율의 증가이고, 여기서 유전자 편집 효율의 증가는 적어도 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%이다.
"오픈 리딩 프레임"은 ORF로 약칭된다.
"유전자"는 비제한적인 예로서 암호화 서열 앞의 조절 서열(5' 비암호화 서열) 및 뒤의 조절 서열(3' 비암호화 서열)을 포함하는 특정 단백질과 같은 기능적 분자를 발현하는 핵산 단편을 포함한다. "자연적 유전자"는 그 자신의 조절 서열과 자연에서 발견되는 유전자를 지칭한다.
"돌연변이된 유전자"는 인간 개입을 통해 변경된 유전자이다. 이러한 "돌연변이된 유전자"는 적어도 하나의 뉴클레오타이드 부가, 결실 또는 치환에 의해 대응하는 비돌연변이된 유전자의 서열과 다른 서열을 갖는다. 본 발명의 소정의 구현예에서, 돌연변이된 유전자는 본원에 개시된 가이드 폴리뉴클레오타이드/Cas 단백질 시스템에서 생긴 변경을 포함한다. 돌연변이된 세포 또는 유기체는 돌연변이된 유전자를 포함하는 세포 또는 유기체이다.
용어 "게놈"은 원핵생물 및 진핵생물 세포 또는 유기체 세포에 적용되면서 핵 내에서 발견되는 염색체 DNA뿐만 아니라 세포의 세포내 성분(예를 들어, 미토콘드리아 또는 색소체) 내에서 발견되는 세포소기관 DNA를 포함한다.
관심 폴리뉴클레오타이드는 본원에 추가로 기재되어 있고, 효소 생성(예컨대, 비제한적인 예로서 박테리아 또는 진균의 발효로 효소를 생성하는 것을 통해 또는 효소를 생성하는 식물에 의해) 및 작물 발생에 관여된 것의 상업 시장 및 관심을 반영하는 폴리뉴클레오타이드를 포함한다.
관심 작물 및 시장은 변화하며, 개발 도상국이 세계 시장을 개방함에 따라 새로운 작물과 기술이 또한 등장할 것이다. 또한, 수확량과 잡종 강세와 같은 작물학적 형질 및 특성에 대한 이해가 높아짐에 따라 유전자 조작을 위한 유전자의 선택은 그에 따라 변할 것이다. 관심 폴리뉴클레오타이드는 농약, 제초제-내성, 살충제 내성, 질환 내성, 선충 내성, 제초제 내성, 미생물 내성, 진균 내성, 바이러스 내성, 생식력 또는 불임성, 낟알 특징 및 상업적 제품을 위해 중요한 형질을 암호화하는 폴리뉴클레오타이드를 포함하지만, 이에 한정되는 것은 아니다.
관심 폴리뉴클레오타이드의 일반적인 범주는, 예를 들어, 징크 핑거와 같은 정보 관련 관심 유전자, 키나아제와 같은 커뮤니케이션 관련 유전자, 및 열 충격 단백질과 같은 하우스키핑 관련 유전자를 포함한다. 보다 구체적인 관심 폴리뉴클레오타이드는 작물 수확량, 낟알 품질, 작물 영양소 함량, 전분 및 탄수화물 품질 및 양에 관련된 유전자뿐만 아니라 속씨 크기, 수크로스 부하, 단백질 품질 및 양, 질소 고정 및/또는 이용, 지방산 및 오일 조성에 영향을 미치는 유전자, 비생물 스트레스에 저항성을 부여하는 단백질을 암호화하는 유전자(예컨대, 가뭄, 질소, 온도, 염도, 독성 금속 또는 미량 원소, 또는 독소, 예컨대 살해충제 및 제초제에 대한 저항성을 부여하는 유전자), 생물 스트레스(예컨대, 진균, 바이러스, 박테리아, 곤충 및 선충에 의한 공격, 및 이러한 유기체와 연관되는 질병의 발생)에 저항성을 부여하는 단백질을 암호화하는 유전자를 포함하지만, 이에 한정되는 것은 아니다.
또한, 관심 폴리뉴클레오타이드는 표적화된 관심 유전자 서열에 대한 메신저 RNA(mRNA)의 적어도 일부에 상보적인 안티센스 서열을 포함할 수도 있는 것으로 인식된다. 안티센스 뉴클레오타이드는 대응 mRNA와 혼성화하도록 작제된다. 안티센스 서열의 변형은 서열이 대응 mRNA에 혼성화하고 이의 발현을 방해하는 한 제조될 수 있다. 이러한 방식으로, 대응 안티센스 서열과 70%, 80% 또는 85%의 서열 동일성을 갖는 안티센스 구성이 사용될 수 있다. 또한, 안티센스 뉴클레오타이드의 일부는 표적 유전자의 발현을 방해하는 데 사용될 수 있다. 일반적으로, 적어도 50개 뉴클레오타이드, 100개 뉴클레오타이드, 200개 뉴클레오타이드 이상의 서열이 사용될 수 있다.
또한, 관심 폴리뉴클레오타이드는 유기체에서 내인성 유전자 발현을 억제하기 위해 센스 방향으로 사용될 수도 있다. 폴리뉴클레오타이드를 센스 방향으로 사용하여 유기체에서의 유전자 발현을 억제하는 방법은 당해 분야에 공지되어 있다. 상기 방법은 일반적으로 내인성 유전자의 전사체에 대응하는 뉴클레오타이드 서열의 적어도 일부에 작동 가능하게 연결된 유기체에서 발현을 유도하는 프로모터를 포함하는 DNA 작제물로 유기체를 형질전환시키는 단계를 수반한다. 통상적으로, 이러한 뉴클레오타이드 서열은 내인성 유전자의 전사체의 서열에 대해 일반적으로 약 65%의 서열 동일성, 약 85%의 서열 동일성보다 크거나, 약 95%의 서열 동일성보다 큰 상당한 서열 동일성을 갖는다. 본원에 참조로 포함되는 미국 특허 5,283,184호 및 5,034,323호를 참조한다.
관심 폴리뉴클레오타이드는 표현형 마커일 수도 있다. 표현형 마커는, 시각적 마커 및 그것이 양성의 선택 가능한 마커든 음성의 선택 가능한 마커든 선택 가능한 마커를 포함하는, 선별 가능한 또는 선택 가능한 마커이다. 임의의 표현형 마커가 사용될 수 있다. 구체적으로, 선택 가능한 또는 선별 가능한 마커는 종종 특정 조건 하에 그것을 포함하는 분자 또는 세포를 확인하거나, 이를 또는 이에 반하여 선택할 수 있게 하는 DNA 분절을 포함한다. 이들 마커는 활성, 예컨대 비제한적인 예로서 RNA, 펩타이드 또는 단백질의 생성을 암호화할 수 있거나, RNA, 펩타이드, 단백질, 무기 및 유기 화합물 또는 조성물 등에 대한 결합 부위를 제공할 수 있다.
선택 가능한 마커의 예는 제한 효소 부위를 포함하는 DNA 분절; 항생제, 예컨대, 스펙티노마이신, 암피실린, 카나마이신, 테트라사이클린, 바스타(Basta), 네오마이신 포스포트랜스퍼라아제 II(NEO) 및 히그로마이신 포스포트랜스퍼라아제(HPT)를 포함하는, 다른 경우에는 독성일 수 있는 화합물에 대해 내성을 제공하는 산물을 암호화하는 DNA 분절; 수용 세포에 없을 수 있는 산물을 암호화하는 DNA 분절(예컨대, tRNA 유전자, 영양요구성 마커); 용이하게 확인될 수 있는 산물을 암호화하는 DNA 분절(예를 들어, 표현형 마커, 예컨대, β-갈락토시다아제, GUS; 형광 단백질, 예컨대, 녹색 형광 단백질(GFP), 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP) 및 세포 표면 단백질); PCR을 위한 새로운 프라이머 부위(예를 들어, 이전에는 병치되지 않은 2개의 DNA 서열의 병치)의 생성, 제한 엔도뉴클레아제 또는 기타 DNA 변형 효소, 화학물질 등에 의해 영향받지 않거나 영향받는 DNA 서열의 포함; 및 확인을 가능하게 하는 특이적인 변형(예를 들어, 메틸화)을 위해 필요한 DNA 서열의 포함을 포함하지만, 이에 한정되는 것은 아니다.
추가적인 선택 가능한 마커는 제초제 화합물, 예컨대, 설포닐우레아, 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 내성을 부여하는 유전자를 포함한다. 예를 들어, 설포닐우레아, 이미다졸리논, 트리아졸로피리미딘 설폰아미드, 피리미디닐살리실레이트 및 설포닐아미노카보닐-트리아졸리논에 대한 내성을 위한 아세토락타제 합성효소(ALS: Acetolactase synthase)(Shaner and Singh, 1997, Herbicide Activity: Toxicol Biochem Mol Biol 69-110); 글리포세이트 내성 5-엔올피루빌쉬키메이트-3-포스페이트(EPSPS)(Saroha et al. 1998, J. Plant Biochemistry & Biotechnology Vol 7:65-72)를 참조한다.
관심 폴리뉴클레오타이드는 다른 형질, 예컨대 비제한적인 예로서 제초제 내성 또는 본원에 기재된 임의의 다른 형질과 함께 쌓이거나 조합되어 사용될 수 있는 유전자를 포함한다. 관심 폴리뉴클레오타이드 및/또는 형질은, 둘 다 본원에 참조로 포함되는 2013년 10월 3일 공개된 US-2013-0263324-A1 및 2013년 1월 24일 공개된 PCT/US13/22891에 기술된 바와 같이, 복합 형질 유전자위에서 함께 쌓일 수 있다.
표적 부위에서 또는 그 근처에서 게놈으로의 삽입을 갖는 세포를 확인하기 위해 다양한 방법을 사용할 수 있다. 비제한적인 예로서 PCR 방법, 시퀀싱 방법, 뉴클레아제 소화, 서던 블롯, 및 이들의 임의의 조합을 포함하여, 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 검출하는 것과 같은 방법을 들 수 있다. 예를 들어, 본원에 기재된 방법에 필요한 정도로 본원에 참조로 포함되는 미국 특허 출원 12/147,834를 참조한다. 상기 방법은 또한 그 게놈으로 통합된 관심 폴리뉴클레오타이드를 포함하는 세포로부터 유기체를 회수하는 단계를 포함한다.
관심 폴리펩타이드는 본원에 기재된 관심 폴리뉴클레오타이드에 의해 암호화되는 임의의 단백질 또는 폴리펩타이드를 포함한다.
폴리뉴클레오타이드 및 폴리펩타이드 서열, 이의 변이체, 및 이들 서열의 구조적 관계는 본원에서 상호 교환적으로 사용되는 용어 "상동성", "상동", "실질적으로 동일한", "실질적으로 유사한" 및 "실질적으로 대응하는"에 의해 기술될 수 있다. 이들은 하나 이상의 아미노산 또는 뉴클레오타이드 염기에서의 변화가 분자의 기능, 예컨대, 유전자 발현을 매개하거나 소정의 표현형을 생성하는 능력에 영향을 미치지 않는 폴리펩타이드 또는 핵산 서열을 지칭한다. 이들 용어는 또한, 초기의 비변형된 핵산에 비해 생성된 핵산의 기능적 특성을 실질적으로 변경하지 않는 핵산 서열의 변형(들)을 지칭한다. 이들 변형은 핵산 단편에서의 하나 이상의 뉴클레오타이드의 결실, 치환, 및/또는 삽입을 포함한다.
포함되는 실질적으로 유사한 핵산 서열은 (적당히 엄격한 조건, 예를 들어 0.5X SSC, 0.1% SDS, 60℃에서) 본원에 예시된 서열과 혼성화하거나, 본원에 개시된 뉴클레오타이드 서열의 임의의 일부에 혼성화하고, 본원에 개시된 임의의 핵산 서열과 기능적으로 동등한 능력에 의해 정의될 수 있다. 엄격성 조건은 원연(distantly-related) 유기체로부터의 상동 서열과 같은 적당히 유사한 단편에 대해 매우 유사한 단편, 예컨대, 근연(closely-related) 유기체로부터의 기능적 효소를 복제하는 유전자로 선별하도록 조정될 수 있다. 혼성화 후 세척이 엄격성 조건을 결정한다.
용어 "선택적으로 혼성화한다"는 엄격한 혼성화 조건 하에 비표적 핵산 서열에의 혼성화보다 검출 가능하게 더 큰 정도(예를 들어, 배경에 비해 적어도 2배)의 핵산 서열의 특정 핵산 표적 서열에의 혼성화 및 비표적 핵산의 실질적 배제에 대한 언급을 포함한다. 선택적으로 혼성화하는 서열은 통상적으로 서로 적어도 약 80%의 서열 동일성, 또는 90%의 서열 동일성을 가지며, 100%의 서열 동일성(즉, 완전히 상보적)까지를 포함한다.
용어 "엄격한 조건" 또는 "엄격한 혼성화 조건"은 시험관내 혼성화 분석법에서 프로브가 그 표적 서열에 선택적으로 혼성화하는 조건에 대한 언급을 포함한다. 엄격한 조건은 서열 의존적이며 상황에 따라 상이할 것이다. 혼성화 및/또는 세척 조건의 엄격성을 제어함으로써, 프로브와 100% 상보적인 표적 서열을 확인할 수 있다(상동 프로빙). 대안적으로, 엄격성 조건은 서열에서 일부 불일치를 허용하여 더 낮은 정도의 유사도가 검출되도록 조정될 수 있다(이종 프로빙). 일반적으로 프로브는 약 1000개 미만의 뉴클레오타이드 길이, 선택적으로 500개 미만의 뉴클레오타이드 길이이다.
통상적으로, 엄격한 조건은 pH 7.0 내지 8.3에서 그리고 짧은 프로브(예를 들어 10개 내지 50개의 뉴클레오타이드)의 경우 적어도 약 30℃에서, 긴 프로브(예를 들어 50개 초과의 뉴클레오타이드)의 경우 적어도 약 60℃에서 염 농도가 약 1.5 M Na 이온 미만, 통상적으로 약 0.01 내지 1.0 M Na 이온 농도(또는 다른 염(들))인 조건일 것이다. 엄격한 조건은 포름아미드와 같은 불안정화제의 첨가로 달성될 수도 있다. 예시적인 낮은 엄격성 조건은 37℃에서의 30 내지 35% 포름아미드, 1 M NaCl, 1% SDS(나트륨 도데실 설페이트) 완충 용액으로의 혼성화, 및 50 내지 55℃에서의 1X 내지 2X SSC(20X SSC = 3.0 M NaCl/0.3 M 삼나트륨 시트레이트) 중 세척을 포함한다. 예시적인 보통의 엄격성 조건은 37℃에서의 40 내지 45% 포름아미드, 1 M NaCl, 1% SDS 중 혼성화, 및 55 내지 60℃에서의 0.5X 내지 1X SSC 중 세척을 포함한다. 예시적인 높은 엄격성 조건은 37℃에서의 50% 포름아미드, 1 M NaCl, 1% SDS 중 혼성화, 및 60 내지 65℃에서의 0.1X SSC 중 세척을 포함한다.
본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 조절할 수 있는 DNA 서열을 지칭한다. 프로모터 서열은 근위의 상류 요소 및 더 원위의 상류 요소로 구성되고, 후자는 종종 인핸서로 지칭된다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이고, 프로모터 고유의 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종 요소일 수 있다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터들로부터 유래된 상이한 요소들로 구성될 수 있고/있거나, 합성 DNA 분절을 포함할 수 있다. 당업자는 상이한 프로모터가 상이한 조직 또는 세포 유형으로, 또는 상이한 발달 단계에서 또는 상이한 환경 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 또한, 대부분의 경우, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 일부 변형을 갖는 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 더 인식된다. 당해 분야에서 잘 알려진 것처럼, 프로모터들은 이들의 강도 및/또는 이들이 활성인 조건, 예컨대 항시성(constitutive) 프로모터, 강한 프로모터, 약한 프로모터, 유도성/억제성 프로모터, 조직 특이적/발달 조절 프로모터, 세포주기 의존성 프로모터 등에 따라 분류될 수 있다.
본원에서 유용한 강력한 프로모터의 예는 본원에 참조로 포함되는 미국 특허 출원 공개 번호 2012/0252079(DGAT2), 2012/0252093(EL1), 2013/0089910(ALK2), 2013/0089911(SPS19), 2006/0019297(GPD 및 GPM), 2011/0059496(GPD 및 GPM), 2005/0130280(FBA, FBAIN, FBAINm), 2006/0057690(GPAT) 및 2010/0068789(YAT1)에 개시된 것들을 포함한다. 적합한 강한 프로모터의 다른 예는 2016년 2월 19일 공개된 WO2016/025131(본원에 참조로 포함됨)의 표 2에 기재된 것을 포함한다.
핵산 또는 폴리펩타이드 서열의 문맥에서 "서열 동일성" 또는 "동일성"은, 특정 비교 창에 걸쳐 최대 관련성을 위해 정렬될 때, 동일한 2개의 서열에서의 핵산 염기 또는 아미노산 잔기를 지칭한다.
용어 "서열 동일성 백분율"은 비교 창에 걸쳐 최적으로 정렬된 2개의 서열을 비교하여 결정된 값을 지칭하며, 비교 창 내의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 일부는 2개의 서열의 최적 정렬을 위한 (부가 또는 결실을 포함하지 않는) 기준 서열과 비교하여 부가 또는 결실(즉, 갭)을 포함할 수 있다. 서열 둘 다에서 동일한 핵산 염기 또는 아미노산 잔기가 나타나는 위치의 개수를 결정하여 일치된 위치의 개수를 산출하고, 일치된 위치의 개수를 비교 창에서의 위치의 총 개수로 나누고, 그 결과에 100을 곱하여 백분율을 계산함으로써, 서열 동일성 백분율을 산출한다. 서열 동일성 백분율의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 한정되는 것은 아니다. 이들 동일성은 본원에 기재된 프로그램 중 임의의 것을 사용하여 결정될 수 있다.
서열 정렬 및 동일성 또는 유사성 백분율 계산은 비제한적인 예로서 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨))의 MegAlign™ 프로그램을 포함하는 상동 서열을 검출하도록 설계된 다양한 비교 방법을 사용하여 결정될 수 있다. 본 출원의 문맥에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 달리 명시되지 않는 한, 분석 결과는 언급된 프로그램의 "디폴트 값"에 기초함이 이해될 것이다. 본원에 사용된 바와 같이, "디폴트 값"은 최초로 초기화될 때, 원래 소프트웨어로 로딩되는 임의의 값 또는 파라미터 세트를 의미할 것이다.
"Clustal V 정렬 방법"은 Clustal V(Higgins and Sharp, (1989) CABIOS 5:151-153; Higgins et al., (1992) Comput Appl Biosci 8:189-191에 기술됨)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨))의 MegAlign™ 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬의 경우, 디폴트 값은 GAP PENALTY = 10 및 GAP LENGTH PENALTY = 10에 해당한다. Clustal 방법을 사용하는 단백질 서열의 동일성 백분율의 계산 및 쌍 정렬을 위한 디폴트 파라미터는 KTUPLE = 1, GAP PENALTY = 3, WINDOW = 5 및 DIAGONALS SAVED = 5이다. 핵산의 경우, 이들 파라미터는 KTUPLE = 2, GAP PENALTY = 5, WINDOW = 4 및 DIAGONALS SAVED = 4이다. Clustal V 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성 백분율"을 얻을 수 있다.
"Clustal W 정렬 방법"은 Clustal W(Higgins and Sharp, (1989) CABIOS 5:151-153; Higgins et al., (1992) Comput Appl Biosci 8:189-191에 기술됨)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨))의 MegAlign™ v6.1 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬을 위한 디폴트 파라미터(GAP PENALTY = 10, GAP LENGTH PENALTY = 0.2, 지연 발산 서열(%) = 30, DNA 전이 가중치 = 0.5, 단백질 가중치 매트릭스 = Gonnet 시리즈, DNA 가중치 매트릭스 = IUB). Clustal W 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성 백분율"을 얻을 수 있다.
달리 명시되지 않는 한, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하여, GAP 버전 10(GCG, Accelrys(캘리포니아주 샌 디에고))을 사용하여 얻은 값을 지칭한다: 뉴클레오타이드 서열에 대한 동일성% 및 유사성%는 갭 생성 페널티 가중치 50 및 갭 길이 연장 페널티 가중치 3 및 nwsgapdna.cmp 점수 매트릭스를 사용하며; 아미노산 서열에 대한 동일성% 및 유사성%는 GAP 생성 페널티 가중치 8 및 갭 길이 연장 페널티 2 및 BLOSUM62 점수 매트릭스를 사용함(Henikoff and Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89:10915). GAP는 Needleman and Wunsch, (1970) J Mol Biol 48:443-53의 알고리즘을 사용하여 일치의 수를 최대화하고 갭의 수를 최소화하는 2개의 전체 서열의 정렬을 찾는다. GAP는 가능한 모든 정렬 및 갭 위치를 고려하고, 일치된 염기의 단위로 갭 생성 페널티 및 갭 연장 페널티를 사용하여 가장 많은 수의 일치된 염기와 가장 적은 갭을 갖는 정렬을 생성한다.
"BLAST"는 생물학적 서열 간의 유사성 영역을 찾는 데 사용되는 미국 국립 생물공학 정보 센터(NCBI: National Center for Biotechnology Information)에 의해 제공된 검색 알고리즘이다. 이 프로그램은 뉴클레오타이드 또는 단백질 서열을 서열 데이터베이스와 비교하고, 일치의 통계적 유의성을 계산하여 유사성이 무작위로 발생한 것으로 예측되지 않도록 쿼리 서열과 충분한 유사성을 갖는 서열을 확인한다. BLAST는 확인된 서열 및 이들의 쿼리 서열에 대한 국소 정렬을 보고한다.
당업자는 여러 수준의 서열 동일성이 다른 종 또는 자연적으로 또는 합성적으로 변형된 종으로부터 폴리펩타이드를 확인하는 데 유용하고, 이러한 폴리펩타이드가 동일하거나 유사한 기능 또는 활성을 갖는다는 것을 잘 이해한다. 백분율 동일성의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 한정되는 것은 아니다. 실제로, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%와 같은 50% 내지 100%의 임의의 정수의 아미노산 동일성은 본 발명을 기술하는 데 유용할 수 있다.
"번역 리더 서열"은 유전자의 프로모터 서열과 암호화 서열 사이에 위치한 폴리뉴클레오타이드 서열을 지칭한다. 번역 리더 서열은 번역 시작 서열의 상류 mRNA에 존재한다. 번역 리더 서열은 mRNA에 대한 1차 전사체의 가공, mRNA 안정성 또는 번역 효율에 영향을 미칠 수 있다. 번역 리더 서열의 예가 기술되어 있다(예를 들어, Turner and Foster, (1995) Mol Biotechnol 3:225-236).
"3' 비암호화 서열", "전사 종결자" 또는 "종결 서열"은 암호화 서열의 하류에 위치한 DNA 서열을 지칭하며, 폴리아데닐화 인식 서열, 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 다른 서열을 포함한다. 폴리아데닐화 신호는 보통 mRNA 전구체 3' 말단에 대한 폴리아데닐산 영역 추가에 영향을 주는 것을 특징으로 한다. 다른 3' 비암호화 서열의 사용은 문헌[Ingelbrecht et al., (1989) Plant Cell 1:671-680]에 예시되어 있다.
본원에 사용된 바와 같이, "RNA 전사체"는 DNA 서열의 RNA 중합효소-촉매된 전사로부터 생긴 산물을 지칭한다. RNA 전사체가 DNA 서열의 완벽한 상보적인 카피인 경우, 이를 1차 전사체 또는 프리-mRNA라고 지칭된다. RNA 전사체는 1차 전사체 프리-mRNA의 전사 후 가공으로부터 유래된 RNA 서열일 때 성숙 RNA 또는 mRNA라고 지칭된다. "메신저 RNA" 또는 "mRNA"는, 인트론이 없고 세포에 의해 단백질로 번역될 수 있는 RNA를 지칭한다. "cDNA"는 효소 역전사효소를 사용하는 mRNA 주형에 상보적이고 그로부터 합성되는 DNA를 지칭한다. cDNA는 단일 가닥이거나, DNA 중합효소 I의 Klenow 단편을 사용하여 이중 가닥 형태로 변환될 수 있다. "센스" RNA는 mRNA를 포함하는 RNA 전사체를 지칭하며 세포내 또는 시험관내 단백질로 번역될 수 있다. "안티센스 RNA"는, 표적 1차 전사체 또는 mRNA의 전부 또는 일부에 상보적이고 표적 유전자의 발현을 차단하는 RNA 전사체를 지칭한다(예를 들어, 미국 특허 5,107,065호 참조). 안티센스 RNA의 상보성은 특정 유전자 전사체의 임의의 부분, 즉 5' 비암호화 서열, 3' 비암호화 서열, 인트론 또는 암호화 서열에 있을 수 있다. "기능적 RNA"는 번역되지 않을 수 있지만 세포 과정에 영향을 미치는 안티센스 RNA, 리보자임 RNA 또는 기타 RNA를 지칭한다. 용어 "보체(complement)" 및 "역보체(reverse complement)"는 mRNA 전사체에 대하여 본원에서 상호 교환적으로 사용되며, 메시지의 안티센스 RNA를 정의하기 위한 의미이다.
"성숙" 단백질은 번역 후 가공된 폴리펩타이드(즉, 1차 번역 산물에 존재하는 임의의 프리펩타이드 또는 프로펩타이드가 제거된 것)를 지칭한다. "전구체" 단백질은 mRNA의 일차 번역 산물(즉, 프리펩타이드 및 프로펩타이드가 여전히 존재하는 것)을 지칭한다. 프리펩타이드 및 프로펩타이드는 세포내 국재화 신호일 수 있으나, 이에 한정되는 것은 아니다.
본원에 사용되는 바와 같이, "표적화된 돌연변이"는 유도 Cas 단백질 시스템을 수반하는 방법을 포함하는 당업자에게 공지된 임의의 방법을 사용하여 표적 유전자 내에 표적 서열을 변경함으로써 제조된 자연적 유전자를 포함하는 유전자(표적 유전자로 지칭됨)에서의 돌연변이이다. Cas 단백질이 cas 엔도뉴클레아제일 때 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 유도된 표적된 돌연변이는 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 게놈 표적 부위 내에 또는 밖에 위치하는 뉴클레오타이드 서열에서 발생할 수 있다.
단백질은 아미노산 치환, 결실, 절두 및 삽입을 비롯한 다양한 방식으로 변경될 수 있다. 이러한 조작 방법은 일반적으로 공지되어 있다. 예를 들어, 단백질(들)의 아미노산 서열 변이체는 DNA에서의 돌연변이에 의해 제조될 수 있다. 돌연변이유발 및 뉴클레오타이드 서열 변경을 위한 방법은 예를 들어 문헌[Kunkel, (1985) Proc. Natl. Acad. Sci. USA 82:488-92; Kunkel et al., (1987) Meth Enzymol 154:367-82; 미국 특허 제4,873,192호; Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York] 및 여기에 인용된 문헌을 포함한다. 단백질의 생물학적 활성에 영향을 미치지 않을 것 같은 아미노산 치환에 관한 지침은, 예를 들어, Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl Biomed Res Found, Washington, D.C.)의 모델에서 발견된다. 하나의 아미노산을 유사한 성질을 갖는 다른 아미노산과 교환하는 것과 같은 보존적 치환이 바람직할 수 있다. 보존적 결실, 삽입 및 아미노산 치환은 단백질의 특징에 근본적인 변화를 일으킬 것으로 예상되지 않으며, 임의의 치환, 결실, 삽입, 또는 이들의 조합의 효과는 통상적인 스크리닝 분석법에 의해 평가될 수 있다. 이중 가닥 파괴 유도 활성에 대한 분석법은 공지되어 있고, 일반적으로 표적 부위를 포함하는 DNA 기질 상에서 물질의 전체 활성 및 특이성을 측정한다.
표준 DNA 단리, 정제, 분자 클로닝, 벡터 작제 및 검증/특성화 방법은 잘 확립되어 있다(예를 들어, Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY) 참조). 벡터 및 작제물은 원형 플라스미드, 및 관심 폴리뉴클레오타이드와 선택적으로 링커, 어댑터, 조절 또는 분석을 비롯한 다른 성분을 포함하는 선형 폴리뉴클레오타이드를 포함한다. 일부 예에서, 인식 부위 및/또는 표적 부위는 인트론, 암호화 서열, 5' UTR, 3' UTR, 및/또는 조절 영역 내에 함유될 수 있다.
약어의 의미는 다음과 같다: "sec"는 초를 의미하고, "min"은 분을 의미하고, "h"는 시간을 의미하고, "d"는 일을 의미하고, "㎕"는 마이크로리터를 의미하고, "㎖"는 밀리리터를 의미하고, "ℓ"는 리터를 의미하고, "μM"은 마이크로몰을 의미하고, "mM"은 밀리몰을 의미하고, "M"은 몰을 의미하고, "mmol"은 밀리몰을 의미하고, "μmole"은 마이크로몰을 의미하고, "g"은 그램을 의미하고, "㎍"은 마이크로그램을 의미하고, "ng"는 나노그램을 의미하고, "U"는 단위를 의미하고, "bp"는 염기 쌍을 의미하고, "kb"는 킬로염기를 의미한다.
본원에 개시된 조성물 및 방법의 비제한적인 예는 다음과 같다:
1. 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편으로서, 변이체의 아미노산 위치는 상기 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
2. 구현예 1에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는, Cas9 엔도뉴클레아제 변이체.
3. 구현예 1에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는, Cas9 엔도뉴클레아제 변이체.
4. 구현예 1 내지 3 중 어느 하나에 있어서, 상기 변이체는 서열 번호 1의 아미노산 서열과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
5. 구현예 3에 있어서, 개선된 특성은 개선된 형질전환 효율이고, 상기 변이체, 또는 이의 활성 단편은 또한 개선된 편집 효율을 갖는, Cas9 엔도뉴클레아제 변이체.
6. 구현예 1 내지 5 중 어느 하나에 있어서, 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
7. 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 조성물.
8. 구현예 7에 있어서, 상기 조성물은 가이드 폴리뉴클레오타이드/Cas9 엔도뉴클레아제 복합체, 가이드 RNA/Cas9 엔도뉴클레아제 복합체, 및 상기 Cas9 엔도뉴클레아제 변이체를 포함하는 융합 단백질로 이루어진 군으로부터 선택되는, 조성물.
9. 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드.
10. 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN)로서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN).
11. 구현예 9의 폴리뉴클레오타이드를 포함하는 재조합 DNA 작제물.
12. 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 숙주 세포.
13. 구현예 9의 폴리뉴클레오타이드를 포함하는 숙주 세포.
14. 구현예 13에 있어서, 세포는 원핵생물 세포 또는 진핵생물 세포인, 숙주 세포.
15. 구현예 14에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
15b. 구현예 7의 PGEN을 포함하는 키트.
15c. 구현예 1, 2, 3, 4, 5 또는 6에 따른 Cas9 엔도뉴클레아제 변이체를 포함하는 전달 입자.
15d. 구현예 15c에 있어서, Cas9 엔도뉴클레아제 변이체 단백질은 가이드 폴리뉴클레오타이드와 복합체화된, 전달 입자.
16. 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 구현예 10의 PGEN을 도입하는 단계 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계를 포함하고, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법
17. 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법으로서, 상기 방법은 적어도 하나의 구현예 10의 PGEN 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계를 포함하고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함하는 방법.
18. 구현예 17에 있어서, 편집된 뉴클레오타이드 서열을 포함하는 적어도 하나의 세포를 선택하는 단계를 추가로 포함하는 방법.
19. 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 구현예 10의 PGEN 및 적어도 하나의 공여 DNA를 도입하는 단계를 포함하고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함하는 방법.
20. 구현예 19에 있어서, 상기 관심 폴리뉴클레오타이드가 상기 표적 부위에서 또는 그 근처에서 통합된 적어도 하나의 세포를 확인하는 단계를 추가로 포함하는 방법.
21. 구현예 16 내지 21 중 어느 하나에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는 방법.
22. 구현예 16 내지 21 중 어느 하나에 있어서, PGEN은 예비조립된 폴리뉴클레오타이드-단백질 복합체로서 세포로 도입되는 방법.
23. 구현예 16 내지 21 중 어느 하나에 있어서, 가이드 폴리뉴클레오타이드 /Cas 엔도뉴클레아제는 가이드 RNA/Cas 엔도뉴클레아제인 방법.
24. 구현예 22에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체는 리보뉴클레오타이드-단백질 복합체로서 세포로 도입되기 전에 시험관내 조립되는 방법.
25. Cas9 엔도뉴클레아제 변이체의 적어도 하나의 특성을 개선하는 방법으로서, 상기 방법은 모 Cas9 엔도뉴클레아제에서 적어도 하나의 아미노산 변형을 도입하여 상기 Cas9 엔도뉴클레아제 변이체를 생성하는 단계를 포함하고, 상기 적어도 하나의 아미노산 변형은 모 Cas9 엔도뉴클레아제의 RuVC 및 HNH 도메인 밖에 위치하고, 상기 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 특성의 개선을 나타내는 방법.
26. 구현예 25에 있어서, 상기 적어도 하나의 아미노산 변형은 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서의 아미노산 치환이고, 변이체의 아미노산 위치는 상기 모 Cas9 엔도뉴클레아제의 아미노산 서열과의 관련성에 의해 넘버링되는 방법.
27. 구현예 26에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는 방법.
28. 구현예 25에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는 방법.
29. 구현예 24 내지 27 중 어느 하나의 방법에 의해 생산된 Cas9 엔도뉴클레아제 변이체.
30. 바실러스 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 바실러스 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 바실러스 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
31. 구현예 30에 있어서, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
32. 구현예 29에 있어서, 바실러스 숙주 세포는 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 알티투디니스(Bacillus altitudinis), 바실러스 아밀로리쿼파시엔스(Bacillus amyloliquefaciens), B. 아밀로리쿼파시엔스 아종 플란타룸(plantarum), 바실러스 브레비스(Bacillus brevis), 바실러스 서르쿨란스(Bacillus circulans), 바실러스 클라우시(Bacillus clausii), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 피르무스(Bacillus firmus), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 메틸로트로피쿠스(Bacillus methylotrophicus), 바실러스 푸밀루스(Bacillus pumilus), 바실러스 사펜시스(Bacillus safensis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 서브틸리스(Bacillus subtilis) 및 바실러스 투린기엔시스(Bacillus thuringiensis)로 이루어진 바실러스 종의 군으로부터 선택되는 방법.
33. E. 콜라이 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 E. 콜라이 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 E. 콜라이 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
34. 사카로마이세스 세레비시아에 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 사카로마이세스 세레비시아에 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 사카로마이세스 세레비시아에 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
35. 진균 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 진균 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 진균 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
36. 세포에서 표적 부위의 변형을 위한 Cas9 엔도뉴클레아제 변이체로서, 상기 Cas9 엔도뉴클레아제 변이체는 이의 HNH 도메인 및 RuVC 도메인 밖에 아미노산 변형을 포함하고, 상기 Cas9 엔도뉴클레아제는 상기 아미노산 변형을 포함하지 않는 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성을 갖고, Cas9 엔도뉴클레아제 변이체는 상기 가이드 폴리뉴클레오타이드와 복합체를 형성할 수 있고, 상기 복합체는 상기 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는, Cas9 엔도뉴클레아제 변이체.
37. 구현예 34에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율, 개선된 배수 형질전환, 개선된 편집 효율 및 개선된 배수 편집으로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는, Cas9 엔도뉴클레아제 변이체.
38. 세포에서 관심 게놈 유전좌위에서의 표적 부위의 변형을 위한 Cas9 엔도뉴클레아제 변이체를 사용하여 편집 효율을 증가시킴으로써 유기체 또는 비인간 유기체를 변형시키는 방법으로서, 상기 방법은 상기 세포에 비자연 발생 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체를 제공하는 단계를 포함하고, 상기 Cas9 엔도뉴클레아제 변이체는 이의 HNH 도메인 및 RuVC 도메인 밖에 아미노산 변형을 포함하고, 상기 Cas9 엔도뉴클레아제는 상기 아미노산 변형을 포함하지 않는 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 유전자 편집 효율을 갖고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 상기 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체를 형성할 수 있는 방법.
39. 원핵생물 또는 진핵생물 세포에서 Cas 엔도뉴클레아제 변이체를 발현하는 방법으로서,
(a) 원핵생물 또는 진핵생물 세포에 구현예 11의 재조합 DNA 작제물을 도입하는 단계; 및
(b) 상기 Cas 엔도뉴클레아제 변이체의 발현을 허용하는 조건 하에 단계 (a)의 원핵생물 또는 진핵생물 세포를 항온처리하는 단계를 포함하는 방법.
38. 서열 번호 58(CasY155H 변이체), 서열 번호 123(CasY155N 변이체), 서열 번호 125(Cas9 Y155E 변이체), 서열 번호 127(Cas9 Y155F 변이체), 서열 번호 129(Cas9 F86A-F98A 변이체)로 이루어진 군으로부터 선택된 Cas9 엔도뉴클레아제 변이체.
실시예
다음 실시예들에서, 달리 언급되지 않는 한, 부(parts) 및 백분율은 중량 기준이고, 도(degree)는 섭씨이다. 이 실시예들은 본 발명의 구현예들을 나타내면서 단지 예시로 제공되는 것임을 이해해야 한다. 상기 논의 및 이들 실시예로부터, 당업자는 다양한 용도 및 조건에 맞도록 본 발명을 다양하게 변화 및 변형시킬 수 있다. 이러한 변형도 첨부된 청구범위의 범위 내에 속하는 것으로 의도된다.
실시예 1
바실러스에서 표적 부위 1 및 표적 부위 2를 표적화하는 Cas9 발현 카세트의 작제.
스트렙토코커스 피오제네스로부터의 Cas9 단백질(서열 번호 1)을 바실러스(서열 번호 2)에서 N-말단 핵 국재화 서열(NLS; "APKKKRKV"; 서열 번호 3), C-말단 NLS("KKKKLK"; 서열 번호 4), deca-히스티딘 태그("HHHHHHHHHH"; 서열 번호 5), B. 서브틸리스로부터의 aprE 프로모터(서열 번호 6) 및 종결자 서열(서열 번호 7)의 첨가에 의해 발현에 대해 코돈 최적화하고, 제조사의 지시에 따라 Q5 DNA 중합효소(NEB)를 사용하여 하기 표 1에 기재된 정방향/역방향 프라이머 쌍으로 증폭시켰다.
플라스미드 pKB320(서열 번호 11)의 골격(서열 번호 10)을 제조사의 지시에 따라 Q5 DNA 중합효소(NEB)를 사용하여 하기 표 2에 기재된 정방향/역방향 프라이머 쌍으로 증폭시켰다.
PCR 산물을 제조사의 지시에 따라 Zymo 투명 및 농축물 5 칼럼을 사용하여 정제하였다. 후속하여, PCR 산물을 등몰 비율의 2개의 단편을 혼합하는 Q5 중합효소(NEB)로 연장된 오버랩 연장 PCR(POE-PCR)을 사용하여 조립하였다. POE-PCR 반응을 순환시켰다: 30회 사이클 동안 오(5)초 동안 98℃, 십(10)초 동안 64℃, 사(4)분 십오(15)초 동안 72℃. 오(5) ㎕의 POE-PCR(DNA)을 제조사의 지시에 따라 Top10 E. 콜라이(Invitrogen)로 형질전환시키고, 오십(50) ㎍/㎖의 황산카나마이신을 함유하는 용원성(L) 브로스(Miller 레시피; 1%(w/v) 트립톤, 0.5% 효모 추출물(w/v), 1% NaCl(w/v))에서 선택하고, 1.5% 한천으로 고화시켰다. 콜로니를 37℃에서 열여덟(18)시간 동안 성장하게 하였다. 콜로니를 선별하고, 제조사의 지시에 따라 Qiaprep DNA miniprep 키트를 사용하여 플라스미드 DNA를 제조하고, 오십오(55) ㎕의 ddH2O에 용리시켰다. 하기 표 3에 기재된 서열분석 프라이머를 사용하여 정확한 조립을 검증하기 위해 플라스미드 DNA를 Sanger 서열분석하였다.
정확히 조립된 플라스미드, pRF694(서열 번호 25)를 사용하여 하기 기재된 바와 같은 표적 부위 1(서열 번호 28) 및 표적 부위 2(서열 번호 29)에서 바실러스 리케니포르미스 게놈을 편집하기 위한 플라스미드 pRF801(서열 번호 26) 및 pRF806(서열 번호 27)을 작제하였다.
B. 리케니포르미스의 serA1 오픈 리딩 프레임(서열 번호 30)은 역방향 배향에서 고유한 표적 부위, 표적 부위 1(서열 번호 28)을 함유한다. 표적 부위는 역방향 배향에서 프로토스페이서 인접한 모티프(서열 번호 31)에 인접하게 있다. 표적 부위는 가변 표적화 도메인(서열 번호 32)을 암호화하는 DNA로 전환될 수 있다. VT 도메인(서열 번호 32)을 암호화하는 DNA 서열은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 1(서열 번호 34)을 표적화하는 기능적 gRNA를 생산하도록 Cas9 엔도뉴클레아제 인식 도메인(CER, 서열 번호 33)을 암호화하는 DNA 서열에 작동 가능하게 융합된다. 프로모터가 gRNA(서열 번호 33)를 암호화하는 DNA의 5'에 위치하고 종결자가 gRNA(서열 번호 33)를 암호화하는 DNA의 3'에 위치하도록 gRNA를 암호화하는 DNA는 바실러스 종 세포에 작동 가능한 프로모터(예를 들어, spac 프로모터; 서열 번호 35) 및 바실러스 종 세포에 작동 가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열 번호 36)에 작동 가능하게 연결되었다.
B. 리케니포르미스 게놈 DNA(gDNA)로부터 2개의 상동성 아암의 증폭에 의해 Cas9/gRNA 절단에 반응하여 serA1 유전자를 결실시키는 폴리뉴클레오타이드 변형 주형(편집 주형이라고도 칭함)을 생성하였다. 제1 단편은 serA1 오픈 리딩 프레임(서열 번호 37)의 바로 500 bp 상류에 해당한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 4에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에서 제2 단편의 5' 말단에 상동인 18 bp 및 제1 단편의 5' 말단에서 pRF694에 상동인 20 bp를 도입한다.
제2 단편은 serA1 오픈 리딩 프레임(서열 번호 40)의 3' 말단의 바로 500 bp 하류에 대응한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 5에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에서 제1 단편의 3' 말단에 상동인 28 bp 및 제2 단편의 3' 말단에서 pRF694에 상동인 21 bp를 도입한다.
pRF801(서열 번호 26), Cas9 발현 카세트를 함유하는 E. 콜라이-B. 리케니포르미스 셔틀 플라스미드(서열 번호 2), serA1 오픈-리딩 프레임 내에 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열 번호 43) 및 제1 상동성 아암(서열 번호 37) 및 제2 상동성 아암(서열 번호 40)으로 이루어진 편집 주형(서열 번호 44)을 생성하는 표준 분자 생물학 기법을 사용하여 표적 부위 1 gRNA 발현 카세트(서열 번호 43), 제1 상동성 아암(서열 번호 37) 및 제2 상동성 아암(서열 번호 40)을 암호화하는 DNA를 pRF694(서열 번호 25)로 조립하였다. 플라스미드는 표 3에 기재된 올리고로 Sanger 서열분석에 의해 검증되었다.
B. 리케니포르미스의 rghR1 오픈 리딩 프레임(서열 번호 45)은 역방향 가닥에서 고유한 표적 부위, 표적 부위 2(서열 번호 46)를 함유한다. 표적 부위는 역방향 가닥에서 프로토스페이서 인접한 모티프(서열 번호 47의 마지막 3개의 염기)에 인접하게 있다. 표적 부위는 가이드 RNA의 가변 표적화(VT) 도메인(서열 번호 48)을 암호화하는 DNA로 전환될 수 있다. VT 도메인(서열 번호 48)을 암호화하는 DNA 서열은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 2(서열 번호 49)를 표적화하는 기능적 가이드 RNA(gRNA)를 생산하도록 Cas9 엔도뉴클레아제 인식 도메인(CER, 서열 번호 33)을 암호화하는 DNA 서열에 작동 가능하게 융합된다. 프로모터가 gRNA(서열 번호 43)를 암호화하는 DNA의 5'에 위치하고 종결자가 gRNA(서열 번호 43)를 암호화하는 DNA의 3'에 위치하도록 gRNA를 암호화하는 DNA는 바실러스 종 세포에 작동 가능한 프로모터(예를 들어, B. 쿠틸리스로부터의 spac 프로모터; 서열 번호 35) 및 바실러스 종 세포에 작동 가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열 번호 36)에 작동 가능하게 연결되었다.
B. 리케니포르미스 게놈 DNA(gDNA)로부터 2개의 상동성 아암의 증폭에 의해 Cas9/gRNA 절단에 반응하여 rghR1 유전자를 변형시키는 폴리뉴클레오타이드 변형 주형(편집 주형이라고도 칭함)을 생성하였다. 제1 단편은 rghR1 오픈 리딩 프레임(서열 번호 50)의 바로 500 bp 상류에 해당한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 6에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에서 제2 단편의 5' 말단에 상동인 23 bp 및 제1 단편의 5' 말단에서 pRF694에 상동인 20 bp를 도입한다.
제2 단편은 rghR1 오픈 리딩 프레임(서열 번호 53)의 3' 말단의 바로 500 bp 하류에 대응한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 7에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에서 제1 단편의 3' 말단에 상동인 20 bp 및 제2 단편의 3' 말단에서 pRF694에 상동인 21 bp를 도입한다.
pRF806(서열 번호 27), Cas9 발현 카세트를 함유하는 E. 콜라이-B. 리케니포르미스 셔틀 플라스미드(서열 번호 2), rghR1 오픈-리딩 프레임 내에 표적 부위 2를 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열 번호 56) 및 제1 상동성 아암(서열 번호 50) 및 제2 상동성 아암(서열 번호 53)으로 이루어진 편집 주형(서열 번호 57)을 생성하는 표준 분자 생물학 기법을 사용하여 표적 부위 2 gRNA 발현 카세트(서열 번호 56), 제1 상동성 아암(서열 번호 50) 및 제2 상동성 아암(서열 번호 53)을 암호화하는 DNA를 pRF694(서열 번호 25)로 조립하였다. 플라스미드는 표 3에 기재된 올리고로 Sanger 서열분석에 의해 검증되었다.
실시예 2
Cas9 Y155 변이체의 생성
본 실시예에서, S. 피오제네스 Cas9의 Y155H 변이체(본원에서 Cas9 Y155H 변이체라고 칭함, 서열 번호 58)를 pRF801(서열 번호 26) 및 pRF806 플라스미드(서열 번호 27)에서 생성하였다. pRF801 플라스미드(서열 번호 26) 또는 pRF806 플라스미드(서열 번호 27)에서 Cas9 Y155H 변이체를 도입하기 위해 부위-지시된 돌연변이유발을 제조사의 지시에 따라 Quikchange 돌연변이유발 키트 및 주형 DNA로서 pRF801(서열 번호 26) 또는 pRF806(서열 번호 27)을 사용하여 하기 표 8에서 올리고를 사용하여 수행하였다.
반응의 생성된 산물인, pRF827(서열 번호 61)은 Cas9 Y155H 변이체 발현 카세트(서열 번호 62), serA1 오픈 리딩 프레임 내에 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열 번호 43) 및 제1 상동성 아암(서열 번호 37) 및 제2 상동성 아암(서열 번호 40)으로 이루어진 편집 주형(서열 번호 44)을 함유하거나, pRF856(서열 번호 63)은 Cas9 Y155H 변이체 발현 카세트(서열 번호 62), rghR1 오픈 리딩 프레임 내에 표적 부위 2를 표적화하는 gRNA 발현 카세트(서열 번호 56) 및 제1 상동성 아암(서열 번호 50) 및 제2 상동성 아암(서열 번호 53)으로 이루어진 편집 주형(서열 번호 57)을 함유하였다. 표 3에 기재된 서열분석 프라이머를 사용하여 정확한 조립을 검증하기 위해 플라스미드 DNA를 Sanger 서열분석하였다.
다른 Cas9 Y155 변이체가 상기 기재된 바와 유사한 상황에서 생성되었다. Cas9 Y155N 변이체가 생성되고, 서열 번호 123(서열 번호 124에 의해 암호화된 아미노산 서열)에 기재되고, Cas9 Y155E 변이체가 생성되고, 서열 번호 125(서열 번호 126에 의해 암호화된 아미노산 서열)에 기재되고, Cas9 Y155F 변이체가 생성되고, 서열 번호 127(서열 번호 128에 의해 암호화된 아미노산 서열)에 기재된다.
실시예 3
스트렙토코커스 피오제네스 Cas9의 Y155H 변이체(Cas9 Y155H 변이체)는 야생형 스트렙토코커스 피오제네스 Cas9(WT Cas9)와 비교하여 바실러스 세포에서 증가된 형질전환 효율 및 동등하거나 증가된 DNA 편집 효율을 갖는다.
본 실시예에서, 제조사의 지시에 따라 회전 환 증폭(Sygnis)을 사용하여 18시간 동안 상기 기재된 pRF694(서열 번호 25), pRF801(서열 번호 26), pRF806(서열 번호 27), pRF827(서열 번호 61), 및 pRF856(서열 번호 63) 플라스미드를 증폭시켰다. 국제 PCT 공보 WO2017/075195호, WO2002/14490호 및 WO2008/7989호에 일반적으로 기재된 바대로 회전 환 증폭된 플라스미드를 pBL.comK 플라스미드(서열 번호 64)를 포함하는 수용성 (모) B. 리케니포르미스 세포로 형질전환시켰다. 세포/DNA 형질전환 혼합물을 20 ㎍/㎖의 카나마이신을 함유하는 L-브로스(Miller 레시피)에 플레이팅하고, 1.5% 한천으로 고화시켰다. 콜로니가 37℃에서 형성하도록 두었다. 카나마이신을 함유하는 L 한천 플레이트에서 성장한 콜로니를 선별하고, L 한천 플레이트에 획선도말하여 회수하였다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 9에 기재된 정방향/역방향 프라이머 쌍을 사용하여 표적 부위 1 유전좌위(서열 번호 65)를 증폭시켜 pRF801(서열 번호 26) 및 pRF827(서열 번호 61)을 갖는 형질전환으로부터의 콜로니를 편집에 대해 스크리닝하였다. 바실러스 세포에서의 WT 및 편집된 표적 부위 1 유전좌위는 증폭된 유전좌위의 크기에 기초하여 분류될 수 있고, WT 앰플리콘(서열 번호 65)은 크기가 편집된 앰플리콘(서열 번호 66)보다 더 컸다.
제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 10에 기재된 정방향/역방향 프라이머 쌍을 사용하여 표적 부위 2 유전좌위(서열 번호 69)를 증폭시켜 플라스미드 pRF806(서열 번호 27) 또는 pRF856(서열 번호 63)을 갖는 형질전환으로부터의 콜로니를 편집 효율에 대해 분석하였다. WT(서열 번호 69) 및 편집된 표적 부위 2 유전좌위(서열 번호 70)는 편집된 유전좌위(서열 번호 70)의 크기에 기초하여 분류될 수 있고, WT 앰플리콘(서열 번호 69)은 크기가 더 컸다.
플라스미드에 선택적인 배지에서 얻은 형질전환체의 수(20 ㎍·㎖-1 황산카나마이신을 함유하는 L 한천)는 표 11에 표시되어 있다. 형질전환 효율은 동일한 gRNA 발현 카세트 및 편집 주형을 갖는 모(WT) Cas9로부터의 형질전환체의 수에 의한 특정 gRNA 및 편집 주형을 갖는 주어진 Cas9 변이체로부터 얻은 형질전환체의 수의 비율이다. 결과는 표 11에 표시되어 있는데, Cas9 Y155H 변이체가 (플라스미드에 의해 전달된) Cas9 변이체의 형질전환 효율을 적어도 84배 내지 402배 증가시킨다는 것을 나타낸다.
표 11에 기재된 결과는 Cas9 Y155H 변이체가 WT Cas9의 DNA 편집 효율과 적어도 동일하거나 이보다 적어도 2.3배(또는 230%) 큰 편집 효율을 갖는다는 것을 나타낸다.
실시예 4
Cas9 F86A-F98A 변이체의 작제.
본 실시예에서, Cas9 F86A-F98A 변이체(서열 번호 129)는 B. 리케니포르미스에서 형질전환 효율 및 편집 빈도에 대해 Cas9 F86A-F98A 변이체를 시험하기 위해 pRF801 플라스미드(서열 번호 26)의 골격에서 작제되었다.
F86A 및 F98A(서열 번호 130)를 포함하는 Cas9의 일부를 함유하는 합성 단편은 외부 벤더로부터 주문되었다. 표준 PCR 기법을 사용하여 표 12에 기재된 올리고를 사용하여 pRF801(서열 번호 131)의 골격을 증폭시켰다.
표준 PCR 기법을 사용하여 하기 표 13에 기재된 올리고를 사용하여 합성 단편(서열 번호 130)을 증폭시켰다.
플라스미드 pRF866(서열 번호 137)을 생성시키기 위해 표준 분자 생물학 기법을 사용하여 F86A-F98A 합성 단편으로 pRF801 골격 단편(서열 번호 131)을 조립하였다. pRF866은 바실러스에 대한 F86A F98A Cas9 발현 카세트(서열 번호 136), serA1 ts1을 표적화하는 gRNA에 대한 발현 카세트를 암호화하는 DNA(서열 번호 43) 및 serA1 결실 편집 주형(서열 번호 44)을 함유한다.
플라스미드 pRF866을 B. 리케니포르미스 세포로 형질전환시켰다.
실시예 5
F86에서의 제1 아미노산 치환 및 F98에서의 제2 아미노산 치환을 포함하는 스트렙토코커스 피오제네스의 Cas9 변이체는 이의 모 (야생형) 스트렙토코커스 피오제네스 Cas9(WT Cas9)와 비교하여 바실러스 세포에서 증가된 형질전환 효율 및 동일한 DNA 편집 효율을 갖는다.
변이체의 아미노산 위치가 서열 번호 1(스트렙토코커스 피오제네스 WT Cas9)에 기재된 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는, F86(예컨대, F86A)에서의 제1 아미노산 치환 및 F98(예컨대, F98A)에서의 제2 아미노산 치환을 포함하는 스트렙토코커스 피오제네스의 Cas9 변이체(Cas9 F86-F98 변이체라고도 칭함)는 실시예 4에 기재된 바대로 생성되었다. 실시예 3에 기재되고 표 14에 기재된 바대로 형질전환 효율 및 편집 효율을 분석하였다.
표 14는 Cas9 F86-F98A 변이체가 WT Cas9와 비교할 때 형질전환 효율을 248배(또는 24,800%) 증가시킨다는 것을 명확히 보여준다. 원하는 편집을 함유하는 스크리닝된 콜로니의 백분율을 결정함으로써 편집 효율에 대해 실시예 3에 기재된 바대로 편집 플라스미드로 형질전환된 콜로니를 스크리닝하였다. 표 14에 기재된 결과는 Cas9 F86A-F98A 변이체가 WT Cas9와 동일한 편집 효율을 갖는다는 것을 나타낸다.
실시예 6
에스체리치아 콜라이 Cas9 벡터의 작제
본 실시예에서, 에스체리치아 콜라이(E. 콜라이)에서의 게놈 편집을 위한 유도성 Cas9 발현 벡터를 작제하였다. 유도제에 반응한 Cas9 발현이 확인되었다.
스트렙토코커스 피오제네스 M1 GAS SF370으로부터의 Cas9 단백질(서열 번호 1)은 당해 분야에 공지된 표준 기법에 따라 코돈 최적화되었다(서열 번호 73). 세포의 핵에 Cas9 단백질을 국재화하기 위해, Cas9 오픈 리딩 프레임의 카복시 말단에서 유인원 바이러스 40(SV40) 1부분(MAPKKKRKV, 서열 번호 74) 핵 국재화 신호를 도입하였다. 야로위아 코돈 최적화된 Cas9 유전자를 표준 분자 생물학 기법에 의해 야로위아 항시성 프로모터, FBA1(서열 번호 75)에 융합시켰다. 야로위아 코돈 최적화된 Cas9 발현 카세트(서열 번호 76)의 예는 항시성 FBA 프로모터, 야로위아 코돈 최적화된 Cas9, 및 SV40 핵 국재화 신호를 함유한다. Cas9 발현 카세트를 플라스미드 pZuf로 클로닝하고, 새로운 작제물을 pZufCas9(서열 번호 77)로 칭했다.
하기 표 15로부터의 프라이머를 사용하여 표준 분자 생물학 기법을 사용하여 pZufCas9로부터 야로위아 코돈 최적화된 Cas9-SV40 융합 유전자(서열 번호 78)를 증폭시켰다.
표 12에서의 프라이머는 5' EcoRI 부위 및 3' HindIII 부위를 융합체에 부가한다. 표준 기법을 사용하여 PCR 산물(서열 번호 81)을 정제하였다. pRF48(서열 번호 83)을 생성하도록 정제된 단편을 life technologies로부터의 pBAD/HisB의 EcoRI 및 HindIII 부위(서열 번호 82)로 클로닝하였다.
Cas9 발현 카세트를 함유하는 저카피 E. 콜라이 플라스미드인 pRF97(서열 번호 86)을 생성하도록 E. 콜라이 Cas9 발현 카세트(서열 번호 84)를 저카피 플라스미드 pKO3(서열 번호 85)으로 삽입하였다.
실시예 7
E. 콜라이 Cas9 플라스미드에서의 Cas9 Y155H 변이체의 생성
본 실시예에서, Cas9 Y155H 변이체를 pRF97(서열 번호 86)에 암호화된 Cas9 단백질로 도입하였다.
pRF97로부터의 Cas9 단백질의 일부를 암호화하지만 Y155H 변이체(서열 번호 87)를 암호화하는 치환을 함유하는 합성 DNA 단편을 제조하였다. 표준 PCR 조건 및 표 16에 기재된 프라이머를 사용하여 합성 단편을 증폭시켰다.
pRF97-Y155H 단편(서열 번호 90)을 제조하도록 표준 PCR 기법 및 하기 표 17에 기재된 프라이머를 사용하여 Y155H 합성 단편(서열 번호 87)의 삽입을 허용하도록 pRF97 플라스미드(서열 번호 86)를 증폭시켰다.
Cas9 Y155H 변이체에 대한 E. 콜라이 발현 카세트를 함유하는 저카피 플라스미드인 pRF861(서열 번호 93)을 생성하기 위해 Y155H 합성 단편(서열 번호 87) 및 pRF97-Y155H 단편(서열 번호 90)을 조합하였다.
실시예 8
WT Cas9 및 Cas9 Y155H 변이체를 사용한 E. 콜라이의 질소 동화 제어 유전자의 결실.
본 실시예에서, WT Cas9 또는 Cas9 Y155H 변이체를 사용하여 E. 콜라이의 질소 동화 제어 유전자를 암호화하는 nac 유전자를 결실시켰다.
E. 콜라이 nac 유전자(서열 번호 94)는 2개의 표적 부위; 표적 부위 1(서열 번호 95) 및 PAM(서열 번호 96의 마지막 3개 염기), 및 표적 부위 2(서열 번호 97) 및 PAM(서열 번호 98의 마지막 3개 염기)을 함유한다. 실시예 1에 기재된 바대로 표적 부위를 암호화하는 DNA의 3' 말단에 CER 도메인(서열 번호 33)을 암호화하는 DNA를 첨가하여 표적 부위의 5' 말단에 E. 콜라이에서 활성인 프로모터(예를 들어, N25 파지 프로모터(서열 번호 99)) 및 CER 도메인 3' 말단에 E. 콜라이에서 활성인 종결자(예를 들어, 람다 파지 t0 종결자(서열 번호 36))를 작동 가능하게 융합함으로써 작동 가능한 gRNA 발현 카세트가 nac 부위 1(서열 번호 100) 및 nac 부위 2(서열 번호 101)에 대해 만들어질 수 있다. E. 콜라이는 상동성 직접 복구를 통해 DNA를 주로 복구하고, 효율을 위해 Cas9 매개된 편집은 편집 주형을 요한다.
nac 오픈 리딩 프레임(서열 번호 104)의 처음의 3개 및 마지막 3개의 코돈을 제외한 모두를 결실시키는 편집 주형을 생성하도록 nac 시작 코돈 및 처음의 3개의 코돈의 상류 491 bp(서열 번호 102)는 nac 오픈 리딩 프레임의 nac 중지 코돈 및 마지막 3개의 코돈의 하류 491 bp(서열 번호 103)에 작동 가능하게 연결되었다.
부위 1 gRNA 발현 카세트(서열 번호 100) 또는 부위 2 gRNA 발현 카세트(서열 번호 102)는 nac 결실 편집 주형(서열 번호 104)에 5' 말단(서열 번호 105)에서 pRF97(서열 번호 86) 및 pRF861(서열 번호 93)과 동일성의 20 bp 및 3' 말단에서 pRF97(서열 번호 86) 및 pRF861(서열 번호 93)과 동일성(서열 번호 106)의 21 bp로 작동 가능하게 연결되고, nacETsite1(서열 번호 107) 및 nacETsite2(서열 번호 108) 합성 DNA 단편으로 순서화되었다.
선형 단편 pRF97-카세트(서열 번호 109) 또는 pRF861-카세트(서열 번호 110)를 생성하기 위해 하기 표 18에 기재된 프라이머 및 표준 분자 생물학 기법을 사용하여 pRF97(서열 번호 86) 또는 pRF861(서열 번호 93)을 증폭시켰다.
pRF97/nacETsite1(서열 번호 113), pRF97/nacETsite2(서열 번호 114), pRF861/nacETsite1(서열 번호 115), 및 pRF861/nacETsite2(서열 번호 116)를 생성하도록 표준 분자 생물학 기법을 사용하여 nacETsite1(서열 번호 107) 또는 nacETsite1(서열 번호 108)로 pRF97-카세트(서열 번호 109) 또는 pRF861-카세트(서열 번호 110)를 조립하였다.
MG1655 E. 콜라이 세포는 이전에 기재된 바대로 전자수용성이게 되고(분자 생물학에서 짧은 프로토콜), 1 ㎕의 pRF97/nacETsite1(서열 번호 113), pRF97/nacETsite2(서열 번호 114), pRF861/nacETsite1(서열 번호 115), 또는 pRF861/nacETsite2(서열 번호 116)로 형질전환되었다. 세포를 (Cas9 발현을 유도하도록) 25 ㎍·㎖-1 클로르암페니콜 및 0.1% w·v-1 L-아라비노스를 함유하는 1.5% w·v-1 한천으로 고화된 L 브로스에 플레이팅하였다. 30℃에서 24시간 성장 후 형질전환으로부터의 콜로니를 계수하였다.
콜로니가 편집된 대립유전자를 함유하는지를 결정하기 위해 각각의 형질전환으로부터의 8개의 콜로니는 하기 표 19에서 프라이머 및 표준 기법을 사용하여 PCR 증폭에 의해 WT nac 유전좌위(서열 번호 117) 또는 편집된 nac 유전좌위(서열 번호 118)의 존재에 대해 PCR에 의해 스크리닝되었다.
WT nac 유전좌위(서열 번호 117)보다 작은 편집된 nac 유전좌위(서열 번호 118)에 대응하는 증폭 산물을 생성시킨 콜로니는 편집 빈도의 계산을 위해 편집된 바대로 계수되었다. 편집 빈도는 스크리닝된 세포의 백분율이고, 이는 PCR로부터 편집된 nac 유전좌위(서열 번호 118)의 존재를 나타낸다. 표 20에서의 결과는 편집 빈도 및 형질전환 효율(형질전환체/형질전환체 WT Cas9)을 보여준다.
표 20은 Cas9 Y155H 변이체가 E. 콜라이에서 작동 가능하고, WTCas9 편집 빈도와 비교할 때 적어도 15% 내지 59%의 편집 효율의 증가를 보여준다는 것을 명확히 나타낸다.
실시예 9
사카로마이세스 세레비시아에 염색체 URA3 유전자 결실을 편집하기 위한 cas9-gRNA 벡터의 작제
사카로마이세스 세레비시아에 염색체 URA3 유전자 결실을 편집하기 위한 Cas9 Y155H 변이체 대 Cas9 야생형(wt)의 형질전환 및 편집 효율을 시험하기 위해, 선택 마커로서 G-418 내성 유전자(KanMX)를 갖는 Cas9 Y155H-gRNA 및 Cas9 wt-gRNA 발현 플라스미드를 하기 기재된 바대로 제조하였다.
제조사의 지시에 따라 하기 표 21에 기재된 정방향/역방향 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pRF694 플라스미드(서열 번호 25)로부터 N-말단 핵 국재화 서열(NLS; "APKKKRKV"; 서열 번호 3), C-말단 NLS("KKKKLK"; 서열 번호 4) 및 deca-히스티딘 태그("HHHHHHHHHH"; 서열 번호 5)를 포함하는 S. 피오제네스(서열 번호 1)로부터 Cas9 야생형 단백질을 암호화하는 합성 폴리뉴클레오타이드를 함유하는 단편 A(Cas9 wt)를 증폭시켰다. 제조사의 지시에 따라 하기 표 21에 기재된 정방향(서열 번호 138)/역방향(서열 번호 138) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pRF827 플라스미드(서열 번호 61)로부터 N-말단 핵 국재화 서열, C-말단 NLS 및 deca-히스티딘 태그를 포함하는 Cas9 Y115H 변이체(서열 번호 58)를 암호화하는 합성 폴리뉴클레오타이드를 함유하는 단편 A'(Cas9 Y115H)를 증폭시켰다.
제조사의 지시에 따라 하기 표 22에 기재된 정방향(서열 번호 145)/역방향(서열 번호 146) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pSE087 플라스미드(서열 번호 144)로부터 RNR2p 프로모터(서열 번호 140), 2-미크론 복제 기원 1(서열 번호 141), KanMX 발현 카세트(서열 번호 142) 및 SNR52p 프로모터(서열 번호 143)를 함유하는 단편 B를 증폭시켰다.
pSE087 플라스미드는 이종 KanMX 발현 카세트를 갖는 2μ 셔틀 벡터이다. 플라스미드는 표적화 sgRNA + T(6) 종결자(서열 번호 147)를 함유하는 스터퍼 단편의 상류에 RNR2 프로모터, SNR52 프로모터의 제어 하에 S. 피오제네스로부터의 cas9 유전자를 함유한다. BsmBI에 의한 플라스미드의 선형화가 sgRNA 스터퍼를 방출시켜 소화된 플라스미드에서 비양립성 오버행을 남기도록 배향된 BsmBI 결합 부위에 의해 sgRNA는 플랭킹된다.
제조사의 지시에 따라 하기 표 23에 기재된 정방향(서열 번호 151)/역방향(서열 번호 152) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 50 bp 상류 상동성 아암(서열 번호 148), URA3 표적화 sgRNA + T(6) 종결자(서열 번호 149) 및 50 bp 하류(서열 번호 150)의 합성 폴리뉴클레오타이드를 함유하는 단편 C를 증폭시켰다.
제조사의 지시에 따라 하기 표 24에 기재된 정방향(서열 번호 156)/역방향(서열 번호 157) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pSE087 플라스미드로부터 2-미크론 복제 기원 2(서열 번호 153), 암피실린 내성 유전자(서열 번호 154) 및 RNR2 종결자(서열 번호 155)를 함유하는 단편 D를 증폭시켰다.
제조사의 지시에 따라 Qiagen PCR 정제 키트(QIAGEN, Inc)를 사용하여 PCR 단편을 정제하였다. 후속하여, 하기 프로토콜에 따라 효모에서 갭 복구에 의해 PCR 단편을 2-미크론 플라스미드 골격에 조립하였다.
제조사의 지시에 따라 동결된-EZ 효모 형질전환 II™ 키트(Zymo Research, Inc)를 사용하여 S. 세레비시아에 ura3Δ 수용성 세포를 제조하였다. 50 ㎕의 S. 세레비시아에 ura3Δ 수용성 세포를 단편 A, B, C 및 D의 각각의 PCR 산물의 DNA 0.1 내지 0.2 ㎍과 혼합하여 pWS572(Cas9 wt)를 생성하였다. 50 ㎕의 S. 세레비시아에 ura3Δ 수용성 세포를 단편 A', B, C 및 D의 각각의 PCR 산물의 DNA 0.1 내지 0.2 ㎍과 혼합하여 pWS573(Cas9 Y115H)을 생성하였다. 키트로부터 제공된 500 ㎕의 EZ 3 용액을 첨가하고 완전히 혼합하였다. 혼합물을 30℃에서 45분 동안 항온처리 후, 50 내지 150 ㎕의 형질전환 혼합물을 200 ㎍/㎖의 게네티신(G418) 항생제가 보충된 YPD 배지 플레이트에 분산시켰다. 플레이트를 30℃에서 2일 내지 4일 동안 항온처리하여 형질전환체가 성장하게 하였다.
ChargeSwitch® Plasmid Yeast Mini kit(Invitrogen, Inc)를 사용하여 200 ㎍/㎖의 게네티신(G418) 항생제가 보충된 YPD 배지에서 성장한 1 ㎖의 형질전환체로부터 pWS572(Cas9 wt) 및 pWS573(Cas9 Y155H)의 생성된 플라스미드를 제조하였다.
실시예 10
pWS572(Cas9 wt) 및 pWS573(Cas9 Y155H)을 사용한 사카로마이세스 세레비시아에 염색체 URA3 유전자 결실
본 실시예에서, 사카로마이세스 세레비시아에 염색체 URA3 유전자 결실에 대한 pWS573(Cas9 Y155H) 대 pWS572(Cas9 wt)의 형질전환 및 편집 효율을 비교하였다. 제조사의 지시에 따라 동결된-EZ 효모 형질전환 II™ 키트(Zymo Research, Inc)를 사용하여 S. 세레비시아에 야생형 수용성 세포를 제조하고, 별개로 pWS573(Cas9 Y155H) 및 pWS572(Cas9 wt)의 100 ng의 플라스미드 DNA로 형질전환시켰다. 50 내지 150 ㎕의 형질전환 혼합물은 200 ㎍/㎖의 게네티신(G418) 항생제가 보충된 YPD 배지 플레이트에 분산시켰다. 플레이트를 30℃에서 2일 내지 4일 동안 항온처리하여 형질전환체가 성장하게 하였다. 2 g/ℓ의 글루코스가 보충된 합성 완전 배지(아미노산이 없는 1X 효모 질소 베이스, 우라실이 부족한 1X 아미노산 혼합물)에 형질전환체를 획선도말하고 형질전환체가 성장하게 하도록 30℃에서 2일 내지 4일 동안 세포를 항온처리하여 정확한 ura3Δ 콜로니를 우라실 영양요구체에 대해 스크리닝하였다. URA3 유전자의 결실은 PCR 및 URA3 표적 영역의 플랭킹 프라이머에 의한 서열분석에 의해 확인되었다. 시험된 콜로니의 총 수로 ura3Δ 콜로니의 수를 나누어 각각의 플라스미드에 대한 편집 빈도를 결정한다.
SEQUENCE LISTING
<110> Danisco US Inc.
Frisch, Ryan L.
He, Hongxian L.
<120> CAS9 VARIANTS AND METHODS OF USE
<130> NB41317-PCT
<150> US 62/599176
<151> 2017-12-15
<160> 157
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 5056
<212> DNA
<213> Artificial sequence
<220>
<223> Bacillus codon optimized Cas9
<400> 2
aattcctcca ttttcttctg ctatcaaaat aacagactcg tgattttcca aacgagcttt 60
caaaaaagcc tctgcccctt gcaaatcgga tgcctgtcta taaaattccc gatattggtt 120
aaacagcggc gcaatggcgg ccgcatctga tgtctttgct tggcgaatgt tcatcttatt 180
tcttcctccc tctcaataat tttttcattc tatccctttt ctgtaaagtt tatttttcag 240
aatactttta tcatcatgct ttgaaaaaat atcacgataa tatccattgt tctcacggaa 300
gcacacgcag gtcatttgaa cgaatttttt cgacaggaat ttgccgggac tcaggagcat 360
ttaacctaaa aaagcatgac atttcagcat aatgaacatt tactcatgtc tattttcgtt 420
cttttctgta tgaaaatagt tatttcgagt ctctacggaa atagcgagag atgatatacc 480
taaatagaga taaaatcatc tcaaaaaaat gggtctacta aaatattatt ccatctatta 540
caataaattc acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag 600
ggtaactagt ggccccaaaa aagaaacgca aggttatgga taaaaaatac agcattggtc 660
tggatatcgg aaccaacagc gttgggtggg cagtaataac agatgaatac aaagtgccgt 720
caaaaaaatt taaggttctg gggaatacag atcgccacag cataaaaaag aatctgattg 780
gggcattgct gtttgattcg ggtgagacag ctgaggccac gcgtctgaaa cgtacagcaa 840
gaagacgtta cacacgtcgt aaaaatcgta tttgctactt acaggaaatt ttttctaacg 900
aaatggccaa ggtagatgat agtttcttcc atcgtctcga agaatctttt ctggttgagg 960
aagataaaaa acacgaacgt caccctatct ttggcaatat cgtggatgaa gtggcctatc 1020
atgaaaaata ccctacgatt tatcatcttc gcaagaagtt ggttgatagt acggacaaag 1080
cggatctgcg tttaatctat cttgcgttag cgcacatgat caaatttcgt ggtcatttct 1140
taattgaagg tgatctgaat cctgataact ctgatgtgga caaattgttt atacaattag 1200
tgcaaaccta taatcagctg ttcgaggaaa accccattaa tgcctctgga gttgatgcca 1260
aagcgatttt aagcgcgaga ctttctaagt cccggcgtct ggagaatctg atcgcccagt 1320
taccagggga aaagaaaaat ggtctgtttg gtaatctgat tgccctcagt ctggggctta 1380
ccccgaactt caaatccaat tttgacctgg ctgaggacgc aaagctgcag ctgagcaaag 1440
atacttatga tgatgacctc gacaatctgc tcgcccagat tggtgaccaa tatgcggatc 1500
tgtttctggc agcgaagaat ctttcggatg ctatcttgct gtcggatatt ctgcgtgtta 1560
ataccgaaat caccaaagcg cctctgtctg caagtatgat caagagatac gacgagcacc 1620
accaggacct gactcttctt aaggcactgg tacgccaaca gcttccggag aaatacaaag 1680
aaatattctt cgaccagtcc aagaatggtt acgcgggcta catcgatggt ggtgcatcac 1740
aggaagagtt ctataaattt attaaaccaa tccttgagaa aatggatggc acggaagagt 1800
tacttgttaa acttaaccgc gaagacttgc ttagaaagca acgtacattc gacaacggct 1860
ccatcccaca ccagattcat ttaggtgaac ttcacgccat cttgcgcaga caagaagatt 1920
tctatccctt cttaaaagac aatcgggaga aaatcgagaa gatcctgacg ttccgcattc 1980
cctattatgt cggtcccctg gcacgtggta attctcggtt tgcctggatg acgcgcaaaa 2040
gtgaggaaac catcacccct tggaactttg aagaagtcgt ggataaaggt gctagcgcgc 2100
agtcttttat agaaagaatg acgaacttcg ataaaaactt gcccaacgaa aaagtcctgc 2160
ccaagcactc tcttttatat gagtacttta ctgtgtacaa cgaactgact aaagtgaaat 2220
acgttacgga aggtatgcgc aaacctgcct ttcttagtgg cgagcagaaa aaagcaattg 2280
tcgatcttct ctttaaaacg aatcgcaagg taactgtaaa acagctgaag gaagattatt 2340
tcaaaaagat cgaatgcttt gattctgtcg agatctcggg tgtcgaagat cgtttcaacg 2400
cttccttagg gacctatcat gatttgctga agataataaa agacaaagac tttctcgaca 2460
atgaagaaaa tgaagatatt ctggaggata ttgttttgac cttgacctta ttcgaagata 2520
gagagatgat cgaggagcgc ttaaaaacct atgcccacct gtttgatgac aaagtcatga 2580
agcaattaaa gcgccgcaga tatacggggt ggggccgctt gagccgcaag ttgattaacg 2640
gtattagaga caagcagagc ggaaaaacta tcctggattt cctcaaatct gacggatttg 2700
cgaaccgcaa ttttatgcag cttatacatg atgattcgct tacattcaaa gaggatattc 2760
agaaggctca ggtgtctggg caaggtgatt cactccacga acatatagca aatttggccg 2820
gctctcctgc gattaagaag gggatcctgc aaacagttaa agttgtggat gaacttgtaa 2880
aagtaatggg ccgccacaag ccggagaata tcgtgataga aatggcgcgc gagaatcaaa 2940
cgacacaaaa aggtcaaaag aactcaagag agagaatgaa gcgcattgag gaggggataa 3000
aggaacttgg atctcaaatt ctgaaagaac atccagttga aaacactcag ctgcaaaatg 3060
aaaaattgta cctgtactac ctgcagaatg gaagagacat gtacgtggat caggaattgg 3120
atatcaatag actctcggac tatgacgtag atcacattgt ccctcagagc ttcctcaagg 3180
atgattctat agataataaa gtacttacga gatcggacaa aaatcgcggt aaatcggata 3240
acgtcccatc ggaggaagtc gttaaaaaga tgaaaaacta ttggcgtcaa ctgctgaacg 3300
ccaagctgat cacacagcgt aagtttgata atctgactaa agccgaacgc ggtggtctta 3360
gtgaactcga taaagcagga tttataaaac ggcagttagt agaaacgcgc caaattacga 3420
aacacgtggc tcagatcctc gattctagaa tgaatacaaa gtacgatgaa aacgataaac 3480
tgatccgtga agtaaaagtc attaccttaa aatctaaact tgtgtccgat ttccgcaaag 3540
attttcagtt ttacaaggtc cgggaaatca ataactatca ccatgcacat gatgcatatt 3600
taaatgcggt tgtaggcacg gcccttatta agaaataccc taaactcgaa agtgagtttg 3660
tttatgggga ttataaagtg tatgacgttc gcaaaatgat cgcgaaatca gaacaggaaa 3720
tcggtaaggc taccgctaaa tacttttttt attccaacat tatgaatttt tttaagaccg 3780
aaataactct cgcgaatggt gaaatccgta aacggcctct tatagaaacc aatggtgaaa 3840
cgggagaaat cgtttgggat aaaggtcgtg actttgccac cgttcgtaaa gtcctctcaa 3900
tgccgcaagt taacattgtc aagaagacgg aagttcaaac agggggattc tccaaagaat 3960
ctatcctgcc gaagcgtaac agtgataaac ttattgccag aaaaaaagat tgggatccaa 4020
aaaaatacgg aggctttgat tcccctaccg tcgcgtatag tgtgctggtg gttgctaaag 4080
tcgagaaagg gaaaagcaag aaattgaaat cagttaaaga actgctgggt attacaatta 4140
tggaaagatc gtcctttgag aaaaatccga tcgacttttt agaggccaag gggtataagg 4200
aagtgaaaaa agatctcatc atcaaattac cgaagtatag tctttttgag ctggaaaacg 4260
gcagaaaaag aatgctggcc tccgcgggcg agttacagaa gggaaatgag ctggcgctgc 4320
cttccaaata tgttaatttt ctgtaccttg ccagtcatta tgagaaactg aagggcagcc 4380
ccgaagataa cgaacagaaa caattattcg tggaacagca taagcactat ttagatgaaa 4440
ttatagagca aattagtgaa ttttctaagc gcgttatcct cgcggatgct aatttagaca 4500
aagtactgtc agcttataat aaacatcggg ataagccgat tagagaacag gccgaaaata 4560
tcattcattt gtttacctta accaaccttg gagcaccagc tgccttcaaa tatttcgata 4620
ccacaattga tcgtaaacgg tatacaagta caaaagaagt cttggacgca accctcattc 4680
atcaatctat tactggatta tatgagacac gcattgatct ttcacagctg ggcggagaca 4740
agaagaaaaa actgaaactg caccatcatc accatcatca tcaccatcat tgataactcg 4800
agaaagctta cataaaaaac cggccttggc cccgccggtt ttttattatt tttcttcctc 4860
cgcatgttca atccgctcca taatcgacgg atggctccct ctgaaaattt taacgagaaa 4920
cggcgggttg acccggctca gtcccgtaac ggccaagtcc tgaaacgtct caatcgccgc 4980
ttcccggttt ccggtcagct caatgccgta acggtcggcg gcgttttcct gataccggga 5040
gacggcattc gtaatc 5056
<210> 3
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> N-terminal NLS
<400> 3
Ala Pro Lys Lys Lys Arg Lys Val
1 5
<210> 4
<211> 6
<212> PRT
<213> Artificial sequence
<220>
<223> C-terminal NLS
<400> 4
Lys Lys Lys Lys Leu Lys
1 5
<210> 5
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> deca-Histidine tag
<400> 5
His His His His His His His His His His
1 5 10
<210> 6
<211> 607
<212> DNA
<213> Bacillus subtilis
<400> 6
attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60
aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120
aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180
cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240
atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300
cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360
taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420
ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480
aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540
aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600
gtaacta 607
<210> 7
<211> 247
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized terminator DNA sequence
<400> 7
acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct ccgcatgttc 60
aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa acggcgggtt 120
gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg cttcccggtt 180
tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg agacggcatt 240
cgtaatc 247
<210> 8
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> Cas9 forward primer
<400> 8
atatatgagt aaacttggtc tgacagaatt cctccatttt cttctgctat 50
<210> 9
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Cas9 revers primer
<400> 9
tgcggccgcg aattcgatta cgaatgccgt ctccc 35
<210> 10
<211> 3290
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pKB320 backbone
<400> 10
gaattcgcgg ccgcacgcgt ccatggggat ccccgcgggt cgacctcgag agttacgcta 60
gggataacag ggtaatatag gagctccagt cggcttaaac cagttttcgc tggtgcgaaa 120
aaagagtgtc ttgtgacacc taaattcaaa atctatcggt cagatttata ccgatttgat 180
tttatatatt cttgaataac atacgccgag ttatcacata aaagcgggaa ccaatcataa 240
aatttaaact tcattgcata atccattaaa ctcttaaatt ctacgattcc ttgttcatca 300
ataaactcaa tcatttcttt aattaattta tatctatctg ttgttgtttt ctttaataat 360
tcattaacat ctacaccgcc ataaactatc atatcttctt tttgatattt aaatttatta 420
ggatcgtcca tgtgaagcat atatctcaca agacctttca cacttcctgc aatctgcgga 480
atagtcgcat tcaattcttc tgttaattat ttttatctgt tcataagatt tattaccctc 540
atacatcact agaatatgat aatgctcttt tttcatccta ccttctgtat cagtatccct 600
atcatgtaat ggagacacta caaattgaat gtgtaactct tttaaatact ctaaccactc 660
ggcttttgct gattctggat ataaaacaaa tgtccaatta cgtcctcttg aatttttctt 720
gttttcagtt tcttttatta cattttcgct catgatataa taacggtgct aatacactta 780
acaaaattta gtcatagata ggcagcatgc cagtgctgtc tatctttttt tgtttaaaat 840
gcaccgtatt cctcctttgc atattttttt attagaatac cggttgcatc tgatttgcta 900
atattatatt tttctttgat tctatttaat atctcatttt cttctgttgt aagtcttaaa 960
gtaacagcaa cttttttctc ttcttttcta tctacaacta tcactgtacc tcccaacatc 1020
tgtttttttc actttaacat aaaaaacaac cttttaacat taaaaaccca atatttattt 1080
atttgtttgg acaatggaca ctggacacct aggggggagg tcgtagtacc cccctatgtt 1140
ttctccccta aataacccca aaaatctaag aaaaaaagac ctcaaaaagg tctttaatta 1200
acatctcaaa tttcgcattt attccaattt cctttttgcg tgtgatgcga gctcatcggc 1260
tccgtcgata ctatgttata cgccaacttt caaaacaact ttgaaaaagc tgttttctgg 1320
tatttaaggt tttagaatgc aaggaacagt gaattggagt tcgtcttgtt ataattagct 1380
tcttggggta tctttaaata ctgtagaaaa gaggaaggaa ataataaatg gctaaaatga 1440
gaatatcacc ggaattgaaa aaactgatcg aaaaataccg ctgcgtaaaa gatacggaag 1500
gaatgtctcc tgctaaggta tataagctgg tgggagaaaa tgaaaaccta tatttaaaaa 1560
tgacggacag ccggtataaa gggaccacct atgatgtgga acgggaaaag gacatgatgc 1620
tatggctgga aggaaagctg cctgttccaa aggtcctgca ctttgaacgg catgatggct 1680
ggagcaatct gctcatgagt gaggccgatg gcgtcctttg ctcggaagag tatgaagatg 1740
aacaaagccc tgaaaagatt atcgagctgt atgcggagtg catcaggctc tttcactcca 1800
tcgacatatc ggattgtccc tatacgaata gcttagacag ccgcttagcc gaattggatt 1860
acttactgaa taacgatctg gccgatgtgg attgcgaaaa ctgggaagaa gacactccat 1920
ttaaagatcc gcgcgagctg tatgattttt taaagacgga aaagcccgaa gaggaacttg 1980
tcttttccca cggcgacctg ggagacagca acatctttgt gaaagatggc aaagtaagtg 2040
gctttattga tcttgggaga agcggcaggg cggacaagtg gtatgacatt gccttctgcg 2100
tccggtcgat cagggaggat atcggggaag aacagtatgt cgagctattt tttgacttac 2160
tggggatcaa gcctgattgg gagaaaataa aatattatat tttactggat gaattgtttt 2220
agtgactgca gtgagatctg gtaatgactc tctagcttga ggcatcaaat aaaacgaaag 2280
gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg 2340
agtaggacaa atccgccgct ctagctaagc agaaggccat cctgacggat ggcctttttg 2400
cgtttctaca aactcttgtt aactctagag ctgcctgccg cgtttcggtg atgaagatct 2460
tcccgatgat taattaattc agaacgctcg gttgccgccg ggcgtttttt atgaagcttc 2520
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 2580
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 2640
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 2700
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 2760
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 2820
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 2880
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 2940
gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 3000
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 3060
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 3120
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 3180
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 3240
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 3290
<210> 11
<211> 4204
<212> DNA
<213> Artificial sequence
<220>
<223> pKB320 plasmid
<400> 11
gcggccgcac gcgtccatgg ggatccccgc gggtcgacct cgagagttac gctagggata 60
acagggtaat ataggagctc cagtcggctt aaaccagttt tcgctggtgc gaaaaaagag 120
tgtcttgtga cacctaaatt caaaatctat cggtcagatt tataccgatt tgattttata 180
tattcttgaa taacatacgc cgagttatca cataaaagcg ggaaccaatc ataaaattta 240
aacttcattg cataatccat taaactctta aattctacga ttccttgttc atcaataaac 300
tcaatcattt ctttaattaa tttatatcta tctgttgttg ttttctttaa taattcatta 360
acatctacac cgccataaac tatcatatct tctttttgat atttaaattt attaggatcg 420
tccatgtgaa gcatatatct cacaagacct ttcacacttc ctgcaatctg cggaatagtc 480
gcattcaatt cttctgttaa ttatttttat ctgttcataa gatttattac cctcatacat 540
cactagaata tgataatgct cttttttcat cctaccttct gtatcagtat ccctatcatg 600
taatggagac actacaaatt gaatgtgtaa ctcttttaaa tactctaacc actcggcttt 660
tgctgattct ggatataaaa caaatgtcca attacgtcct cttgaatttt tcttgttttc 720
agtttctttt attacatttt cgctcatgat ataataacgg tgctaataca cttaacaaaa 780
tttagtcata gataggcagc atgccagtgc tgtctatctt tttttgttta aaatgcaccg 840
tattcctcct ttgcatattt ttttattaga ataccggttg catctgattt gctaatatta 900
tatttttctt tgattctatt taatatctca ttttcttctg ttgtaagtct taaagtaaca 960
gcaacttttt tctcttcttt tctatctaca actatcactg tacctcccaa catctgtttt 1020
tttcacttta acataaaaaa caacctttta acattaaaaa cccaatattt atttatttgt 1080
ttggacaatg gacactggac acctaggggg gaggtcgtag taccccccta tgttttctcc 1140
cctaaataac cccaaaaatc taagaaaaaa agacctcaaa aaggtcttta attaacatct 1200
caaatttcgc atttattcca atttcctttt tgcgtgtgat gcgagctcat cggctccgtc 1260
gatactatgt tatacgccaa ctttcaaaac aactttgaaa aagctgtttt ctggtattta 1320
aggttttaga atgcaaggaa cagtgaattg gagttcgtct tgttataatt agcttcttgg 1380
ggtatcttta aatactgtag aaaagaggaa ggaaataata aatggctaaa atgagaatat 1440
caccggaatt gaaaaaactg atcgaaaaat accgctgcgt aaaagatacg gaaggaatgt 1500
ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa cctatattta aaaatgacgg 1560
acagccggta taaagggacc acctatgatg tggaacggga aaaggacatg atgctatggc 1620
tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga acggcatgat ggctggagca 1680
atctgctcat gagtgaggcc gatggcgtcc tttgctcgga agagtatgaa gatgaacaaa 1740
gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag gctctttcac tccatcgaca 1800
tatcggattg tccctatacg aatagcttag acagccgctt agccgaattg gattacttac 1860
tgaataacga tctggccgat gtggattgcg aaaactggga agaagacact ccatttaaag 1920
atccgcgcga gctgtatgat tttttaaaga cggaaaagcc cgaagaggaa cttgtctttt 1980
cccacggcga cctgggagac agcaacatct ttgtgaaaga tggcaaagta agtggcttta 2040
ttgatcttgg gagaagcggc agggcggaca agtggtatga cattgccttc tgcgtccggt 2100
cgatcaggga ggatatcggg gaagaacagt atgtcgagct attttttgac ttactgggga 2160
tcaagcctga ttgggagaaa ataaaatatt atattttact ggatgaattg ttttagtgac 2220
tgcagtgaga tctggtaatg actctctagc ttgaggcatc aaataaaacg aaaggctcag 2280
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 2340
acaaatccgc cgctctagct aagcagaagg ccatcctgac ggatggcctt tttgcgtttc 2400
tacaaactct tgttaactct agagctgcct gccgcgtttc ggtgatgaag atcttcccga 2460
tgattaatta attcagaacg ctcggttgcc gccgggcgtt ttttatgaag cttcgttgct 2520
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 2580
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 2640
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2700
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2760
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2820
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 2880
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 2940
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 3000
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 3060
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 3120
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 3180
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 3240
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 3300
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 3360
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 3420
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 3480
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 3540
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 3600
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 3660
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 3720
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 3780
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 3840
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 3900
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 3960
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 4020
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 4080
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 4140
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgga 4200
attc 4204
<210> 12
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> pKB320 forward primer
<400> 12
gggagacggc attcgtaatc gaattcgcgg ccgca 35
<210> 13
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> pKB320 reverse primer
<400> 13
atagcagaag aaaatggagg aattctgtca gaccaagttt actcatatat 50
<210> 14
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid RSP1
<400> 14
ccgactggag ctcctatatt acc 23
<210> 15
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid RSP2
<400> 15
gctgtggcga tctgtattcc 20
<210> 16
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP1
<400> 16
gtcttttaag taagtctact ct 22
<210> 17
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP2
<400> 17
ccaaagcgat tttaagcgcg 20
<210> 18
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP3
<400> 18
cctggcacgt ggtaattctc 20
<210> 19
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP4
<400> 19
ggatttcctc aaatctgacg 20
<210> 20
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP5
<400> 20
gtagaaacgc gccaaattac g 21
<210> 21
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP6
<400> 21
gctggtggtt gctaaagtcg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP7
<400> 22
ggacgcaacc ctcattcatc 20
<210> 23
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid RSP3
<400> 23
caggcatccg atttgcaagg 20
<210> 24
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid FSP8
<400> 24
gcaagcagca gattacgcg 19
<210> 25
<211> 8347
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF694
<400> 25
gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60
tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120
taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180
ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240
gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300
agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360
tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420
tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480
ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540
acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600
gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660
ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720
tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780
ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840
agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900
gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960
gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020
catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080
gcggatctgc gtttaatcta tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140
ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200
gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260
aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320
ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380
accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440
gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500
ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560
aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620
caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680
gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740
caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800
ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860
tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920
ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980
ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040
agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100
cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160
cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220
tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280
gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340
ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400
gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460
aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520
agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580
aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640
ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700
gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760
cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820
ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880
aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940
acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000
aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060
gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120
gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180
gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240
aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300
gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360
agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420
aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480
ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540
gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600
ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660
gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720
atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780
gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840
acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900
atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960
tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020
aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080
gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140
atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200
gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260
ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320
ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380
cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440
attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500
aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560
atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620
accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680
catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740
aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800
gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040
agacggcatt cgtaatcgaa ttcgcggccg cacgcgtcca tggggatccc cgcgggtcga 5100
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 5160
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 5220
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 5280
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 5340
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 5400
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 5460
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 5520
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 5580
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 5640
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 5700
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 5760
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 5820
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 5880
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 5940
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 6000
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 6060
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 6120
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 6180
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 6240
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 6300
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 6360
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 6420
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 6480
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 6540
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 6600
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 6660
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 6720
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 6780
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 6840
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 6900
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 6960
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 7020
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 7080
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 7140
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 7200
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 7260
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 7320
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 7380
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 7440
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 7500
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 7560
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 7620
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 7680
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 7740
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7800
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7860
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7920
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7980
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 8040
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 8100
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 8160
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 8220
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 8280
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 8340
tctgaca 8347
<210> 26
<211> 9724
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF801
<400> 26
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240
tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720
gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780
ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840
taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900
ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960
aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020
actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080
tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140
tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200
caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260
ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320
gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380
atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440
gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500
aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560
gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620
tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 27
<211> 9724
<212> DNA
<213> Artificial sequence
<220>
<223> pRF806 plasmid
<400> 27
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240
catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720
atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780
tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840
actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900
tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960
caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020
ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080
ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140
ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200
ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260
tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320
tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380
aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440
agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500
cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560
tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620
ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 28
<211> 20
<212> DNA
<213> Bacillus licheniformis
<400> 28
ctcgacttcg aatacatcca 20
<210> 29
<211> 20
<212> DNA
<213> Bacillus licheniformis
<400> 29
gatgccatca gttcctcata 20
<210> 30
<211> 1578
<212> DNA
<213> Bacillus licheniformis
<400> 30
atgtttcgag tattggtctc agataaaatg tccagcgacg gcctcaaacc attaatggaa 60
gcagatttta ttgaaattgt agaaaagaat gttgcggaag cggaagacga gcttcatacg 120
tttgacgcgc tcttggtgcg gagcgccacg aaggtaaccg aagagctgtt taaaaagatg 180
acttcgctga aaatcgtcgc cagagcaggt gtcggcgtcg acaatatcga tattgacgag 240
gcgacaaaac acggtgttat cgtcgtaaac gcgccaaacg ggaatacaat ttcaaccgct 300
gaacatacct ttgcaatgtt ttcagcgtta atgagacata ttccgcaggc aaacatctcc 360
gtgaaatcaa gggagtggaa tcgttcggct tacgtcggtt cagagcttta cggaaaaacg 420
ctcggcatca tcggaatggg ccgcatcgga agcgaaatcg cgagccgcgc aaaagcattc 480
ggtatgaccg ttcatgtatt tgacccgttc ctgacccaag aaagggcaag caagctcggc 540
gttaacgcga acagctttga agaagttctg gcatgcgccg acatcattac ggttcatacc 600
ccgctcacga aagaaacgaa gggacttttg aacaaagaaa ccatcgcaaa aacgaaaaaa 660
ggcgttcgtc tcgttaactg tgcaagaggc ggcatcatcg atgaagcagc gcttttggaa 720
gctctggaaa gcggacatgt cgctggcgct gccttggatg tattcgaagt cgagcctccg 780
gtcgattcaa aactgatcga tcatccgctt gtagtcgcga ctcctcactt gggcgcctca 840
acaaaagaag cccagctgaa tgtcgctgca caagtgtccg aagaagtcct tcagtatgcg 900
caaggaaacc ctgtgatgtc cgcgatcaac cttccggcca tgacaaagga ttcattcgaa 960
aaaatccagc cttatcatca gtttgccaat acgatcggaa accttgtgtc tcagtgcatg 1020
aatgagcctg ttcaagatgt agccatccaa tatgaaggct ccatcgccaa acttgaaacg 1080
tcatttatta cgaaaagcct tttggccgga tttctgaagc cgagggtcgc ggctaccgtt 1140
aacgaagtga atgccggcac cgttgcgaaa gagcgcggca tcagcttcag cgaaaaaatt 1200
tcttccaatg agtcaggcta tgaaaactgc atctctgtga ctgtcacggg agatgtaaca 1260
acattctctt taagagcgac gtacattccg cacttcggcg gacgcatcgt tgccttaaac 1320
ggctttgata ttgattttta tccggctgga caccttgtct acattcacca ccaggataaa 1380
ccaggggcta tcggccatgt cggacgaatt ttaggagacc atgacatcaa tatcgccact 1440
atgcaggtag gccgaaaaga aaaaggcgga gaagcgatca tgatgctttc ctttgaccgc 1500
caccttgagg acgatatttt agctgagctg aaaaacatcc cggatatcgt gtctgttaaa 1560
gccatcgacc ttccttaa 1578
<210> 31
<211> 23
<212> DNA
<213> Bacillus licheniformis
<400> 31
ctcgacttcg aatacatcca agg 23
<210> 32
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized DNA encoding variable targeting domain
<400> 32
ctcgacttcg aatacatcca 20
<210> 33
<211> 76
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized DNA encoding CER domain
<400> 33
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 34
<211> 96
<212> RNA
<213> Artificial sequence
<220>
<223> synthesized gRNA targeting target site 1
<400> 34
cucgacuucg aauacaucca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 35
<211> 224
<212> DNA
<213> artificial sequence
<220>
<223> synthesized spac promoter
<400> 35
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tgga 224
<210> 36
<211> 95
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized t0 terminator
<400> 36
gactcctgtt gatagatcca gtaatgacct cagaactcca tctggatttg ttcagaacgc 60
tcggttgccg ccgggcgttt tttattggtg agaat 95
<210> 37
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 37
aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60
tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120
ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180
gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240
gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300
aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360
ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420
gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480
tatttaggag gaaatcttac 500
<210> 38
<211> 40
<212> DNA
<213> Artificial sequence
<220>
<223> serA1 homology arm 1 forward primer
<400> 38
tgagtaaact tggtctgaca aatggttctt tcccctgtcc 40
<210> 39
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> serA1 homology arm 1 forward primer
<400> 39
aggttccgca gcttctgtgt aagatttcct cctaaataag cgtcat 46
<210> 40
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 40
acagaagctg cggaacctga aaagaattcc tttcaggttc cgtttttttt aggaattctc 60
cctgatctca agcatctggc ggggataaat ccgctctcct ttcaaatcgt tccattcttt 120
gaggcgctgt acagttacgc ccattttttc ggcgatatga tgaagcgtat cccctttccg 180
cactacatat gtaccggtct tcgattcatc gtcatgaagg cggagtgttt ggccggcctt 240
gagatttgaa tgtttcaacc cgtttattct catgatctcc tcgatggata taccgctatc 300
cttgctgatt ctccagagcg tgtccccttt ttgaacggtc accgcaccgc tcattgtccc 360
ggcgttttga taaacgtgga tagaattttg ccggaacgcc tcctcacgaa gcaccgtcag 420
cggattgatt gcatatcttt tatcttcagt ccatgaaccg tgatgcattt caaaatgcag 480
gtgggttccg gtcgatattc 500
<210> 41
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> serA1 homology arm 2 forward primer
<400> 41
atgacgctta tttaggagga aatcttacac agaagctgcg gaacct 46
<210> 42
<211> 41
<212> DNA
<213> Artificial sequence
<220>
<223> serA1 homology arm 2 reverse primer
<400> 42
cagaagaaaa tggaggaatt cgaatatcga ccggaaccca c 41
<210> 43
<211> 415
<212> DNA
<213> Artificial sequence
<220>
<223> DNA encoding ts1 gRNA expression cassette
<400> 43
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240
tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415
<210> 44
<211> 1000
<212> DNA
<213> Artificial sequence
<220>
<223> serA1 deletion editing template
<400> 44
aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60
tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120
ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180
gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240
gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300
aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360
ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420
gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480
tatttaggag gaaatcttac acagaagctg cggaacctga aaagaattcc tttcaggttc 540
cgtttttttt aggaattctc cctgatctca agcatctggc ggggataaat ccgctctcct 600
ttcaaatcgt tccattcttt gaggcgctgt acagttacgc ccattttttc ggcgatatga 660
tgaagcgtat cccctttccg cactacatat gtaccggtct tcgattcatc gtcatgaagg 720
cggagtgttt ggccggcctt gagatttgaa tgtttcaacc cgtttattct catgatctcc 780
tcgatggata taccgctatc cttgctgatt ctccagagcg tgtccccttt ttgaacggtc 840
accgcaccgc tcattgtccc ggcgttttga taaacgtgga tagaattttg ccggaacgcc 900
tcctcacgaa gcaccgtcag cggattgatt gcatatcttt tatcttcagt ccatgaaccg 960
tgatgcattt caaaatgcag gtgggttccg gtcgatattc 1000
<210> 45
<211> 402
<212> DNA
<213> Bacillus licheniformis
<400> 45
atgacgaact ttggacacca tttacgacaa ttaagggaac ggaaaaaact gaccgtcaat 60
caactggcga tgtattccgg cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag 120
cgcggcgtgc cgaagccggc gacgatcaga aaactggcgg acgctttgaa agtcccgtat 180
gaggaactga tggcatctgc aggctatatc agcgcgtcta cagtccagga agcaagaagc 240
agctatgatt ccatttacga catcgtgtca cagtacgatt tagaggacct ttctctgttt 300
gacagcgaaa agtggaaggt gctttcaaaa aaagacatcg aaaacctgga caaatatttc 360
gactttctcg tgcaggaagc aagcagccga aacaaaaact ga 402
<210> 46
<211> 20
<212> DNA
<213> Bacillus licheniformis
<400> 46
gatgccatca gttcctcata 20
<210> 47
<211> 23
<212> DNA
<213> Bacillus licheniformis
<400> 47
gatgccatca gttcctcata cgg 23
<210> 48
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized DNA encoding variable targeting domain 2
<400> 48
gatgccatca gttcctcata 20
<210> 49
<211> 96
<212> RNA
<213> Artificial sequence
<220>
<223> synthesized gRNA targeting target site 2
<400> 49
gaugccauca guuccucaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 50
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 50
ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60
ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120
acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180
catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240
cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300
gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360
taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420
tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480
gagattgcga ggttttggcc 500
<210> 51
<211> 40
<212> DNA
<213> artificial sequence
<220>
<223> rghR1 homology arm 1 forward primer
<400> 51
tgagtaaact tggtctgaca ttgatattca gcaccctgcg 40
<210> 52
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> rghR1 homology arm 1 reverse primer
<400> 52
tgtgccgcgg agaagtatgg ccaaaacctc gcaatctc 38
<210> 53
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 53
atacttctcc gcggcacact ctcctctcta tcattttcgt ctgtttacga tcctgctgtt 60
attttatccc ttatgttaac ttttgtcaat atttttcctg tctaagtatt tcctatagtc 120
aacatttgta ttaaaatgtt catatcatga atttgcgggg gggatggcga tgacaaggtt 180
cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg tcggttaatc agcttgccat 240
gtatgccggt gtgagcgccg cagccatttc cagagccgca gccatttcca gaatcgaaaa 300
cggccaccgc ggcgttccca agcccgcgac gatcagaaaa ttggccgagg ctctgaaaat 360
gccgtacgag cagctcatgg atattgccgg ttatatgaga gctgacgaga ttcgcgaaca 420
gccgcgcggc tatgtcacga tgcaggagat cgcggccaag cacggcgtcg aagacctgtg 480
gctgtttaaa cccgagaaat 500
<210> 54
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> rghR1 homology arm 2 forward primer
<400> 54
gagattgcga ggttttggcc atacttctcc gcggcaca 38
<210> 55
<211> 44
<212> DNA
<213> Artificial sequence
<220>
<223> rghR1 homology arm 2 reverse primer
<400> 55
cagaagaaaa tggaggaatt catttctcgg gtttaaacag ccac 44
<210> 56
<211> 415
<212> DNA
<213> Artificial sequence
<220>
<223> DNA encoding ts2 expression cassette
<400> 56
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240
catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415
<210> 57
<211> 1000
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized rghR1 deletion editing template
<400> 57
ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60
ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120
acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180
catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240
cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300
gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360
taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420
tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480
gagattgcga ggttttggcc atacttctcc gcggcacact ctcctctcta tcattttcgt 540
ctgtttacga tcctgctgtt attttatccc ttatgttaac ttttgtcaat atttttcctg 600
tctaagtatt tcctatagtc aacatttgta ttaaaatgtt catatcatga atttgcgggg 660
gggatggcga tgacaaggtt cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg 720
tcggttaatc agcttgccat gtatgccggt gtgagcgccg cagccatttc cagagccgca 780
gccatttcca gaatcgaaaa cggccaccgc ggcgttccca agcccgcgac gatcagaaaa 840
ttggccgagg ctctgaaaat gccgtacgag cagctcatgg atattgccgg ttatatgaga 900
gctgacgaga ttcgcgaaca gccgcgcggc tatgtcacga tgcaggagat cgcggccaag 960
cacggcgtcg aagacctgtg gctgtttaaa cccgagaaat 1000
<210> 58
<211> 1368
<212> PRT
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155H variant
<400> 58
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile His Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 59
<211> 33
<212> DNA
<213> Artificial sequence
<220>
<223> Y155H forward primer
<400> 59
gatctgcgtt taatccatct tgcgttagcg cac 33
<210> 60
<211> 33
<212> DNA
<213> Artificial sequence
<220>
<223> Y155H reverse primer
<400> 60
gtgcgctaac gcaagatgga ttaaacgcag atc 33
<210> 61
<211> 9724
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF827
<400> 61
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240
tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720
gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780
ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840
taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900
ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960
aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020
actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080
tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140
tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200
caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260
ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320
gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380
atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440
gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500
aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560
gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620
tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 62
<211> 5042
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized Y155H variant expression cassette
<400> 62
attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60
aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120
aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180
cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240
atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300
cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360
taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420
ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480
aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540
aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600
gtaactagtg gccccaaaaa agaaacgcaa ggttatggat aaaaaataca gcattggtct 660
ggatatcgga accaacagcg ttgggtgggc agtaataaca gatgaataca aagtgccgtc 720
aaaaaaattt aaggttctgg ggaatacaga tcgccacagc ataaaaaaga atctgattgg 780
ggcattgctg tttgattcgg gtgagacagc tgaggccacg cgtctgaaac gtacagcaag 840
aagacgttac acacgtcgta aaaatcgtat ttgctactta caggaaattt tttctaacga 900
aatggccaag gtagatgata gtttcttcca tcgtctcgaa gaatcttttc tggttgagga 960
agataaaaaa cacgaacgtc accctatctt tggcaatatc gtggatgaag tggcctatca 1020
tgaaaaatac cctacgattt atcatcttcg caagaagttg gttgatagta cggacaaagc 1080
ggatctgcgt ttaatccatc ttgcgttagc gcacatgatc aaatttcgtg gtcatttctt 1140
aattgaaggt gatctgaatc ctgataactc tgatgtggac aaattgttta tacaattagt 1200
gcaaacctat aatcagctgt tcgaggaaaa ccccattaat gcctctggag ttgatgccaa 1260
agcgatttta agcgcgagac tttctaagtc ccggcgtctg gagaatctga tcgcccagtt 1320
accaggggaa aagaaaaatg gtctgtttgg taatctgatt gccctcagtc tggggcttac 1380
cccgaacttc aaatccaatt ttgacctggc tgaggacgca aagctgcagc tgagcaaaga 1440
tacttatgat gatgacctcg acaatctgct cgcccagatt ggtgaccaat atgcggatct 1500
gtttctggca gcgaagaatc tttcggatgc tatcttgctg tcggatattc tgcgtgttaa 1560
taccgaaatc accaaagcgc ctctgtctgc aagtatgatc aagagatacg acgagcacca 1620
ccaggacctg actcttctta aggcactggt acgccaacag cttccggaga aatacaaaga 1680
aatattcttc gaccagtcca agaatggtta cgcgggctac atcgatggtg gtgcatcaca 1740
ggaagagttc tataaattta ttaaaccaat ccttgagaaa atggatggca cggaagagtt 1800
acttgttaaa cttaaccgcg aagacttgct tagaaagcaa cgtacattcg acaacggctc 1860
catcccacac cagattcatt taggtgaact tcacgccatc ttgcgcagac aagaagattt 1920
ctatcccttc ttaaaagaca atcgggagaa aatcgagaag atcctgacgt tccgcattcc 1980
ctattatgtc ggtcccctgg cacgtggtaa ttctcggttt gcctggatga cgcgcaaaag 2040
tgaggaaacc atcacccctt ggaactttga agaagtcgtg gataaaggtg ctagcgcgca 2100
gtcttttata gaaagaatga cgaacttcga taaaaacttg cccaacgaaa aagtcctgcc 2160
caagcactct cttttatatg agtactttac tgtgtacaac gaactgacta aagtgaaata 2220
cgttacggaa ggtatgcgca aacctgcctt tcttagtggc gagcagaaaa aagcaattgt 2280
cgatcttctc tttaaaacga atcgcaaggt aactgtaaaa cagctgaagg aagattattt 2340
caaaaagatc gaatgctttg attctgtcga gatctcgggt gtcgaagatc gtttcaacgc 2400
ttccttaggg acctatcatg atttgctgaa gataataaaa gacaaagact ttctcgacaa 2460
tgaagaaaat gaagatattc tggaggatat tgttttgacc ttgaccttat tcgaagatag 2520
agagatgatc gaggagcgct taaaaaccta tgcccacctg tttgatgaca aagtcatgaa 2580
gcaattaaag cgccgcagat atacggggtg gggccgcttg agccgcaagt tgattaacgg 2640
tattagagac aagcagagcg gaaaaactat cctggatttc ctcaaatctg acggatttgc 2700
gaaccgcaat tttatgcagc ttatacatga tgattcgctt acattcaaag aggatattca 2760
gaaggctcag gtgtctgggc aaggtgattc actccacgaa catatagcaa atttggccgg 2820
ctctcctgcg attaagaagg ggatcctgca aacagttaaa gttgtggatg aacttgtaaa 2880
agtaatgggc cgccacaagc cggagaatat cgtgatagaa atggcgcgcg agaatcaaac 2940
gacacaaaaa ggtcaaaaga actcaagaga gagaatgaag cgcattgagg aggggataaa 3000
ggaacttgga tctcaaattc tgaaagaaca tccagttgaa aacactcagc tgcaaaatga 3060
aaaattgtac ctgtactacc tgcagaatgg aagagacatg tacgtggatc aggaattgga 3120
tatcaataga ctctcggact atgacgtaga tcacattgtc cctcagagct tcctcaagga 3180
tgattctata gataataaag tacttacgag atcggacaaa aatcgcggta aatcggataa 3240
cgtcccatcg gaggaagtcg ttaaaaagat gaaaaactat tggcgtcaac tgctgaacgc 3300
caagctgatc acacagcgta agtttgataa tctgactaaa gccgaacgcg gtggtcttag 3360
tgaactcgat aaagcaggat ttataaaacg gcagttagta gaaacgcgcc aaattacgaa 3420
acacgtggct cagatcctcg attctagaat gaatacaaag tacgatgaaa acgataaact 3480
gatccgtgaa gtaaaagtca ttaccttaaa atctaaactt gtgtccgatt tccgcaaaga 3540
ttttcagttt tacaaggtcc gggaaatcaa taactatcac catgcacatg atgcatattt 3600
aaatgcggtt gtaggcacgg cccttattaa gaaataccct aaactcgaaa gtgagtttgt 3660
ttatggggat tataaagtgt atgacgttcg caaaatgatc gcgaaatcag aacaggaaat 3720
cggtaaggct accgctaaat acttttttta ttccaacatt atgaattttt ttaagaccga 3780
aataactctc gcgaatggtg aaatccgtaa acggcctctt atagaaacca atggtgaaac 3840
gggagaaatc gtttgggata aaggtcgtga ctttgccacc gttcgtaaag tcctctcaat 3900
gccgcaagtt aacattgtca agaagacgga agttcaaaca gggggattct ccaaagaatc 3960
tatcctgccg aagcgtaaca gtgataaact tattgccaga aaaaaagatt gggatccaaa 4020
aaaatacgga ggctttgatt cccctaccgt cgcgtatagt gtgctggtgg ttgctaaagt 4080
cgagaaaggg aaaagcaaga aattgaaatc agttaaagaa ctgctgggta ttacaattat 4140
ggaaagatcg tcctttgaga aaaatccgat cgacttttta gaggccaagg ggtataagga 4200
agtgaaaaaa gatctcatca tcaaattacc gaagtatagt ctttttgagc tggaaaacgg 4260
cagaaaaaga atgctggcct ccgcgggcga gttacagaag ggaaatgagc tggcgctgcc 4320
ttccaaatat gttaattttc tgtaccttgc cagtcattat gagaaactga agggcagccc 4380
cgaagataac gaacagaaac aattattcgt ggaacagcat aagcactatt tagatgaaat 4440
tatagagcaa attagtgaat tttctaagcg cgttatcctc gcggatgcta atttagacaa 4500
agtactgtca gcttataata aacatcggga taagccgatt agagaacagg ccgaaaatat 4560
cattcatttg tttaccttaa ccaaccttgg agcaccagct gccttcaaat atttcgatac 4620
cacaattgat cgtaaacggt atacaagtac aaaagaagtc ttggacgcaa ccctcattca 4680
tcaatctatt actggattat atgagacacg cattgatctt tcacagctgg gcggagacaa 4740
gaagaaaaaa ctgaaactgc accatcatca ccatcatcat caccatcatt gataaacata 4800
aaaaaccggc cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc 4860
gctccataat cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc 4920
ggctcagtcc cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg 4980
tcagctcaat gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa 5040
tc 5042
<210> 63
<211> 9724
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF856
<400> 63
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240
catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720
atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780
tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840
actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900
tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960
caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020
ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080
ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140
ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200
ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260
tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320
tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380
aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440
agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500
cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560
tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620
ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 64
<211> 6393
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized pBL.comK-syn
<400> 64
aagcttcata tgcaagggtt tattgttttc taaaatctga ttaccaatta gaatgaatat 60
ttcccaaata ttaaataata aaacaaaaaa attgaaaaaa gtgtttccac cattttttca 120
atttttttat aattttttta atctgttatt taaatagttt atagttaaat ttacattttc 180
attagtccat tcaatattct ctccaagata actacgaact gctaacaaaa ttctctccct 240
atgttctaat ggagaagatt cagccactgc atttcccgca atatcttttg gtatgatttt 300
acccgtgtcc atagttaaaa tcatacggca taaagttaat atagagttgg tttcatcatc 360
ctgataatta tctattaatt cctctgacga atccataatg gctcttctca catcagaaaa 420
tggaatatca ggtagtaatt cctctaagtc ataatttccg tatattcttt tattttttcg 480
ttttgcttgg taaagcatta tggttaaatc tgaatttaat tccttctgag gaatgtatcc 540
ttgttcataa agctcttgta accattctcc ataaataaat tcttgtttgg gaggatgatt 600
ccacggtacc atttcttgct gaataataat tgttaattca atatatcgta agttgctttt 660
atctcctatt ttttttgaaa taggtctaat tttttgtata agtatttctt tactttgatc 720
tgtcaatggt tcagatacga cgactaaaaa gtcaagatca ctatttggtt ttagtccact 780
ctcaactcct gatccaaaca tgtaagtacc aataaggtta ttttttaaat gtttccgaag 840
tatttttttc actttattaa tttgttcgta tgtattcaaa tatatcctcc tcactatttt 900
gattagtacc tattttatat ccatagttgt taattaaata aacttaattt agtttattta 960
tggatttcat tggcttctaa attttttatc tagataataa ttattttagt taattttatt 1020
ctagattata tatgatatga tctttcattt ccataaaact aaagtaagtg taaacctatt 1080
cattgtttta aaaatatctc ttgccagtca cgttacgtta ttagttatag ttattataac 1140
atgtattcac gaacgggcgc gccggtatcc gcgcttcttg agcactattt attcaaagcc 1200
gctccagatc aatagcgctt tttcagctcc ctgaggatga attcgtatat cagctgattc 1260
cggtcttctt tcggatagag cataaattcc tgtttcttct gcatggggtt tccttcaatc 1320
ctgtcgataa attttgttct cagccatgcc gttcggtaaa cctggttttc gaaagatgag 1380
atggatacgg gcagctccag cgtttccccg ttgacaaacg tgacaaacgt gttgtcatac 1440
tttgccgcgc aaaactcgtg aacatgcgca tgggaaagcc acccgcactg aggacgagtt 1500
gaggaaaatg tggggaaaag aaaaatgttg tttgagtgat ccaccatgat cggcggttta 1560
tgggaaactt taatgacttc atatgtgccc gcttttcttc ccgcatagct cgatccgaaa 1620
tagcggcagc ttctttcgat aatttgaaac ggcttcatat tgacgcggaa agtcctgtcg 1680
gtctcaagta tttttgaggc ggatttctcc ccctcaccca gaggcaggac agccattgtc 1740
gaactgttta cttcatacgt atcctttgtc atatcctctg tgctcatgtg atttccccct 1800
taaaaataaa ttcattcaaa tacagatgca ttttatttca tatagtaagt acatcaccta 1860
ttagtttgtt gtttaaacaa actaacttat tttcatctta tataacctcg tcagtatttt 1920
caatattttt tttagttttt tatgaacaca ttagatttaa taaagggaag attcgctatg 1980
tactatgttg atacttaatt taaagattaa acaaatggag tggatgaagt ggatatcgct 2040
gatcaaacct ttgtcaaaaa agtaaatcaa aagttattat taaaagaaat ccttaaaaat 2100
tcacctattt caagagcaaa attatctgaa atgactggat taaataaatc aactgtctca 2160
tcacaggtaa acacgttaat gaaagaaagt atggtatttg aaataggtca aggacaatca 2220
agtggcggaa gaagacctgt catgcttgtt tttaataaaa aggcaggata ctccgttgga 2280
atagatgttg gtgtggatta tattaatggc attttaacag accttgaagg aacaatcgtt 2340
cttgatcaat accgccattt ggaatccaat tctccagaaa taacgaaaga cattttgatt 2400
gatatgattc atcactttat tacgcaaatg ccccaatctc cgtacgggtt tattggtata 2460
ggtacttgcg tgcctggact cattgataaa gatcaaaaaa ttgttttcac tccgaactcc 2520
aactggagag atattgactt aaaatcttcg atacaagaga agtacaatgt gtctgttttt 2580
attgaaaatg aggcaaatgc tggcgcatat ggagaaaaac tatttggagc tgcaaaaaat 2640
cacgataaca ttatttacgt aagtatcagc acaggaatag ggatcggtgt tattatcaac 2700
aatcatttat atagaggagt aagcggcttc tctggagaaa tgggacatat gacaatagac 2760
tttaatggtc ctaaatgcag ttgcggaaac cgaggatgct gggaattgta tgcttcagag 2820
aaggctttat ttaaatctct tcagaccaaa gagaaaaaac tgtcctatca agatatcata 2880
aacctcgccc atctgaatga tatcggaacc ttaaatgcat tacaaaattt tggattctat 2940
ttaggaatag gccttaccaa tattctaaat actctcaacc cacaagccgt aattttaaga 3000
aatagcataa ttgaatcgca tcctatggtt ttaaattcaa tgagaagtga agtatcatca 3060
agggtttatt cccaattagg caatagctat gaattattgc catcttcctt aggacagaat 3120
gcaccggcat taggaatgtc ctccattgtg attgatcatt ttctggacat gattacaatg 3180
taatttttta tggaatggac agctcatctt taaagatgag tttttttatt ctaggagtat 3240
ttctgaagca atagtgacat ggcaccttct catatgaaaa aggagttcta aaataaaaat 3300
ctcctttttc atgtgcaaat tatttttctt tataacgaaa atatctaaat gacaatgcat 3360
atgcaagagg ggatcacata aatatatatt ttaaaaatat cccactttat ccaattttcg 3420
tttgttgaac taatgggtgc tttagttgaa gaataaaaga ccacattaaa aaatgtggtc 3480
ttttgtgttt ttttaaagga tttgagcgta gcgaaaaatc cttttctttc ttatcttgat 3540
actatataga aacaacatca tttttcaaaa ttaggtcaaa gccttgtgta tcaagggttt 3600
gatggttctt tgacaggtaa aaactccttc tgctattatt aaatactata tagaaacaac 3660
atcatttttc aaaattaggt caaagccttg tgtatcaagg gtttgatggt tctttgacag 3720
gtaaaaactc cttctgctat tattaaggtg tcgaatcaaa ataatagaat gctagagaac 3780
tagctcagaa ggagtttttt tgttgattta ttcatctgaa aatgattata gcatcctcga 3840
agataaaacc gcaacaggta aaaagcggga ttggaagggg aaaaagagac ggacgaacct 3900
catggcggag cattacgaag cgttagagag taagattggg gcaccttact atggcaaaaa 3960
ggctgaaaaa ctaattagtt gtgcagagta tctttcgttt aagagagacc cggagacggg 4020
caagttaaaa ctgtatcaag cccatttttg taaagtgagg ttatgtccga tgtgtgcgtg 4080
gcgcaggtcg ttaaaaattg cttatcacaa taagttgatc gtagaggaag ccaatagaca 4140
gtacggctgc ggatggattt ttctcacgct gacgattcga aatgtaaagg gagaacggct 4200
gaagccacaa atttctgcga tgatggaagg ctttaggaaa ctgttccagt acaaaaaagt 4260
aaaaacttcg gttcttggat ttttcagagc tttagagatt accaaaaatc atgaagaaga 4320
tacatatcat cctcattttc atgtgttgat accagtaagg aaaaattatt ttgggaaaaa 4380
ctatattaag caggcggagt ggacgagcct ttggaaaaag gcgatgaaat tggattacac 4440
tccaattgtc gatattcgtc gagtgaaagg taaagctaag attgacgctg aacagattga 4500
aaacgatgtg cggaacgcaa tgatggagca aaaagctgtt ctcgaaatct ctaaatatcc 4560
ggttaaggat acggatgttg tgcgcggtaa taaggtgact gaagacaatc tgaacacggt 4620
gctttacttg gatgatgcgt tggcagctcg aaggttaatt ggatacggtg gcattttgaa 4680
ggagatacat aaagagctga atcttggtga tgcggaggac ggcgatctgg tcaagattga 4740
ggaagaagat gacgaggttg caaatggtgc atttgaggtt atggcttatt ggcatcctgg 4800
cattaaaaat tacataatca aataaaaaaa gcagaccttt agaaggcctg cttttttaac 4860
taacccattt gtattgtgtt gaaatatgtt ttgtatggtg cactctcagt acaatctgct 4920
ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 4980
gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 5040
tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 5100
gcctattttt ataggttaat gtcatgataa taatggtttc ttagcgattc acaaaaaata 5160
ggcacacgaa aaacaagtta agggatgcag tttatgcatc ccttaactta aaatactaaa 5220
aatgcccata ttttttcctc cttataaaat tagtataatt atagcacgag atctaaaagg 5280
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 5340
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5400
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5460
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5520
ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5580
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5640
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5700
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5760
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5820
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5880
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5940
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 6000
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 6060
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 6120
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 6180
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 6240
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 6300
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 6360
ggaaacagct atgaccatga ttacgccgga tcc 6393
<210> 65
<211> 2800
<212> DNA
<213> Bacillus licheniformis
<400> 65
tagagacgag acgtctcacc ttgttgtgtt tcattttgtc actctctcct tttcgatcac 60
atctcacgaa aagaggaatg gttctttccc ctgtcctaaa caaaaaaccc gctttattga 120
aaaagcgggg ctgttttaca gacaggtcaa ataaacgttt gaaaatgttc atttcaaaac 180
gcgcggaacc tccatcttct cccatccaga ctatactgtc ggcttcggaa tcgcaccgaa 240
tcctgcccat aaaaaggctc gcgggcttag agcgcttgct catcaccgcc ggtagggaat 300
ttcaccctgc cccgaagatt gatcttattt atttttaata ctgatattat tataaattaa 360
ttgtgaaaaa atgtacaggt gcaaagctta ttgcgctgtt ttgggacatc ctgcacgata 420
tttcggtaaa ctcacttttt ccgcatacta aaaaccgcac attcacagtt atttcatttt 480
taattttcgt ctttccgcgt gaaactcatt gacactcttt atggaatatg gtaaattatc 540
agatatttat gacgcttatt taggaggaaa tcttacatgt ttcgagtatt ggtctcagat 600
aaaatgtcca gcgacggcct caaaccatta atggaagcag attttattga aattgtagaa 660
aagaatgttg cggaagcgga agacgagctt catacgtttg acgcgctctt ggtgcggagc 720
gccacgaagg taaccgaaga gctgtttaaa aagatgactt cgctgaaaat cgtcgccaga 780
gcaggtgtcg gcgtcgacaa tatcgatatt gacgaggcga caaaacacgg tgttatcgtc 840
gtaaacgcgc caaacgggaa tacaatttca accgctgaac atacctttgc aatgttttca 900
gcgttaatga gacatattcc gcaggcaaac atctccgtga aatcaaggga gtggaatcgt 960
tcggcttacg tcggttcaga gctttacgga aaaacgctcg gcatcatcgg aatgggccgc 1020
atcggaagcg aaatcgcgag ccgcgcaaaa gcattcggta tgaccgttca tgtatttgac 1080
ccgttcctga cccaagaaag ggcaagcaag ctcggcgtta acgcgaacag ctttgaagaa 1140
gttctggcat gcgccgacat cattacggtt cataccccgc tcacgaaaga aacgaaggga 1200
cttttgaaca aagaaaccat cgcaaaaacg aaaaaaggcg ttcgtctcgt taactgtgca 1260
agaggcggca tcatcgatga agcagcgctt ttggaagctc tggaaagcgg acatgtcgct 1320
ggcgctgcct tggatgtatt cgaagtcgag cctccggtcg attcaaaact gatcgatcat 1380
ccgcttgtag tcgcgactcc tcacttgggc gcctcaacaa aagaagccca gctgaatgtc 1440
gctgcacaag tgtccgaaga agtccttcag tatgcgcaag gaaaccctgt gatgtccgcg 1500
atcaaccttc cggccatgac aaaggattca ttcgaaaaaa tccagcctta tcatcagttt 1560
gccaatacga tcggaaacct tgtgtctcag tgcatgaatg agcctgttca agatgtagcc 1620
atccaatatg aaggctccat cgccaaactt gaaacgtcat ttattacgaa aagccttttg 1680
gccggatttc tgaagccgag ggtcgcggct accgttaacg aagtgaatgc cggcaccgtt 1740
gcgaaagagc gcggcatcag cttcagcgaa aaaatttctt ccaatgagtc aggctatgaa 1800
aactgcatct ctgtgactgt cacgggagat gtaacaacat tctctttaag agcgacgtac 1860
attccgcact tcggcggacg catcgttgcc ttaaacggct ttgatattga tttttatccg 1920
gctggacacc ttgtctacat tcaccaccag gataaaccag gggctatcgg ccatgtcgga 1980
cgaattttag gagaccatga catcaatatc gccactatgc aggtaggccg aaaagaaaaa 2040
ggcggagaag cgatcatgat gctttccttt gaccgccacc ttgaggacga tattttagct 2100
gagctgaaaa acatcccgga tatcgtgtct gttaaagcca tcgaccttcc ttaaacagaa 2160
gctgcggaac ctgaaaagaa ttcctttcag gttccgtttt ttttaggaat tctccctgat 2220
ctcaagcatc tggcggggat aaatccgctc tcctttcaaa tcgttccatt ctttgaggcg 2280
ctgtacagtt acgcccattt tttcggcgat atgatgaagc gtatcccctt tccgcactac 2340
atatgtaccg gtcttcgatt catcgtcatg aaggcggagt gtttggccgg ccttgagatt 2400
tgaatgtttc aacccgttta ttctcatgat ctcctcgatg gatataccgc tatccttgct 2460
gattctccag agcgtgtccc ctttttgaac ggtcaccgca ccgctcattg tcccggcgtt 2520
ttgataaacg tggatagaat tttgccggaa cgcctcctca cgaagcaccg tcagcggatt 2580
gattgcatat cttttatctt cagtccatga accgtgatgc atttcaaaat gcaggtgggt 2640
tccggtcgat attcccgtat tgccgatgat tccgatttgc tcgccttttt tcacccgctc 2700
cttttccttt ttcaggcgtt tgcttaagtg ggcataaacg gtttcatatc cgttgtcatg 2760
tttaataaat atcacttggc cgtaggagtc ggattgatac 2800
<210> 66
<211> 1222
<212> DNA
<213> Artificial sequence
<220>
<223> target site 1 edited locus
<400> 66
tagagacgag acgtctcacc ttgttgtgtt tcattttgtc actctctcct tttcgatcac 60
atctcacgaa aagaggaatg gttctttccc ctgtcctaaa caaaaaaccc gctttattga 120
aaaagcgggg ctgttttaca gacaggtcaa ataaacgttt gaaaatgttc atttcaaaac 180
gcgcggaacc tccatcttct cccatccaga ctatactgtc ggcttcggaa tcgcaccgaa 240
tcctgcccat aaaaaggctc gcgggcttag agcgcttgct catcaccgcc ggtagggaat 300
ttcaccctgc cccgaagatt gatcttattt atttttaata ctgatattat tataaattaa 360
ttgtgaaaaa atgtacaggt gcaaagctta ttgcgctgtt ttgggacatc ctgcacgata 420
tttcggtaaa ctcacttttt ccgcatacta aaaaccgcac attcacagtt atttcatttt 480
taattttcgt ctttccgcgt gaaactcatt gacactcttt atggaatatg gtaaattatc 540
agatatttat gacgcttatt taggaggaaa tcttacacag aagctgcgga acctgaaaag 600
aattcctttc aggttccgtt ttttttagga attctccctg atctcaagca tctggcgggg 660
ataaatccgc tctcctttca aatcgttcca ttctttgagg cgctgtacag ttacgcccat 720
tttttcggcg atatgatgaa gcgtatcccc tttccgcact acatatgtac cggtcttcga 780
ttcatcgtca tgaaggcgga gtgtttggcc ggccttgaga tttgaatgtt tcaacccgtt 840
tattctcatg atctcctcga tggatatacc gctatccttg ctgattctcc agagcgtgtc 900
ccctttttga acggtcaccg caccgctcat tgtcccggcg ttttgataaa cgtggataga 960
attttgccgg aacgcctcct cacgaagcac cgtcagcgga ttgattgcat atcttttatc 1020
ttcagtccat gaaccgtgat gcatttcaaa atgcaggtgg gttccggtcg atattcccgt 1080
attgccgatg attccgattt gctcgccttt tttcacccgc tccttttcct ttttcaggcg 1140
tttgcttaag tgggcataaa cggtttcata tccgttgtca tgtttaataa atatcacttg 1200
gccgtaggag tcggattgat ac 1222
<210> 67
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 67
tagagacgag acgtctcacc 20
<210> 68
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 68
gtatcaatcc gactcctacg g 21
<210> 69
<211> 1517
<212> DNA
<213> Bacillus licheniformis
<400> 69
atcaaacatg ccatgtttgc ggcgtatttt gtcaaaatga tattttcgcc gtcggtatat 60
atttcgagcg ggtccttttc attgatattc agcaccctgc gcatttcgac cgggagaacg 120
actctgccga gctcatcgat tctccggaca atcccggtat ttttcacgtt tgaaaagcct 180
ccttttctcc tttctttatt gacttttgtc aacatcttta taataaaaga gatcttcaaa 240
ttttttgttg aaatactgaa tcatctttcc gatcacaagt tgtccgggcc tcctttcgcc 300
atttaaaact ctgctgagtg tcgccgggga tacgccgatt tcaatggcaa gctgatttaa 360
ggagagattg tgttcaatca tgtactggag aacaaaatct cttttgatat gaatcttttt 420
taccatgatt actccccttt ctaatctctt atgtttcttt ttatctacat tgaacatata 480
cgatttgtta acttttgtca atacttttac catccatatg tttcctatag gcaatattcg 540
tactaaaata ttttataata agagattgcg aggttttggc catgacgaac tttggacacc 600
atttacgaca attaagggaa cggaaaaaac tgaccgtcaa tcaactggcg atgtattccg 660
gcgtcagttc ggcaggcatt tcgcgaatcg aaaacggaaa gcgcggcgtg ccgaagccgg 720
cgacgatcag aaaactggcg gacgctttga aagtcccgta tgaggaactg atggcatctg 780
caggctatat cagcgcgtct acagtccagg aagcaagaag cagctatgat tccatttacg 840
acatcgtgtc acagtacgat ttagaggacc tttctctgtt tgacagcgaa aagtggaagg 900
tgctttcaaa aaaagacatc gaaaacctgg acaaatattt cgactttctc gtgcaggaag 960
caagcagccg aaacaaaaac tgaatacttc tccgcggcac actctcctct ctatcatttt 1020
cgtctgttta cgatcctgct gttattttat cccttatgtt aacttttgtc aatatttttc 1080
ctgtctaagt atttcctata gtcaacattt gtattaaaat gttcatatca tgaatttgcg 1140
ggggggatgg cgatgacaag gttcggcgag cggctcaaag agctgaggga acaaagaagc 1200
ctgtcggtta atcagcttgc catgtatgcc ggtgtgagcg ccgcagccat ttccagagcc 1260
gcagccattt ccagaatcga aaacggccac cgcggcgttc ccaagcccgc gacgatcaga 1320
aaattggccg aggctctgaa aatgccgtac gagcagctca tggatattgc cggttatatg 1380
agagctgacg agattcgcga acagccgcgc ggctatgtca cgatgcagga gatcgcggcc 1440
aagcacggcg tcgaagacct gtggctgttt aaacccgaga aatgggactg tttgtcccgc 1500
gaagacctgc tcaacct 1517
<210> 70
<211> 1115
<212> DNA
<213> Artificial sequence
<220>
<223> target site 2 edited locus
<400> 70
atcaaacatg ccatgtttgc ggcgtatttt gtcaaaatga tattttcgcc gtcggtatat 60
atttcgagcg ggtccttttc attgatattc agcaccctgc gcatttcgac cgggagaacg 120
actctgccga gctcatcgat tctccggaca atcccggtat ttttcacgtt tgaaaagcct 180
ccttttctcc tttctttatt gacttttgtc aacatcttta taataaaaga gatcttcaaa 240
ttttttgttg aaatactgaa tcatctttcc gatcacaagt tgtccgggcc tcctttcgcc 300
atttaaaact ctgctgagtg tcgccgggga tacgccgatt tcaatggcaa gctgatttaa 360
ggagagattg tgttcaatca tgtactggag aacaaaatct cttttgatat gaatcttttt 420
taccatgatt actccccttt ctaatctctt atgtttcttt ttatctacat tgaacatata 480
cgatttgtta acttttgtca atacttttac catccatatg tttcctatag gcaatattcg 540
tactaaaata ttttataata agagattgcg aggttttggc catacttctc cgcggcacac 600
tctcctctct atcattttcg tctgtttacg atcctgctgt tattttatcc cttatgttaa 660
cttttgtcaa tatttttcct gtctaagtat ttcctatagt caacatttgt attaaaatgt 720
tcatatcatg aatttgcggg ggggatggcg atgacaaggt tcggcgagcg gctcaaagag 780
ctgagggaac aaagaagcct gtcggttaat cagcttgcca tgtatgccgg tgtgagcgcc 840
gcagccattt ccagagccgc agccatttcc agaatcgaaa acggccaccg cggcgttccc 900
aagcccgcga cgatcagaaa attggccgag gctctgaaaa tgccgtacga gcagctcatg 960
gatattgccg gttatatgag agctgacgag attcgcgaac agccgcgcgg ctatgtcacg 1020
atgcaggaga tcgcggccaa gcacggcgtc gaagacctgt ggctgtttaa acccgagaaa 1080
tgggactgtt tgtcccgcga agacctgctc aacct 1115
<210> 71
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 71
atcaaacatg ccatgtttgc 20
<210> 72
<211> 18
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 72
aggttgagca ggtcttcg 18
<210> 73
<211> 4272
<212> DNA
<213> Artificial sequence
<220>
<223> Yarrowia codon optimized Cas9
<400> 73
atggggggtt ctcatcatca tcatcatcat ggtatggcta gcatgactgg tggacagcaa 60
atgggtcggg atctgtacga cgatgacgat aaggatccga gctcgagatc tgcagctggt 120
accatatggg aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc 180
ggctgggctg tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga 240
aacaccgatc gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc 300
gagactgccg aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag 360
aaccgaatct gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg 420
ttctttcatc gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat 480
cccatctttg gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac 540
cacctgcgaa agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc 600
gctctggcac acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc 660
gacaacagcg atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc 720
gaggaaaacc ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc 780
tcgaagagca gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga 840
ctgtttggca acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc 900
gatctggcgg aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac 960
aacctgcttg cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt 1020
tcggatgcta ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc 1080
ctttctgcct ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag 1140
gctcttgtcc gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag 1200
aacggctacg ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc 1260
aagccaattc tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag 1320
gatctgcttc ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc 1380
ggtgagctgc acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac 1440
cgagagaaga tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc 1500
agaggaaact ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg 1560
aacttcgagg aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc 1620
aacttcgaca agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag 1680
tactttacag tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag 1740
cctgccttct tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac 1800
cgaaaggtca ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac 1860
agcgtcgaga tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat 1920
ctgctcaaga ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg 1980
gaggacatcg tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc 2040
aagacatacg ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac 2100
accggctggg gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga 2160
aagaccattc tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc 2220
attcacgacg attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag 2280
ggcgacagct tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc 2340
attctccaga ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc 2400
gagaacattg tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac 2460
tcgcgagagc ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc 2520
aaggagcatc ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg 2580
cagaatggtc gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac 2640
gatgtggacc acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc 2700
cttacacgat ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc 2760
aaaaagatga agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag 2820
ttcgacaatc ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc 2880
atcaagcgtc aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat 2940
tctcggatga acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt 3000
actctcaagt ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga 3060
gagatcaaca attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg 3120
ctcatcaaga aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac 3180
gacgttcgaa agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac 3240
ttcttttact ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag 3300
attcgaaaga gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag 3360
ggtcgagact ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag 3420
aaaaccgagg ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc 3480
gacaagctca tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct 3540
cctaccgtcg cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag 3600
ctcaagtccg tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag 3660
aatcccatcg acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc 3720
aagctgccca agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc 3780
gctggcgagc tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc 3840
tatctggctt ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa 3900
ctcttcgttg agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt 3960
tcgaagcgag tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag 4020
catcgggaca aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc 4080
aacctgggtg ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac 4140
acatccacca aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac 4200
gagacccgaa tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag 4260
cgaaaggtct aa 4272
<210> 74
<211> 9
<212> PRT
<213> Simian virus 40
<400> 74
Met Ala Pro Lys Lys Lys Arg Lys Val
1 5
<210> 75
<211> 546
<212> DNA
<213> Yarrowia lipolytica
<400> 75
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
accatg 546
<210> 76
<211> 4683
<212> DNA
<213> Artificial sequence
<220>
<223> Yarrowia Cas9 expression cassette
<400> 76
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 600
gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 660
cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 720
gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 780
tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 840
cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 900
ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccacctgcga 960
aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 1020
cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 1080
gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 1140
cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 1200
agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 1260
aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 1320
gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 1380
gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 1440
attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 1500
tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 1560
cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 1620
gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 1680
ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 1740
cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 1800
cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 1860
atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 1920
tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 1980
gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 2040
aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 2100
gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 2160
ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 2220
actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 2280
atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 2340
attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 2400
gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 2460
gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 2520
ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 2580
ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 2640
gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 2700
ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 2760
actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 2820
gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 2880
cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 2940
cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 3000
cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 3060
cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 3120
tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 3180
aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 3240
cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 3300
caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 3360
aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 3420
tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 3480
aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 3540
aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 3600
aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 3660
tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 3720
agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 3780
tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 3840
gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 3900
atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 3960
gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 4020
gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 4080
gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 4140
aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 4200
ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 4260
tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 4320
gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 4380
gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 4440
aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 4500
gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 4560
aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 4620
atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 4680
taa 4683
<210> 77
<211> 10706
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pZufCas9
<400> 77
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700
agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760
agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820
atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880
ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940
atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000
cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060
tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120
ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180
accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240
gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300
ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360
ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420
ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480
tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540
tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600
atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660
agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720
agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780
ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840
accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900
agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960
gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020
atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080
gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140
aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320
aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500
tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680
ttcgaaatct aaactacaca tcacac 10706
<210> 78
<211> 4144
<212> DNA
<213> Artificial sequence
<220>
<223> Cas9-SV40 fusion
<400> 78
acaagaaata ctccatcggc ctggacattg gaaccaactc tgtcggctgg gctgtcatca 60
ccgacgagta caaggtgccc tccaagaaat tcaaggtcct cggaaacacc gatcgacact 120
ccatcaagaa aaacctcatt ggtgccctgt tgttcgattc tggcgagact gccgaagcta 180
ccagactcaa gcgaactgct cggcgacgtt acacccgacg gaagaaccga atctgctacc 240
tgcaggagat cttttccaac gagatggcca aggtggacga ttcgttcttt catcgactgg 300
aggaatcctt cctcgtcgag gaagacaaga aacacgagcg tcatcccatc tttggcaaca 360
ttgtggacga ggttgcttac cacgagaagt atcctaccat ctaccacctg cgaaagaaac 420
tcgtcgattc caccgacaag gcggatctca gacttatcta cctcgctctg gcacacatga 480
tcaagtttcg aggtcatttc ctcatcgagg gcgatctcaa tcccgacaac agcgatgtgg 540
acaagctgtt cattcagctc gttcagacct acaaccagct gttcgaggaa aaccccatca 600
atgcctccgg agtcgatgca aaggccatct tgtctgctcg actctcgaag agcagacgac 660
tggagaacct cattgcccaa cttcctggcg agaaaaagaa cggactgttt ggcaacctca 720
ttgccctttc tcttggtctc acacccaact tcaagtccaa cttcgatctg gcggaggacg 780
ccaagctcca gctgtccaag gacacctacg acgatgacct cgacaacctg cttgcacaga 840
ttggcgatca gtacgccgac ctgtttctcg ctgccaagaa cctttcggat gctattctct 900
tgtctgacat tctgcgagtc aacaccgaga tcacaaaggc tcccctttct gcctccatga 960
tcaagcgata cgacgagcac catcaggatc tcacactgct caaggctctt gtccgacagc 1020
aactgcccga gaagtacaag gagatctttt tcgatcagtc gaagaacggc tacgctggat 1080
acatcgacgg cggagcctct caggaagagt tctacaagtt catcaagcca attctcgaga 1140
agatggacgg aaccgaggaa ctgcttgtca agctcaatcg agaggatctg cttcggaagc 1200
aacgaacctt cgacaacggc agcattcctc atcagatcca cctcggtgag ctgcacgcca 1260
ttcttcgacg tcaggaagac ttctacccct ttctcaagga caaccgagag aagatcgaga 1320
agattcttac ctttcgaatc ccctactatg ttggtcctct tgccagagga aactctcgat 1380
ttgcttggat gactcgaaag tccgaggaaa ccatcactcc ctggaacttc gaggaagtcg 1440
tggacaaggg tgcctctgca cagtccttca tcgagcgaat gaccaacttc gacaagaatc 1500
tgcccaacga gaaggttctt cccaagcatt cgctgctcta cgagtacttt acagtctaca 1560
acgaactcac caaagtcaag tacgttaccg agggaatgcg aaagcctgcc ttcttgtctg 1620
gcgaacagaa gaaagccatt gtcgatctcc tgttcaagac caaccgaaag gtcactgtta 1680
agcagctcaa ggaggactac ttcaagaaaa tcgagtgttt cgacagcgtc gagatttccg 1740
gagttgagga ccgattcaac gcctctttgg gcacctatca cgatctgctc aagattatca 1800
aggacaagga ttttctcgac aacgaggaaa acgaggacat tctggaggac atcgtgctca 1860
ctcttaccct gttcgaagat cgggagatga tcgaggaacg actcaagaca tacgctcacc 1920
tgttcgacga caaggtcatg aaacaactca agcgacgtag atacaccggc tggggaagac 1980
tttcgcgaaa gctcatcaac ggcatcagag acaagcagtc cggaaagacc attctggact 2040
ttctcaagtc cgatggcttt gccaaccgaa acttcatgca gctcattcac gacgattctc 2100
ttaccttcaa ggaggacatc cagaaggcac aagtgtccgg tcagggcgac agcttgcacg 2160
aacatattgc caacctggct ggttcgccag ccatcaagaa aggcattctc cagactgtca 2220
aggttgtcga cgagctggtg aaggtcatgg gacgtcacaa gcccgagaac attgtgatcg 2280
agatggccag agagaaccag acaactcaaa agggtcagaa aaactcgcga gagcggatga 2340
agcgaatcga ggaaggcatc aaggagctgg gatcccagat tctcaaggag catcccgtcg 2400
agaacactca actgcagaac gagaagctgt atctctacta tctgcagaat ggtcgagaca 2460
tgtacgtgga tcaggaactg gacatcaatc gtctcagcga ctacgatgtg gaccacattg 2520
tccctcaatc ctttctcaag gacgattcta tcgacaacaa ggtccttaca cgatccgaca 2580
agaacagagg caagtcggac aacgttccca gcgaagaggt ggtcaaaaag atgaagaact 2640
actggcgaca gctgctcaac gccaagctca ttacccagcg aaagttcgac aatcttacca 2700
aggccgagcg aggcggtctg tccgagctcg acaaggctgg cttcatcaag cgtcaactcg 2760
tcgagaccag acagatcaca aagcacgtcg cacagattct cgattctcgg atgaacacca 2820
agtacgacga gaacgacaag ctcatccgag aggtcaaggt gattactctc aagtccaaac 2880
tggtctccga tttccgaaag gactttcagt tctacaaggt gcgagagatc aacaattacc 2940
accatgccca cgatgcttac ctcaacgccg tcgttggcac tgcgctcatc aagaaatacc 3000
ccaagctcga aagcgagttc gtttacggcg attacaaggt ctacgacgtt cgaaagatga 3060
ttgccaagtc cgaacaggag attggcaagg ctactgccaa gtacttcttt tactccaaca 3120
tcatgaactt tttcaagacc gagatcacct tggccaacgg agagattcga aagagaccac 3180
ttatcgagac caacggcgaa actggagaga tcgtgtggga caagggtcga gactttgcaa 3240
ccgtgcgaaa ggttctgtcg atgcctcagg tcaacatcgt caagaaaacc gaggttcaga 3300
ctggcggatt ctccaaggag tcgattctgc ccaagcgaaa ctccgacaag ctcatcgctc 3360
gaaagaaaga ctgggatccc aagaaatacg gtggcttcga ttctcctacc gtcgcctatt 3420
ccgtgcttgt cgttgcgaag gtcgagaagg gcaagtccaa aaagctcaag tccgtcaagg 3480
agctgctcgg aattaccatc atggagcgat cgagcttcga gaagaatccc atcgacttct 3540
tggaagccaa gggttacaag gaggtcaaga aagacctcat tatcaagctg cccaagtact 3600
ctctgttcga actggagaac ggtcgaaagc gtatgctcgc ctccgctggc gagctgcaga 3660
agggaaacga gcttgccttg ccttcgaagt acgtcaactt tctctatctg gcttctcact 3720
acgagaagct caagggttct cccgaggaca acgaacagaa gcaactcttc gttgagcagc 3780
acaaacatta cctcgacgag attatcgagc agatttccga gttttcgaag cgagtcatcc 3840
tggctgatgc caacttggac aaggtgctct ctgcctacaa caagcatcgg gacaaaccca 3900
ttcgagaaca ggcggagaac atcattcacc tgtttactct taccaacctg ggtgctcctg 3960
cagctttcaa gtacttcgat accactatcg accgaaagcg gtacacatcc accaaggagg 4020
ttctcgatgc caccctgatt caccagtcca tcactggcct gtacgagacc cgaatcgacc 4080
tgtctcagct tggtggcgac tccagagccg atcccaagaa aaagcgaaag gtctaagcgg 4140
ccgc 4144
<210> 79
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Cas9-SV40 forward primer
<400> 79
gggggaattc gacaagaaat actccatcgg cctgg 35
<210> 80
<211> 31
<212> DNA
<213> Artificial sequence
<220>
<223> Cas9-SV40 reverse primer
<400> 80
ccccaagctt agcggccgct tagacctttc g 31
<210> 81
<211> 4166
<212> DNA
<213> Artificial sequence
<220>
<223> Cas9-SV40 PCR product
<400> 81
gggggaattc gacaagaaat actccatcgg cctggacatt ggaaccaact ctgtcggctg 60
ggctgtcatc accgacgagt acaaggtgcc ctccaagaaa ttcaaggtcc tcggaaacac 120
cgatcgacac tccatcaaga aaaacctcat tggtgccctg ttgttcgatt ctggcgagac 180
tgccgaagct accagactca agcgaactgc tcggcgacgt tacacccgac ggaagaaccg 240
aatctgctac ctgcaggaga tcttttccaa cgagatggcc aaggtggacg attcgttctt 300
tcatcgactg gaggaatcct tcctcgtcga ggaagacaag aaacacgagc gtcatcccat 360
ctttggcaac attgtggacg aggttgctta ccacgagaag tatcctacca tctaccacct 420
gcgaaagaaa ctcgtcgatt ccaccgacaa ggcggatctc agacttatct acctcgctct 480
ggcacacatg atcaagtttc gaggtcattt cctcatcgag ggcgatctca atcccgacaa 540
cagcgatgtg gacaagctgt tcattcagct cgttcagacc tacaaccagc tgttcgagga 600
aaaccccatc aatgcctccg gagtcgatgc aaaggccatc ttgtctgctc gactctcgaa 660
gagcagacga ctggagaacc tcattgccca acttcctggc gagaaaaaga acggactgtt 720
tggcaacctc attgcccttt ctcttggtct cacacccaac ttcaagtcca acttcgatct 780
ggcggaggac gccaagctcc agctgtccaa ggacacctac gacgatgacc tcgacaacct 840
gcttgcacag attggcgatc agtacgccga cctgtttctc gctgccaaga acctttcgga 900
tgctattctc ttgtctgaca ttctgcgagt caacaccgag atcacaaagg ctcccctttc 960
tgcctccatg atcaagcgat acgacgagca ccatcaggat ctcacactgc tcaaggctct 1020
tgtccgacag caactgcccg agaagtacaa ggagatcttt ttcgatcagt cgaagaacgg 1080
ctacgctgga tacatcgacg gcggagcctc tcaggaagag ttctacaagt tcatcaagcc 1140
aattctcgag aagatggacg gaaccgagga actgcttgtc aagctcaatc gagaggatct 1200
gcttcggaag caacgaacct tcgacaacgg cagcattcct catcagatcc acctcggtga 1260
gctgcacgcc attcttcgac gtcaggaaga cttctacccc tttctcaagg acaaccgaga 1320
gaagatcgag aagattctta cctttcgaat cccctactat gttggtcctc ttgccagagg 1380
aaactctcga tttgcttgga tgactcgaaa gtccgaggaa accatcactc cctggaactt 1440
cgaggaagtc gtggacaagg gtgcctctgc acagtccttc atcgagcgaa tgaccaactt 1500
cgacaagaat ctgcccaacg agaaggttct tcccaagcat tcgctgctct acgagtactt 1560
tacagtctac aacgaactca ccaaagtcaa gtacgttacc gagggaatgc gaaagcctgc 1620
cttcttgtct ggcgaacaga agaaagccat tgtcgatctc ctgttcaaga ccaaccgaaa 1680
ggtcactgtt aagcagctca aggaggacta cttcaagaaa atcgagtgtt tcgacagcgt 1740
cgagatttcc ggagttgagg accgattcaa cgcctctttg ggcacctatc acgatctgct 1800
caagattatc aaggacaagg attttctcga caacgaggaa aacgaggaca ttctggagga 1860
catcgtgctc actcttaccc tgttcgaaga tcgggagatg atcgaggaac gactcaagac 1920
atacgctcac ctgttcgacg acaaggtcat gaaacaactc aagcgacgta gatacaccgg 1980
ctggggaaga ctttcgcgaa agctcatcaa cggcatcaga gacaagcagt ccggaaagac 2040
cattctggac tttctcaagt ccgatggctt tgccaaccga aacttcatgc agctcattca 2100
cgacgattct cttaccttca aggaggacat ccagaaggca caagtgtccg gtcagggcga 2160
cagcttgcac gaacatattg ccaacctggc tggttcgcca gccatcaaga aaggcattct 2220
ccagactgtc aaggttgtcg acgagctggt gaaggtcatg ggacgtcaca agcccgagaa 2280
cattgtgatc gagatggcca gagagaacca gacaactcaa aagggtcaga aaaactcgcg 2340
agagcggatg aagcgaatcg aggaaggcat caaggagctg ggatcccaga ttctcaagga 2400
gcatcccgtc gagaacactc aactgcagaa cgagaagctg tatctctact atctgcagaa 2460
tggtcgagac atgtacgtgg atcaggaact ggacatcaat cgtctcagcg actacgatgt 2520
ggaccacatt gtccctcaat cctttctcaa ggacgattct atcgacaaca aggtccttac 2580
acgatccgac aagaacagag gcaagtcgga caacgttccc agcgaagagg tggtcaaaaa 2640
gatgaagaac tactggcgac agctgctcaa cgccaagctc attacccagc gaaagttcga 2700
caatcttacc aaggccgagc gaggcggtct gtccgagctc gacaaggctg gcttcatcaa 2760
gcgtcaactc gtcgagacca gacagatcac aaagcacgtc gcacagattc tcgattctcg 2820
gatgaacacc aagtacgacg agaacgacaa gctcatccga gaggtcaagg tgattactct 2880
caagtccaaa ctggtctccg atttccgaaa ggactttcag ttctacaagg tgcgagagat 2940
caacaattac caccatgccc acgatgctta cctcaacgcc gtcgttggca ctgcgctcat 3000
caagaaatac cccaagctcg aaagcgagtt cgtttacggc gattacaagg tctacgacgt 3060
tcgaaagatg attgccaagt ccgaacagga gattggcaag gctactgcca agtacttctt 3120
ttactccaac atcatgaact ttttcaagac cgagatcacc ttggccaacg gagagattcg 3180
aaagagacca cttatcgaga ccaacggcga aactggagag atcgtgtggg acaagggtcg 3240
agactttgca accgtgcgaa aggttctgtc gatgcctcag gtcaacatcg tcaagaaaac 3300
cgaggttcag actggcggat tctccaagga gtcgattctg cccaagcgaa actccgacaa 3360
gctcatcgct cgaaagaaag actgggatcc caagaaatac ggtggcttcg attctcctac 3420
cgtcgcctat tccgtgcttg tcgttgcgaa ggtcgagaag ggcaagtcca aaaagctcaa 3480
gtccgtcaag gagctgctcg gaattaccat catggagcga tcgagcttcg agaagaatcc 3540
catcgacttc ttggaagcca agggttacaa ggaggtcaag aaagacctca ttatcaagct 3600
gcccaagtac tctctgttcg aactggagaa cggtcgaaag cgtatgctcg cctccgctgg 3660
cgagctgcag aagggaaacg agcttgcctt gccttcgaag tacgtcaact ttctctatct 3720
ggcttctcac tacgagaagc tcaagggttc tcccgaggac aacgaacaga agcaactctt 3780
cgttgagcag cacaaacatt acctcgacga gattatcgag cagatttccg agttttcgaa 3840
gcgagtcatc ctggctgatg ccaacttgga caaggtgctc tctgcctaca acaagcatcg 3900
ggacaaaccc attcgagaac aggcggagaa catcattcac ctgtttactc ttaccaacct 3960
gggtgctcct gcagctttca agtacttcga taccactatc gaccgaaagc ggtacacatc 4020
caccaaggag gttctcgatg ccaccctgat tcaccagtcc atcactggcc tgtacgagac 4080
ccgaatcgac ctgtctcagc ttggtggcga ctccagagcc gatcccaaga aaaagcgaaa 4140
ggtctaagcg gccgctaagc ttgggg 4166
<210> 82
<211> 4092
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pBAD/HisB
<400> 82
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat ggggggttct catcatcatc atcatcatgg tatggctagc 360
atgactggtg gacagcaaat gggtcgggat ctgtacgacg atgacgataa ggatccgagc 420
tcgagatctg cagctggtac catatgggaa ttcgaagctt ggctgttttg gcggatgaga 480
gaagattttc agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa 540
tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 600
acgccgtagc gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc 660
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 720
cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc 780
aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc 840
agaaggccat cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc 900
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 960
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1020
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1080
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1140
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1200
tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 1260
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1320
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1380
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1440
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1500
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1560
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1620
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1680
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 1740
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 1800
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 1860
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 1920
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 1980
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2040
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2100
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 2160
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2220
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2280
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2340
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2400
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2460
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2520
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2580
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2640
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 2700
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 2760
gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820
atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2880
cagtatacac tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa 2940
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3000
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3060
ggcagcagat caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg 3120
acgaagcagg gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg 3180
ttaccaatta tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga 3240
actcgctcgg gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt 3300
caaaaccaac attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct 3360
tcgcctggct gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc 3420
ggaaaagatg tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat 3480
caaaattgct gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat 3540
ccatcggtgg atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa 3600
gcagatttat cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt 3660
gcccaaacag gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat 3720
tggcaaatat tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa 3780
cccactggtg ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg 3840
gcgggaacag caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca 3900
ccccctgacc gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga 3960
taaaaaaatc gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat 4020
taaacgagta tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc 4080
cgccattcag ag 4092
<210> 83
<211> 8237
<212> DNA
<213> Artificial sequence
<220>
<223> plamsid pRF48
<400> 83
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggggttctc atcatcatca tcatcatggt atggctagca tgactggtgg 8160
acagcaaatg ggtcgggatc tgtacgacga tgacgataag gatccgagct cgagatctgc 8220
agctggtacc atatggg 8237
<210> 84
<211> 6493
<212> DNA
<213> Artificial sequence
<220>
<223> E.Coli Cas9 expression cassette
<400> 84
tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 60
cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 120
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 180
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagcag atcaattcgc 240
gcgcgaaggc gaagcggcat gcataatgtg cctgtcaaat ggacgaagca gggattctgc 300
aaaccctatg ctactccgtc aagccgtcaa ttgtctgatt cgttaccaat tatgacaact 360
tgacggctac atcattcact ttttcttcac aaccggcacg gaactcgctc gggctggccc 420
cggtgcattt tttaaatacc cgcgagaaat agagttgatc gtcaaaacca acattgcgac 480
cgacggtggc gataggcatc cgggtggtgc tcaaaagcag cttcgcctgg ctgatacgtt 540
ggtcctcgcg ccagcttaag acgctaatcc ctaactgctg gcggaaaaga tgtgacagac 600
gcgacggcga caagcaaaca tgctgtgcga cgctggcgat atcaaaattg ctgtctgcca 660
ggtgatcgct gatgtactga caagcctcgc gtacccgatt atccatcggt ggatggagcg 720
actcgttaat cgcttccatg cgccgcagta acaattgctc aagcagattt atcgccagca 780
gctccgaata gcgcccttcc ccttgcccgg cgttaatgat ttgcccaaac aggtcgctga 840
aatgcggctg gtgcgcttca tccgggcgaa agaaccccgt attggcaaat attgacggcc 900
agttaagcca ttcatgccag taggcgcgcg gacgaaagta aacccactgg tgataccatt 960
cgcgagcctc cggatgacga ccgtagtgat gaatctctcc tggcgggaac agcaaaatat 1020
cacccggtcg gcaaacaaat tctcgtccct gatttttcac caccccctga ccgcgaatgg 1080
tgagattgag aatataacct ttcattccca gcggtcggtc gataaaaaaa tcgagataac 1140
cgttggcctc aatcggcgtt aaacccgcca ccagatgggc attaaacgag tatcccggca 1200
gcaggggatc attttgcgct tcagccatac ttttcatact cccgccattc agagaagaaa 1260
ccaattgtcc atattgcatc agacattgcc gtcactgcgt cttttactgg ctcttctcgc 1320
taaccaaacc ggtaaccccg cttattaaaa gcattctgta acaaagcggg accaaagcca 1380
tgacaaaaac gcgtaacaaa agtgtctata atcacggcag aaaagtccac attgattatt 1440
tgcacggcgt cacactttgc tatgccatag catttttatc cataagatta gcggatccta 1500
cctgacgctt tttatcgcaa ctctctactg tttctccata cccgtttttt gggctaacag 1560
gaggaattaa ccatgggggg ttctcatcat catcatcatc atggtatggc tagcatgact 1620
ggtggacagc aaatgggtcg ggatctgtac gacgatgacg ataaggatcc gagctcgaga 1680
tctgcagctg gtaccatatg ggaattcgac aagaaatact ccatcggcct ggacattgga 1740
accaactctg tcggctgggc tgtcatcacc gacgagtaca aggtgccctc caagaaattc 1800
aaggtcctcg gaaacaccga tcgacactcc atcaagaaaa acctcattgg tgccctgttg 1860
ttcgattctg gcgagactgc cgaagctacc agactcaagc gaactgctcg gcgacgttac 1920
acccgacgga agaaccgaat ctgctacctg caggagatct tttccaacga gatggccaag 1980
gtggacgatt cgttctttca tcgactggag gaatccttcc tcgtcgagga agacaagaaa 2040
cacgagcgtc atcccatctt tggcaacatt gtggacgagg ttgcttacca cgagaagtat 2100
cctaccatct accacctgcg aaagaaactc gtcgattcca ccgacaaggc ggatctcaga 2160
cttatctacc tcgctctggc acacatgatc aagtttcgag gtcatttcct catcgagggc 2220
gatctcaatc ccgacaacag cgatgtggac aagctgttca ttcagctcgt tcagacctac 2280
aaccagctgt tcgaggaaaa ccccatcaat gcctccggag tcgatgcaaa ggccatcttg 2340
tctgctcgac tctcgaagag cagacgactg gagaacctca ttgcccaact tcctggcgag 2400
aaaaagaacg gactgtttgg caacctcatt gccctttctc ttggtctcac acccaacttc 2460
aagtccaact tcgatctggc ggaggacgcc aagctccagc tgtccaagga cacctacgac 2520
gatgacctcg acaacctgct tgcacagatt ggcgatcagt acgccgacct gtttctcgct 2580
gccaagaacc tttcggatgc tattctcttg tctgacattc tgcgagtcaa caccgagatc 2640
acaaaggctc ccctttctgc ctccatgatc aagcgatacg acgagcacca tcaggatctc 2700
acactgctca aggctcttgt ccgacagcaa ctgcccgaga agtacaagga gatctttttc 2760
gatcagtcga agaacggcta cgctggatac atcgacggcg gagcctctca ggaagagttc 2820
tacaagttca tcaagccaat tctcgagaag atggacggaa ccgaggaact gcttgtcaag 2880
ctcaatcgag aggatctgct tcggaagcaa cgaaccttcg acaacggcag cattcctcat 2940
cagatccacc tcggtgagct gcacgccatt cttcgacgtc aggaagactt ctaccccttt 3000
ctcaaggaca accgagagaa gatcgagaag attcttacct ttcgaatccc ctactatgtt 3060
ggtcctcttg ccagaggaaa ctctcgattt gcttggatga ctcgaaagtc cgaggaaacc 3120
atcactccct ggaacttcga ggaagtcgtg gacaagggtg cctctgcaca gtccttcatc 3180
gagcgaatga ccaacttcga caagaatctg cccaacgaga aggttcttcc caagcattcg 3240
ctgctctacg agtactttac agtctacaac gaactcacca aagtcaagta cgttaccgag 3300
ggaatgcgaa agcctgcctt cttgtctggc gaacagaaga aagccattgt cgatctcctg 3360
ttcaagacca accgaaaggt cactgttaag cagctcaagg aggactactt caagaaaatc 3420
gagtgtttcg acagcgtcga gatttccgga gttgaggacc gattcaacgc ctctttgggc 3480
acctatcacg atctgctcaa gattatcaag gacaaggatt ttctcgacaa cgaggaaaac 3540
gaggacattc tggaggacat cgtgctcact cttaccctgt tcgaagatcg ggagatgatc 3600
gaggaacgac tcaagacata cgctcacctg ttcgacgaca aggtcatgaa acaactcaag 3660
cgacgtagat acaccggctg gggaagactt tcgcgaaagc tcatcaacgg catcagagac 3720
aagcagtccg gaaagaccat tctggacttt ctcaagtccg atggctttgc caaccgaaac 3780
ttcatgcagc tcattcacga cgattctctt accttcaagg aggacatcca gaaggcacaa 3840
gtgtccggtc agggcgacag cttgcacgaa catattgcca acctggctgg ttcgccagcc 3900
atcaagaaag gcattctcca gactgtcaag gttgtcgacg agctggtgaa ggtcatggga 3960
cgtcacaagc ccgagaacat tgtgatcgag atggccagag agaaccagac aactcaaaag 4020
ggtcagaaaa actcgcgaga gcggatgaag cgaatcgagg aaggcatcaa ggagctggga 4080
tcccagattc tcaaggagca tcccgtcgag aacactcaac tgcagaacga gaagctgtat 4140
ctctactatc tgcagaatgg tcgagacatg tacgtggatc aggaactgga catcaatcgt 4200
ctcagcgact acgatgtgga ccacattgtc cctcaatcct ttctcaagga cgattctatc 4260
gacaacaagg tccttacacg atccgacaag aacagaggca agtcggacaa cgttcccagc 4320
gaagaggtgg tcaaaaagat gaagaactac tggcgacagc tgctcaacgc caagctcatt 4380
acccagcgaa agttcgacaa tcttaccaag gccgagcgag gcggtctgtc cgagctcgac 4440
aaggctggct tcatcaagcg tcaactcgtc gagaccagac agatcacaaa gcacgtcgca 4500
cagattctcg attctcggat gaacaccaag tacgacgaga acgacaagct catccgagag 4560
gtcaaggtga ttactctcaa gtccaaactg gtctccgatt tccgaaagga ctttcagttc 4620
tacaaggtgc gagagatcaa caattaccac catgcccacg atgcttacct caacgccgtc 4680
gttggcactg cgctcatcaa gaaatacccc aagctcgaaa gcgagttcgt ttacggcgat 4740
tacaaggtct acgacgttcg aaagatgatt gccaagtccg aacaggagat tggcaaggct 4800
actgccaagt acttctttta ctccaacatc atgaactttt tcaagaccga gatcaccttg 4860
gccaacggag agattcgaaa gagaccactt atcgagacca acggcgaaac tggagagatc 4920
gtgtgggaca agggtcgaga ctttgcaacc gtgcgaaagg ttctgtcgat gcctcaggtc 4980
aacatcgtca agaaaaccga ggttcagact ggcggattct ccaaggagtc gattctgccc 5040
aagcgaaact ccgacaagct catcgctcga aagaaagact gggatcccaa gaaatacggt 5100
ggcttcgatt ctcctaccgt cgcctattcc gtgcttgtcg ttgcgaaggt cgagaagggc 5160
aagtccaaaa agctcaagtc cgtcaaggag ctgctcggaa ttaccatcat ggagcgatcg 5220
agcttcgaga agaatcccat cgacttcttg gaagccaagg gttacaagga ggtcaagaaa 5280
gacctcatta tcaagctgcc caagtactct ctgttcgaac tggagaacgg tcgaaagcgt 5340
atgctcgcct ccgctggcga gctgcagaag ggaaacgagc ttgccttgcc ttcgaagtac 5400
gtcaactttc tctatctggc ttctcactac gagaagctca agggttctcc cgaggacaac 5460
gaacagaagc aactcttcgt tgagcagcac aaacattacc tcgacgagat tatcgagcag 5520
atttccgagt tttcgaagcg agtcatcctg gctgatgcca acttggacaa ggtgctctct 5580
gcctacaaca agcatcggga caaacccatt cgagaacagg cggagaacat cattcacctg 5640
tttactctta ccaacctggg tgctcctgca gctttcaagt acttcgatac cactatcgac 5700
cgaaagcggt acacatccac caaggaggtt ctcgatgcca ccctgattca ccagtccatc 5760
actggcctgt acgagacccg aatcgacctg tctcagcttg gtggcgactc cagagccgat 5820
cccaagaaaa agcgaaaggt ctaagcggcc gctaagcttg gctgttttgg cggatgagag 5880
aagattttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 5940
ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 6000
cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 6060
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 6120
ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca 6180
acggcccgga gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca 6240
gaaggccatc ctgacggatg gcctttttgc gtttctacaa actcttttgt ttatttttct 6300
aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 6360
attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 6420
cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg 6480
aagatcagtt ggg 6493
<210> 85
<211> 5681
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pKO3
<220>
<221> misc_feature
<222> (1039)..(1039)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1109)..(1109)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1661)..(1662)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1665)..(1665)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (3573)..(3574)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (5648)..(5648)
<223> n is a, c, g, or t
<400> 85
ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60
tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120
tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180
ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420
gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540
tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720
cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780
ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840
attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900
gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960
aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020
atgtctattg ctggtttant cggtacccgg ggatcgcggc cgcggaccgg atcctctaga 1080
gcggccgcga tcctctagag tcgaccggng aatggcgaat gggacgcgcc ctgtagcggc 1140
gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 1200
ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 1260
cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 1320
gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 1380
gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 1440
ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt 1500
tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 1560
atattaacgc ttacaattta ggtggcactt ttcggggaaa tgtgcgcgga acccctattt 1620
gtttattttt ctaaatacat tcaaatatgt atccgctcat nncangatcc tttttaaccc 1680
atcacatata cctgccgttc actattattt agtgaaatga gatattatga tattttctga 1740
attgtgatta aaaaggcaac tttatgccca tgcaacagaa actataaaaa atacagagaa 1800
tgaaaagaaa cagatagatt ttttagttct ttaggcccgt agtctgcaaa tccttttatg 1860
attttctatc aaacaaaaga ggaaaataga ccagttgcaa tccaaacgag agtctaatag 1920
aatgaggtcg aaaagtaaat cgcgcgggtt tgttactgat aaagcaggca agacctaaaa 1980
tgtgtaaagg gcaaagtgta tactttggcg tcacccctta catattttag gtcttttttt 2040
attgtgcgta actaacttgc catcttcaaa caggagggct ggaagaagca gaccgctaac 2100
acagtacata aaaaaggaga catgaacgat gaacatcaaa aagtttgcaa aacaagcaac 2160
agtattaacc tttactaccg cactgctggc aggaggcgca actcaagcgt ttgcgaaaga 2220
aacgaaccaa aagccatata aggaaacata cggcatttcc catattacac gccatgatat 2280
gctgcaaatc cctgaacagc aaaaaaatga aaaatatcaa gttcctgaat tcgattcgtc 2340
cacaattaaa aatatctctt ctgcaaaagg cctggacgtt tgggacagct ggccattaca 2400
aaacgctgac ggcactgtcg caaactatca cggctaccac atcgtctttg cattagccgg 2460
agatcctaaa aatgcggatg acacatcgat ttacatgttc tatcaaaaag tcggcgaaac 2520
ttctattgac agctggaaaa acgctggccg cgtctttaaa gacagcgaca aattcgatgc 2580
aaatgattct atcctaaaag accaaacaca agaatggtca ggttcagcca catttacatc 2640
tgacggaaaa atccgtttat tctacactga tttctccggt aaacattacg gcaaacaaac 2700
actgacaact gcacaagtta acgtatcagc atcagacagc tctttgaaca tcaacggtgt 2760
agaggattat aaatcaatct ttgacggtga cggaaaaacg tatcaaaatg tacagcagtt 2820
catcgatgaa ggcaactaca gctcaggcga caaccatacg ctgagagatc ctcactacgt 2880
agaagataaa ggccacaaat acttagtatt tgaagcaaac actggaactg aagatggcta 2940
ccaaggcgaa gaatctttat ttaacaaagc atactatggc aaaagcacat cattcttccg 3000
tcaagaaagt caaaaacttc tgcaaagcga taaaaaacgc acggctgagt tagcaaacgg 3060
cgctctcggt atgattgagc taaacgatga ttacacactg aaaaaagtga tgaaaccgct 3120
gattgcatct aacacagtaa cagatgaaat tgaacgcgcg aacgtcttta aaatgaacgg 3180
caaatggtac ctgttcactg actcccgcgg atcaaaaatg acgattgacg gcattacgtc 3240
taacgatatt tacatgcttg gttatgtttc taattcttta actggcccat acaagccgct 3300
gaacaaaact ggccttgtgt taaaaatgga tcttgatcct aacgatgtaa cctttactta 3360
ctcacacttc gctgtacctc aagcgaaagg aaacaatgtc gtgattacaa gctatatgac 3420
aaacagagga ttctacgcag acaaacaatc aacgtttgcg ccaagcttcc tgctgaacat 3480
caaaggcaag aaaacatctg ttgtcaaaga cagcatcctt gaacaaggac aattaacagt 3540
taacaaataa aaacgcaaaa gaaaatgccg atnnccggtt tattgactac cggaagcagt 3600
gtgaccgtgt gcttctcaaa tgcctcaggc tgtctatgtg tgactgttga gctgtaacaa 3660
gttgtctcag gtgttcaatt tcatgttcta gttgctttgt tttactggtt tcacctgttc 3720
tattaggtgt tacatgctgt tcatctgtta cattgtcgat ctgttcatgg tgaacagctt 3780
taaatgcacc aaaaactcgt aaaagctctg atgtatctat cttttttaca ccgttttcat 3840
ctgtgcatat ggacagtttt ccctttgata tctaacggtg aacagttgtt ctacttttgt 3900
ttgttagtct tgatgcttca ctgatagata caagagccat aagaacctca gatccttccg 3960
tatttagcca gtatgttctc tagtgtggtt cgttgttttt gcgtgagcca tgagaacgaa 4020
ccattgagat catgcttact ttgcatgtca ctcaaaaatt ttgcctcaaa actggtgagc 4080
tgaatttttg cagttaaagc atcgtgtagt gtttttctta gtccgttacg taggtaggaa 4140
tctgatgtaa tggttgttgg tattttgtca ccattcattt ttatctggtt gttctcaagt 4200
tcggttacga gatccatttg tctatctagt tcaacttgga aaatcaacgt atcagtcggg 4260
cggcctcgct tatcaaccac caatttcata ttgctgtaag tgtttaaatc tttacttatt 4320
ggtttcaaaa cccattggtt aagcctttta aactcatggt agttattttc aagcattaac 4380
atgaacttaa attcatcaag gctaatctct atatttgcct tgtgagtttt cttttgtgtt 4440
agttctttta ataaccactc ataaatcctc atagagtatt tgttttcaaa agacttaaca 4500
tgttccagat tatattttat gaattttttt aactggaaaa gataaggcaa tatctcttca 4560
ctaaaaacta attctaattt ttcgcttgag aacttggcat agtttgtcca ctggaaaatc 4620
tcaaagcctt taaccaaagg attcctgatt tccacagttc tcgtcatcag ctctctggtt 4680
gctttagcta atacaccata agcattttcc ctactgatgt tcatcatctg agcgtattgg 4740
ttataagtga acgataccgt ccgttctttc cttgtagggt tttcaatcgt ggggttgagt 4800
agtgccacac agcataaaat tagcttggtt tcatgctccg ttaagtcata gcgactaatc 4860
gctagttcat ttgctttgaa aacaactaat tcagacatac atctcaattg gtctaggtga 4920
ttttaatcac tataccaatt gagatgggct agtcaatgat aattactagt ccttttcctt 4980
tgagttgtgg gtatctgtaa attctgctag acctttgctg gaaaacttgt aaattctgct 5040
agaccctctg taaattccgc tagacctttg tgtgtttttt ttgtttatat tcaagtggtt 5100
ataatttata gaataaagaa agaataaaaa aagataaaaa gaatagatcc cagccctgtg 5160
tataactcac tactttagtc agttccgcag tattacaaaa ggatgtcgca aacgctgttt 5220
gctcctctac aaaacagacc ttaaaaccct aaaggcttaa gtagcaccct cgcaagctcg 5280
ggcaaatcgc tgaatattcc ttttgtctcc gaccatcagg cacctgagtc gctgtctttt 5340
tcgtgacatt cagttcgctg cgctcacggc tctggcagtg aatgggggta aatggcacta 5400
caggcgcctt ttatggattc atgcaaggaa actacccata atacaagaaa agcccgtcac 5460
gggcttctca gggcgtttta tggcgggtct gctatgtggt gctatctgac tttttgctgt 5520
tcagcagttc ctgccctctg attttccagt ctgaccactt cggattatcc cgtgacaggt 5580
cattcagact ggctaatgca cccagtaagg cagcggtatc atcaacaggc ttacccgtct 5640
tactgtcngg atcgacgctc tcccttatgc gactcctgca t 5681
<210> 86
<211> 12166
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF97
<400> 86
ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60
tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120
tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180
ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420
gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540
tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720
cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780
ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840
attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900
gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960
aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020
atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260
ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320
agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380
cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440
aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500
tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560
tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620
ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680
caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740
caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800
tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860
acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920
cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980
tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040
ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100
tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160
gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220
gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280
ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340
ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400
cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460
agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520
agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580
cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640
tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700
aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760
cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820
tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880
cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940
aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000
tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060
gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120
ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180
gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240
tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300
aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360
gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420
gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480
cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540
ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600
cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660
tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720
ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780
cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840
gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900
tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960
acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020
aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080
ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140
ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200
tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260
tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320
tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380
cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440
tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500
aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560
gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620
cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680
ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740
cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800
tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860
cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920
gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980
actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040
gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100
gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160
tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220
ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280
tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340
ctcgaaactt gatcatgtgt gccagagcga ggtagataag tctgagatcc gccttgtcgg 5400
tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460
cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520
ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580
agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640
gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700
ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760
tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820
agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880
cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940
gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000
tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060
gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120
ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180
tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240
acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300
agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360
gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420
gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480
gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540
ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600
tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660
acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720
atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780
gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840
aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900
atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960
cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020
ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080
gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140
cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200
aatcagacaa ttgacggctt gacggagtag catagggttt gcagaatccc tgcttcgtcc 7260
atttgacagg cacattatgc atgccgcttc gccttcgcgc gcgaattgat ctgctgcctc 7320
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 7380
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 7440
ggcgggtgtc ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc 7500
ttaactatgc ggcatcagag cagattgtac tgagagtgca ggggatcgcg gccgcggacc 7560
ggatcctcta gagcggccgc gatcctctag agtcgaccgg gaatggcgaa tgggacgcgc 7620
cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 7680
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 7740
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 7800
tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc 7860
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 7920
tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga 7980
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 8040
attttaacaa aatattaacg cttacaattt aggtggcact tttcggggaa atgtgcgcgg 8100
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tcagatcctt 8160
tttaacccat cacatatacc tgccgttcac tattatttag tgaaatgaga tattatgata 8220
ttttctgaat tgtgattaaa aaggcaactt tatgcccatg caacagaaac tataaaaaat 8280
acagagaatg aaaagaaaca gatagatttt ttagttcttt aggcccgtag tctgcaaatc 8340
cttttatgat tttctatcaa acaaaagagg aaaatagacc agttgcaatc caaacgagag 8400
tctaatagaa tgaggtcgaa aagtaaatcg cgcgggtttg ttactgataa agcaggcaag 8460
acctaaaatg tgtaaagggc aaagtgtata ctttggcgtc accccttaca tattttaggt 8520
ctttttttat tgtgcgtaac taacttgcca tcttcaaaca ggagggctgg aagaagcaga 8580
ccgctaacac agtacataaa aaaggagaca tgaacgatga acatcaaaaa gtttgcaaaa 8640
caagcaacag tattaacctt tactaccgca ctgctggcag gaggcgcaac tcaagcgttt 8700
gcgaaagaaa cgaaccaaaa gccatataag gaaacatacg gcatttccca tattacacgc 8760
catgatatgc tgcaaatccc tgaacagcaa aaaaatgaaa aatatcaagt tcctgaattc 8820
gattcgtcca caattaaaaa tatctcttct gcaaaaggcc tggacgtttg ggacagctgg 8880
ccattacaaa acgctgacgg cactgtcgca aactatcacg gctaccacat cgtctttgca 8940
ttagccggag atcctaaaaa tgcggatgac acatcgattt acatgttcta tcaaaaagtc 9000
ggcgaaactt ctattgacag ctggaaaaac gctggccgcg tctttaaaga cagcgacaaa 9060
ttcgatgcaa atgattctat cctaaaagac caaacacaag aatggtcagg ttcagccaca 9120
tttacatctg acggaaaaat ccgtttattc tacactgatt tctccggtaa acattacggc 9180
aaacaaacac tgacaactgc acaagttaac gtatcagcat cagacagctc tttgaacatc 9240
aacggtgtag aggattataa atcaatcttt gacggtgacg gaaaaacgta tcaaaatgta 9300
cagcagttca tcgatgaagg caactacagc tcaggcgaca accatacgct gagagatcct 9360
cactacgtag aagataaagg ccacaaatac ttagtatttg aagcaaacac tggaactgaa 9420
gatggctacc aaggcgaaga atctttattt aacaaagcat actatggcaa aagcacatca 9480
ttcttccgtc aagaaagtca aaaacttctg caaagcgata aaaaacgcac ggctgagtta 9540
gcaaacggcg ctctcggtat gattgagcta aacgatgatt acacactgaa aaaagtgatg 9600
aaaccgctga ttgcatctaa cacagtaaca gatgaaattg aacgcgcgaa cgtctttaaa 9660
atgaacggca aatggtacct gttcactgac tcccgcggat caaaaatgac gattgacggc 9720
attacgtcta acgatattta catgcttggt tatgtttcta attctttaac tggcccatac 9780
aagccgctga acaaaactgg ccttgtgtta aaaatggatc ttgatcctaa cgatgtaacc 9840
tttacttact cacacttcgc tgtacctcaa gcgaaaggaa acaatgtcgt gattacaagc 9900
tatatgacaa acagaggatt ctacgcagac aaacaatcaa cgtttgcgcc aagcttcctg 9960
ctgaacatca aaggcaagaa aacatctgtt gtcaaagaca gcatccttga acaaggacaa 10020
ttaacagtta acaaataaaa acgcaaaaga aaatgccgat ccggtttatt gactaccgga 10080
agcagtgtga ccgtgtgctt ctcaaatgcc tcaggctgtc tatgtgtgac tgttgagctg 10140
taacaagttg tctcaggtgt tcaatttcat gttctagttg ctttgtttta ctggtttcac 10200
ctgttctatt aggtgttaca tgctgttcat ctgttacatt gtcgatctgt tcatggtgaa 10260
cagctttaaa tgcaccaaaa actcgtaaaa gctctgatgt atctatcttt tttacaccgt 10320
tttcatctgt gcatatggac agttttccct ttgatatcta acggtgaaca gttgttctac 10380
ttttgtttgt tagtcttgat gcttcactga tagatacaag agccataaga acctcagatc 10440
cttccgtatt tagccagtat gttctctagt gtggttcgtt gtttttgcgt gagccatgag 10500
aacgaaccat tgagatcatg cttactttgc atgtcactca aaaattttgc ctcaaaactg 10560
gtgagctgaa tttttgcagt taaagcatcg tgtagtgttt ttcttagtcc gttacgtagg 10620
taggaatctg atgtaatggt tgttggtatt ttgtcaccat tcatttttat ctggttgttc 10680
tcaagttcgg ttacgagatc catttgtcta tctagttcaa cttggaaaat caacgtatca 10740
gtcgggcggc ctcgcttatc aaccaccaat ttcatattgc tgtaagtgtt taaatcttta 10800
cttattggtt tcaaaaccca ttggttaagc cttttaaact catggtagtt attttcaagc 10860
attaacatga acttaaattc atcaaggcta atctctatat ttgccttgtg agttttcttt 10920
tgtgttagtt cttttaataa ccactcataa atcctcatag agtatttgtt ttcaaaagac 10980
ttaacatgtt ccagattata ttttatgaat ttttttaact ggaaaagata aggcaatatc 11040
tcttcactaa aaactaattc taatttttcg cttgagaact tggcatagtt tgtccactgg 11100
aaaatctcaa agcctttaac caaaggattc ctgatttcca cagttctcgt catcagctct 11160
ctggttgctt tagctaatac accataagca ttttccctac tgatgttcat catctgagcg 11220
tattggttat aagtgaacga taccgtccgt tctttccttg tagggttttc aatcgtgggg 11280
ttgagtagtg ccacacagca taaaattagc ttggtttcat gctccgttaa gtcatagcga 11340
ctaatcgcta gttcatttgc tttgaaaaca actaattcag acatacatct caattggtct 11400
aggtgatttt aatcactata ccaattgaga tgggctagtc aatgataatt actagtcctt 11460
ttcctttgag ttgtgggtat ctgtaaattc tgctagacct ttgctggaaa acttgtaaat 11520
tctgctagac cctctgtaaa ttccgctaga cctttgtgtg ttttttttgt ttatattcaa 11580
gtggttataa tttatagaat aaagaaagaa taaaaaaaga taaaaagaat agatcccagc 11640
cctgtgtata actcactact ttagtcagtt ccgcagtatt acaaaaggat gtcgcaaacg 11700
ctgtttgctc ctctacaaaa cagaccttaa aaccctaaag gcttaagtag caccctcgca 11760
agctcgggca aatcgctgaa tattcctttt gtctccgacc atcaggcacc tgagtcgctg 11820
tctttttcgt gacattcagt tcgctgcgct cacggctctg gcagtgaatg ggggtaaatg 11880
gcactacagg cgccttttat ggattcatgc aaggaaacta cccataatac aagaaaagcc 11940
cgtcacgggc ttctcagggc gttttatggc gggtctgcta tgtggtgcta tctgactttt 12000
tgctgttcag cagttcctgc cctctgattt tccagtctga ccacttcgga ttatcccgtg 12060
acaggtcatt cagactggct aatgcaccca gtaaggcagc ggtatcatca acaggcttac 12120
ccgtcttact gtcggatcga cgctctccct tatgcgactc ctgcat 12166
<210> 87
<211> 410
<212> DNA
<213> Artificial sequence
<220>
<223> Y155H encoding synthetic fragment
<400> 87
ctccagtcgt ctgctcttcg agagtcgagc agacaagatg gcctttgcat cgactccgga 60
ggcattgatg gggttttcct cgaacagctg gttgtaggtc tgaacgagct gaatgaacag 120
cttgtccaca tcgctgttgt cgggattgag atcgccctcg atgaggaaat gacctcgaaa 180
cttgatcatg tgtgccagag cgagatggat aagtctgaga tccgccttgt cggtggaatc 240
gacgagtttc tttcgcaggt ggtagatggt aggatacttc tcgtggtaag caacctcgtc 300
cacaatgttg ccaaagatgg gatgacgctc gtgtttcttg tcttcctcga cgaggaagga 360
ttcctccagt cgatgaaaga acgaatcgtc caccttggcc atctcgttgg 410
<210> 88
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Y155H synthetic fragment forward primer
<400> 88
ccaacgagat ggccaaggtg 20
<210> 89
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Y155H synthetic fragment reverse primer
<400> 89
ccaacgagat ggccaaggtg 20
<210> 90
<211> 11794
<212> DNA
<213> Artificial sequence
<220>
<223> pRF97-Y155H fragment of plasmid
<400> 90
caccttggcc atctcgttgg aaaagatctc ctgcaggtag cagattcggt tcttccgtcg 60
ggtgtaacgt cgccgagcag ttcgcttgag tctggtagct tcggcagtct cgccagaatc 120
gaacaacagg gcaccaatga ggtttttctt gatggagtgt cgatcggtgt ttccgaggac 180
cttgaatttc ttggagggca ccttgtactc gtcggtgatg acagcccagc cgacagagtt 240
ggttccaatg tccaggccga tggagtattt cttgtcgaat tcccatatgg taccagctgc 300
agatctcgag ctcggatcct tatcgtcatc gtcgtacaga tcccgaccca tttgctgtcc 360
accagtcatg ctagccatac catgatgatg atgatgatga gaacccccca tggttaattc 420
ctcctgttag cccaaaaaac gggtatggag aaacagtaga gagttgcgat aaaaagcgtc 480
aggtaggatc cgctaatctt atggataaaa atgctatggc atagcaaagt gtgacgccgt 540
gcaaataatc aatgtggact tttctgccgt gattatagac acttttgtta cgcgtttttg 600
tcatggcttt ggtcccgctt tgttacagaa tgcttttaat aagcggggtt accggtttgg 660
ttagcgagaa gagccagtaa aagacgcagt gacggcaatg tctgatgcaa tatggacaat 720
tggtttcttc tctgaatggc gggagtatga aaagtatggc tgaagcgcaa aatgatcccc 780
tgctgccggg atactcgttt aatgcccatc tggtggcggg tttaacgccg attgaggcca 840
acggttatct cgattttttt atcgaccgac cgctgggaat gaaaggttat attctcaatc 900
tcaccattcg cggtcagggg gtggtgaaaa atcagggacg agaatttgtt tgccgaccgg 960
gtgatatttt gctgttcccg ccaggagaga ttcatcacta cggtcgtcat ccggaggctc 1020
gcgaatggta tcaccagtgg gtttactttc gtccgcgcgc ctactggcat gaatggctta 1080
actggccgtc aatatttgcc aatacggggt tctttcgccc ggatgaagcg caccagccgc 1140
atttcagcga cctgtttggg caaatcatta acgccgggca aggggaaggg cgctattcgg 1200
agctgctggc gataaatctg cttgagcaat tgttactgcg gcgcatggaa gcgattaacg 1260
agtcgctcca tccaccgatg gataatcggg tacgcgaggc ttgtcagtac atcagcgatc 1320
acctggcaga cagcaatttt gatatcgcca gcgtcgcaca gcatgtttgc ttgtcgccgt 1380
cgcgtctgtc acatcttttc cgccagcagt tagggattag cgtcttaagc tggcgcgagg 1440
accaacgtat cagccaggcg aagctgcttt tgagcaccac ccggatgcct atcgccaccg 1500
tcggtcgcaa tgttggtttt gacgatcaac tctatttctc gcgggtattt aaaaaatgca 1560
ccggggccag cccgagcgag ttccgtgccg gttgtgaaga aaaagtgaat gatgtagccg 1620
tcaagttgtc ataattggta acgaatcaga caattgacgg cttgacggag tagcataggg 1680
tttgcagaat ccctgcttcg tccatttgac aggcacatta tgcatgccgc ttcgccttcg 1740
cgcgcgaatt gatctgctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 1800
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 1860
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta 1920
gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt 1980
gcaggggatc gcggccgcgg accggatcct ctagagcggc cgcgatcctc tagagtcgac 2040
cggtggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 2100
gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 2160
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 2220
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 2280
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 2340
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 2400
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 2460
ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt aggtggcact 2520
tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg 2580
tatccgctca ccgcgatcct ttttaaccca tcacatatac ctgccgttca ctattattta 2640
gtgaaatgag atattatgat attttctgaa ttgtgattaa aaaggcaact ttatgcccat 2700
gcaacagaaa ctataaaaaa tacagagaat gaaaagaaac agatagattt tttagttctt 2760
taggcccgta gtctgcaaat ccttttatga ttttctatca aacaaaagag gaaaatagac 2820
cagttgcaat ccaaacgaga gtctaataga atgaggtcga aaagtaaatc gcgcgggttt 2880
gttactgata aagcaggcaa gacctaaaat gtgtaaaggg caaagtgtat actttggcgt 2940
caccccttac atattttagg tcttttttta ttgtgcgtaa ctaacttgcc atcttcaaac 3000
aggagggctg gaagaagcag accgctaaca cagtacataa aaaaggagac atgaacgatg 3060
aacatcaaaa agtttgcaaa acaagcaaca gtattaacct ttactaccgc actgctggca 3120
ggaggcgcaa ctcaagcgtt tgcgaaagaa acgaaccaaa agccatataa ggaaacatac 3180
ggcatttccc atattacacg ccatgatatg ctgcaaatcc ctgaacagca aaaaaatgaa 3240
aaatatcaag ttcctgagtt cgattcgtcc acaattaaaa atatctcttc tgcaaaaggc 3300
ctggacgttt gggacagctg gccattacaa aacgctgacg gcactgtcgc aaactatcac 3360
ggctaccaca tcgtctttgc attagccgga gatcctaaaa atgcggatga cacatcgatt 3420
tacatgttct atcaaaaagt cggcgaaact tctattgaca gctggaaaaa cgctggccgc 3480
gtctttaaag acagcgacaa attcgatgca aatgattcta tcctaaaaga ccaaacacaa 3540
gaatggtcag gttcagccac atttacatct gacggaaaaa tccgtttatt ctacactgat 3600
ttctccggta aacattacgg caaacaaaca ctgacaactg cacaagttaa cgtatcagca 3660
tcagacagct ctttgaacat caacggtgta gaggattata aatcaatctt tgacggtgac 3720
ggaaaaacgt atcaaaatgt acagcagttc atcgatgaag gcaactacag ctcaggcgac 3780
aaccatacgc tgagagatcc tcactacgta gaagataaag gccacaaata cttagtattt 3840
gaagcaaaca ctggaactga agatggctac caaggcgaag aatctttatt taacaaagca 3900
tactatggca aaagcacatc attcttccgt caagaaagtc aaaaacttct gcaaagcgat 3960
aaaaaacgca cggctgagtt agcaaacggc gctctcggta tgattgagct aaacgatgat 4020
tacacactga aaaaagtgat gaaaccgctg attgcatcta acacagtaac agatgaaatt 4080
gaacgcgcga acgtctttaa aatgaacggc aaatggtacc tgttcactga ctcccgcgga 4140
tcaaaaatga cgattgacgg cattacgtct aacgatattt acatgcttgg ttatgtttct 4200
aattctttaa ctggcccata caagccgctg aacaaaactg gccttgtgtt aaaaatggat 4260
cttgatccta acgatgtaac ctttacttac tcacacttcg ctgtacctca agcgaaagga 4320
aacaatgtcg tgattacaag ctatatgaca aacagaggat tctacgcaga caaacaatca 4380
acgtttgcgc caagcttcct gctgaacatc aaaggcaaga aaacatctgt tgtcaaagac 4440
agcatccttg aacaaggaca attaacagtt aacaaataaa aacgcaaaag aaaatgccga 4500
tattgactac cggaagcagt gtgaccgtgt gcttctcaaa tgcctgattc aggctgtcta 4560
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 4620
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 4680
cgatctgttc atggtgaaca gctttaaatg caccaaaaac tcgtaaaagc tctgatgtat 4740
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 4800
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 4860
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 4920
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 4980
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 5040
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 5100
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 5160
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 5220
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 5280
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 5340
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 5400
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 5460
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 5520
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 5580
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 5640
atgttcatca tctgaacgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 5700
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 5760
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 5820
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 5880
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 5940
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 6000
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 6060
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 6120
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 6180
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 6240
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 6300
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 6360
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 6420
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 6480
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 6540
tatcatcaac aggcttaccc gtcttactgt cggggatcga cgctctccct tatgcgactc 6600
ctgcaccttt cgtcttcgaa taaatacctg tgacggaaga tcacttcgca gaataaataa 6660
atcctggtgt ccctgttgat accgggaagc cctgggccaa cttttggcga aaatgagacg 6720
ttgatcggca cgtaagaggt tccaactttc accataatga aataagatca ctaccgggcg 6780
tattttttga gttatcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca 6840
ctggatatac caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc 6900
agtcagttgc tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa 6960
agaccgtaaa gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc 7020
tgatgaatgc tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg 7080
atagtgttca cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct 7140
ggagtgaata ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt 7200
gttacggtga aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct 7260
cagccaatcc ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact 7320
tcttcgcccc cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc 7380
cgctggcgat tcaggttcat catgccgttt gtgatggctt ccatgtcggc agaatgctta 7440
atgaattaca acagtactgc gatgagtggc agggcggggc gtaatttttt taaggcagtt 7500
attggtgccc ttaaacgcct ggttgctacg cctgaataag tgataataag cggatgaatg 7560
gcagaaattc gaaagcaaat tcgacccggt cgtcggttca gggcagggtc gttaaatagc 7620
cgcttatgtc tattgctggt ctcggtaccc tgcacccaac tgatcttcag catcttttac 7680
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 7740
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 7800
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 7860
aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 7920
gcctggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 7980
tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 8040
taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 8100
cctactctcg catggggaga ccccacacta ccatcggcgc tacggcgttt cacttctgag 8160
ttcggcatgg ggtcaggtgg gaccaccgcg ctactgccgc caggcaaatt ctgttttatc 8220
agaccgcttc tgcgttctga tttaatctgt atcaggctga aaatcttctc tcatccgcca 8280
aaacagccaa gcttagcggc cgcttagacc tttcgctttt tcttgggatc ggctctggag 8340
tcgccaccaa gctgagacag gtcgattcgg gtctcgtaca ggccagtgat ggactggtga 8400
atcagggtgg catcgagaac ctccttggtg gatgtgtacc gctttcggtc gatagtggta 8460
tcgaagtact tgaaagctgc aggagcaccc aggttggtaa gagtaaacag gtgaatgatg 8520
ttctccgcct gttctcgaat gggtttgtcc cgatgcttgt tgtaggcaga gagcaccttg 8580
tccaagttgg catcagccag gatgactcgc ttcgaaaact cggaaatctg ctcgataatc 8640
tcgtcgaggt aatgtttgtg ctgctcaacg aagagttgct tctgttcgtt gtcctcggga 8700
gaacccttga gcttctcgta gtgagaagcc agatagagaa agttgacgta cttcgaaggc 8760
aaggcaagct cgtttccctt ctgcagctcg ccagcggagg cgagcatacg ctttcgaccg 8820
ttctccagtt cgaacagaga gtacttgggc agcttgataa tgaggtcttt cttgacctcc 8880
ttgtaaccct tggcttccaa gaagtcgatg ggattcttct cgaagctcga tcgctccatg 8940
atggtaattc cgagcagctc cttgacggac ttgagctttt tggacttgcc cttctcgacc 9000
ttcgcaacga caagcacgga ataggcgacg gtaggagaat cgaagccacc gtatttcttg 9060
ggatcccagt ctttctttcg agcgatgagc ttgtcggagt ttcgcttggg cagaatcgac 9120
tccttggaga atccgccagt ctgaacctcg gttttcttga cgatgttgac ctgaggcatc 9180
gacagaacct ttcgcacggt tgcaaagtct cgacccttgt cccacacgat ctctccagtt 9240
tcgccgttgg tctcgataag tggtctcttt cgaatctctc cgttggccaa ggtgatctcg 9300
gtcttgaaaa agttcatgat gttggagtaa aagaagtact tggcagtagc cttgccaatc 9360
tcctgttcgg acttggcaat catctttcga acgtcgtaga ccttgtaatc gccgtaaacg 9420
aactcgcttt cgagcttggg gtatttcttg atgagcgcag tgccaacgac ggcgttgagg 9480
taagcatcgt gggcatggtg gtaattgttg atctctcgca ccttgtagaa ctgaaagtcc 9540
tttcggaaat cggagaccag tttggacttg agagtaatca ccttgacctc tcggatgagc 9600
ttgtcgttct cgtcgtactt ggtgttcatc cgagaatcga gaatctgtgc gacgtgcttt 9660
gtgatctgtc tggtctcgac gagttgacgc ttgatgaagc cagccttgtc gagctcggac 9720
agaccgcctc gctcggcctt ggtaagattg tcgaactttc gctgggtaat gagcttggcg 9780
ttgagcagct gtcgccagta gttcttcatc tttttgacca cctcttcgct gggaacgttg 9840
tccgacttgc ctctgttctt gtcggatcgt gtaaggacct tgttgtcgat agaatcgtcc 9900
ttgagaaagg attgagggac aatgtggtcc acatcgtagt cgctgagacg attgatgtcc 9960
agttcctgat ccacgtacat gtctcgacca ttctgcagat agtagagata cagcttctcg 10020
ttctgcagtt gagtgttctc gacgggatgc tccttgagaa tctgggatcc cagctccttg 10080
atgccttcct cgattcgctt catccgctct cgcgagtttt tctgaccctt ttgagttgtc 10140
tggttctctc tggccatctc gatcacaatg ttctcgggct tgtgacgtcc catgaccttc 10200
accagctcgt cgacaacctt gacagtctgg agaatgcctt tcttgatggc tggcgaacca 10260
gccaggttgg caatatgttc gtgcaagctg tcgccctgac cggacacttg tgccttctgg 10320
atgtcctcct tgaaggtaag agaatcgtcg tgaatgagct gcatgaagtt tcggttggca 10380
aagccatcgg acttgagaaa gtccagaatg gtctttccgg actgcttgtc tctgatgccg 10440
ttgatgagct ttcgcgaaag tcttccccag ccggtgtatc tacgtcgctt gagttgtttc 10500
atgaccttgt cgtcgaacag gtgagcgtat gtcttgagtc gttcctcgat catctcccga 10560
tcttcgaaca gggtaagagt gagcacgatg tcctccagaa tgtcctcgtt ttcctcgttg 10620
tcgagaaaat ccttgtcctt gataatcttg agcagatcgt gataggtgcc caaagaggcg 10680
ttgaatcggt cctcaactcc ggaaatctcg acgctgtcga aacactcgat tttcttgaag 10740
tagtcctcct tgagctgctt aacagtgacc tttcggttgg tcttgaacag gagatcgaca 10800
atggctttct tctgttcgcc agacaagaag gcaggctttc gcattccctc ggtaacgtac 10860
ttgactttgg tgagttcgtt gtagactgta aagtactcgt agagcagcga atgcttggga 10920
agaaccttct cgttgggcag attcttgtcg aagttggtca ttcgctcgat gaaggactgt 10980
gcagaggcac ccttgtccac gacttcctcg aagttccagg gagtgatggt ttcctcggac 11040
tttcgagtca tccaagcaaa tcgagagttt cctctggcaa gaggaccaac atagtagggg 11100
attcgaaagg taagaatctt ctcgatcttc tctcggttgt ccttgagaaa ggggtagaag 11160
tcttcctgac gtcgaagaat ggcgtgcagc tcaccgaggt ggatctgatg aggaatgctg 11220
ccgttgtcga aggttcgttg cttccgaagc agatcctctc gattgagctt gacaagcagt 11280
tcctcggttc cgtccatctt ctcgagaatt ggcttgatga acttgtagaa ctcttcctga 11340
gaggctccgc cgtcgatgta tccagcgtag ccgttcttcg actgatcgaa aaagatctcc 11400
ttgtacttct cgggcagttg ctgtcggaca agagccttga gcagtgtgag atcctgatgg 11460
tgctcgtcgt atcgcttgat catggaggca gaaaggggag cctttgtgat ctcggtgttg 11520
actcgcagaa tgtcagacaa gagaatagca tccgaaaggt tcttggcagc gagaaacagg 11580
tcggcgtact gatcgccaat ctgtgcaagc aggttgtcga ggtcatcgtc gtaggtgtcc 11640
ttggacagct ggagcttggc gtcctccgcc agatcgaagt tggacttgaa gttgggtgtg 11700
agaccaagag aaagggcaat gaggttgcca aacagtccgt tctttttctc gccaggaagt 11760
tgggcaatga ggttctccag tcgtctgctc ttcg 11794
<210> 91
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> pRF97-Y155H fragment forward primer
<400> 91
caccttggcc atctcgttgg 20
<210> 92
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> pRF97-Y155H fragment reverse primer
<400> 92
cgaagagcag acgactggag 20
<210> 93
<211> 12164
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF861
<400> 93
cctttcgtct tcgaataaat acctgtgacg gaagatcact tcgcagaata aataaatcct 60
ggtgtccctg ttgataccgg gaagccctgg gccaactttt ggcgaaaatg agacgttgat 120
cggcacgtaa gaggttccaa ctttcaccat aatgaaataa gatcactacc gggcgtattt 180
tttgagttat cgagattttc aggagctaag gaagctaaaa tggagaaaaa aatcactgga 240
tataccaccg ttgatatatc ccaatggcat cgtaaagaac attttgaggc atttcagtca 300
gttgctcaat gtacctataa ccagaccgtt cagctggata ttacggcctt tttaaagacc 360
gtaaagaaaa ataagcacaa gttttatccg gcctttattc acattcttgc ccgcctgatg 420
aatgctcatc cggaattccg tatggcaatg aaagacggtg agctggtgat atgggatagt 480
gttcaccctt gttacaccgt tttccatgag caaactgaaa cgttttcatc gctctggagt 540
gaataccacg acgatttccg gcagtttcta cacatatatt cgcaagatgt ggcgtgttac 600
ggtgaaaacc tggcctattt ccctaaaggg tttattgaga atatgttttt cgtctcagcc 660
aatccctggg tgagtttcac cagttttgat ttaaacgtgg ccaatatgga caacttcttc 720
gcccccgttt tcaccatggg caaatattat acgcaaggcg acaaggtgct gatgccgctg 780
gcgattcagg ttcatcatgc cgtttgtgat ggcttccatg tcggcagaat gcttaatgaa 840
ttacaacagt actgcgatga gtggcagggc ggggcgtaat ttttttaagg cagttattgg 900
tgcccttaaa cgcctggttg ctacgcctga ataagtgata ataagcggat gaatggcaga 960
aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020
atgtctattg ctggtctcgg taccctgcac ccaactgatc ttcagcatct tttactttca 1080
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 1140
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 1200
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaaaga 1260
gtttgtagaa acgcaaaaag gccatccgtc aggatggcct tctgcttaat ttgatgcctg 1320
gcagtttatg gcgggcgtcc tgcccgccac cctccgggcc gttgcttcgc aacgttcaaa 1380
tccgctcccg gcggatttgt cctactcagg agagcgttca ccgacaaaca acagataaaa 1440
cgaaaggccc agtctttcga ctgagccttt cgttttattt gatgcctggc agttccctac 1500
tctcgcatgg ggagacccca cactaccatc ggcgctacgg cgtttcactt ctgagttcgg 1560
catggggtca ggtgggacca ccgcgctact gccgccaggc aaattctgtt ttatcagacc 1620
gcttctgcgt tctgatttaa tctgtatcag gctgaaaatc ttctctcatc cgccaaaaca 1680
gccaagctta gcggccgctt agacctttcg ctttttcttg ggatcggctc tggagtcgcc 1740
accaagctga gacaggtcga ttcgggtctc gtacaggcca gtgatggact ggtgaatcag 1800
ggtggcatcg agaacctcct tggtggatgt gtaccgcttt cggtcgatag tggtatcgaa 1860
gtacttgaaa gctgcaggag cacccaggtt ggtaagagta aacaggtgaa tgatgttctc 1920
cgcctgttct cgaatgggtt tgtcccgatg cttgttgtag gcagagagca ccttgtccaa 1980
gttggcatca gccaggatga ctcgcttcga aaactcggaa atctgctcga taatctcgtc 2040
gaggtaatgt ttgtgctgct caacgaagag ttgcttctgt tcgttgtcct cgggagaacc 2100
cttgagcttc tcgtagtgag aagccagata gagaaagttg acgtacttcg aaggcaaggc 2160
aagctcgttt cccttctgca gctcgccagc ggaggcgagc atacgctttc gaccgttctc 2220
cagttcgaac agagagtact tgggcagctt gataatgagg tctttcttga cctccttgta 2280
acccttggct tccaagaagt cgatgggatt cttctcgaag ctcgatcgct ccatgatggt 2340
aattccgagc agctccttga cggacttgag ctttttggac ttgcccttct cgaccttcgc 2400
aacgacaagc acggaatagg cgacggtagg agaatcgaag ccaccgtatt tcttgggatc 2460
ccagtctttc tttcgagcga tgagcttgtc ggagtttcgc ttgggcagaa tcgactcctt 2520
ggagaatccg ccagtctgaa cctcggtttt cttgacgatg ttgacctgag gcatcgacag 2580
aacctttcgc acggttgcaa agtctcgacc cttgtcccac acgatctctc cagtttcgcc 2640
gttggtctcg ataagtggtc tctttcgaat ctctccgttg gccaaggtga tctcggtctt 2700
gaaaaagttc atgatgttgg agtaaaagaa gtacttggca gtagccttgc caatctcctg 2760
ttcggacttg gcaatcatct ttcgaacgtc gtagaccttg taatcgccgt aaacgaactc 2820
gctttcgagc ttggggtatt tcttgatgag cgcagtgcca acgacggcgt tgaggtaagc 2880
atcgtgggca tggtggtaat tgttgatctc tcgcaccttg tagaactgaa agtcctttcg 2940
gaaatcggag accagtttgg acttgagagt aatcaccttg acctctcgga tgagcttgtc 3000
gttctcgtcg tacttggtgt tcatccgaga atcgagaatc tgtgcgacgt gctttgtgat 3060
ctgtctggtc tcgacgagtt gacgcttgat gaagccagcc ttgtcgagct cggacagacc 3120
gcctcgctcg gccttggtaa gattgtcgaa ctttcgctgg gtaatgagct tggcgttgag 3180
cagctgtcgc cagtagttct tcatcttttt gaccacctct tcgctgggaa cgttgtccga 3240
cttgcctctg ttcttgtcgg atcgtgtaag gaccttgttg tcgatagaat cgtccttgag 3300
aaaggattga gggacaatgt ggtccacatc gtagtcgctg agacgattga tgtccagttc 3360
ctgatccacg tacatgtctc gaccattctg cagatagtag agatacagct tctcgttctg 3420
cagttgagtg ttctcgacgg gatgctcctt gagaatctgg gatcccagct ccttgatgcc 3480
ttcctcgatt cgcttcatcc gctctcgcga gtttttctga cccttttgag ttgtctggtt 3540
ctctctggcc atctcgatca caatgttctc gggcttgtga cgtcccatga ccttcaccag 3600
ctcgtcgaca accttgacag tctggagaat gcctttcttg atggctggcg aaccagccag 3660
gttggcaata tgttcgtgca agctgtcgcc ctgaccggac acttgtgcct tctggatgtc 3720
ctccttgaag gtaagagaat cgtcgtgaat gagctgcatg aagtttcggt tggcaaagcc 3780
atcggacttg agaaagtcca gaatggtctt tccggactgc ttgtctctga tgccgttgat 3840
gagctttcgc gaaagtcttc cccagccggt gtatctacgt cgcttgagtt gtttcatgac 3900
cttgtcgtcg aacaggtgag cgtatgtctt gagtcgttcc tcgatcatct cccgatcttc 3960
gaacagggta agagtgagca cgatgtcctc cagaatgtcc tcgttttcct cgttgtcgag 4020
aaaatccttg tccttgataa tcttgagcag atcgtgatag gtgcccaaag aggcgttgaa 4080
tcggtcctca actccggaaa tctcgacgct gtcgaaacac tcgattttct tgaagtagtc 4140
ctccttgagc tgcttaacag tgacctttcg gttggtcttg aacaggagat cgacaatggc 4200
tttcttctgt tcgccagaca agaaggcagg ctttcgcatt ccctcggtaa cgtacttgac 4260
tttggtgagt tcgttgtaga ctgtaaagta ctcgtagagc agcgaatgct tgggaagaac 4320
cttctcgttg ggcagattct tgtcgaagtt ggtcattcgc tcgatgaagg actgtgcaga 4380
ggcacccttg tccacgactt cctcgaagtt ccagggagtg atggtttcct cggactttcg 4440
agtcatccaa gcaaatcgag agtttcctct ggcaagagga ccaacatagt aggggattcg 4500
aaaggtaaga atcttctcga tcttctctcg gttgtccttg agaaaggggt agaagtcttc 4560
ctgacgtcga agaatggcgt gcagctcacc gaggtggatc tgatgaggaa tgctgccgtt 4620
gtcgaaggtt cgttgcttcc gaagcagatc ctctcgattg agcttgacaa gcagttcctc 4680
ggttccgtcc atcttctcga gaattggctt gatgaacttg tagaactctt cctgagaggc 4740
tccgccgtcg atgtatccag cgtagccgtt cttcgactga tcgaaaaaga tctccttgta 4800
cttctcgggc agttgctgtc ggacaagagc cttgagcagt gtgagatcct gatggtgctc 4860
gtcgtatcgc ttgatcatgg aggcagaaag gggagccttt gtgatctcgg tgttgactcg 4920
cagaatgtca gacaagagaa tagcatccga aaggttcttg gcagcgagaa acaggtcggc 4980
gtactgatcg ccaatctgtg caagcaggtt gtcgaggtca tcgtcgtagg tgtccttgga 5040
cagctggagc ttggcgtcct ccgccagatc gaagttggac ttgaagttgg gtgtgagacc 5100
aagagaaagg gcaatgaggt tgccaaacag tccgttcttt ttctcgccag gaagttgggc 5160
aatgaggttc tccagtcgtc tgctcttcga gagtcgagca gacaagatgg cctttgcatc 5220
gactccggag gcattgatgg ggttttcctc gaacagctgg ttgtaggtct gaacgagctg 5280
aatgaacagc ttgtccacat cgctgttgtc gggattgaga tcgccctcga tgaggaaatg 5340
acctcgaaac ttgatcatgt gtgccagagc gagatggata agtctgagat ccgccttgtc 5400
ggtggaatcg acgagtttct ttcgcaggtg gtagatggta ggatacttct cgtggtaagc 5460
aacctcgtcc acaatgttgc caaagatggg atgacgctcg tgtttcttgt cttcctcgac 5520
gaggaaggat tcctccagtc gatgaaagaa cgaatcgtcc accttggcca tctcgttgga 5580
aaagatctcc tgcaggtagc agattcggtt cttccgtcgg gtgtaacgtc gccgagcagt 5640
tcgcttgagt ctggtagctt cggcagtctc gccagaatcg aacaacaggg caccaatgag 5700
gtttttcttg atggagtgtc gatcggtgtt tccgaggacc ttgaatttct tggagggcac 5760
cttgtactcg tcggtgatga cagcccagcc gacagagttg gttccaatgt ccaggccgat 5820
ggagtatttc ttgtcgaatt cccatatggt accagctgca gatctcgagc tcggatcctt 5880
atcgtcatcg tcgtacagat cccgacccat ttgctgtcca ccagtcatgc tagccatacc 5940
atgatgatga tgatgatgag aaccccccat ggttaattcc tcctgttagc ccaaaaaacg 6000
ggtatggaga aacagtagag agttgcgata aaaagcgtca ggtaggatcc gctaatctta 6060
tggataaaaa tgctatggca tagcaaagtg tgacgccgtg caaataatca atgtggactt 6120
ttctgccgtg attatagaca cttttgttac gcgtttttgt catggctttg gtcccgcttt 6180
gttacagaat gcttttaata agcggggtta ccggtttggt tagcgagaag agccagtaaa 6240
agacgcagtg acggcaatgt ctgatgcaat atggacaatt ggtttcttct ctgaatggcg 6300
ggagtatgaa aagtatggct gaagcgcaaa atgatcccct gctgccggga tactcgttta 6360
atgcccatct ggtggcgggt ttaacgccga ttgaggccaa cggttatctc gattttttta 6420
tcgaccgacc gctgggaatg aaaggttata ttctcaatct caccattcgc ggtcaggggg 6480
tggtgaaaaa tcagggacga gaatttgttt gccgaccggg tgatattttg ctgttcccgc 6540
caggagagat tcatcactac ggtcgtcatc cggaggctcg cgaatggtat caccagtggg 6600
tttactttcg tccgcgcgcc tactggcatg aatggcttaa ctggccgtca atatttgcca 6660
atacggggtt ctttcgcccg gatgaagcgc accagccgca tttcagcgac ctgtttgggc 6720
aaatcattaa cgccgggcaa ggggaagggc gctattcgga gctgctggcg ataaatctgc 6780
ttgagcaatt gttactgcgg cgcatggaag cgattaacga gtcgctccat ccaccgatgg 6840
ataatcgggt acgcgaggct tgtcagtaca tcagcgatca cctggcagac agcaattttg 6900
atatcgccag cgtcgcacag catgtttgct tgtcgccgtc gcgtctgtca catcttttcc 6960
gccagcagtt agggattagc gtcttaagct ggcgcgagga ccaacgtatc agccaggcga 7020
agctgctttt gagcaccacc cggatgccta tcgccaccgt cggtcgcaat gttggttttg 7080
acgatcaact ctatttctcg cgggtattta aaaaatgcac cggggccagc ccgagcgagt 7140
tccgtgccgg ttgtgaagaa aaagtgaatg atgtagccgt caagttgtca taattggtaa 7200
cgaatcagac aattgacggc ttgacggagt agcatagggt ttgcagaatc cctgcttcgt 7260
ccatttgaca ggcacattat gcatgccgct tcgccttcgc gcgcgaattg atctgctgcc 7320
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 7380
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 7440
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 7500
gcttaactat gcggcatcag agcagattgt actgagagtg caggggatcg cggccgcgga 7560
ccggatcctc tagagcggcc gcgatcctct agagtcgacc ggtggcgaat gggacgcgcc 7620
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 7680
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 7740
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 7800
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 7860
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 7920
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 7980
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 8040
ttttaacaaa atattaacgc ttacaattta ggtggcactt ttcggggaaa tgtgcgcgga 8100
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcac cgcgatcctt 8160
tttaacccat cacatatacc tgccgttcac tattatttag tgaaatgaga tattatgata 8220
ttttctgaat tgtgattaaa aaggcaactt tatgcccatg caacagaaac tataaaaaat 8280
acagagaatg aaaagaaaca gatagatttt ttagttcttt aggcccgtag tctgcaaatc 8340
cttttatgat tttctatcaa acaaaagagg aaaatagacc agttgcaatc caaacgagag 8400
tctaatagaa tgaggtcgaa aagtaaatcg cgcgggtttg ttactgataa agcaggcaag 8460
acctaaaatg tgtaaagggc aaagtgtata ctttggcgtc accccttaca tattttaggt 8520
ctttttttat tgtgcgtaac taacttgcca tcttcaaaca ggagggctgg aagaagcaga 8580
ccgctaacac agtacataaa aaaggagaca tgaacgatga acatcaaaaa gtttgcaaaa 8640
caagcaacag tattaacctt tactaccgca ctgctggcag gaggcgcaac tcaagcgttt 8700
gcgaaagaaa cgaaccaaaa gccatataag gaaacatacg gcatttccca tattacacgc 8760
catgatatgc tgcaaatccc tgaacagcaa aaaaatgaaa aatatcaagt tcctgagttc 8820
gattcgtcca caattaaaaa tatctcttct gcaaaaggcc tggacgtttg ggacagctgg 8880
ccattacaaa acgctgacgg cactgtcgca aactatcacg gctaccacat cgtctttgca 8940
ttagccggag atcctaaaaa tgcggatgac acatcgattt acatgttcta tcaaaaagtc 9000
ggcgaaactt ctattgacag ctggaaaaac gctggccgcg tctttaaaga cagcgacaaa 9060
ttcgatgcaa atgattctat cctaaaagac caaacacaag aatggtcagg ttcagccaca 9120
tttacatctg acggaaaaat ccgtttattc tacactgatt tctccggtaa acattacggc 9180
aaacaaacac tgacaactgc acaagttaac gtatcagcat cagacagctc tttgaacatc 9240
aacggtgtag aggattataa atcaatcttt gacggtgacg gaaaaacgta tcaaaatgta 9300
cagcagttca tcgatgaagg caactacagc tcaggcgaca accatacgct gagagatcct 9360
cactacgtag aagataaagg ccacaaatac ttagtatttg aagcaaacac tggaactgaa 9420
gatggctacc aaggcgaaga atctttattt aacaaagcat actatggcaa aagcacatca 9480
ttcttccgtc aagaaagtca aaaacttctg caaagcgata aaaaacgcac ggctgagtta 9540
gcaaacggcg ctctcggtat gattgagcta aacgatgatt acacactgaa aaaagtgatg 9600
aaaccgctga ttgcatctaa cacagtaaca gatgaaattg aacgcgcgaa cgtctttaaa 9660
atgaacggca aatggtacct gttcactgac tcccgcggat caaaaatgac gattgacggc 9720
attacgtcta acgatattta catgcttggt tatgtttcta attctttaac tggcccatac 9780
aagccgctga acaaaactgg ccttgtgtta aaaatggatc ttgatcctaa cgatgtaacc 9840
tttacttact cacacttcgc tgtacctcaa gcgaaaggaa acaatgtcgt gattacaagc 9900
tatatgacaa acagaggatt ctacgcagac aaacaatcaa cgtttgcgcc aagcttcctg 9960
ctgaacatca aaggcaagaa aacatctgtt gtcaaagaca gcatccttga acaaggacaa 10020
ttaacagtta acaaataaaa acgcaaaaga aaatgccgat attgactacc ggaagcagtg 10080
tgaccgtgtg cttctcaaat gcctgattca ggctgtctat gtgtgactgt tgagctgtaa 10140
caagttgtct caggtgttca atttcatgtt ctagttgctt tgttttactg gtttcacctg 10200
ttctattagg tgttacatgc tgttcatctg ttacattgtc gatctgttca tggtgaacag 10260
ctttaaatgc accaaaaact cgtaaaagct ctgatgtatc tatctttttt acaccgtttt 10320
catctgtgca tatggacagt tttccctttg atatgtaacg gtgaacagtt gttctacttt 10380
tgtttgttag tcttgatgct tcactgatag atacaagagc cataagaacc tcagatcctt 10440
ccgtatttag ccagtatgtt ctctagtgtg gttcgttgtt tttgcgtgag ccatgagaac 10500
gaaccattga gatcatactt actttgcatg tcactcaaaa attttgcctc aaaactggtg 10560
agctgaattt ttgcagttaa agcatcgtgt agtgtttttc ttagtccgtt atgtaggtag 10620
gaatctgatg taatggttgt tggtattttg tcaccattca tttttatctg gttgttctca 10680
agttcggtta cgagatccat ttgtctatct agttcaactt ggaaaatcaa cgtatcagtc 10740
gggcggcctc gcttatcaac caccaatttc atattgctgt aagtgtttaa atctttactt 10800
attggtttca aaacccattg gttaagcctt ttaaactcat ggtagttatt ttcaagcatt 10860
aacatgaact taaattcatc aaggctaatc tctatatttg ccttgtgagt tttcttttgt 10920
gttagttctt ttaataacca ctcataaatc ctcatagagt atttgttttc aaaagactta 10980
acatgttcca gattatattt tatgaatttt tttaactgga aaagataagg caatatctct 11040
tcactaaaaa ctaattctaa tttttcgctt gagaacttgg catagtttgt ccactggaaa 11100
atctcaaagc ctttaaccaa aggattcctg atttccacag ttctcgtcat cagctctctg 11160
gttgctttag ctaatacacc ataagcattt tccctactga tgttcatcat ctgaacgtat 11220
tggttataag tgaacgatac cgtccgttct ttccttgtag ggttttcaat cgtggggttg 11280
agtagtgcca cacagcataa aattagcttg gtttcatgct ccgttaagtc atagcgacta 11340
atcgctagtt catttgcttt gaaaacaact aattcagaca tacatctcaa ttggtctagg 11400
tgattttaat cactatacca attgagatgg gctagtcaat gataattact agtccttttc 11460
ctttgagttg tgggtatctg taaattctgc tagacctttg ctggaaaact tgtaaattct 11520
gctagaccct ctgtaaattc cgctagacct ttgtgtgttt tttttgttta tattcaagtg 11580
gttataattt atagaataaa gaaagaataa aaaaagataa aaagaataga tcccagccct 11640
gtgtataact cactacttta gtcagttccg cagtattaca aaaggatgtc gcaaacgctg 11700
tttgctcctc tacaaaacag accttaaaac cctaaaggct taagtagcac cctcgcaagc 11760
tcgggcaaat cgctgaatat tccttttgtc tccgaccatc aggcacctga gtcgctgtct 11820
ttttcgtgac attcagttcg ctgcgctcac ggctctggca gtgaatgggg gtaaatggca 11880
ctacaggcgc cttttatgga ttcatgcaag gaaactaccc ataatacaag aaaagcccgt 11940
cacgggcttc tcagggcgtt ttatggcggg tctgctatgt ggtgctatct gactttttgc 12000
tgttcagcag ttcctgccct ctgattttcc agtctgacca cttcggatta tcccgtgaca 12060
ggtcattcag actggctaat gcacccagta aggcagcggt atcatcaaca ggcttacccg 12120
tcttactgtc ggggatcgac gctctccctt atgcgactcc tgca 12164
<210> 94
<211> 918
<212> DNA
<213> E. coli
<400> 94
atgaacttca gacgcctgaa atacttcgta aaaattgtag atattggtag cctgacccag 60
gctgctgaag tattgcatat cgcacaacca gcgctcagcc agcaggttgc cacactggaa 120
ggtgagttaa atcaacaact tttgatccgt acaaagcggg gcgttacacc aacagacgcc 180
ggaaaaattc tctataccca tgcgcgggcc attttacgtc agtgtgaaca ggcccaactg 240
gcggtgcata acgttggtca ggcattatcg gggcaagtct cgattggctt tgcaccagga 300
accgctgcgt catccatcac catgccctta ttacaggcgg ttcgcgctga atttccggag 360
atcgttatct atcttcatga aaatagtggt gcagtgctta acgaaaaatt gataaatcac 420
caactcgata tggcggtgat ttatgagcat tcccctgtgg ctggtgtatc cagtcaggct 480
ttgctgaaag aagatctttt tctggtagga actcaagatt gcccggggca aagcgttgat 540
gtgaatgcta ttgcgcaaat gaacctcttt ctccccagtg attacagtgc tattagactt 600
cgtgttgatg aggctttttc cctacggcga ctcacggcaa aagttattgg tgaaattgag 660
tctattgcca cgcttaccgc agcgattgcc agcggcatgg gcgttgcagt attacccgaa 720
tcggccgcgc gttcgttatg tggcgcagta aatgggtgga tgtcacgcat taccactcct 780
tccatgagtc tctctttgtc attaaattta cccgccagag cgaacttatc gccacaggca 840
caggcagtga aagagttgtt aatgtcagtg attagttctc cagtgatgga aaaaaggcag 900
tggcaattgg tgagctaa 918
<210> 95
<211> 20
<212> DNA
<213> E. coli
<400> 95
tatgcaatac ttcagcagcc 20
<210> 96
<211> 23
<212> DNA
<213> E. coli
<400> 96
tatgcaatac ttcagcagcc tgg 23
<210> 97
<211> 20
<212> DNA
<213> E. coli
<400> 97
acaaccagcg ctcagccagc 20
<210> 98
<211> 23
<212> DNA
<213> E. coli
<400> 98
acaaccagcg ctcagccagc agg 23
<210> 99
<211> 56
<212> DNA
<213> N25 phage
<400> 99
aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattca 56
<210> 100
<211> 247
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized nac target site 1 gRNA expression cassette
<400> 100
aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcatatg 60
caatacttca gcagccgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 120
atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 180
ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 240
tgagaat 247
<210> 101
<211> 247
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized nac target site 2 gRNA expression cassette
<400> 101
aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcaacaa 60
ccagcgctca gccagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 120
atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 180
ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 240
tgagaat 247
<210> 102
<211> 500
<212> DNA
<213> E. coli
<400> 102
gaagttcatg ttgcctccgg tttttaagaa tcggcccaag tgccgccatt acttacaacc 60
agattgcaag atgcttgcca gttttatttt ggtgttgatg tacaagctaa ccaactgtca 120
aataagagat tatgatagat tcgtcatttg ctcctttaat cagctgtcgc gttcccctgc 180
cctataaaag gagggtatgc accacgatgg ttcattaccc aataagattg aaagctcacc 240
actttgttga aattgacagc aaacaaacaa aaaaatgcat ttcacccttt gacatcacca 300
tgcactgcca ttaatatgcg ccccgttcac acgattcctc tgtagttcag tcggtagaac 360
ggcggactgt taatccgtat gtcactggtt cgagtccagt cagaggagcc aaattcaaaa 420
aagcctgctt tctagcaggc tttttgcttt ctaattacca acgctcttaa aacatctgtc 480
ttgaaccaga actaatttgc 500
<210> 103
<211> 500
<212> DNA
<213> E. coli
<400> 103
cgtcccctgg attagctcga gccgaacctc cgggaaaagt tcgcgaaaag ctttaatgac 60
ctctggcaag ctataacgtg cctgagtatg cgtcgttgca atagtgagaa cgccagacgt 120
atcgttggta aacaggtctg caagccgacg aacattactg gcttcattca gaatacgttc 180
tgcaatgacc agtaatgctt tgcccggttc agtcatgccc agcagtcgct tacctcgtcg 240
aacaaatatt tcgatgccaa gttcatcctc cagttcccga atatgacggc tgacgcctga 300
ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg taatcctgac gtgcagcctc 360
gcggattatc tttagttgtt ggaaattcac ggtaaactcc gggcagttca gatttcccgt 420
tattgttaaa gtctaatgcc cggcataaca aataataaaa acccgcatct tattccatcc 480
cgatataaca cttagctcac 500
<210> 104
<211> 1000
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized nac deletion editing template
<400> 104
cgtcccctgg attagctcga gccgaacctc cgggaaaagt tcgcgaaaag ctttaatgac 60
ctctggcaag ctataacgtg cctgagtatg cgtcgttgca atagtgagaa cgccagacgt 120
atcgttggta aacaggtctg caagccgacg aacattactg gcttcattca gaatacgttc 180
tgcaatgacc agtaatgctt tgcccggttc agtcatgccc agcagtcgct tacctcgtcg 240
aacaaatatt tcgatgccaa gttcatcctc cagttcccga atatgacggc tgacgcctga 300
ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg taatcctgac gtgcagcctc 360
gcggattatc tttagttgtt ggaaattcac ggtaaactcc gggcagttca gatttcccgt 420
tattgttaaa gtctaatgcc cggcataaca aataataaaa acccgcatct tattccatcc 480
cgatataaca cttagctcac gaagttcatg ttgcctccgg tttttaagaa tcggcccaag 540
tgccgccatt acttacaacc agattgcaag atgcttgcca gttttatttt ggtgttgatg 600
tacaagctaa ccaactgtca aataagagat tatgatagat tcgtcatttg ctcctttaat 660
cagctgtcgc gttcccctgc cctataaaag gagggtatgc accacgatgg ttcattaccc 720
aataagattg aaagctcacc actttgttga aattgacagc aaacaaacaa aaaaatgcat 780
ttcacccttt gacatcacca tgcactgcca ttaatatgcg ccccgttcac acgattcctc 840
tgtagttcag tcggtagaac ggcggactgt taatccgtat gtcactggtt cgagtccagt 900
cagaggagcc aaattcaaaa aagcctgctt tctagcaggc tttttgcttt ctaattacca 960
acgctcttaa aacatctgtc ttgaaccaga actaatttgc 1000
<210> 105
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> 5' pRF97 or pRF861 identity fragment
<400> 105
cgaatcagac aattgacggc 20
<210> 106
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> 3' pRF97 or pRF861 identity fragment
<400> 106
gcttccggta gtcaataaac c 21
<210> 107
<211> 1288
<212> DNA
<213> artificial sequence
<220>
<223> nacETsite1
<400> 107
cgaatcagac aattgacggc cgtcccctgg attagctcga gccgaacctc cgggaaaagt 60
tcgcgaaaag ctttaatgac ctctggcaag ctataacgtg cctgagtatg cgtcgttgca 120
atagtgagaa cgccagacgt atcgttggta aacaggtctg caagccgacg aacattactg 180
gcttcattca gaatacgttc tgcaatgacc agtaatgctt tgcccggttc agtcatgccc 240
agcagtcgct tacctcgtcg aacaaatatt tcgatgccaa gttcatcctc cagttcccga 300
atatgacggc tgacgcctga ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg 360
taatcctgac gtgcagcctc gcggattatc tttagttgtt ggaaattcac ggtaaactcc 420
gggcagttca gatttcccgt tattgttaaa gtctaatgcc cggcataaca aataataaaa 480
acccgcatct tattccatcc cgatataaca cttagctcac gaagttcatg ttgcctccgg 540
tttttaagaa tcggcccaag tgccgccatt acttacaacc agattgcaag atgcttgcca 600
gttttatttt ggtgttgatg tacaagctaa ccaactgtca aataagagat tatgatagat 660
tcgtcatttg ctcctttaat cagctgtcgc gttcccctgc cctataaaag gagggtatgc 720
accacgatgg ttcattaccc aataagattg aaagctcacc actttgttga aattgacagc 780
aaacaaacaa aaaaatgcat ttcacccttt gacatcacca tgcactgcca ttaatatgcg 840
ccccgttcac acgattcctc tgtagttcag tcggtagaac ggcggactgt taatccgtat 900
gtcactggtt cgagtccagt cagaggagcc aaattcaaaa aagcctgctt tctagcaggc 960
tttttgcttt ctaattacca acgctcttaa aacatctgtc ttgaaccaga actaatttgc 1020
aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcatatg 1080
caatacttca gcagccgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1140
atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 1200
ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 1260
tgagaatggt ttattgacta ccggaagc 1288
<210> 108
<211> 1288
<212> DNA
<213> artificial sequence
<220>
<223> nacETsite2
<400> 108
cgaatcagac aattgacggc cgtcccctgg attagctcga gccgaacctc cgggaaaagt 60
tcgcgaaaag ctttaatgac ctctggcaag ctataacgtg cctgagtatg cgtcgttgca 120
atagtgagaa cgccagacgt atcgttggta aacaggtctg caagccgacg aacattactg 180
gcttcattca gaatacgttc tgcaatgacc agtaatgctt tgcccggttc agtcatgccc 240
agcagtcgct tacctcgtcg aacaaatatt tcgatgccaa gttcatcctc cagttcccga 300
atatgacggc tgacgcctga ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg 360
taatcctgac gtgcagcctc gcggattatc tttagttgtt ggaaattcac ggtaaactcc 420
gggcagttca gatttcccgt tattgttaaa gtctaatgcc cggcataaca aataataaaa 480
acccgcatct tattccatcc cgatataaca cttagctcac gaagttcatg ttgcctccgg 540
tttttaagaa tcggcccaag tgccgccatt acttacaacc agattgcaag atgcttgcca 600
gttttatttt ggtgttgatg tacaagctaa ccaactgtca aataagagat tatgatagat 660
tcgtcatttg ctcctttaat cagctgtcgc gttcccctgc cctataaaag gagggtatgc 720
accacgatgg ttcattaccc aataagattg aaagctcacc actttgttga aattgacagc 780
aaacaaacaa aaaaatgcat ttcacccttt gacatcacca tgcactgcca ttaatatgcg 840
ccccgttcac acgattcctc tgtagttcag tcggtagaac ggcggactgt taatccgtat 900
gtcactggtt cgagtccagt cagaggagcc aaattcaaaa aagcctgctt tctagcaggc 960
tttttgcttt ctaattacca acgctcttaa aacatctgtc ttgaaccaga actaatttgc 1020
aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcaacaa 1080
ccagcgctca gccagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1140
atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 1200
ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 1260
tgagaatggt ttattgacta ccggaagc 1288
<210> 109
<211> 9322
<212> DNA
<213> Artificial sequence
<220>
<223> pRF97-cassette
<400> 109
ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctc aggctgtcta 60
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 120
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 180
cgatctgttc atggtgaaca gctttaaatg caccaaaaac tcgtaaaagc tctgatgtat 240
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatctaac 300
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 360
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 420
ttttgcgtga gccatgagaa cgaaccattg agatcatgct tactttgcat gtcactcaaa 480
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 540
cttagtccgt tacgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 600
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 660
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 720
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 780
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 840
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 900
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 960
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 1020
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 1080
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 1140
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 1200
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 1260
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 1320
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 1380
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 1440
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 1500
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 1560
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 1620
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 1680
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 1740
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 1800
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 1860
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 1920
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 1980
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 2040
tatcatcaac aggcttaccc gtcttactgt cggatcgacg ctctccctta tgcgactcct 2100
gcatcccttt cgtcttcgaa taaatacctg tgacggaaga tcacttcgca gaataaataa 2160
atcctggtgt ccctgttgat accgggaagc cctgggccaa cttttggcga aaatgagacg 2220
ttgatcggca cgtaagaggt tccaactttc accataatga aataagatca ctaccgggcg 2280
tattttttga gttatcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca 2340
ctggatatac caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc 2400
agtcagttgc tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa 2460
agaccgtaaa gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc 2520
tgatgaatgc tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg 2580
atagtgttca cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct 2640
ggagtgaata ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt 2700
gttacggtga aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct 2760
cagccaatcc ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact 2820
tcttcgcccc cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc 2880
cgctggcgat tcaggttcat catgccgttt gtgatggctt ccatgtcggc agaatgctta 2940
atgaattaca acagtactgc gatgagtggc agggcggggc gtaatttttt taaggcagtt 3000
attggtgccc ttaaacgcct ggtgctacgc ctgaataagt gataataagc ggatgaatgg 3060
cagaaattcg aaagcaaatt cgacccggtc gtcggttcag ggcagggtcg ttaaatagcc 3120
gcttatgtct attgctggtt tatcggtacc ccccaactga tcttcagcat cttttacttt 3180
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 3240
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 3300
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaaa 3360
gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta atttgatgcc 3420
tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc gcaacgttca 3480
aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa caacagataa 3540
aacgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 3600
actctcgcat ggggagaccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 3660
ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaattctg ttttatcaga 3720
ccgcttctgc gttctgattt aatctgtatc aggctgaaaa tcttctctca tccgccaaaa 3780
cagccaagct tagcggccgc ttagaccttt cgctttttct tgggatcggc tctggagtcg 3840
ccaccaagct gagacaggtc gattcgggtc tcgtacaggc cagtgatgga ctggtgaatc 3900
agggtggcat cgagaacctc cttggtggat gtgtaccgct ttcggtcgat agtggtatcg 3960
aagtacttga aagctgcagg agcacccagg ttggtaagag taaacaggtg aatgatgttc 4020
tccgcctgtt ctcgaatggg tttgtcccga tgcttgttgt aggcagagag caccttgtcc 4080
aagttggcat cagccaggat gactcgcttc gaaaactcgg aaatctgctc gataatctcg 4140
tcgaggtaat gtttgtgctg ctcaacgaag agttgcttct gttcgttgtc ctcgggagaa 4200
cccttgagct tctcgtagtg agaagccaga tagagaaagt tgacgtactt cgaaggcaag 4260
gcaagctcgt ttcccttctg cagctcgcca gcggaggcga gcatacgctt tcgaccgttc 4320
tccagttcga acagagagta cttgggcagc ttgataatga ggtctttctt gacctccttg 4380
taacccttgg cttccaagaa gtcgatggga ttcttctcga agctcgatcg ctccatgatg 4440
gtaattccga gcagctcctt gacggacttg agctttttgg acttgccctt ctcgaccttc 4500
gcaacgacaa gcacggaata ggcgacggta ggagaatcga agccaccgta tttcttggga 4560
tcccagtctt tctttcgagc gatgagcttg tcggagtttc gcttgggcag aatcgactcc 4620
ttggagaatc cgccagtctg aacctcggtt ttcttgacga tgttgacctg aggcatcgac 4680
agaacctttc gcacggttgc aaagtctcga cccttgtccc acacgatctc tccagtttcg 4740
ccgttggtct cgataagtgg tctctttcga atctctccgt tggccaaggt gatctcggtc 4800
ttgaaaaagt tcatgatgtt ggagtaaaag aagtacttgg cagtagcctt gccaatctcc 4860
tgttcggact tggcaatcat ctttcgaacg tcgtagacct tgtaatcgcc gtaaacgaac 4920
tcgctttcga gcttggggta tttcttgatg agcgcagtgc caacgacggc gttgaggtaa 4980
gcatcgtggg catggtggta attgttgatc tctcgcacct tgtagaactg aaagtccttt 5040
cggaaatcgg agaccagttt ggacttgaga gtaatcacct tgacctctcg gatgagcttg 5100
tcgttctcgt cgtacttggt gttcatccga gaatcgagaa tctgtgcgac gtgctttgtg 5160
atctgtctgg tctcgacgag ttgacgcttg atgaagccag ccttgtcgag ctcggacaga 5220
ccgcctcgct cggccttggt aagattgtcg aactttcgct gggtaatgag cttggcgttg 5280
agcagctgtc gccagtagtt cttcatcttt ttgaccacct cttcgctggg aacgttgtcc 5340
gacttgcctc tgttcttgtc ggatcgtgta aggaccttgt tgtcgataga atcgtccttg 5400
agaaaggatt gagggacaat gtggtccaca tcgtagtcgc tgagacgatt gatgtccagt 5460
tcctgatcca cgtacatgtc tcgaccattc tgcagatagt agagatacag cttctcgttc 5520
tgcagttgag tgttctcgac gggatgctcc ttgagaatct gggatcccag ctccttgatg 5580
ccttcctcga ttcgcttcat ccgctctcgc gagtttttct gacccttttg agttgtctgg 5640
ttctctctgg ccatctcgat cacaatgttc tcgggcttgt gacgtcccat gaccttcacc 5700
agctcgtcga caaccttgac agtctggaga atgcctttct tgatggctgg cgaaccagcc 5760
aggttggcaa tatgttcgtg caagctgtcg ccctgaccgg acacttgtgc cttctggatg 5820
tcctccttga aggtaagaga atcgtcgtga atgagctgca tgaagtttcg gttggcaaag 5880
ccatcggact tgagaaagtc cagaatggtc tttccggact gcttgtctct gatgccgttg 5940
atgagctttc gcgaaagtct tccccagccg gtgtatctac gtcgcttgag ttgtttcatg 6000
accttgtcgt cgaacaggtg agcgtatgtc ttgagtcgtt cctcgatcat ctcccgatct 6060
tcgaacaggg taagagtgag cacgatgtcc tccagaatgt cctcgttttc ctcgttgtcg 6120
agaaaatcct tgtccttgat aatcttgagc agatcgtgat aggtgcccaa agaggcgttg 6180
aatcggtcct caactccgga aatctcgacg ctgtcgaaac actcgatttt cttgaagtag 6240
tcctccttga gctgcttaac agtgaccttt cggttggtct tgaacaggag atcgacaatg 6300
gctttcttct gttcgccaga caagaaggca ggctttcgca ttccctcggt aacgtacttg 6360
actttggtga gttcgttgta gactgtaaag tactcgtaga gcagcgaatg cttgggaaga 6420
accttctcgt tgggcagatt cttgtcgaag ttggtcattc gctcgatgaa ggactgtgca 6480
gaggcaccct tgtccacgac ttcctcgaag ttccagggag tgatggtttc ctcggacttt 6540
cgagtcatcc aagcaaatcg agagtttcct ctggcaagag gaccaacata gtaggggatt 6600
cgaaaggtaa gaatcttctc gatcttctct cggttgtcct tgagaaaggg gtagaagtct 6660
tcctgacgtc gaagaatggc gtgcagctca ccgaggtgga tctgatgagg aatgctgccg 6720
ttgtcgaagg ttcgttgctt ccgaagcaga tcctctcgat tgagcttgac aagcagttcc 6780
tcggttccgt ccatcttctc gagaattggc ttgatgaact tgtagaactc ttcctgagag 6840
gctccgccgt cgatgtatcc agcgtagccg ttcttcgact gatcgaaaaa gatctccttg 6900
tacttctcgg gcagttgctg tcggacaaga gccttgagca gtgtgagatc ctgatggtgc 6960
tcgtcgtatc gcttgatcat ggaggcagaa aggggagcct ttgtgatctc ggtgttgact 7020
cgcagaatgt cagacaagag aatagcatcc gaaaggttct tggcagcgag aaacaggtcg 7080
gcgtactgat cgccaatctg tgcaagcagg ttgtcgaggt catcgtcgta ggtgtccttg 7140
gacagctgga gcttggcgtc ctccgccaga tcgaagttgg acttgaagtt gggtgtgaga 7200
ccaagagaaa gggcaatgag gttgccaaac agtccgttct ttttctcgcc aggaagttgg 7260
gcaatgaggt tctccagtcg tctgctcttc gagagtcgag cagacaagat ggcctttgca 7320
tcgactccgg aggcattgat ggggttttcc tcgaacagct ggttgtaggt ctgaacgagc 7380
tgaatgaaca gcttgtccac atcgctgttg tcgggattga gatcgccctc gatgaggaaa 7440
tgacctcgaa acttgatcat gtgtgccaga gcgaggtaga taagtctgag atccgccttg 7500
tcggtggaat cgacgagttt ctttcgcagg tggtagatgg taggatactt ctcgtggtaa 7560
gcaacctcgt ccacaatgtt gccaaagatg ggatgacgct cgtgtttctt gtcttcctcg 7620
acgaggaagg attcctccag tcgatgaaag aacgaatcgt ccaccttggc catctcgttg 7680
gaaaagatct cctgcaggta gcagattcgg ttcttccgtc gggtgtaacg tcgccgagca 7740
gttcgcttga gtctggtagc ttcggcagtc tcgccagaat cgaacaacag ggcaccaatg 7800
aggtttttct tgatggagtg tcgatcggtg tttccgagga ccttgaattt cttggagggc 7860
accttgtact cgtcggtgat gacagcccag ccgacagagt tggttccaat gtccaggccg 7920
atggagtatt tcttgtcgaa ttcccatatg gtaccagctg cagatctcga gctcggatcc 7980
ttatcgtcat cgtcgtacag atcccgaccc atttgctgtc caccagtcat gctagccata 8040
ccatgatgat gatgatgatg agaacccccc atggttaatt cctcctgtta gcccaaaaaa 8100
cgggtatgga gaaacagtag agagttgcga taaaaagcgt caggtaggat ccgctaatct 8160
tatggataaa aatgctatgg catagcaaag tgtgacgccg tgcaaataat caatgtggac 8220
ttttctgccg tgattataga cacttttgtt acgcgttttt gtcatggctt tggtcccgct 8280
ttgttacaga atgcttttaa taagcggggt taccggtttg gttagcgaga agagccagta 8340
aaagacgcag tgacggcaat gtctgatgca atatggacaa ttggtttctt ctctgaatgg 8400
cgggagtatg aaaagtatgg ctgaagcgca aaatgatccc ctgctgccgg gatactcgtt 8460
taatgcccat ctggtggcgg gtttaacgcc gattgaggcc aacggttatc tcgatttttt 8520
tatcgaccga ccgctgggaa tgaaaggtta tattctcaat ctcaccattc gcggtcaggg 8580
ggtggtgaaa aatcagggac gagaatttgt ttgccgaccg ggtgatattt tgctgttccc 8640
gccaggagag attcatcact acggtcgtca tccggaggct cgcgaatggt atcaccagtg 8700
ggtttacttt cgtccgcgcg cctactggca tgaatggctt aactggccgt caatatttgc 8760
caatacgggg ttctttcgcc cggatgaagc gcaccagccg catttcagcg acctgtttgg 8820
gcaaatcatt aacgccgggc aaggggaagg gcgctattcg gagctgctgg cgataaatct 8880
gcttgagcaa ttgttactgc ggcgcatgga agcgattaac gagtcgctcc atccaccgat 8940
ggataatcgg gtacgcgagg cttgtcagta catcagcgat cacctggcag acagcaattt 9000
tgatatcgcc agcgtcgcac agcatgtttg cttgtcgccg tcgcgtctgt cacatctttt 9060
ccgccagcag ttagggatta gcgtcttaag ctggcgcgag gaccaacgta tcagccaggc 9120
gaagctgctt ttgagcacca cccggatgcc tatcgccacc gtcggtcgca atgttggttt 9180
tgacgatcaa ctctatttct cgcgggtatt taaaaaatgc accggggcca gcccgagcga 9240
gttccgtgcc ggttgtgaag aaaaagtgaa tgatgtagcc gtcaagttgt cataattggt 9300
aacgaatcag acaattgacg gc 9322
<210> 110
<211> 9322
<212> DNA
<213> Artificial sequence
<220>
<223> pRF861-cassette
<400> 110
ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctc aggctgtcta 60
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 120
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 180
cgatctgttc atggtgaaca gctttaaatg caccaaaaac tcgtaaaagc tctgatgtat 240
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatctaac 300
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 360
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 420
ttttgcgtga gccatgagaa cgaaccattg agatcatgct tactttgcat gtcactcaaa 480
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 540
cttagtccgt tacgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 600
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 660
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 720
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 780
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 840
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 900
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 960
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 1020
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 1080
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 1140
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 1200
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 1260
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 1320
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 1380
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 1440
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 1500
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 1560
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 1620
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 1680
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 1740
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 1800
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 1860
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 1920
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 1980
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 2040
tatcatcaac aggcttaccc gtcttactgt cggatcgacg ctctccctta tgcgactcct 2100
gcatcccttt cgtcttcgaa taaatacctg tgacggaaga tcacttcgca gaataaataa 2160
atcctggtgt ccctgttgat accgggaagc cctgggccaa cttttggcga aaatgagacg 2220
ttgatcggca cgtaagaggt tccaactttc accataatga aataagatca ctaccgggcg 2280
tattttttga gttatcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca 2340
ctggatatac caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc 2400
agtcagttgc tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa 2460
agaccgtaaa gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc 2520
tgatgaatgc tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg 2580
atagtgttca cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct 2640
ggagtgaata ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt 2700
gttacggtga aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct 2760
cagccaatcc ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact 2820
tcttcgcccc cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc 2880
cgctggcgat tcaggttcat catgccgttt gtgatggctt ccatgtcggc agaatgctta 2940
atgaattaca acagtactgc gatgagtggc agggcggggc gtaatttttt taaggcagtt 3000
attggtgccc ttaaacgcct ggtgctacgc ctgaataagt gataataagc ggatgaatgg 3060
cagaaattcg aaagcaaatt cgacccggtc gtcggttcag ggcagggtcg ttaaatagcc 3120
gcttatgtct attgctggtt tatcggtacc ccccaactga tcttcagcat cttttacttt 3180
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 3240
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 3300
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaaa 3360
gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta atttgatgcc 3420
tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc gcaacgttca 3480
aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa caacagataa 3540
aacgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 3600
actctcgcat ggggagaccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 3660
ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaattctg ttttatcaga 3720
ccgcttctgc gttctgattt aatctgtatc aggctgaaaa tcttctctca tccgccaaaa 3780
cagccaagct tagcggccgc ttagaccttt cgctttttct tgggatcggc tctggagtcg 3840
ccaccaagct gagacaggtc gattcgggtc tcgtacaggc cagtgatgga ctggtgaatc 3900
agggtggcat cgagaacctc cttggtggat gtgtaccgct ttcggtcgat agtggtatcg 3960
aagtacttga aagctgcagg agcacccagg ttggtaagag taaacaggtg aatgatgttc 4020
tccgcctgtt ctcgaatggg tttgtcccga tgcttgttgt aggcagagag caccttgtcc 4080
aagttggcat cagccaggat gactcgcttc gaaaactcgg aaatctgctc gataatctcg 4140
tcgaggtaat gtttgtgctg ctcaacgaag agttgcttct gttcgttgtc ctcgggagaa 4200
cccttgagct tctcgtagtg agaagccaga tagagaaagt tgacgtactt cgaaggcaag 4260
gcaagctcgt ttcccttctg cagctcgcca gcggaggcga gcatacgctt tcgaccgttc 4320
tccagttcga acagagagta cttgggcagc ttgataatga ggtctttctt gacctccttg 4380
taacccttgg cttccaagaa gtcgatggga ttcttctcga agctcgatcg ctccatgatg 4440
gtaattccga gcagctcctt gacggacttg agctttttgg acttgccctt ctcgaccttc 4500
gcaacgacaa gcacggaata ggcgacggta ggagaatcga agccaccgta tttcttggga 4560
tcccagtctt tctttcgagc gatgagcttg tcggagtttc gcttgggcag aatcgactcc 4620
ttggagaatc cgccagtctg aacctcggtt ttcttgacga tgttgacctg aggcatcgac 4680
agaacctttc gcacggttgc aaagtctcga cccttgtccc acacgatctc tccagtttcg 4740
ccgttggtct cgataagtgg tctctttcga atctctccgt tggccaaggt gatctcggtc 4800
ttgaaaaagt tcatgatgtt ggagtaaaag aagtacttgg cagtagcctt gccaatctcc 4860
tgttcggact tggcaatcat ctttcgaacg tcgtagacct tgtaatcgcc gtaaacgaac 4920
tcgctttcga gcttggggta tttcttgatg agcgcagtgc caacgacggc gttgaggtaa 4980
gcatcgtggg catggtggta attgttgatc tctcgcacct tgtagaactg aaagtccttt 5040
cggaaatcgg agaccagttt ggacttgaga gtaatcacct tgacctctcg gatgagcttg 5100
tcgttctcgt cgtacttggt gttcatccga gaatcgagaa tctgtgcgac gtgctttgtg 5160
atctgtctgg tctcgacgag ttgacgcttg atgaagccag ccttgtcgag ctcggacaga 5220
ccgcctcgct cggccttggt aagattgtcg aactttcgct gggtaatgag cttggcgttg 5280
agcagctgtc gccagtagtt cttcatcttt ttgaccacct cttcgctggg aacgttgtcc 5340
gacttgcctc tgttcttgtc ggatcgtgta aggaccttgt tgtcgataga atcgtccttg 5400
agaaaggatt gagggacaat gtggtccaca tcgtagtcgc tgagacgatt gatgtccagt 5460
tcctgatcca cgtacatgtc tcgaccattc tgcagatagt agagatacag cttctcgttc 5520
tgcagttgag tgttctcgac gggatgctcc ttgagaatct gggatcccag ctccttgatg 5580
ccttcctcga ttcgcttcat ccgctctcgc gagtttttct gacccttttg agttgtctgg 5640
ttctctctgg ccatctcgat cacaatgttc tcgggcttgt gacgtcccat gaccttcacc 5700
agctcgtcga caaccttgac agtctggaga atgcctttct tgatggctgg cgaaccagcc 5760
aggttggcaa tatgttcgtg caagctgtcg ccctgaccgg acacttgtgc cttctggatg 5820
tcctccttga aggtaagaga atcgtcgtga atgagctgca tgaagtttcg gttggcaaag 5880
ccatcggact tgagaaagtc cagaatggtc tttccggact gcttgtctct gatgccgttg 5940
atgagctttc gcgaaagtct tccccagccg gtgtatctac gtcgcttgag ttgtttcatg 6000
accttgtcgt cgaacaggtg agcgtatgtc ttgagtcgtt cctcgatcat ctcccgatct 6060
tcgaacaggg taagagtgag cacgatgtcc tccagaatgt cctcgttttc ctcgttgtcg 6120
agaaaatcct tgtccttgat aatcttgagc agatcgtgat aggtgcccaa agaggcgttg 6180
aatcggtcct caactccgga aatctcgacg ctgtcgaaac actcgatttt cttgaagtag 6240
tcctccttga gctgcttaac agtgaccttt cggttggtct tgaacaggag atcgacaatg 6300
gctttcttct gttcgccaga caagaaggca ggctttcgca ttccctcggt aacgtacttg 6360
actttggtga gttcgttgta gactgtaaag tactcgtaga gcagcgaatg cttgggaaga 6420
accttctcgt tgggcagatt cttgtcgaag ttggtcattc gctcgatgaa ggactgtgca 6480
gaggcaccct tgtccacgac ttcctcgaag ttccagggag tgatggtttc ctcggacttt 6540
cgagtcatcc aagcaaatcg agagtttcct ctggcaagag gaccaacata gtaggggatt 6600
cgaaaggtaa gaatcttctc gatcttctct cggttgtcct tgagaaaggg gtagaagtct 6660
tcctgacgtc gaagaatggc gtgcagctca ccgaggtgga tctgatgagg aatgctgccg 6720
ttgtcgaagg ttcgttgctt ccgaagcaga tcctctcgat tgagcttgac aagcagttcc 6780
tcggttccgt ccatcttctc gagaattggc ttgatgaact tgtagaactc ttcctgagag 6840
gctccgccgt cgatgtatcc agcgtagccg ttcttcgact gatcgaaaaa gatctccttg 6900
tacttctcgg gcagttgctg tcggacaaga gccttgagca gtgtgagatc ctgatggtgc 6960
tcgtcgtatc gcttgatcat ggaggcagaa aggggagcct ttgtgatctc ggtgttgact 7020
cgcagaatgt cagacaagag aatagcatcc gaaaggttct tggcagcgag aaacaggtcg 7080
gcgtactgat cgccaatctg tgcaagcagg ttgtcgaggt catcgtcgta ggtgtccttg 7140
gacagctgga gcttggcgtc ctccgccaga tcgaagttgg acttgaagtt gggtgtgaga 7200
ccaagagaaa gggcaatgag gttgccaaac agtccgttct ttttctcgcc aggaagttgg 7260
gcaatgaggt tctccagtcg tctgctcttc gagagtcgag cagacaagat ggcctttgca 7320
tcgactccgg aggcattgat ggggttttcc tcgaacagct ggttgtaggt ctgaacgagc 7380
tgaatgaaca gcttgtccac atcgctgttg tcgggattga gatcgccctc gatgaggaaa 7440
tgacctcgaa acttgatcat gtgtgccaga gcgagatgga taagtctgag atccgccttg 7500
tcggtggaat cgacgagttt ctttcgcagg tggtagatgg taggatactt ctcgtggtaa 7560
gcaacctcgt ccacaatgtt gccaaagatg ggatgacgct cgtgtttctt gtcttcctcg 7620
acgaggaagg attcctccag tcgatgaaag aacgaatcgt ccaccttggc catctcgttg 7680
gaaaagatct cctgcaggta gcagattcgg ttcttccgtc gggtgtaacg tcgccgagca 7740
gttcgcttga gtctggtagc ttcggcagtc tcgccagaat cgaacaacag ggcaccaatg 7800
aggtttttct tgatggagtg tcgatcggtg tttccgagga ccttgaattt cttggagggc 7860
accttgtact cgtcggtgat gacagcccag ccgacagagt tggttccaat gtccaggccg 7920
atggagtatt tcttgtcgaa ttcccatatg gtaccagctg cagatctcga gctcggatcc 7980
ttatcgtcat cgtcgtacag atcccgaccc atttgctgtc caccagtcat gctagccata 8040
ccatgatgat gatgatgatg agaacccccc atggttaatt cctcctgtta gcccaaaaaa 8100
cgggtatgga gaaacagtag agagttgcga taaaaagcgt caggtaggat ccgctaatct 8160
tatggataaa aatgctatgg catagcaaag tgtgacgccg tgcaaataat caatgtggac 8220
ttttctgccg tgattataga cacttttgtt acgcgttttt gtcatggctt tggtcccgct 8280
ttgttacaga atgcttttaa taagcggggt taccggtttg gttagcgaga agagccagta 8340
aaagacgcag tgacggcaat gtctgatgca atatggacaa ttggtttctt ctctgaatgg 8400
cgggagtatg aaaagtatgg ctgaagcgca aaatgatccc ctgctgccgg gatactcgtt 8460
taatgcccat ctggtggcgg gtttaacgcc gattgaggcc aacggttatc tcgatttttt 8520
tatcgaccga ccgctgggaa tgaaaggtta tattctcaat ctcaccattc gcggtcaggg 8580
ggtggtgaaa aatcagggac gagaatttgt ttgccgaccg ggtgatattt tgctgttccc 8640
gccaggagag attcatcact acggtcgtca tccggaggct cgcgaatggt atcaccagtg 8700
ggtttacttt cgtccgcgcg cctactggca tgaatggctt aactggccgt caatatttgc 8760
caatacgggg ttctttcgcc cggatgaagc gcaccagccg catttcagcg acctgtttgg 8820
gcaaatcatt aacgccgggc aaggggaagg gcgctattcg gagctgctgg cgataaatct 8880
gcttgagcaa ttgttactgc ggcgcatgga agcgattaac gagtcgctcc atccaccgat 8940
ggataatcgg gtacgcgagg cttgtcagta catcagcgat cacctggcag acagcaattt 9000
tgatatcgcc agcgtcgcac agcatgtttg cttgtcgccg tcgcgtctgt cacatctttt 9060
ccgccagcag ttagggatta gcgtcttaag ctggcgcgag gaccaacgta tcagccaggc 9120
gaagctgctt ttgagcacca cccggatgcc tatcgccacc gtcggtcgca atgttggttt 9180
tgacgatcaa ctctatttct cgcgggtatt taaaaaatgc accggggcca gcccgagcga 9240
gttccgtgcc ggttgtgaag aaaaagtgaa tgatgtagcc gtcaagttgt cataattggt 9300
aacgaatcag acaattgacg gc 9322
<210> 111
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 111
ggtttattga ctaccggaag c 21
<210> 112
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 112
gccgtcaatt gtctgattcg 20
<210> 113
<211> 10569
<212> DNA
<213> Artificial sequence
<220>
<223> pRF97-nacETsite1 plasmid
<400> 113
ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60
tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120
tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180
ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420
gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540
tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720
cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780
ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840
attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900
gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960
aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020
atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260
ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320
agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380
cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440
aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500
tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560
tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620
ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680
caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740
caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800
tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860
acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920
cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980
tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040
ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100
tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160
gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220
gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280
ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340
ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400
cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460
agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520
agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580
cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640
tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700
aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760
cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820
tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880
cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940
aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000
tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060
gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120
ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180
gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240
tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300
aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360
gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420
gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480
cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540
ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600
cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660
tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720
ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780
cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840
gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900
tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960
acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020
aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080
ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140
ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200
tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260
tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320
tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380
cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440
tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500
aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560
gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620
cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680
ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740
cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800
tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860
cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920
gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980
actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040
gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100
gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160
tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220
ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280
tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340
ctcgaaactt gatcatgtgt gccagagcga ggtagataag tctgagatcc gccttgtcgg 5400
tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460
cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520
ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580
agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640
gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700
ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760
tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820
agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880
cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940
gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000
tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060
gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120
ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180
tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240
acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300
agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360
gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420
gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480
gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540
ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600
tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660
acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720
atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780
gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840
aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900
atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960
cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020
ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080
gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140
cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200
aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260
gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320
agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380
ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440
cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500
atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560
atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620
gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680
ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740
tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800
tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860
gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920
cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980
acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040
ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100
cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160
tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220
gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcatatgca 8280
atacttcagc agccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340
caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400
cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460
agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520
gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580
ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640
attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700
tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760
ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820
aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880
gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940
tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000
tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060
cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120
caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180
tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240
actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300
tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360
tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420
actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480
acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540
ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600
tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660
ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720
catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780
cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840
gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900
cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960
gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020
agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080
attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140
aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200
accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260
ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320
ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380
ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440
tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500
agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560
ctcctgcat 10569
<210> 114
<211> 10569
<212> DNA
<213> Artificial sequence
<220>
<223> pRF97-nacETsite2 plasmid
<400> 114
ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60
tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120
tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180
ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420
gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540
tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720
cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780
ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840
attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900
gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960
aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020
atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260
ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320
agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380
cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440
aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500
tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560
tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620
ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680
caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740
caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800
tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860
acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920
cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980
tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040
ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100
tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160
gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220
gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280
ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340
ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400
cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460
agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520
agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580
cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640
tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700
aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760
cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820
tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880
cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940
aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000
tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060
gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120
ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180
gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240
tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300
aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360
gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420
gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480
cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540
ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600
cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660
tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720
ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780
cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840
gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900
tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960
acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020
aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080
ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140
ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200
tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260
tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320
tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380
cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440
tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500
aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560
gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620
cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680
ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740
cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800
tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860
cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920
gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980
actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040
gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100
gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160
tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220
ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280
tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340
ctcgaaactt gatcatgtgt gccagagcga ggtagataag tctgagatcc gccttgtcgg 5400
tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460
cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520
ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580
agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640
gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700
ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760
tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820
agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880
cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940
gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000
tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060
gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120
ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180
tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240
acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300
agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360
gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420
gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480
gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540
ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600
tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660
acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720
atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780
gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840
aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900
atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960
cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020
ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080
gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140
cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200
aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260
gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320
agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380
ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440
cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500
atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560
atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620
gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680
ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740
tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800
tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860
gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920
cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980
acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040
ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100
cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160
tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220
gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcaacaacc 8280
agcgctcagc cagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340
caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400
cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460
agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520
gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580
ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640
attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700
tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760
ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820
aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880
gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940
tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000
tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060
cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120
caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180
tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240
actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300
tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360
tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420
actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480
acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540
ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600
tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660
ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720
catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780
cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840
gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900
cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960
gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020
agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080
attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140
aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200
accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260
ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320
ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380
ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440
tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500
agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560
ctcctgcat 10569
<210> 115
<211> 10569
<212> DNA
<213> Artificial sequence
<220>
<223> pRF861-nacETsite1 plasmid
<400> 115
ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60
tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120
tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180
ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420
gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540
tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720
cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780
ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840
attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900
gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960
aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020
atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260
ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320
agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380
cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440
aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500
tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560
tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620
ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680
caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740
caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800
tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860
acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920
cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980
tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040
ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100
tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160
gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220
gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280
ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340
ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400
cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460
agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520
agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580
cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640
tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700
aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760
cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820
tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880
cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940
aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000
tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060
gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120
ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180
gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240
tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300
aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360
gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420
gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480
cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540
ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600
cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660
tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720
ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780
cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840
gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900
tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960
acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020
aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080
ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140
ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200
tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260
tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320
tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380
cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440
tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500
aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560
gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620
cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680
ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740
cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800
tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860
cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920
gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980
actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040
gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100
gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160
tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220
ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280
tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340
ctcgaaactt gatcatgtgt gccagagcga gatggataag tctgagatcc gccttgtcgg 5400
tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460
cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520
ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580
agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640
gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700
ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760
tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820
agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880
cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940
gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000
tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060
gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120
ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180
tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240
acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300
agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360
gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420
gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480
gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540
ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600
tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660
acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720
atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780
gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840
aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900
atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960
cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020
ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080
gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140
cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200
aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260
gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320
agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380
ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440
cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500
atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560
atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620
gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680
ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740
tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800
tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860
gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920
cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980
acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040
ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100
cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160
tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220
gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcatatgca 8280
atacttcagc agccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340
caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400
cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460
agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520
gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580
ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640
attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700
tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760
ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820
aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880
gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940
tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000
tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060
cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120
caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180
tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240
actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300
tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360
tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420
actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480
acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540
ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600
tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660
ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720
catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780
cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840
gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900
cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960
gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020
agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080
attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140
aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200
accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260
ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320
ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380
ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440
tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500
agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560
ctcctgcat 10569
<210> 116
<211> 10569
<212> DNA
<213> Artificial sequence
<220>
<223> pRF861-nacETsite2 plasmid
<400> 116
ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60
tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120
tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180
ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420
gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540
tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720
cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780
ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840
attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900
gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960
aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020
atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260
ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320
agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380
cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440
aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500
tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560
tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620
ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680
caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740
caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800
tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860
acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920
cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980
tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040
ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100
tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160
gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220
gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280
ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340
ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400
cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460
agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520
agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580
cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640
tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700
aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760
cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820
tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880
cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940
aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000
tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060
gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120
ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180
gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240
tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300
aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360
gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420
gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480
cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540
ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600
cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660
tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720
ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780
cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840
gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900
tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960
acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020
aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080
ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140
ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200
tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260
tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320
tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380
cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440
tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500
aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560
gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620
cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680
ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740
cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800
tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860
cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920
gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980
actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040
gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100
gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160
tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220
ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280
tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340
ctcgaaactt gatcatgtgt gccagagcga gatggataag tctgagatcc gccttgtcgg 5400
tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460
cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520
ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580
agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640
gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700
ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760
tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820
agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880
cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940
gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000
tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060
gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120
ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180
tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240
acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300
agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360
gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420
gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480
gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540
ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600
tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660
acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720
atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780
gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840
aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900
atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960
cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020
ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080
gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140
cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200
aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260
gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320
agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380
ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440
cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500
atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560
atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620
gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680
ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740
tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800
tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860
gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920
cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980
acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040
ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100
cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160
tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220
gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcaacaacc 8280
agcgctcagc cagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340
caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400
cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460
agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520
gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580
ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640
attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700
tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760
ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820
aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880
gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940
tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000
tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060
cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120
caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180
tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240
actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300
tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360
tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420
actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480
acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540
ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600
tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660
ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720
catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780
cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840
gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900
cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960
gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020
agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080
attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140
aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200
accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260
ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320
ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380
ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440
tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500
agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560
ctcctgcat 10569
<210> 117
<211> 1958
<212> DNA
<213> E. coli
<400> 117
caatgtcgca atttcctgtg gcgtcccctg gattagctcg agccgaacct ccgggaaaag 60
ttcgcgaaaa gctttaatga cctctggcaa gctataacgt gcctgagtat gcgtcgttgc 120
aatagtgaga acgccagacg tatcgttggt aaacaggtct gcaagccgac gaacattact 180
ggcttcattc agaatacgtt ctgcaatgac cagtaatgct ttgcccggtt cagtcatgcc 240
cagcagtcgc ttacctcgtc gaacaaatat ttcgatgcca agttcatcct ccagttcccg 300
aatatgacgg ctgacgcctg actgtgaggt aaaaagcata ttcgcaacct ctgtcaggtt 360
gtaatcctga cgtgcagcct cgcggattat ctttagttgt tggaaattca cggtaaactc 420
cgggcagttc agatttcccg ttattgttaa agtctaatgc ccggcataac aaataataaa 480
aacccgcatc ttattccatc ccgatataac acttagctca ccaattgcca ctgccttttt 540
tccatcactg gagaactaat cactgacatt aacaactctt tcactgcctg tgcctgtggc 600
gataagttcg ctctggcggg taaatttaat gacaaagaga gactcatgga aggagtggta 660
atgcgtgaca tccacccatt tactgcgcca cataacgaac gcgcggccga ttcgggtaat 720
actgcaacgc ccatgccgct ggcaatcgct gcggtaagcg tggcaataga ctcaatttca 780
ccaataactt ttgccgtgag tcgccgtagg gaaaaagcct catcaacacg aagtctaata 840
gcactgtaat cactggggag aaagaggttc atttgcgcaa tagcattcac atcaacgctt 900
tgccccgggc aatcttgagt tcctaccaga aaaagatctt ctttcagcaa agcctgactg 960
gatacaccag ccacagggga atgctcataa atcaccgcca tatcgagttg gtgatttatc 1020
aatttttcgt taagcactgc accactattt tcatgaagat agataacgat ctccggaaat 1080
tcagcgcgaa ccgcctgtaa taagggcatg gtgatggatg acgcagcggt tcctggtgca 1140
aagccaatcg agacttgccc cgataatgcc tgaccaacgt tatgcaccgc cagttgggcc 1200
tgttcacact gacgtaaaat ggcccgcgca tgggtataga gaatttttcc ggcgtctgtt 1260
ggtgtaacgc cccgctttgt acggatcaaa agttgttgat ttaactcacc ttccagtgtg 1320
gcaacctgct ggctgagcgc tggttgtgcg atatgcaata cttcagcagc ctgggtcagg 1380
ctaccaatat ctacaatttt tacgaagtat ttcaggcgtc tgaagttcat gttgcctccg 1440
gtttttaaga atcggcccaa gtgccgccat tacttacaac cagattgcaa gatgcttgcc 1500
agttttattt tggtgttgat gtacaagcta accaactgtc aaataagaga ttatgataga 1560
ttcgtcattt gctcctttaa tcagctgtcg cgttcccctg ccctataaaa ggagggtatg 1620
caccacgatg gttcattacc caataagatt gaaagctcac cactttgttg aaattgacag 1680
caaacaaaca aaaaaatgca tttcaccctt tgacatcacc atgcactgcc attaatatgc 1740
gccccgttca cacgattcct ctgtagttca gtcggtagaa cggcggactg ttaatccgta 1800
tgtcactggt tcgagtccag tcagaggagc caaattcaaa aaagcctgct ttctagcagg 1860
ctttttgctt tctaattacc aacgctctta aaacatctgt cttgaaccag aactaatttg 1920
cacaggcatt cccgatcgac gttgcaacgc agcatttg 1958
<210> 118
<211> 1058
<212> DNA
<213> artificial sequence
<220>
<223> edited nac locus
<400> 118
caatgtcgca atttcctgtg gcgtcccctg gattagctcg agccgaacct ccgggaaaag 60
ttcgcgaaaa gctttaatga cctctggcaa gctataacgt gcctgagtat gcgtcgttgc 120
aatagtgaga acgccagacg tatcgttggt aaacaggtct gcaagccgac gaacattact 180
ggcttcattc agaatacgtt ctgcaatgac cagtaatgct ttgcccggtt cagtcatgcc 240
cagcagtcgc ttacctcgtc gaacaaatat ttcgatgcca agttcatcct ccagttcccg 300
aatatgacgg ctgacgcctg actgtgaggt aaaaagcata ttcgcaacct ctgtcaggtt 360
gtaatcctga cgtgcagcct cgcggattat ctttagttgt tggaaattca cggtaaactc 420
cgggcagttc agatttcccg ttattgttaa agtctaatgc ccggcataac aaataataaa 480
aacccgcatc ttattccatc ccgatataac acttagctca cgaagttcat gttgcctccg 540
gtttttaaga atcggcccaa gtgccgccat tacttacaac cagattgcaa gatgcttgcc 600
agttttattt tggtgttgat gtacaagcta accaactgtc aaataagaga ttatgataga 660
ttcgtcattt gctcctttaa tcagctgtcg cgttcccctg ccctataaaa ggagggtatg 720
caccacgatg gttcattacc caataagatt gaaagctcac cactttgttg aaattgacag 780
caaacaaaca aaaaaatgca tttcaccctt tgacatcacc atgcactgcc attaatatgc 840
gccccgttca cacgattcct ctgtagttca gtcggtagaa cggcggactg ttaatccgta 900
tgtcactggt tcgagtccag tcagaggagc caaattcaaa aaagcctgct ttctagcagg 960
ctttttgctt tctaattacc aacgctctta aaacatctgt cttgaaccag aactaatttg 1020
cacaggcatt cccgatcgac gttgcaacgc agcatttg 1058
<210> 119
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 119
caatgtcgca atttcctgtg 20
<210> 120
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 120
caaatgctgc gttgcaacg 19
<210> 121
<211> 4104
<212> DNA
<213> Streptococcus pyogenes
<400> 121
atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60
ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120
cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180
gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240
tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300
ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360
aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420
aagttggttg atagtacgga caaagcggat ctgcgtttaa tctatcttgc gttagcgcac 480
atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540
gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600
attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660
cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720
ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780
gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840
cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900
ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960
atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020
caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080
ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140
gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200
aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260
gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320
gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380
cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440
gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500
aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560
tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620
agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680
gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740
tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800
ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860
ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920
cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980
cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040
gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100
tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160
cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220
gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280
atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340
atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400
gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460
gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520
attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580
gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640
aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700
actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760
ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820
acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880
aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940
tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000
taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060
atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120
aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180
cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240
gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300
caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360
gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420
tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480
aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540
tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600
tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660
cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720
cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780
cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840
atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900
ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960
ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020
gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080
gatctttcac agctgggcgg agac 4104
<210> 122
<211> 4104
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155H DNA
<400> 122
atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60
ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120
cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180
gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240
tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300
ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360
aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420
aagttggttg atagtacgga caaagcggat ctgcgtttaa tccatcttgc gttagcgcac 480
atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540
gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600
attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660
cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720
ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780
gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840
cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900
ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960
atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020
caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080
ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140
gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200
aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260
gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320
gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380
cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440
gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500
aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560
tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620
agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680
gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740
tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800
ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860
ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920
cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980
cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040
gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100
tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160
cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220
gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280
atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340
atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400
gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460
gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520
attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580
gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640
aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700
actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760
ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820
acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880
aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940
tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000
taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060
atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120
aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180
cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240
gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300
caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360
gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420
tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480
aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540
tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600
tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660
cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720
cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780
cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840
atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900
ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960
ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020
gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080
gatctttcac agctgggcgg agac 4104
<210> 123
<211> 1368
<212> PRT
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155N variant
<400> 123
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Asn Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 124
<211> 4104
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155N
<400> 124
atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60
ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120
cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180
gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240
tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300
ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360
aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420
aagttggttg atagtacgga caaagcggat ctgcgtttaa tcaatcttgc gttagcgcac 480
atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540
gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600
attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660
cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720
ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780
gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840
cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900
ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960
atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020
caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080
ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140
gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200
aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260
gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320
gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380
cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440
gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500
aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560
tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620
agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680
gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740
tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800
ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860
ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920
cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980
cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040
gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100
tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160
cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220
gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280
atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340
atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400
gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460
gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520
attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580
gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640
aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700
actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760
ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820
acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880
aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940
tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000
taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060
atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120
aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180
cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240
gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300
caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360
gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420
tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480
aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540
tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600
tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660
cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720
cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780
cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840
atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900
ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960
ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020
gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080
gatctttcac agctgggcgg agac 4104
<210> 125
<211> 1368
<212> PRT
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155E
<400> 125
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Glu Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 126
<211> 4104
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155E
<400> 126
atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60
ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120
cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180
gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240
tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300
ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360
aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420
aagttggttg atagtacgga caaagcggat ctgcgtttaa tcgagcttgc gttagcgcac 480
atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540
gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600
attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660
cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720
ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780
gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840
cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900
ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960
atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020
caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080
ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140
gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200
aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260
gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320
gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380
cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440
gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500
aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560
tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620
agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680
gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740
tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800
ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860
ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920
cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980
cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040
gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100
tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160
cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220
gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280
atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340
atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400
gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460
gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520
attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580
gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640
aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700
actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760
ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820
acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880
aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940
tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000
taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060
atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120
aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180
cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240
gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300
caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360
gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420
tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480
aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540
tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600
tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660
cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720
cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780
cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840
atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900
ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960
ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020
gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080
gatctttcac agctgggcgg agac 4104
<210> 127
<211> 1368
<212> PRT
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155F
<400> 127
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Phe Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 128
<211> 4104
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized Cas9 Y155F
<400> 128
atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60
ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120
cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180
gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240
tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300
ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360
aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420
aagttggttg atagtacgga caaagcggat ctgcgtttaa tctttcttgc gttagcgcac 480
atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540
gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600
attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660
cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720
ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780
gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840
cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900
ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960
atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020
caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080
ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140
gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200
aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260
gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320
gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380
cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440
gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500
aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560
tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620
agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680
gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740
tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800
ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860
ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920
cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980
cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040
gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100
tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160
cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220
gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280
atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340
atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400
gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460
gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520
attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580
gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640
aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700
actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760
ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820
acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880
aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940
tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000
taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060
atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120
aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180
cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240
gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300
caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360
gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420
tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480
aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540
tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600
tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660
cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720
cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780
cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840
atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900
ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960
ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020
gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080
gatctttcac agctgggcgg agac 4104
<210> 129
<211> 1368
<212> PRT
<213> Artificial sequence
<220>
<223> synthesized Cas9 F86A F98A variant
<400> 129
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Ala Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Ala Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile His Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 130
<211> 498
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized F86A F98A synthetic fragment
<400> 130
cacgtcgtaa aaatcgtatt tgctacttac aggaaattgc gtctaacgaa atggccaagg 60
tagatgatag tgcgttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 120
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 180
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 240
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 300
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 360
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 420
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 480
agaaaaatgg tctgtttg 498
<210> 131
<211> 9266
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF801 backbone for F86A-F98A
<400> 131
aaagaaaaat ggtctgtttg gtaatctgat tgccctcagt ctggggctta ccccgaactt 60
caaatccaat tttgacctgg ctgaggacgc aaagctgcag ctgagcaaag atacttatga 120
tgatgacctc gacaatctgc tcgcccagat tggtgaccaa tatgcggatc tgtttctggc 180
agcgaagaat ctttcggatg ctatcttgct gtcggatatt ctgcgtgtta ataccgaaat 240
caccaaagcg cctctgtctg caagtatgat caagagatac gacgagcacc accaggacct 300
gactcttctt aaggcactgg tacgccaaca gcttccggag aaatacaaag aaatattctt 360
cgaccagtcc aagaatggtt acgcgggcta catcgatggt ggtgcatcac aggaagagtt 420
ctataaattt attaaaccaa tccttgagaa aatggatggc acggaagagt tacttgttaa 480
acttaaccgc gaagacttgc ttagaaagca acgtacattc gacaacggct ccatcccaca 540
ccagattcat ttaggtgaac ttcacgccat cttgcgcaga caagaagatt tctatccctt 600
cttaaaagac aatcgggaga aaatcgagaa gatcctgacg ttccgcattc cctattatgt 660
cggtcccctg gcacgtggta attctcggtt tgcctggatg acgcgcaaaa gtgaggaaac 720
catcacccct tggaactttg aagaagtcgt ggataaaggt gctagcgcgc agtcttttat 780
agaaagaatg acgaacttcg ataaaaactt gcccaacgaa aaagtcctgc ccaagcactc 840
tcttttatat gagtacttta ctgtgtacaa cgaactgact aaagtgaaat acgttacgga 900
aggtatgcgc aaacctgcct ttcttagtgg cgagcagaaa aaagcaattg tcgatcttct 960
ctttaaaacg aatcgcaagg taactgtaaa acagctgaag gaagattatt tcaaaaagat 1020
cgaatgcttt gattctgtcg agatctcggg tgtcgaagat cgtttcaacg cttccttagg 1080
gacctatcat gatttgctga agataataaa agacaaagac tttctcgaca atgaagaaaa 1140
tgaagatatt ctggaggata ttgttttgac cttgacctta ttcgaagata gagagatgat 1200
cgaggagcgc ttaaaaacct atgcccacct gtttgatgac aaagtcatga agcaattaaa 1260
gcgccgcaga tatacggggt ggggccgctt gagccgcaag ttgattaacg gtattagaga 1320
caagcagagc ggaaaaacta tcctggattt cctcaaatct gacggatttg cgaaccgcaa 1380
ttttatgcag cttatacatg atgattcgct tacattcaaa gaggatattc agaaggctca 1440
ggtgtctggg caaggtgatt cactccacga acatatagca aatttggccg gctctcctgc 1500
gattaagaag gggatcctgc aaacagttaa agttgtggat gaacttgtaa aagtaatggg 1560
ccgccacaag ccggagaata tcgtgataga aatggcgcgc gagaatcaaa cgacacaaaa 1620
aggtcaaaag aactcaagag agagaatgaa gcgcattgag gaggggataa aggaacttgg 1680
atctcaaatt ctgaaagaac atccagttga aaacactcag ctgcaaaatg aaaaattgta 1740
cctgtactac ctgcagaatg gaagagacat gtacgtggat caggaattgg atatcaatag 1800
actctcggac tatgacgtag atcacattgt ccctcagagc ttcctcaagg atgattctat 1860
agataataaa gtacttacga gatcggacaa aaatcgcggt aaatcggata acgtcccatc 1920
ggaggaagtc gttaaaaaga tgaaaaacta ttggcgtcaa ctgctgaacg ccaagctgat 1980
cacacagcgt aagtttgata atctgactaa agccgaacgc ggtggtctta gtgaactcga 2040
taaagcagga tttataaaac ggcagttagt agaaacgcgc caaattacga aacacgtggc 2100
tcagatcctc gattctagaa tgaatacaaa gtacgatgaa aacgataaac tgatccgtga 2160
agtaaaagtc attaccttaa aatctaaact tgtgtccgat ttccgcaaag attttcagtt 2220
ttacaaggtc cgggaaatca ataactatca ccatgcacat gatgcatatt taaatgcggt 2280
tgtaggcacg gcccttatta agaaataccc taaactcgaa agtgagtttg tttatgggga 2340
ttataaagtg tatgacgttc gcaaaatgat cgcgaaatca gaacaggaaa tcggtaaggc 2400
taccgctaaa tacttttttt attccaacat tatgaatttt tttaagaccg aaataactct 2460
cgcgaatggt gaaatccgta aacggcctct tatagaaacc aatggtgaaa cgggagaaat 2520
cgtttgggat aaaggtcgtg actttgccac cgttcgtaaa gtcctctcaa tgccgcaagt 2580
taacattgtc aagaagacgg aagttcaaac agggggattc tccaaagaat ctatcctgcc 2640
gaagcgtaac agtgataaac ttattgccag aaaaaaagat tgggatccaa aaaaatacgg 2700
aggctttgat tcccctaccg tcgcgtatag tgtgctggtg gttgctaaag tcgagaaagg 2760
gaaaagcaag aaattgaaat cagttaaaga actgctgggt attacaatta tggaaagatc 2820
gtcctttgag aaaaatccga tcgacttttt agaggccaag gggtataagg aagtgaaaaa 2880
agatctcatc atcaaattac cgaagtatag tctttttgag ctggaaaacg gcagaaaaag 2940
aatgctggcc tccgcgggcg agttacagaa gggaaatgag ctggcgctgc cttccaaata 3000
tgttaatttt ctgtaccttg ccagtcatta tgagaaactg aagggcagcc ccgaagataa 3060
cgaacagaaa caattattcg tggaacagca taagcactat ttagatgaaa ttatagagca 3120
aattagtgaa ttttctaagc gcgttatcct cgcggatgct aatttagaca aagtactgtc 3180
agcttataat aaacatcggg ataagccgat tagagaacag gccgaaaata tcattcattt 3240
gtttacctta accaaccttg gagcaccagc tgccttcaaa tatttcgata ccacaattga 3300
tcgtaaacgg tatacaagta caaaagaagt cttggacgca accctcattc atcaatctat 3360
tactggatta tatgagacac gcattgatct ttcacagctg ggcggagaca agaagaaaaa 3420
actgaaactg caccatcatc accatcatca tcaccatcat tgataactcg agaaagctta 3480
cataaaaaac cggccttggc cccgccggtt ttttattatt tttcttcctc cgcatgttca 3540
atccgctcca taatcgacgg atggctccct ctgaaaattt taacgagaaa cggcgggttg 3600
acccggctca gtcccgtaac ggccaagtcc tgaaacgtct caatcgccgc ttcccggttt 3660
ccggtcagct caatgccgta acggtcggcg gcgttttcct gataccggga gacggcattc 3720
gtaatcgggt gaagtggtca agacctcact aggcacctta aaaatagcgc accctgaaga 3780
agatttattt gaggtagccc ttgcctacct agcttccaag aaagatatcc taacagcaca 3840
agagcggaaa gatgttttgt tctacatcca gaacaacctc tgctaaaatt cctgaaaaat 3900
tttgcaaaaa gttgttgact ttatctacaa ggtgtggcat aatgtgtgga ctcgacttcg 3960
aatacatcca gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 4020
ttgaaaaagt ggcaccgagt cggtgcgact cctgttgata gatccagtaa tgacctcaga 4080
actccatctg gatttgttca gaacgctcgg ttgccgccgg gcgtttttta ttggtgagaa 4140
tgtcgacctc gagagttacg ctagggataa cagggtaata taggagctcc agtcggctta 4200
aaccagtttt cgctggtgcg aaaaaagagt gtcttgtgac acctaaattc aaaatctatc 4260
ggtcagattt ataccgattt gattttatat attcttgaat aacatacgcc gagttatcac 4320
ataaaagcgg gaaccaatca taaaatttaa acttcattgc ataatccatt aaactcttaa 4380
attctacgat tccttgttca tcaataaact caatcatttc tttaattaat ttatatctat 4440
ctgttgttgt tttctttaat aattcattaa catctacacc gccataaact atcatatctt 4500
ctttttgata tttaaattta ttaggatcgt ccatgtgaag catatatctc acaagacctt 4560
tcacacttcc tgcaatctgc ggaatagtcg cattcaattc ttctgttaat tatttttatc 4620
tgttcataag atttattacc ctcatacatc actagaatat gataatgctc ttttttcatc 4680
ctaccttctg tatcagtatc cctatcatgt aatggagaca ctacaaattg aatgtgtaac 4740
tcttttaaat actctaacca ctcggctttt gctgattctg gatataaaac aaatgtccaa 4800
ttacgtcctc ttgaattttt cttgttttca gtttctttta ttacattttc gctcatgata 4860
taataacggt gctaatacac ttaacaaaat ttagtcatag ataggcagca tgccagtgct 4920
gtctatcttt ttttgtttaa aatgcaccgt attcctcctt tgcatatttt tttattagaa 4980
taccggttgc atctgatttg ctaatattat atttttcttt gattctattt aatatctcat 5040
tttcttctgt tgtaagtctt aaagtaacag caactttttt ctcttctttt ctatctacaa 5100
ctatcactgt acctcccaac atctgttttt ttcactttaa cataaaaaac aaccttttaa 5160
cattaaaaac ccaatattta tttatttgtt tggacaatgg acactggaca cctagggggg 5220
aggtcgtagt acccccctat gttttctccc ctaaataacc ccaaaaatct aagaaaaaaa 5280
gacctcaaaa aggtctttaa ttaacatctc aaatttcgca tttattccaa tttccttttt 5340
gcgtgtgatg cgagctcatc ggctccgtcg atactatgtt atacgccaac tttcaaaaca 5400
actttgaaaa agctgttttc tggtatttaa ggttttagaa tgcaaggaac agtgaattgg 5460
agttcgtctt gttataatta gcttcttggg gtatctttaa atactgtaga aaagaggaag 5520
gaaataataa atggctaaaa tgagaatatc accggaattg aaaaaactga tcgaaaaata 5580
ccgctgcgta aaagatacgg aaggaatgtc tcctgctaag gtatataagc tggtgggaga 5640
aaatgaaaac ctatatttaa aaatgacgga cagccggtat aaagggacca cctatgatgt 5700
ggaacgggaa aaggacatga tgctatggct ggaaggaaag ctgcctgttc caaaggtcct 5760
gcactttgaa cggcatgatg gctggagcaa tctgctcatg agtgaggccg atggcgtcct 5820
ttgctcggaa gagtatgaag atgaacaaag ccctgaaaag attatcgagc tgtatgcgga 5880
gtgcatcagg ctctttcact ccatcgacat atcggattgt ccctatacga atagcttaga 5940
cagccgctta gccgaattgg attacttact gaataacgat ctggccgatg tggattgcga 6000
aaactgggaa gaagacactc catttaaaga tccgcgcgag ctgtatgatt ttttaaagac 6060
ggaaaagccc gaagaggaac ttgtcttttc ccacggcgac ctgggagaca gcaacatctt 6120
tgtgaaagat ggcaaagtaa gtggctttat tgatcttggg agaagcggca gggcggacaa 6180
gtggtatgac attgccttct gcgtccggtc gatcagggag gatatcgggg aagaacagta 6240
tgtcgagcta ttttttgact tactggggat caagcctgat tgggagaaaa taaaatatta 6300
tattttactg gatgaattgt tttagtgact gcagtgagat ctggtaatga ctctctagct 6360
tgaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 6420
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gctctagcta agcagaaggc 6480
catcctgacg gatggccttt ttgcgtttct acaaactctt gttaactcta gagctgcctg 6540
ccgcgtttcg gtgatgaaga tcttcccgat gattaattaa ttcagaacgc tcggttgccg 6600
ccgggcgttt tttatgaagc ttcgttgctg gcgtttttcc ataggctccg cccccctgac 6660
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 6720
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 6780
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 6840
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 6900
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 6960
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 7020
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 7080
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 7140
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 7200
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 7260
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 7320
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 7380
acttggtctg acaaatggtt ctttcccctg tcctaaacaa aaaacccgct ttattgaaaa 7440
agcggggctg ttttacagac aggtcaaata aacgtttgaa aatgttcatt tcaaaacgcg 7500
cggaacctcc atcttctccc atccagacta tactgtcggc ttcggaatcg caccgaatcc 7560
tgcccataaa aaggctcgcg ggcttagagc gcttgctcat caccgccggt agggaatttc 7620
accctgcccc gaagattgat cttatttatt tttaatactg atattattat aaattaattg 7680
tgaaaaaatg tacaggtgca aagcttattg cgctgttttg ggacatcctg cacgatattt 7740
cggtaaactc actttttccg catactaaaa accgcacatt cacagttatt tcatttttaa 7800
ttttcgtctt tccgcgtgaa actcattgac actctttatg gaatatggta aattatcaga 7860
tatttatgac gcttatttag gaggaaatct tacacagaag ctgcggaacc tgaaaagaat 7920
tcctttcagg ttccgttttt tttaggaatt ctccctgatc tcaagcatct ggcggggata 7980
aatccgctct cctttcaaat cgttccattc tttgaggcgc tgtacagtta cgcccatttt 8040
ttcggcgata tgatgaagcg tatccccttt ccgcactaca tatgtaccgg tcttcgattc 8100
atcgtcatga aggcggagtg tttggccggc cttgagattt gaatgtttca acccgtttat 8160
tctcatgatc tcctcgatgg atataccgct atccttgctg attctccaga gcgtgtcccc 8220
tttttgaacg gtcaccgcac cgctcattgt cccggcgttt tgataaacgt ggatagaatt 8280
ttgccggaac gcctcctcac gaagcaccgt cagcggattg attgcatatc ttttatcttc 8340
agtccatgaa ccgtgatgca tttcaaaatg caggtgggtt ccggtcgata ttcgaattcc 8400
tccattttct tctgctatca aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa 8460
agcctctgcc ccttgcaaat cggatgcctg tctataaaat tcccgatatt ggttaaacag 8520
cggcgcaatg gcggccgcat ctgatgtctt tgcttggcga atgttcatct tatttcttcc 8580
tccctctcaa taattttttc attctatccc ttttctgtaa agtttatttt tcagaatact 8640
tttatcatca tgctttgaaa aaatatcacg ataatatcca ttgttctcac ggaagcacac 8700
gcaggtcatt tgaacgaatt ttttcgacag gaatttgccg ggactcagga gcatttaacc 8760
taaaaaagca tgacatttca gcataatgaa catttactca tgtctatttt cgttcttttc 8820
tgtatgaaaa tagttatttc gagtctctac ggaaatagcg agagatgata tacctaaata 8880
gagataaaat catctcaaaa aaatgggtct actaaaatat tattccatct attacaataa 8940
attcacagaa tagtctttta agtaagtcta ctctgaattt ttttaaaagg agagggtaac 9000
tagtggcccc aaaaaagaaa cgcaaggtta tggataaaaa atacagcatt ggtctggata 9060
tcggaaccaa cagcgttggg tgggcagtaa taacagatga atacaaagtg ccgtcaaaaa 9120
aatttaaggt tctggggaat acagatcgcc acagcataaa aaagaatctg attggggcat 9180
tgctgtttga ttcgggtgag acagctgagg ccacgcgtct gaaacgtaca gcaagaagac 9240
gttacacacg tcgtaaaaat cgtatt 9266
<210> 132
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer pRF801 backbone forward
<400> 132
aaagaaaaat ggtctgtttg 20
<210> 133
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer pRF801 backbone reverse
<400> 133
aatacgattt ttacgacgtg 20
<210> 134
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer F86A F98A synthetic forward
<400> 134
cacgtcgtaa aaatcgtatt 20
<210> 135
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer F86A F98A synthetic reverse
<400> 135
caaacagacc atttttcttt 20
<210> 136
<211> 9724
<212> DNA
<213> Artificial sequence
<220>
<223> plasmid pRF866
<400> 136
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240
tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720
gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780
ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840
taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900
ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960
aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020
actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080
tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140
tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200
caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260
ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320
gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380
atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440
gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500
aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560
gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620
tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaattgc gtctaacgaa atggccaagg 5580
tagatgatag tgcgttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 137
<211> 5042
<212> DNA
<213> Artificial sequence
<220>
<223> Bacillus F86A-F98A expression cassette
<400> 137
attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60
aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120
aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180
cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240
atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300
cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360
taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420
ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480
aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540
aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600
gtaactagtg gccccaaaaa agaaacgcaa ggttatggat aaaaaataca gcattggtct 660
ggatatcgga accaacagcg ttgggtgggc agtaataaca gatgaataca aagtgccgtc 720
aaaaaaattt aaggttctgg ggaatacaga tcgccacagc ataaaaaaga atctgattgg 780
ggcattgctg tttgattcgg gtgagacagc tgaggccacg cgtctgaaac gtacagcaag 840
aagacgttac acacgtcgta aaaatcgtat ttgctactta caggaaattg cgtctaacga 900
aatggccaag gtagatgata gtgcgttcca tcgtctcgaa gaatcttttc tggttgagga 960
agataaaaaa cacgaacgtc accctatctt tggcaatatc gtggatgaag tggcctatca 1020
tgaaaaatac cctacgattt atcatcttcg caagaagttg gttgatagta cggacaaagc 1080
ggatctgcgt ttaatccatc ttgcgttagc gcacatgatc aaatttcgtg gtcatttctt 1140
aattgaaggt gatctgaatc ctgataactc tgatgtggac aaattgttta tacaattagt 1200
gcaaacctat aatcagctgt tcgaggaaaa ccccattaat gcctctggag ttgatgccaa 1260
agcgatttta agcgcgagac tttctaagtc ccggcgtctg gagaatctga tcgcccagtt 1320
accaggggaa aagaaaaatg gtctgtttgg taatctgatt gccctcagtc tggggcttac 1380
cccgaacttc aaatccaatt ttgacctggc tgaggacgca aagctgcagc tgagcaaaga 1440
tacttatgat gatgacctcg acaatctgct cgcccagatt ggtgaccaat atgcggatct 1500
gtttctggca gcgaagaatc tttcggatgc tatcttgctg tcggatattc tgcgtgttaa 1560
taccgaaatc accaaagcgc ctctgtctgc aagtatgatc aagagatacg acgagcacca 1620
ccaggacctg actcttctta aggcactggt acgccaacag cttccggaga aatacaaaga 1680
aatattcttc gaccagtcca agaatggtta cgcgggctac atcgatggtg gtgcatcaca 1740
ggaagagttc tataaattta ttaaaccaat ccttgagaaa atggatggca cggaagagtt 1800
acttgttaaa cttaaccgcg aagacttgct tagaaagcaa cgtacattcg acaacggctc 1860
catcccacac cagattcatt taggtgaact tcacgccatc ttgcgcagac aagaagattt 1920
ctatcccttc ttaaaagaca atcgggagaa aatcgagaag atcctgacgt tccgcattcc 1980
ctattatgtc ggtcccctgg cacgtggtaa ttctcggttt gcctggatga cgcgcaaaag 2040
tgaggaaacc atcacccctt ggaactttga agaagtcgtg gataaaggtg ctagcgcgca 2100
gtcttttata gaaagaatga cgaacttcga taaaaacttg cccaacgaaa aagtcctgcc 2160
caagcactct cttttatatg agtactttac tgtgtacaac gaactgacta aagtgaaata 2220
cgttacggaa ggtatgcgca aacctgcctt tcttagtggc gagcagaaaa aagcaattgt 2280
cgatcttctc tttaaaacga atcgcaaggt aactgtaaaa cagctgaagg aagattattt 2340
caaaaagatc gaatgctttg attctgtcga gatctcgggt gtcgaagatc gtttcaacgc 2400
ttccttaggg acctatcatg atttgctgaa gataataaaa gacaaagact ttctcgacaa 2460
tgaagaaaat gaagatattc tggaggatat tgttttgacc ttgaccttat tcgaagatag 2520
agagatgatc gaggagcgct taaaaaccta tgcccacctg tttgatgaca aagtcatgaa 2580
gcaattaaag cgccgcagat atacggggtg gggccgcttg agccgcaagt tgattaacgg 2640
tattagagac aagcagagcg gaaaaactat cctggatttc ctcaaatctg acggatttgc 2700
gaaccgcaat tttatgcagc ttatacatga tgattcgctt acattcaaag aggatattca 2760
gaaggctcag gtgtctgggc aaggtgattc actccacgaa catatagcaa atttggccgg 2820
ctctcctgcg attaagaagg ggatcctgca aacagttaaa gttgtggatg aacttgtaaa 2880
agtaatgggc cgccacaagc cggagaatat cgtgatagaa atggcgcgcg agaatcaaac 2940
gacacaaaaa ggtcaaaaga actcaagaga gagaatgaag cgcattgagg aggggataaa 3000
ggaacttgga tctcaaattc tgaaagaaca tccagttgaa aacactcagc tgcaaaatga 3060
aaaattgtac ctgtactacc tgcagaatgg aagagacatg tacgtggatc aggaattgga 3120
tatcaataga ctctcggact atgacgtaga tcacattgtc cctcagagct tcctcaagga 3180
tgattctata gataataaag tacttacgag atcggacaaa aatcgcggta aatcggataa 3240
cgtcccatcg gaggaagtcg ttaaaaagat gaaaaactat tggcgtcaac tgctgaacgc 3300
caagctgatc acacagcgta agtttgataa tctgactaaa gccgaacgcg gtggtcttag 3360
tgaactcgat aaagcaggat ttataaaacg gcagttagta gaaacgcgcc aaattacgaa 3420
acacgtggct cagatcctcg attctagaat gaatacaaag tacgatgaaa acgataaact 3480
gatccgtgaa gtaaaagtca ttaccttaaa atctaaactt gtgtccgatt tccgcaaaga 3540
ttttcagttt tacaaggtcc gggaaatcaa taactatcac catgcacatg atgcatattt 3600
aaatgcggtt gtaggcacgg cccttattaa gaaataccct aaactcgaaa gtgagtttgt 3660
ttatggggat tataaagtgt atgacgttcg caaaatgatc gcgaaatcag aacaggaaat 3720
cggtaaggct accgctaaat acttttttta ttccaacatt atgaattttt ttaagaccga 3780
aataactctc gcgaatggtg aaatccgtaa acggcctctt atagaaacca atggtgaaac 3840
gggagaaatc gtttgggata aaggtcgtga ctttgccacc gttcgtaaag tcctctcaat 3900
gccgcaagtt aacattgtca agaagacgga agttcaaaca gggggattct ccaaagaatc 3960
tatcctgccg aagcgtaaca gtgataaact tattgccaga aaaaaagatt gggatccaaa 4020
aaaatacgga ggctttgatt cccctaccgt cgcgtatagt gtgctggtgg ttgctaaagt 4080
cgagaaaggg aaaagcaaga aattgaaatc agttaaagaa ctgctgggta ttacaattat 4140
ggaaagatcg tcctttgaga aaaatccgat cgacttttta gaggccaagg ggtataagga 4200
agtgaaaaaa gatctcatca tcaaattacc gaagtatagt ctttttgagc tggaaaacgg 4260
cagaaaaaga atgctggcct ccgcgggcga gttacagaag ggaaatgagc tggcgctgcc 4320
ttccaaatat gttaattttc tgtaccttgc cagtcattat gagaaactga agggcagccc 4380
cgaagataac gaacagaaac aattattcgt ggaacagcat aagcactatt tagatgaaat 4440
tatagagcaa attagtgaat tttctaagcg cgttatcctc gcggatgcta atttagacaa 4500
agtactgtca gcttataata aacatcggga taagccgatt agagaacagg ccgaaaatat 4560
cattcatttg tttaccttaa ccaaccttgg agcaccagct gccttcaaat atttcgatac 4620
cacaattgat cgtaaacggt atacaagtac aaaagaagtc ttggacgcaa ccctcattca 4680
tcaatctatt actggattat atgagacacg cattgatctt tcacagctgg gcggagacaa 4740
gaagaaaaaa ctgaaactgc accatcatca ccatcatcat caccatcatt gataaacata 4800
aaaaaccggc cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc 4860
gctccataat cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc 4920
ggctcagtcc cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg 4980
tcagctcaat gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa 5040
tc 5042
<210> 138
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 138
aaagaaatat atagagagat actcttatca atgatggtga tgatgatggt gatg 54
<210> 139
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 139
acacgtattt atttgtccaa ttaccatggc cccaaaaaag aaacgcaagg ttatggat 58
<210> 140
<211> 767
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized RNR2p promoter
<400> 140
gccaatctaa agcgttgtct tcctcgttcc tcgcgcacgc gattttgcgt tctgcatagg 60
aagccgaagt cgaacaagaa gcaggcaaag tttagagcac tgcccctccg cactcaaaaa 120
agaaaaaact aggaggaaaa taaaattctc aaccacacaa acacataaac acatacaaat 180
acaaatacaa gcttatttac ttgacatcgc gcgatcttcc actattcagc gccgtccgcc 240
ctctctcgtg ttttttgttt acgcgacaac tatgcgaaat ccggagcaac gggcaaccgt 300
ttggggaaag accacaccca cgcgcgatcg ccatggcaac gaggtcgcac acgccccaca 360
cccagacctc cctgcgagcg ggcatgggta caatgtcccc gttgccacag agaccacttc 420
gtagcacagc gcagagcgta gcgtgttgtt gctgctgaca aaagaaaatt tttcttagca 480
aagcaaagga ggggaagcac gggcagatag caccgtacca tacccttgga aactcgaaat 540
gaacgaagca ggaaatgaga gaatgagagt tttgtaggta tatatagcgg tagtgtttgc 600
gcgttaccat catcttctgg atctatctat tgttcttttc ctcatcactt tccccttttt 660
cgctcttctt cttgtctttt atttctttct tttttttaat tgttccctcg attggctatc 720
taccaaagaa tccaaactta atacacgtat ttatttgtcc aattacc 767
<210> 141
<211> 1346
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized 2-micron replication origin 1
<400> 141
aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 60
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 120
taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg agagcgctaa 180
tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgagagcgc 240
tattttacca acaaagaatc tatacttctt ttttgttcta caaaaatgca tcccgagagc 300
gctatttttc taacaaagca tcttagatta ctttttttct cctttgtgcg ctctataatg 360
cagtctcttg ataacttttt gcactgtagg tccgttaagg ttagaagaag gctactttgg 420
tgtctatttt ctcttccata aaaaaagcct gactccactt cccgcgttta ctgattacta 480
gcgaagctgc gggtgcattt tttcaagata aaggcatccc cgattatatt ctataccgat 540
gtggattgcg catactttgt gaacagaaag tgatagcgtt gatgattctt cattggtcag 600
aaaattatga acggtttctt ctattttgtc tctatatact acgtatagga aatgtttaca 660
ttttcgtatt gttttcgatt cactctatga atagttctta ctacaatttt tttgtctaaa 720
gagtaatact agagataaac ataaaaaatg tagaggtcga gtttagatgc aagttcaagg 780
agcgaaaggt ggatgggtag gttatatagg gatatagcac agagatatat agcaaagaga 840
tacttttgag caatgtttgt ggaagcggta ttcgcaatat tttagtagct cgttacagtc 900
cggtgcgttt ttggtttttt gaaagtgcgt cttcagagcg cttttggttt tcaaaagcgc 960
tctgaagttc ctatactttc tagagaatag gaacttcgga ataggaactt caaagcgttt 1020
ccgaaaacga gcgcttccga aaatgcaacg cgagctgcgc acatacagct cactgttcac 1080
gtcgcaccta tatctgcgtg ttgcctgtat atatatatac atgagaagaa cggcatagtg 1140
cgtgtttatg cttaaatgcg tacttatatg cgtctattta tgtaggatga aaggtagtct 1200
agtacctcct gtgatattat cccattccat gcggggtatc gtatgcttcc ttcagcacta 1260
ccctttagct gttctatatg ctgccactcc tcaattggat tagtctcatc cttcaatgct 1320
atcatttcct ttgatattgg atcata 1346
<210> 142
<211> 1705
<212> DNA
<213> Artificial Sequence
<220>
<223> KanMX expression cassette
<400> 142
ctagggattc ataaccattt tctcaatcga attacacaga acacaccgta caaacctctc 60
tatcataact acttaatagt cacacacgta ctcgtctaaa tacacatcat cgtcctacaa 120
gttcatcaaa gtgttggaca gacaactata ccagcatgga tctcttgtat cggttctttt 180
ctcccgctct ctcgcaataa caatgaacac tgggtcaatc atagcctaca caggtgaaca 240
gagtagcgtt tatacagggt ttatacggtg attcctacgg caaaaatttt tcatttctaa 300
aaaaaaaaag aaaaattttt ctttccaacg ctagaaggaa aagaaaaatc taattaaatt 360
gatttggtga ttttctgaga gttccctttt tcatatatcg aattttgaat ataaaaggag 420
atcgaaaaaa tttttctatt caatctgttt tctggtttta tttgatagtt tttttgtgta 480
ttattattat ggattagtac tggtttatat gggtttttct gtataacttc tttttatttt 540
agtttgttta atcttatttt gagttacatt atagttccct aactgcaaga gaagtaacat 600
taaaactcga gatgggtaag gaaaagactc acgtttcgag gccgcgatta aattccaaca 660
tggatgctga tttatatggg tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga 720
caatctatcg attgtatggg aagcccgatg cgccagagtt gtttctgaaa catggcaaag 780
gtagcgttgc caatgatgtt acagatgaga tggtcagact aaactggctg acggaattta 840
tgcctcttcc gaccatcaag cattttatcc gtactcctga tgatgcatgg ttactcacca 900
ctgcgatccc cggcaaaaca gcattccagg tattagaaga atatcctgat tcaggtgaaa 960
atattgttga tgcgctggca gtgttcctgc gccggttgca ttcgattcct gtttgtaatt 1020
gtccttttaa cagcgatcgc gtatttcgtc tggctcaggc gcaatcacga atgaataacg 1080
gtttggttga tgcgagtgat tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct 1140
ggaaagaaat gcataagctt ttgccattct caccggattc agtcgtcact catggtgatt 1200
tctcacttga taaccttatt tttgacgagg ggaaattaat aggttgtatt gatgttggac 1260
gagtcggaat cgcagaccga taccaggatc ttgccatcct atggaactgc ctcggtgagt 1320
tttctccttc attacagaaa cggctttttc aaaaatatgg tattgataat cctgatatga 1380
ataaattgca gtttcatttg atgctcgatg agtttttcta agtttaactt gatactacta 1440
gatttttctc ttcatttata aaatttttgg ttataattga agctttagaa gtatgaaaaa 1500
atcctttttt ttcattcttt gcaaccaaaa taagaagctt cttttattca ttgaaatgat 1560
gaatataaac ctaacaaaag aaaaagactc gaatatcaaa cattaaaaaa aaataaaaga 1620
ggttatctgt tttcccattt agttggagtt tgcattttct aatagataga actctcaatt 1680
aatgtggatt tagtttctct gttcg 1705
<210> 143
<211> 299
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized SNR52p promoter
<400> 143
ccctcactaa agggaacaaa agctggagct tctttgaaaa gataatgtat gattatgctt 60
tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag gtgattacat 120
gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg ggaaaggtgc 180
gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg ctgtagaagt 240
gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga taaatgatc 299
<210> 144
<211> 11555
<212> DNA
<213> Artificial Sequence
<220>
<223> pSE087 plasmid
<400> 144
gatcctctag tttctcggta ctatgcatat gatccaatat caaaggaaat gatagcattg 60
aaggatgaga ctaatccaat tgaggagtgg cagcatatag aacagctaaa gggtagtgct 120
gaaggaagca tacgataccc cgcatggaat gggataatat cacaggaggt actagactac 180
ctttcatcct acataaatag acgcatataa gtacgcattt aagcataaac acgcactatg 240
ccgttcttct catgtatata tatatacagg caacacgcag atataggtgc gacgtgaaca 300
gtgagctgta tgtgcgcagc tcgcgttgca ttttcggaag cgctcgtttt cggaaacgct 360
ttgaagttcc tattccgaag ttcctattct ctagaaagta taggaacttc agagcgcttt 420
tgaaaaccaa aagcgctctg aagacgcact ttcaaaaaac caaaaacgca ccggactgta 480
acgagctact aaaatattgc gaataccgct tccacaaaca ttgctcaaaa gtatctcttt 540
gctatatatc tctgtgctat atccctatat aacctaccca tccacctttc gctccttgaa 600
cttgcatcta aactcgacct ctacattttt tatgtttatc tctagtatta ctctttagac 660
aaaaaaattg tagtaagaac tattcataga gtgaatcgaa aacaatacga aaatgtaaac 720
atttcctata cgtagtatat agagacaaaa tagaagaaac cgttcataat tttctgacca 780
atgaagaatc atcaacgcta tcactttctg ttcacaaagt atgcgcaatc cacatcggta 840
tagaatataa tcggggatgc ctttatcttg aaaaaatgca cccgcagctt cgctagtaat 900
cagtaaacgc gggaagtgga gtcaggcttt ttttatggaa gagaaaatag acaccaaagt 960
agccttcttc taaccttaac ggacctacag tgcaaaaagt tatcaagaga ctgcattata 1020
gagcgcacaa aggagaaaaa aagtaatcta agatgctttg ttagaaaaat agcgctctcg 1080
ggatgcattt ttgtagaaca aaaaagaagt atagattctt tgttggtaaa atagcgctct 1140
cgcgttgcat ttctgttctg taaaaatgca gctcagattc tttgtttgaa aaattagcgc 1200
tctcgcgttg catttttgtt ttacaaaaat gaagcacaga ttcttcgttg gtaaaatagc 1260
gctttcgcgt tgcatttctg ttctgtaaaa atgcagctca gattctttgt ttgaaaaatt 1320
agcgctctcg cgttgcattt ttgttctaca aaatgaagca cagatgcttc gttaacaaag 1380
atatgctatt gaagtgcaag atggaaacgc agaaaatgaa ccggggatgc gacgtgcaag 1440
attacctatg caatagatgc aatagtttcg gcatgccgaa cagagaaact aaatccacat 1500
taattgagag ttctatctat tagaaaatgc aaactccaac taaatgggaa aacagataac 1560
ctcttttatt tttttttaat gtttgatatt cgagtctttt tcttttgtta ggtttatatt 1620
catcatttca atgaataaaa gaagcttctt attttggttg caaagaatga aaaaaaagga 1680
ttttttcata cttctaaagc ttcaattata accaaaaatt ttataaatga agagaaaaat 1740
ctagtagtat caagttaaac ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta 1800
ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa 1860
aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc gattccgact 1920
cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt atcaagtgag 1980
aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagcttatg catttctttc 2040
cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa 2100
ccgttattca ttcgtgattg cgcctgagcc agacgaaata cgcgatcgct gttaaaagga 2160
caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata 2220
ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttgcc ggggatcgca 2280
gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt cggaagaggc 2340
ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt ggcaacgcta 2400
cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa tcgatagatt 2460
gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa atcagcatcc 2520
atgttggaat ttaatcgcgg cctcgaaacg tgagtctttt ccttacccat ctcgagtttt 2580
aatgttactt ctcttgcagt tagggaacta taatgtaact caaaataaga ttaaacaaac 2640
taaaataaaa agaagttata cagaaaaacc catataaacc agtactaatc cataataata 2700
atacacaaaa aaactatcaa ataaaaccag aaaacagatt gaatagaaaa attttttcga 2760
tctcctttta tattcaaaat tcgatatatg aaaaagggaa ctctcagaaa atcaccaaat 2820
caatttaatt agatttttct tttccttcta gcgttggaaa gaaaaatttt tctttttttt 2880
tttagaaatg aaaaattttt gccgtaggaa tcaccgtata aaccctgtat aaacgctact 2940
ctgttcacct gtgtaggcta tgattgaccc agtgttcatt gttattgcga gagagcggga 3000
gaaaagaacc gatacaagag atccatgctg gtatagttgt ctgtccaaca ctttgatgaa 3060
cttgtaggac gatgatgtgt atttagacga gtacgtgtgt gactattaag tagttatgat 3120
agagaggttt gtacggtgtg ttctgtgtaa ttcgattgag aaaatggtta tgaatcccta 3180
gacccgggaa tctctaagta aatgcatgta tactaaactc acaaattaga gcttcaattt 3240
aattatatca gttattaccc gggttacgcc aagcgcgcaa ttaaccctca ctaaagggaa 3300
caaaagctgg agctcccctc actaaaggga acaaaagctg gagcttcttt gaaaagataa 3360
tgtatgatta tgctttcact catatttata cagaaacttg atgttttctt tcgagtatat 3420
acaaggtgat tacatgtacg tttgaagtac aactctagat tttgtagtgc cctcttgggc 3480
tagcgggaaa ggtgcgcatt ttttcacacc ctacaatgtt ctgttcaaaa gattttggtc 3540
aaacgctgta gaagtgaaag ttggtgcgca tgtttcggcg ttcgaaactt ctccgcagtg 3600
aaagataaat gatcggagac ggatacgttc tctatggagg agttttagag ctagaaatag 3660
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtggtgc 3720
tttttttctg gccgtctcta agggcccggt acccaattcg ccctatagtg agtcgtatta 3780
cgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 3840
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3900
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3960
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 4020
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 4080
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 4140
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 4200
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 4260
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 4320
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 4380
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 4440
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 4500
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 4560
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 4620
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4680
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4740
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4800
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4860
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4920
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4980
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 5040
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 5100
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 5160
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 5220
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 5280
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 5340
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 5400
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 5460
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 5520
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 5580
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 5640
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5700
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5760
aaagtgccac ctgacgtcgg cgcgccattt aaatagatcc ggtccgctcg agctgtaccg 5820
cagatgggac ctcttatgaa agtagacatc cttaagtgat gtaggggtat gtccgagtag 5880
ttcgttcaac tatttttaaa gacacatcgt tccaggttta tattcatata catatgtatg 5940
tattgtatag gtttttttat tttttatttt ttattttttt tttttttttt ttcaattttt 6000
ttaagctttt cttacttttc cgatgccctt tccactttaa tcaatatacg tatgaaattc 6060
agccgaagtt tccgtttgat aatatattag attcaatata aaaaaaagtt tatatgattc 6120
agtgtatata tatatatata aataagaggt gcgaaagccc acataaagag attgaagaga 6180
ctgcgtaaaa agaaatatat agagagatac tcttaactag acctttcttt tcttctttgg 6240
gtcggctctg gagtcgccac ccaattgaga taagtcaatt ctagtttcgt acaaaccagt 6300
aatagattga tggatcaagg tggcgtccaa gacttccttg gtagaggtgt aacgcttacg 6360
gtcaatagtg gtgtcgaagt acttgaaggc agcaggagca cccaaattgg tcaaagtgaa 6420
caagtgaatg atgttttcag cttgttctct gattggcttg tctctgtgct tgttgtaggc 6480
ggacaaaacc ttgtccaagt tagcgtcagc caaaatgact ctcttggaga actcggagat 6540
ttgttcaatg atttcgtcca agtagtgctt gtgttgttcg acgaatagtt gcttttgttc 6600
gttgtcttct ggactaccct tcaacttttc gtagtgagaa gccaagtata ggaagttaac 6660
gtacttgctt ggcaaggcca attcgttacc cttttgcaat tcaccagcgg aagccaacat 6720
tctctttcta ccgttttcca attcgaacaa tgagtacttt ggcaacttta tgatcaagtc 6780
tttcttgact tccttgtaac ccttagcttc taggaagtcg attgggttct tttcgaaaga 6840
acttctttcc atgatggtaa tacctaacaa ttccttgacg ctcttcaatt tcttagactt 6900
acccttttca accttagcga caaccaaaac gctgtaggca acggtaggag agtcgaagcc 6960
accgtatttc tttgggtccc aatctttctt tctagcgatc aacttatcag agtttctctt 7020
tggtaagata gattccttag agaagccacc agtttggact tcggttttct tgacgatgtt 7080
gacttgtggc atagacaaaa cctttctaac ggtagcgaaa tcacgaccct tgtcccaaac 7140
aatttcacct gtttcaccgt ttgtttcgat caatggtctc tttctgattt caccgttagc 7200
caaggtgatt tcggtcttaa agaagttcat aatgttagag taaaagaagt acttagcagt 7260
ggccttaccg atttcttgtt cagacttagc gatcatcttt ctgacatcgt agaccttgta 7320
atcaccgtag acaaattcag attctagctt tgggtatttc ttgattagag cggtacccac 7380
gacagcgttc aagtaagcat cgtgagcatg gtggtaattg ttgatttctc taaccttgta 7440
gaattggaag tcctttctga agtcagaaac caacttggac ttcaaagtga tgaccttgac 7500
ttctctaatc aacttatcat tttcgtcgta cttggtgttc atacgggaat ctaggatttg 7560
ggcaacgtgc ttggtgattt gtctggtttc gaccaattgt ctcttgatga agccagcctt 7620
atccaattcg gacaatccac ctctttcagc cttagttagg ttatcgaact ttctttgagt 7680
gattagctta gcgtttagca attgtctcca gtagttcttc atctttttca cgacctcttc 7740
ggatggaacg ttgtcagact tacctctgtt cttgtcggat ctggtcaaaa ccttgttgtc 7800
aatagaatcg tccttcaaga aagattgtgg gacgatgtgg tcaacgtcgt agtcggataa 7860
tctgttgata tctaattctt ggtcaacgta catatctcta ccgttttgca agtagtacaa 7920
gtataacttt tcgttttgta gttgggtgtt ttcaacgggg tgttccttca agatttgaga 7980
acccaattcc ttgataccct cttcgattct cttcattctt tctctagagt tcttttgacc 8040
cttttgtgta gtttgatttt ctctagccat ttctatgacg atgttttctg gcttgtgtct 8100
acccataacc ttaactagtt cgtctacaac cttgacagtt tgtagaatac ctttctttat 8160
ggctggggaa ccagccaagt tagcgatgtg ttcgtgcaag gaatcacctt gaccagaaac 8220
ttgagccttt tggatatctt ccttgaaggt caaagaatcg tcgtggatca attgcatgaa 8280
gtttctgttg gcgaaaccat cggacttcaa gaaatccaag atggtcttac cagattgctt 8340
gtctctgata ccgttaatca actttcttga caatctaccc caaccagtgt acctacgtct 8400
tttcaattgc ttcataacct tgtcatcaaa caagtgggcg taggtcttca atctctcttc 8460
gatcatttct ctgtcttcga acaaggttaa agttaggaca atgtcttcca aaatgtcttc 8520
gttctcttcg ttatccaaga agtccttgtc cttaatgatc tttagtaagt cgtggtaggt 8580
acccaaagaa gcgttgaatc tatcttcaac accagagatt tcaacagaat cgaaacattc 8640
gattttcttg aagtagtctt cctttagttg cttaacagtg acctttctgt ttgtcttgaa 8700
taacaagtca acgatagctt tcttttgttc gccagacaag aaggctggct ttctcatacc 8760
ttcagtaacg tacttgacct tggtcaattc gttgtaaaca gtgaagtatt cgtataacaa 8820
ggaatgcttt ggcaagacct tttcgtttgg caagtttttg tcgaagttgg tcattctttc 8880
gatgaaagat tgagcggaag cacccttatc tacgacctct tcgaaattcc aaggggtgat 8940
ggtctcttcg gactttctgg tcatccaagc gaatctggag ttacctctag ctagaggacc 9000
gacgtagtat gggattctaa aagttaggat cttttcaatc ttttctctgt tgtccttcaa 9060
gaatgggtag aagtcttctt gccttctcaa gatagcgtgt agttcaccta agtggatttg 9120
gtgtggaatg gaaccgttgt cgaaggttct ttgctttctt aacaagtctt ctctattcaa 9180
cttaactagc aactcttcgg taccgtccat cttttccaag attggcttga tgaacttgta 9240
gaactcttct tgactagctc caccgtcgat gtaaccagcg taaccgttct tagattgatc 9300
aaagaagatt tccttgtact tttcgggcaa ttgttgtcta accaaagcct tcaatagagt 9360
caagtcttga tggtgttcgt cgtatctctt aatcatggaa gcagacaatg gagccttagt 9420
gatttcagtg ttaactctca aaatgtcaga tagcaaaatg gcatcagaca agttcttggc 9480
agccaagaac aagtcagcgt attggtcacc aatttgggct aacaagttat ctaaatcgtc 9540
atcgtaagtg tccttggaca attgcaactt agcatcttca gccaaatcga agttagactt 9600
gaagtttgga gtcaaaccca aagacaaagc aatcaagtta ccgaacaaac cgtttttctt 9660
ttcacctggt aattgggcaa tcaagttttc caaacgtctg gacttggata atctagcgga 9720
caaaatggcc ttagcgtcaa caccagaggc gttgatagga ttctcttcga acaattggtt 9780
gtaagtttga accaattgga tgaacaactt atcgacgtca gagttgtctg ggttcaagtc 9840
accttcgatt aggaagtgac cacggaactt gatcatgtgg gccaaagcca agtagatcaa 9900
tctcaagtca gccttgtcgg tggagtcaac caatttcttt ctcaagtggt agatagttgg 9960
gtacttttcg tggtaagcga cttcgtcaac gatgttaccg aagattgggt gtctttcgtg 10020
ctttttgtcc tcttcgacca agaaagactc ttccaatctg tgaaagaaag aatcgtcaac 10080
cttagccatt tcattagaga agatttcttg caagtaacag attctgttct tacgtctagt 10140
gtaacgtcta cgggctgttc tcttcaatct agtagcttcg gcagtttcac cagagtcgaa 10200
taacaaagca ccgattaggt ttttcttgat ggagtgtcta tcggtgttac ccaagacctt 10260
gaatttctta gatgggacct tgtattcgtc agtaatgaca gcccaaccaa cagagttggt 10320
accgatgtcc aaaccgatag agtatttctt gtccatggta attggacaaa taaatacgtg 10380
tattaagttt ggattctttg gtagatagcc aatcgaggga acaattaaaa aaaagaaaga 10440
aataaaagac aagaagaaga gcgaaaaagg ggaaagtgat gaggaaaaga acaatagata 10500
gatccagaag atgatggtaa cgcgcaaaca ctaccgctat atatacctac aaaactctca 10560
ttctctcatt tcctgcttcg ttcatttcga gtttccaagg gtatggtacg gtgctatctg 10620
cccgtgcttc ccctcctttg ctttgctaag aaaaattttc ttttgtcagc agcaacaaca 10680
cgctacgctc tgcgctgtgc tacgaagtgg tctctgtggc aacggggaca ttgtacccat 10740
gcccgctcgc agggaggtct gggtgtgggg cgtgtgcgac ctcgttgcca tggcgatcgc 10800
gcgtgggtgt ggtctttccc caaacggttg cccgttgctc cggatttcgc atagttgtcg 10860
cgtaaacaaa aaacacgaga gagggcggac ggcgctgaat agtggaagat cgcgcgatgt 10920
caagtaaata agcttgtatt tgtatttgta tgtgtttatg tgtttgtgtg gttgagaatt 10980
ttattttcct cctagttttt tcttttttga gtgcggaggg gcagtgctct aaactttgcc 11040
tgcttcttgt tcgacttcgg cttcctatgc agaacgcaaa atcgcgtgcg cgaggaacga 11100
ggaagacaac gctttagatt ggcgcggccg cccgcaaatt aaagccttcg agcgtcccaa 11160
aaccttctca agcaaggttt tcagtataat gttacatgcg tacacgcgtc tgtacagaaa 11220
aaaaagaaaa atttgaaata taaataacgt tcttaatact aacataacta taaaaaaata 11280
aatagggacc tagacttcag gttgtctaac tccttccttt tcggttagag cggatgtggg 11340
gggagggcgt gaatgtaagc gtgacataac taattacatg attaatctag taacaaggct 11400
aagatatcag cctgaaataa agggtggtga agtaataatt aaatcatccg tataaaccta 11460
tacacatata tgaggaaaaa taatacaaaa gtgttttaaa tacagataca tacatgaaca 11520
tatgcacgta tagcgcccaa atgtcggtaa tggga 11555
<210> 145
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 145
ctccgcagtg aaagataaat gatcgcccaa aatttgttta ctaaaaacac atgtgga 57
<210> 146
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 146
gaattgggta ccgggccctt agagtaaaaa attgtacttg gcggataatg cctttagc 58
<210> 147
<211> 106
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized targeting sgRNA + T(6) terminator
<400> 147
gatacgttct ctatggagga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct tttttt 106
<210> 148
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized 50 bp upstream homology arm
<400> 148
cccaaaattt gtttactaaa aacacatgtg gatatcttga ctgatttttc 50
<210> 149
<211> 106
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized URA3 targeting sgRNA + T(6) terminator
<400> 149
tatcttgact gatttttcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct tttttt 106
<210> 150
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized 50 bp downstream homology arm
<400> 150
gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc 50
<210> 151
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 151
ccgccaagta caatttttta ctctaagggc ccggtaccca attcgcccta tagtgag 57
<210> 152
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 152
catcatcacc atcattgata agagtatctc tctatatatt tctttttacg cagtctc 57
<210> 153
<211> 566
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized 2-micron replication origin 2
<400> 153
gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 60
caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 120
actgttcttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 180
acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 240
cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 300
gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 360
cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 420
gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 480
tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 540
tcgtcagggg ggcggagcct atggaa 566
<210> 154
<211> 859
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized ampicillin resistant gene
<400> 154
atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 60
gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 120
cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 180
gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 240
cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 300
gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 360
tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 420
ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 480
gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 540
cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 600
tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 660
tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct 720
cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 780
acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 840
tcactgatta agcattggt 859
<210> 155
<211> 400
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized RNR2 terminator
<400> 155
gagtatctct ctatatattt ctttttacgc agtctcttca atctctttat gtgggctttc 60
gcacctctta tttatatata tatatataca ctgaatcata taaacttttt tttatattga 120
atctaatata ttatcaaacg gaaacttcgg ctgaatttca tacgtatatt gattaaagtg 180
gaaagggcat cggaaaagta agaaaagctt aaaaaaattg aaaaaaaaaa aaaaaaaaat 240
aaaaaataaa aaataaaaaa acctatacaa tacatacata tgtatatgaa tataaacctg 300
gaacgatgtg tctttaaaaa tagttgaacg aactactcgg acatacccct acatcactta 360
aggatgtcta ctttcataag aggtcccatc tgcggtacag 400
<210> 156
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 156
ccttgcgttt cttttttggg gccatggtaa ttggacaaat aaatacgtgt attaag 56
<210> 157
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 157
tgtttttagt aaacaaattt tgggcgatca tttatctttc actgcggaga agtttc 56
Claims (34)
- 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편으로서, 변이체의 아미노산 위치는 상기 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
- 제1항에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는, Cas9 엔도뉴클레아제 변이체.
- 제1항에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는, Cas9 엔도뉴클레아제 변이체.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 변이체는 서열 번호 1의 아미노산 서열과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
- 제3항에 있어서, 개선된 특성은 개선된 형질전환 효율이고, 상기 변이체, 또는 이의 활성 단편은 또한 개선된 편집 효율을 갖는, Cas9 엔도뉴클레아제 변이체.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
- 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 조성물.
- 제7항에 있어서, 상기 조성물은 가이드 폴리뉴클레오타이드/Cas9 엔도뉴클레아제 복합체, 가이드 RNA/Cas9 엔도뉴클레아제 복합체, 및 상기 Cas9 엔도뉴클레아제 변이체를 포함하는 융합 단백질로 이루어진 군으로부터 선택되는, 조성물.
- 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드.
- 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN)로서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹(nicking)하거나 풀거나(unwinding) 절단할 수 있는, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN).
- 제9항의 폴리뉴클레오타이드를 포함하는 재조합 DNA 작제물.
- 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 숙주 세포.
- 제9항의 폴리뉴클레오타이드를 포함하는 숙주 세포.
- 제13항에 있어서, 세포는 원핵생물 세포 또는 진핵생물 세포인, 숙주 세포.
- 제14항에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
- 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 제10항의 PGEN을 도입하는 단계 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계를 포함하고, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
- 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법으로서, 상기 방법은 적어도 하나의 제10항의 PGEN 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계를 포함하고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함하는 방법.
- 제17항에 있어서, 편집된 뉴클레오타이드 서열을 포함하는 적어도 하나의 세포를 선택하는 단계를 추가로 포함하는 방법.
- 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 제10항의 PGEN 및 적어도 하나의 공여 DNA를 도입하는 단계를 포함하고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함하는 방법.
- 제19항에 있어서, 상기 관심 폴리뉴클레오타이드가 상기 표적 부위에서 또는 그 근처에서 통합된 적어도 하나의 세포를 확인하는 단계를 추가로 포함하는 방법.
- 제16항 내지 제21항 중 어느 한 항에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는 방법.
- 제16항 내지 제21항 중 어느 한 항에 있어서, PGEN은 예비조립된 폴리뉴클레오타이드-단백질 복합체로서 세포로 도입되는 방법.
- 제16항 내지 제21항 중 어느 한 항에 있어서, 가이드 폴리뉴클레오타이드 /Cas 엔도뉴클레아제는 가이드 RNA/Cas 엔도뉴클레아제인 방법.
- 제22항에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체는 리보뉴클레오타이드-단백질 복합체로서 세포로 도입되기 전에 시험관내 조립되는 방법.
- Cas9 엔도뉴클레아제 변이체의 적어도 하나의 특성을 개선하는 방법으로서, 상기 방법은 모 Cas9 엔도뉴클레아제에서 적어도 하나의 아미노산 변형을 도입하여 상기 Cas9 엔도뉴클레아제 변이체를 생성하는 단계를 포함하고, 상기 적어도 하나의 아미노산 변형은 모 Cas9 엔도뉴클레아제의 RuVC 및 HNH 도메인 밖에 위치하고, 상기 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 특성의 개선을 나타내는 방법.
- 제25항에 있어서, 상기 적어도 하나의 아미노산 변형은 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서의 아미노산 치환이고, 변이체의 아미노산 위치는 상기 모 Cas9 엔도뉴클레아제의 아미노산 서열과의 관련성에 의해 넘버링되는 방법.
- 제26항에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는 방법.
- 제25항에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는 방법.
- 제24항 내지 제27항 중 어느 한 항의 방법에 의해 생산된 Cas9 엔도뉴클레아제 변이체.
- 바실러스 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 바실러스 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 바실러스 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법. - 제30항에 있어서, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
- 제29항에 있어서, 바실러스 숙주 세포는 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 알티투디니스(Bacillus altitudinis), 바실러스 아밀로리쿼파시엔스(Bacillus amyloliquefaciens), B. 아밀로리쿼파시엔스 아종 플란타룸(plantarum), 바실러스 브레비스(Bacillus brevis), 바실러스 서르쿨란스(Bacillus circulans), 바실러스 클라우시(Bacillus clausii), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 피르무스(Bacillus firmus), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 메틸로트로피쿠스(Bacillus methylotrophicus), 바실러스 푸밀루스(Bacillus pumilus), 바실러스 사펜시스(Bacillus safensis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 서브틸리스(Bacillus subtilis) 및 바실러스 투린기엔시스(Bacillus thuringiensis)로 이루어진 바실러스 종의 군으로부터 선택되는 방법.
- E. 콜라이 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 E. 콜라이 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 E. 콜라이 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법. - 진균 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 진균 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 진균 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762599176P | 2017-12-15 | 2017-12-15 | |
US62/599,176 | 2017-12-15 | ||
PCT/US2018/064955 WO2019118463A1 (en) | 2017-12-15 | 2018-12-11 | Cas9 variants and methods of use |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200098578A true KR20200098578A (ko) | 2020-08-20 |
Family
ID=65003497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207019496A KR20200098578A (ko) | 2017-12-15 | 2018-12-11 | Cas9 변이체 및 사용 방법 |
Country Status (10)
Country | Link |
---|---|
US (2) | US11781125B2 (ko) |
EP (1) | EP3707253A1 (ko) |
JP (2) | JP7384801B2 (ko) |
KR (1) | KR20200098578A (ko) |
CN (1) | CN111465689A (ko) |
AU (1) | AU2018386002A1 (ko) |
BR (1) | BR112020011011A2 (ko) |
CA (1) | CA3084191A1 (ko) |
MX (1) | MX2020005726A (ko) |
WO (1) | WO2019118463A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022526982A (ja) * | 2019-04-05 | 2022-05-27 | ダニスコ・ユーエス・インク | 線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物 |
CN110272858B (zh) * | 2019-07-18 | 2020-09-04 | 江南大学 | 一种高产l-乳酸的凝结芽孢杆菌及其应用 |
EP4031560A1 (en) * | 2019-08-14 | 2022-07-27 | Danisco US Inc | Compositions and methods for increased protein production in bacillus licheniformis |
JP2023524334A (ja) | 2020-01-15 | 2023-06-12 | ダニスコ・ユーエス・インク | バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法 |
CN112195164B (zh) * | 2020-12-07 | 2021-04-23 | 中国科学院动物研究所 | 工程化的Cas效应蛋白及其使用方法 |
CN116601293A (zh) * | 2020-12-07 | 2023-08-15 | 中国科学院动物研究所 | 工程化的Cas效应蛋白及其使用方法 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US5107065A (en) | 1986-03-28 | 1992-04-21 | Calgene, Inc. | Anti-sense regulation of gene expression in plant cells |
US4873192A (en) | 1987-02-17 | 1989-10-10 | The United States Of America As Represented By The Department Of Health And Human Services | Process for site specific mutagenesis without phenotypic selection |
US5316931A (en) | 1988-02-26 | 1994-05-31 | Biosource Genetics Corp. | Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes |
US5990387A (en) | 1988-06-10 | 1999-11-23 | Pioneer Hi-Bred International, Inc. | Stable transformation of plant cells |
US5034323A (en) | 1989-03-30 | 1991-07-23 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5231020A (en) | 1989-03-30 | 1993-07-27 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5879918A (en) | 1989-05-12 | 1999-03-09 | Pioneer Hi-Bred International, Inc. | Pretreatment of microprojectiles prior to using in a particle gun |
US5932782A (en) | 1990-11-14 | 1999-08-03 | Pioneer Hi-Bred International, Inc. | Plant transformation method using agrobacterium species adhered to microprojectiles |
TW261517B (ko) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
BR9306802A (pt) | 1992-07-27 | 1998-12-08 | Pioneer Hi Bred Int | Processo independente de genótipos para produção de planta de soja transgénica e processo de regeneração de plantas de soja a partir de nodos cotiledonais |
IL108241A (en) | 1992-12-30 | 2000-08-13 | Biosource Genetics Corp | Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus |
US5736369A (en) | 1994-07-29 | 1998-04-07 | Pioneer Hi-Bred International, Inc. | Method for producing transgenic cereal plants |
EP0892811B1 (de) | 1996-03-26 | 2002-12-18 | Razvan T. Radulescu | Peptide mit antiproliferativen eigenschaften |
AU3495297A (en) | 1996-07-08 | 1998-02-02 | Pioneer Hi-Bred International, Inc. | Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs |
US5981840A (en) | 1997-01-24 | 1999-11-09 | Pioneer Hi-Bred International, Inc. | Methods for agrobacterium-mediated transformation |
EP1309677B2 (en) | 2000-08-11 | 2012-04-11 | Genencor International, Inc. | Bacillus transformation, transformants and mutant libraries |
SI1495330T1 (sl) | 2002-04-12 | 2009-06-30 | Dowd Brian F O | Postopki identificiranja spojin, ki medsebojno vplivajo na transmembranske proteine |
US20110059496A1 (en) | 2003-06-25 | 2011-03-10 | E. I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast |
US7459546B2 (en) | 2003-06-25 | 2008-12-02 | E.I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase regulatory sequences for gene expression in oleaginous yeast |
WO2005049805A2 (en) | 2003-11-14 | 2005-06-02 | E.I. Dupont De Nemours And Company | Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast |
US7264949B2 (en) | 2004-09-15 | 2007-09-04 | E.I. Du Pont De Nemours And Company | Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast |
US20060094102A1 (en) | 2004-11-04 | 2006-05-04 | Zhixiong Xue | Ammonium transporter promoter for gene expression in oleaginous yeast |
DK2336362T3 (en) | 2005-08-26 | 2019-01-21 | Dupont Nutrition Biosci Aps | USE OF CRISPR-ASSOCIATED GENES (CAS) |
WO2008007989A1 (en) | 2006-07-11 | 2008-01-17 | Grabania, Bogdan | Head for directing objects, especially for displaying screens |
RU2485180C2 (ru) | 2007-06-07 | 2013-06-20 | Эгрикалча Энд Эгри-Фуд Кэнэда | Способ трансфекции и трансдукции растительных клеток |
EA201391373A1 (ru) | 2011-03-23 | 2014-07-30 | Пайонир Хай-Бред Интернэшнл, Инк. | Способы получения сложного локуса трансгенных признаков |
WO2012135773A1 (en) | 2011-03-31 | 2012-10-04 | E. I. Du Pont De Nemours And Company | Yarrowia diacylglycerol acyltransferase promoter regions for gene expression in yeast |
WO2012135777A1 (en) | 2011-04-01 | 2012-10-04 | E. I. Du Pont De Nemours And Company | Yarrowia esterase/lipase promoter regions for gene expression in yeast |
US8735094B2 (en) | 2011-04-05 | 2014-05-27 | E I Du Pont De Nemours And Company | Yarrowia n-alkane-hydroxylating cytochrome P450 promoter regions for gene expression in yeast |
WO2012138612A1 (en) | 2011-04-07 | 2012-10-11 | E. I. Du Pont De Nemours And Company | Yarrowia peroxisomal 2,4-dienoyl-coa reductase promoter regions for gene expression in yeast |
LT3401400T (lt) | 2012-05-25 | 2019-06-10 | The Regents Of The University Of California | Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
EP4234696A3 (en) | 2012-12-12 | 2023-09-06 | The Broad Institute Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
CA3109801C (en) | 2013-08-22 | 2024-01-09 | Andrew Cigan | Plant genome modification using guide rna/cas endonuclease systems and methods of use |
US10513711B2 (en) * | 2014-08-13 | 2019-12-24 | Dupont Us Holding, Llc | Genetic targeting in non-conventional yeast using an RNA-guided endonuclease |
AU2015343307B2 (en) | 2014-11-06 | 2021-05-20 | Iff Us Holding, Llc | Peptide-mediated delivery of RNA-guided endonuclease into cells |
KR20180008572A (ko) | 2015-05-15 | 2018-01-24 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | Cas 엔도뉴클레아제 시스템, pam 서열 및 가이드 rna 요소의 신속한 특성화 |
WO2017019867A1 (en) | 2015-07-28 | 2017-02-02 | Danisco Us Inc | Genome editing systems and methods of use |
KR20180059535A (ko) | 2015-10-20 | 2018-06-04 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | 마커-프리 게놈 변형을 위한 방법 및 조성물 |
JP7025325B2 (ja) | 2015-10-30 | 2022-02-24 | ダニスコ・ユーエス・インク | タンパク質発現の増強およびその方法 |
US20180362975A1 (en) | 2015-12-04 | 2018-12-20 | Novartis Ag | Compositions and methods for immunooncology |
US9946070B2 (en) | 2016-03-08 | 2018-04-17 | Sharp Kabushiki Kaisha | Automotive head up display |
US20190161742A1 (en) * | 2016-03-11 | 2019-05-30 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
JP2020515258A (ja) * | 2017-03-31 | 2020-05-28 | アジェノビア コーポレーション | 抗ウイルス治療剤 |
-
2018
- 2018-12-11 AU AU2018386002A patent/AU2018386002A1/en active Pending
- 2018-12-11 US US16/772,910 patent/US11781125B2/en active Active
- 2018-12-11 CN CN201880080411.2A patent/CN111465689A/zh active Pending
- 2018-12-11 KR KR1020207019496A patent/KR20200098578A/ko not_active Application Discontinuation
- 2018-12-11 CA CA3084191A patent/CA3084191A1/en active Pending
- 2018-12-11 WO PCT/US2018/064955 patent/WO2019118463A1/en unknown
- 2018-12-11 BR BR112020011011-6A patent/BR112020011011A2/pt unknown
- 2018-12-11 JP JP2020532651A patent/JP7384801B2/ja active Active
- 2018-12-11 MX MX2020005726A patent/MX2020005726A/es unknown
- 2018-12-11 EP EP18830596.5A patent/EP3707253A1/en active Pending
-
2022
- 2022-10-26 JP JP2022171188A patent/JP2023011727A/ja active Pending
-
2023
- 2023-08-28 US US18/456,663 patent/US20240018497A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2020005726A (es) | 2020-08-13 |
US11781125B2 (en) | 2023-10-10 |
JP2023011727A (ja) | 2023-01-24 |
US20200308561A1 (en) | 2020-10-01 |
US20240018497A1 (en) | 2024-01-18 |
AU2018386002A1 (en) | 2020-05-28 |
CA3084191A1 (en) | 2019-06-20 |
WO2019118463A1 (en) | 2019-06-20 |
JP2021506257A (ja) | 2021-02-22 |
EP3707253A1 (en) | 2020-09-16 |
CN111465689A (zh) | 2020-07-28 |
BR112020011011A2 (pt) | 2020-11-17 |
JP7384801B2 (ja) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102622910B1 (ko) | Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법 | |
KR102424626B1 (ko) | 원형 폴리뉴클레오티드 변형 주형과 함께 가이드 RNA/Cas 엔도뉴클레아제 시스템을 이용하여 대장균에서 효율적으로 유전자 편집을 하기 위한 조성물 및 방법 | |
KR102424721B1 (ko) | Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달 | |
KR20200098578A (ko) | Cas9 변이체 및 사용 방법 | |
CN107002020B (zh) | 使用rna引导的内切核酸酶在非常规酵母中基因靶向 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
DK2663645T3 (da) | Gærstammer, der er modificeret til produktion af ethanol fra glycerol | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
KR101420991B1 (ko) | 테르펜 합성효소 변이체들을 개발하는 방법들 | |
CN102695796B (zh) | 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法 | |
KR20180107155A (ko) | Cpf1 또는 csm1을 사용하여 게놈을 변형하기 위한 조성물 및 방법 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
DK2324119T3 (en) | Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
KR20130032897A (ko) | 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거 | |
KR20120136349A (ko) | 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템 | |
DK2443248T3 (en) | IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
KR20140099251A (ko) | 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 | |
KR20130105649A (ko) | 피루베이트로부터 아세토락테이트로의 전환을 촉매작용시키는 폴리펩티드를 암호화하는 폴리뉴클레오티드의 통합 | |
CN106661573B (zh) | 多核苷酸文库的重组酶介导的整合 | |
CN108779480A (zh) | 生产鞘氨醇碱和鞘脂类的方法 | |
KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |