KR20200098578A - Cas9 변이체 및 사용 방법 - Google Patents

Cas9 변이체 및 사용 방법 Download PDF

Info

Publication number
KR20200098578A
KR20200098578A KR1020207019496A KR20207019496A KR20200098578A KR 20200098578 A KR20200098578 A KR 20200098578A KR 1020207019496 A KR1020207019496 A KR 1020207019496A KR 20207019496 A KR20207019496 A KR 20207019496A KR 20200098578 A KR20200098578 A KR 20200098578A
Authority
KR
South Korea
Prior art keywords
cas9
sequence
bacillus
variant
seq
Prior art date
Application number
KR1020207019496A
Other languages
English (en)
Inventor
라이언 엘 프리쉬
홍샨 허
Original Assignee
다니스코 유에스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니스코 유에스 인크. filed Critical 다니스코 유에스 인크.
Publication of KR20200098578A publication Critical patent/KR20200098578A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

변이체 Cas 시스템 및 이러한 시스템을 포함하는 요소, 예를 들어 비제한적인 예로서 Cas 엔도뉴클레아제 변이체, Cas 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체, 및 Cas 엔도뉴클레아제 변이체와 상호작용할 수 있는 가이드 폴리뉴클레오타이드 및 가이드 RNA 요소를 위한 조성물 및 방법이 제공된다. 세포의 게놈에서 표적 서열의 게놈 변형을 위한 조성물 및 방법이 제공된다. 상기 방법 및 조성물은 세포 또는 유기체의 게놈 내에 표적 서열을 변형시키거나 변경하기 위한 효과적인 시스템을 제공하기 위해 Cas9 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템을 사용한다.

Description

CAS9 변이체 및 사용 방법
본 출원은 그 전체가 참조로 본원에 포함된, 2017년 12월 15일 출원된 미국 가출원 제62/599,176호의 이익을 주장한다.
기술분야
본 발명은 분자 생물학의 분야에 관한 것이고, 특히 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템의 조성물, 및 세포의 게놈을 변형시키기 위한 조성물 및 이의 방법에 관한 것이다.
전자로 제출된 서열 목록의 참조
본 서열 목록의 공식 사본은 2018년 11월 29일 작성되고 크기가 476 킬로바이트이며 본 명세서와 동시에 제출된 파일명 20181129_NB41317PCT_ST25.txt의 ASCII 형식의 서열 목록으로서 EFS-웹을 통해 전자로 제출되었다. 이러한 ASCII 형식의 서류에 포함된 서열 목록은 본 명세서의 일부이며, 그 전체가 참조로 본원에 포함된다.
재조합 DNA 기술은 표적화된 게놈 위치에서 DNA 서열을 삽입하고/하거나 특정한 내인성 염색체 서열을 변형할 수 있도록 하였다. 부위 특이적 재조합 시스템을 사용한 부위 특이적 통합 기술뿐만 아니라 다른 유형의 재조합 기술이 다양한 유기체에서 관심 유전자의 표적화된 삽입을 생성하기 위해 사용되어 왔다. Cas 시스템의 부위 특이적 성질을 고려할 때, 포유류 세포에서를 포함하여 이 시스템에 기초한 게놈 변형/조작 기법이 기재되어 있다(예를 들어, Hsu et al., 2014 참조). Cas-기반 게놈 조작은, 의도된 대로 작용할 때, crRNA의 DNA-표적화 영역(즉, 가변 표적화 도메인)이 게놈에서 원하는 표적 부위와 상동성인 재조합 crRNA(또는 균등하게 기능적인 가이드 폴리뉴클레오타이드)를 설계하고, 숙주 세포에서 crRNA를 (임의의 편리하고 통상적인 수단을 통해) Cas 엔도뉴클레아제와 기능적 복합체로 조합함으로써, 복잡한 게놈 내에 사실상 임의의 특정 위치를 표적화하는 능력을 부여한다.
Cas-기반 게놈 조작 기법이 다수의 상이한 숙주 세포 유형에 적용되지만, 이 기법은 알려진 제한을 갖는다. 예를 들어, 비제한적인 예로서 바실러스 종과 같은 소정의 숙주 세포를 형질전환하는 것의 효율은 여전히 낮고 비싸다.
따라서, 원핵생물 또는 진핵생물 세포에서 게놈 표적 부위를 변형/변경하기 위한 더 효과적인, 효율적인 또는 달리 더 튼튼한 또는 가요성인 Cas-기반 게놈 변형 방법 및 조성물을 개발할 필요성이 남아 있다.
비제한적인 예로서 Cas 엔도뉴클레아제 변이체, 가이드 폴리뉴클레오타이드, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체, 가이드 RNA/Cas 엔도뉴클레아제 시스템, 특히 HNH 및 RuvC 도메인 밖에 위치한 적어도 하나의 아미노산 변형을 포함하는 Cas9 엔도뉴클레아제 변이체를 포함하는, 변이체 Cas 시스템 및 이러한 시스템을 포함하는 요소에 대한 조성물 및 방법이 제공되고, 선택적으로 Cas9 엔도뉴클레아제 변이체는 적어도 하나의 아미노산 변형을 갖지 않는 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성을 갖는다.
Cas9 엔도뉴클레아제 변이체, 가이드 폴리뉴클레오타이드 및 적어도 하나의 Cas9 엔도뉴클레아제 변이체 및 적어도 하나의 가이드 RNA를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템의 직접적인 전달을 위한 것뿐만 아니라, 원핵생물 또는 진핵생물 세포의 게놈에서의 표적 서열의 게놈 변형을 위한, 유전자 편집을 위한 그리고 유기체의 게놈으로 또는 게놈으로부터 관심 폴리뉴클레오타이드를 삽입하거나 결실시키기 위한 조성물 및 방법이 또한 제공된다.
본 발명의 일 구현예에서, Cas9 엔도뉴클레아제 변이체는 서열 번호 2에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편이고, 변이체의 아미노산 위치는 상기 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다. 상기 Cas9 엔도뉴클레아제 변이체는 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택된 적어도 하나의 아미노산 치환을 가질 수 있다. Cas9 엔도뉴클레아제 변이체는 이의 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 가질 수 있다. Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 가질 수 있다.
본 발명의 일 구현예에서, Cas9 엔도뉴클레아제 변이체는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편이고, 상기 변이체는 서열 번호 2의 아미노산 서열과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
본 발명의 일 구현예에서, Cas9 엔도뉴클레아제 변이체는 Cas9 엔도뉴클레아제 변이체이고, 개선된 특성은 개선된 형질전환 효율이고, 상기 변이체, 또는 이의 활성 단편은 또한 개선된 편집 효율을 갖는다.
본 발명의 일 구현예에서, 상기 조성물은 본원에 개시된 Cas9 엔도뉴클레아제 변이체, 또는 이의 기능적 단편을 포함하는 조성물이다. 상기 조성물은 가이드 폴리뉴클레오타이드/Cas9 엔도뉴클레아제 복합체, 가이드 RNA/Cas9 엔도뉴클레아제 복합체 및 상기 Cas9 엔도뉴클레아제 변이체를 포함하는 융합 단백질로 이루어진 군으로부터 선택될 수 있다.
본 발명의 일 구현예에서, 폴리뉴클레오타이드는 본원에 개시된 임의의 하나의 Cas9 엔도뉴클레아제 변이체를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드이다.
본 발명의 일 구현예에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN)는 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 PGEN이고, 여기서 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹(nicking)하거나 풀거나(unwinding) 절단할 수 있다.
본 발명의 일 구현예에서, 상기 방법은 세포의 게놈에서 표적 부위를 변형시키는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 적어도 하나의 PGEN을 도입하는 단계 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계를 포함하고, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택된다.
본 발명의 일 구현예에서, 상기 방법은 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법을 포함하고, 상기 방법은 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 적어도 하나의 PGEN 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계를 포함하고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함한다.
본 발명의 일 구현예에서, 상기 방법은 세포의 게놈에서 표적 부위를 변형시키는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 적어도 하나의 PGEN 및 적어도 하나의 공여 DNA를 도입하는 단계를 포함하고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함한다.
본 발명의 일 구현예에서, 상기 방법은 Cas9 엔도뉴클레아제 변이체의 적어도 하나의 특성을 개선하는 방법을 포함하고, 상기 방법은 모 Cas9 엔도뉴클레아제에서 적어도 하나의 아미노산 변형을 도입하여 상기 Cas9 엔도뉴클레아제 변이체를 생성하는 단계를 포함하고, 상기 적어도 하나의 아미노산 변형은 모 Cas9 엔도뉴클레아제의 RuvC 및 HNH 도메인 밖에 위치하고, 상기 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 특성의 개선을 보여준다. 적어도 하나의 아미노산 변형은 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 위치에서 아미노산 치환일 수 있고, 변이체의 아미노산 위치는 상기 모 Cas9 엔도뉴클레아제의 아미노산 서열과의 관련성에 의해 넘버링된다. 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택될 수 있다.
본원에 기재된 방법에 의해 생산된 원핵생물 및 진핵생물 세포의 게놈에서 변형된 표적 서열을 갖거나 뉴클레오타이드 서열에서의 변형을 갖는 발현 카세트, 재조합 DNA, 핵산 작제물, 원핵생물 및 진핵생물 세포가 또한 제공된다. 본 발명의 방법 및 조성물의 추가 구현예가 본원에 기재된다.
도면의 간단한 설명 및 서열 목록
본 발명은 본 출원의 일부를 형성하는 다음의 상세한 설명 및 첨부 도면 그리고 서열 목록으로부터 더욱 완전하게 이해될 수 있다. 본원에 첨부된 서열 설명 및 서열 목록은 37 C.F.R. §§ 1.821 내지 1.825에 명시된 바와 같이 특허 출원에서 뉴클레오타이드 및 아미노산 서열 공개를 규제하는 규칙을 따른다. 서열 설명은 참조로 본원에 포함된 37 C.F.R. §§ 1.821 내지 1.825에 정의된 바와 같은 아미노산에 대한 3 철자 코드를 함유한다.
도면
도 1은 Cas9 폴리펩타이드 및 이의 Cas9 단백질 도메인의 개략적 표시를 도시한다. RuvC 뉴클레아제 도메인은 검정 채움으로 도시되고, 십자 방격은 브리지 나선을 나타내고, 사선 점선 채움은 REC I 도메인을 나타내고, 중간 회색 채움은 REC II 도메인을 나타내고, 밝은 회색 채움은 HNH 뉴클레아제 도메인을 나타내고, 볼 채움은 PAM 인식 도메인을 나타낸다. (Jinek M., Jiang F.,Taylor D.W. et al. 2014, Science 343, 1247997로부터 조정됨). 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 Y155 변형은 REC1 도메인에 위치한다.
도 2는 Cas9 엔도뉴클레아제의 1차 아미노산 구조로 맵핑된 도메인 구조를 도시한다. 본원에 기재된 (REC1 도메인에서) Cas9 Y155 엔도뉴클레아제 변이체의 Y155 변형의 위치가 화살표로 표시된다.
도 3은 Cas9 엔도뉴클레아제의 1차 아미노산 구조로 맵핑된 도메인 구조를 도시한다. 본원에 기재된 Cas9 엔도뉴클레아제 F86-F98 변이체의 F86 및 F98 변형의 위치가 화살표로 표시된다.
하기 서열은 37 C.F.R. §§ 1.821 내지 1.825("뉴클레오타이드 서열 및/또는 아미노산 서열 공개를 포함하는 특허 출원의 요건 - 서열 규칙[Requirements for Patent Applications Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures - the Sequence Rules]")를 따르며, 세계 지적 재산권 기구(WIPO: World Intellectual Property Organization) 표준 ST.25 (2009) 및 유럽 특허 조약(EPC: European Patent Convention) 및 특허 협력 조약(PCT: Patent Cooperation Treaty) 규칙 5.2 및 49.5(a-bis), 및 시행 세칙의 제208조 및 부칙 C의 서열 목록 요건과 일치한다. 뉴클레오타이드 및 아미노산 서열 데이터에 사용되는 부호 및 포맷은 37 C.F.R. § 1.822에 기재된 개시된 규칙을 따른다.
서열 번호 1은 스트렙토코커스 피오제네스(Streptococcus pyogenes) Cas9의 아미노산 서열을 기재한다.
서열 번호 2는 스트렙토코커스 피오제네스 Cas9의 야생형 Cas9 단백질을 암호화하는 바실러스 코돈 최적화된 Cas9 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 3은 N-말단 NLS의 아미노산 서열을 기재한다.
서열 번호 4는 C-말단 NLS의 아미노산 서열을 기재한다.
서열 번호 5는 데카-히스티딘 태그의 아미노산 서열을 기재한다.
서열 번호 6은 6 aprE 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 7은 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 8-9, 12-13, 38-39, 41-42, 50-51, 54-55, 59-60, 67-68, 71-72, 79-80, 88-89, 91-92, 111-112, 119-120, 138-139, 145-146, 151-152, 156-157은 프라이머의 뉴클레오타이드 서열을 기재한다.
서열 번호 10은 pKB320 골격의 뉴클레오타이드 서열을 기재한다.
서열 번호 11은 pKB320의 뉴클레오타이드 서열을 기재한다.
서열 번호 14는 플라스미드 RSP1의 뉴클레오타이드 서열을 기재한다.
서열 번호 15는 플라스미드 RSP2의 뉴클레오타이드 서열을 기재한다.
서열 번호 16 내지 27은 각각 플라스미드 FSP1, FSP2, FSP3, FSP4, FSP5, FSP6, FSP7, RSP3, FSP8, pRF694, pRF801 및 pRF806의 뉴클레오타이드 서열을 기재한다.
서열 번호 28은 바실러스 리케니포르미스(Bacillus licheniformis)의 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 29는 바실러스 리케니포르미스의 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 30은 serA1 오픈 리딩 프레임의 뉴클레오타이드 서열을 기재한다.
서열 번호 31은 바실러스 리케니포르미스의 표적 부위 1 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 32는 가변 표적화 도메인 1을 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 33은 CER 도메인을 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 34는 표적 부위 1을 표적화하는 gRNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 35는 spac 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 36은 t0 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 37은 바실러스 리케니포르미스의 serA1 상동성 아암 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 40은 바실러스 리케니포르미스의 serA1 상동성 아암 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 43은 ts1 gRNA 발현 카세트를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 44는 serA1 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 45는 바실러스 리케니포르미스의 rghR1 오픈 리딩 프레임의 뉴클레오타이드 서열을 기재한다.
서열 번호 46은 바실러스 리케니포르미스의 표적 부위 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 47은 바실러스 리케니포르미스의 표적 부위 2 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 48은 가변 표적화 도메인 2를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 49는 표적 부위 2를 표적화하는 가이드 RNA(gRNA)의 뉴클레오타이드 서열을 기재한다.
서열 번호 50은 바실러스 리케니포르미스로부터의 rghR1의 상동성 아암 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 53은 바실러스 리케니포르미스로부터의 rghR1의 상동성 아암 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 56은 ts2 발현 카세트를 암호화하는 DNA의 뉴클레오타이드 서열을 기재한다.
서열 번호 57은 rghR1 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 58은 Cas9 Y155H 변이체의 아미노산 서열을 기재한다.
서열 번호 61은 pRF827의 뉴클레오타이드 서열을 기재한다.
서열 번호 62는 Cas9 Y155H 변이체 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 63은 pRF856의 뉴클레오타이드 서열을 기재한다.
서열 번호 64는 pBL.comK-syn의 뉴클레오타이드 서열을 기재한다.
서열 번호 65는 바실러스 리케니포르미스로부터의 표적 부위 1 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 66은 표적 부위 1 편집된 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 69는 바실러스 리케니포르미스로부터의 표적 부위 2 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 70은 표적 부위 2 편집된 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 73은 야로위아 코돈 최적화된 Cas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 74는 SV40 NLS의 뉴클레오타이드 서열을 기재한다.
서열 번호 75는 야로위아 FBA1 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 76은 야로위아 Cas9 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 77은 pZufCas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 78은 Cas9-SV40 융합의 뉴클레오타이드 서열을 기재한다.
서열 번호 81은 Cas9-SV40 PCR 산물의 뉴클레오타이드 서열을 기재한다.
서열 번호 82-83은 각각 pBAD/HisB 및 pRF48의 뉴클레오타이드 서열을 기재한다.
서열 번호 84는 E. 콜라이 최적화된 Cas9 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 85-86은 각각 pKO3 및 pRF97의 뉴클레오타이드 서열을 기재한다.
서열 번호 87은 Cas9 Y155H 암호화 합성 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 90은 pRF97-Y155H 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 93은 pRF861의 뉴클레오타이드 서열을 기재한다.
서열 번호 94는 E. 콜라이로부터의 nac 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 95는 nac 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 96은 nac 표적 부위 1+ PAM E. 콜라이의 뉴클레오타이드 서열을 기재한다.
서열 번호 97은 nac 표적 부위 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 98은 nac 표적 부위 1 + PAM의 뉴클레오타이드 서열을 기재한다.
서열 번호 99는 N25 파지 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 100은 nac 표적 부위 1 gRNA 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 101은 nac 표적 부위 2 gRNA 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 102는 nac 상류 결실 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 103은 nac 하류 결실 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 104는 nac 결실 편집 주형의 뉴클레오타이드 서열을 기재한다.
서열 번호 105는 5' pRF97 또는 pRF861 동일성의 뉴클레오타이드 서열을 기재한다.
서열 번호 106은 3' pRF97 또는 pRF861 동일성의 뉴클레오타이드 서열을 기재한다.
서열 번호 107은 nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 108은 nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 109는 pRF97-카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 110은 pRF861-카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 113은 pRF97-nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 114는 pRF97-nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 115는 pRF861-nacETsite1의 뉴클레오타이드 서열을 기재한다.
서열 번호 116은 pRF861-nacETsite2의 뉴클레오타이드 서열을 기재한다.
서열 번호 117은 이. 콜라이로부터의 야생형(WT) nac 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 118은 편집된 nac 유전좌위의 뉴클레오타이드 서열을 기재한다.
서열 번호 121은 스트렙토코커스 피오제네스 Cas9의 뉴클레오타이드 서열을 기재한다.
서열 번호 122는 Cas9 Y155H 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 123은 Cas9 Y155N 변이체의 아미노산 서열을 기재한다.
서열 번호 124는 Cas9 Y155N 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 125는 Cas9 Y155E 변이체의 아미노산 서열을 기재한다.
서열 번호 126은 Cas9 Y155E 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 127은 Cas9 Y155F 변이체의 아미노산 서열을 기재한다.
서열 번호 128은 Cas9 Y155F 변이체를 암호화하는 뉴클레오타이드 서열을 기재한다.
서열 번호 129는 Cas9 F86A-F98A 변이체의 아미노산 서열을 기재한다.
서열 번호 130은 F86A-F98A 합성 단편의 뉴클레오타이드 서열을 기재한다.
서열 번호 131은 F86A F98A에 대한 pRF801 골격의 뉴클레오타이드 서열을 기재한다.
서열 번호 132는 pRF801 골격 정방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 133은 pRF801 골격 역방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 134는 F86A-F98A 합성 정방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 135는 F86A-F98A 합성 역방향의 뉴클레오타이드 서열을 기재한다.
서열 번호 136은 바실러스 F86A F98A 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 137은 pRF866의 뉴클레오타이드 서열을 기재한다.
서열 번호 140은 RNR2p 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 141은 2-미크론 복제 기원 1의 뉴클레오타이드 서열을 기재한다.
서열 번호 142는 KanMX 발현 카세트의 뉴클레오타이드 서열을 기재한다.
서열 번호 143은 SNR52p 프로모터의 뉴클레오타이드 서열을 기재한다.
서열 번호 144는 pSE087 플라스미드의 뉴클레오타이드 서열을 기재한다.
서열 번호 147은 표적화 sgRNA + T(6) 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 148은 50 bp 상류 상동성 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 149는 URA3 표적화 sgRNA + T(6) 종결자의 뉴클레오타이드 서열을 기재한다.
서열 번호 150은 50 bp 하류 상동성 아암의 뉴클레오타이드 서열을 기재한다.
서열 번호 153은 2-미크론 복제 기원 2의 뉴클레오타이드 서열을 기재한다.
서열 번호 154는 154 암피실린 내성 유전자의 뉴클레오타이드 서열을 기재한다.
서열 번호 155는 RNR2 종결자의 뉴클레오타이드 서열을 기재한다.
변이체 Cas 시스템 및 이러한 시스템을 포함하는 요소, 예를 들어 비제한적인 예로서 Cas 엔도뉴클레아제 변이체, Cas 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체, 및 Cas 엔도뉴클레아제 변이체와 상호작용할 수 있는 가이드 폴리뉴클레오타이드 및 가이드 RNA 요소를 위한 조성물 및 방법이 제공된다. Cas 엔도뉴클레아제 변이체, 가이드 RNA 및 가이드 RNA/Cas 엔도뉴클레아제 복합체의 직접적인 전달을 위한 조성물 및 방법이 또한 제공된다. 본 발명은 세포 게놈에서의 표적 서열의 게놈 변형, 유전자 편집 및 세포 게놈 내로의 관심 폴리뉴클레오타이드의 삽입을 위한 조성물 및 방법을 추가로 포함한다.
본 명세서는 읽기 쉽도록 여러 부문으로 구성되어 있지만, 독자는 한 부문의 서술이 다른 부문에도 적용될 수 있음을 이해할 것이다. 이러한 방식으로, 본 명세서의 상이한 부문에 사용된 표제가 제한적인 것으로 해석되어서는 안 된다.
본원에 제공된 표제는 본 명세서를 전체로 참조하여 가질 수 있는 본 조성물 및 방법의 다양한 양태 또는 구현예의 제한이 아니다. 따라서, 바로 아래에 정의된 용어는 본 명세서를 전체로 참조하여 더욱 완전하게 정의된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 조성물 및 방법이 속하는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에서 기술되는 것과 유사하거나 동등한 임의의 방법 및 재료가 본 조성물 및 방법의 실시 또는 시험에 사용될 수도 있지만, 대표적인 예시적인 방법 및 재료가 이제 기술된다.
본 명세서에서 언급된 모든 간행물 및 특허는, 각각의 개별 간행물 또는 특허가 구체적으로 그리고 개별적으로 참조로 포함되는 것으로 표시되듯이 그리고 이 간행물이 언급될 때 관련되는 방법 및/또는 재료를 개시하고 기재하기 위해 참조로 본원에 포함되듯이, 참조로 본원에 포함된다.
Cas 유전자 및 단백질
CRISPR(클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부: clustered regularly interspaced short palindromic repeat) 유전자위는, 예를 들어, 박테리아 및 고세균 세포에 의해 외래 DNA를 파괴하는 데 사용되는 DNA 절단 시스템의 성분을 암호화하는 소정의 유전자위를 지칭한다(Horvath and Barrangou, 2010, Science 327:167-170; WO2007/025097; 2007년 3월 1일 공개됨). CRISPR 유전자위는 다양한 Cas(CRISPR-연관된(associated)) 유전자에 의해 플랭킹될 수 있는, 짧은 가변 DNA 서열(소위 '스페이서')에 의해 분리된 짧은 다이렉트 반복부(CRISPR 반복부)를 포함하는 CRISPR 배열로 이루어질 수 있다. 주어진 CRISPR 유전자위에서 CRISPR-연관된 유전자의 수는 종들 간에 달라질 수 있다. 다중아단위 효과기 복합체(I형, III형 및 IV형 아형)를 갖는 클래스 1 시스템, 및 단일 단백질 효과기(II형 및 V형 아형을 포함하며, 비제한적인 예로서 Cas9, Cpf1, C2c1, C2c2, C2c3를 포함)를 갖는 클래스 2 시스템을 포함하는 여러 CRISPR/Cas 시스템이 기술되었다. 클래스 1 시스템(참조로 본원에 포함되는 Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13:1-15; Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13; Haft et al., 2005, Computational Biology, PLoS Comput Biol 1(6): e60. doi:10.1371 /journal .pcbi. 0010060 및 2013년 11월 23일 공개된 WO 2013/176772 A1). 박테리아로부터의 II형 CRISPR/Cas 시스템은 crRNA(CRISPR RNA) 및 tracrRNA(전사-촉진 CRISPR RNA)를 사용하여 Cas 엔도뉴클레아제를 이의 DNA 표적으로 유도한다. crRNA는 이중 가닥 DNA 표적의 한 가닥에 상보적인 스페이서 영역 및 tracrRNA(전사-촉진 CRISPR RNA)와 염기 쌍을 이루어 Cas 엔도뉴클레아제가 DNA 표적을 절단하도록 유도하는 RNA 듀플렉스를 형성하는 영역을 포함한다. 스페이서는 Cas1 및 Cas2 단백질을 수반하는 완전히 이해되지 않은 과정을 통해 획득된다. 모든 II형 CRISPR/Cas 유전자위는 cas9 유전자 외에 cas1 및 cas2 유전자를 포함한다(Chylinski et al., 2013, RNA Biology 10:726-737; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15). II형 CRISPR-Cas 유전자위는 각각의 CRISPR 배열 내 반복부와 부분적으로 상보적인 tracrRNA를 암호화할 수 있고, Csn1 및 Csn2와 같은 다른 단백질을 포함할 수 있다. cas1 및 cas2 유전자 부근에 있는 cas9의 존재는 II형 유전자위의 특징이다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15). I형 CRISPR-Cas(CRISPR-연관된(associated)) 시스템은 침입하는 바이러스 DNA에 대해 방어하기 위해 단일 CRISPR RNA(crRNA) 및 Cas3과 함께 기능하는 Cascade(항바이러스 방어에 대한 CRISPR-연관된 복합체)라 칭하는 단백질의 복합체로 이루어진다(Brouns, S.J.J. et al. Science 321:960-964; Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13:1-15, 본원에 그 전문이 포함됨).
본원에서 용어 "Cas 유전자"는 일반적으로 플랭킹 CRISPR 유전자위에 커플링되거나 회합되거나 가까이 있거나, 또는 그 부근에 있는 유전자를 지칭한다. 용어 "Cas 유전자", "cas 유전자", "CRISPR-연관된(associated)(Cas) 유전자" 및 "클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부-연관된 유전자"는 본원에서 상호 교환적으로 사용된다.
용어 "Cas 단백질" 또는 "Cas 폴리펩타이드"는 Cas(CRISPR-연관된(associated)) 유전자에 의해 암호화된 폴리펩타이드를 지칭한다. Cas 단백질은 Cas 엔도뉴클레아제를 포함한다.
Cas 단백질은 박테리아 또는 고세균 단백질일 수 있다. 본원에서 I형 내지 III형 CRISPR Cas 단백질은 통상적으로 원핵생물 기원이며, 예를 들어, I형 및 III형 Cas 단백질은 박테리아 또는 고세균 종으로부터 유래될 수 있는 반면, II형 Cas 단백질(즉, Cas9)은 박테리아 종으로부터 유래될 수 있다. 다른 양태에서, Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 동족체, 또는 변형된 버전 중 하나 이상을 포함한다. Cas 단백질은 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-HD, Cas5, Cas7, Cas8, Cas10, 또는 이들의 조합 또는 복합체를 포함한다.
용어 "Cas 엔도뉴클레아제"는, 적합한 폴리뉴클레오타이드 성분과의 복합체인 경우, 특정 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단할 수 있는 Cas 폴리펩타이드(Cas 단백질)를 지칭한다. Cas 엔도뉴클레아제는 (예를 들어, 세포의 게놈에서의 표적 부위에서) 이중 가닥 DNA에서의 특정 표적 부위의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하고 절단하는 가이드 폴리뉴클레오타이드에 의해 유도된다. 본원에 기재된 Cas 엔도뉴클레아제는 하나 이상의 뉴클레아제 도메인을 포함한다. 본원에 기재된 공여 DNA 삽입 방법에 사용된 Cas 엔도뉴클레아제는 단일 또는 이중 가닥 절단을 표적 부위에서의 DNA로 도입하는 엔도뉴클레아제이다. 대안적으로, 엔도뉴클레아제는 DNA 절단 또는 닉킹 활성이 결여될 수 있지만, 적합한 RNA 성분과 복합체를 형성할 때 여전히 DNA 표적 서열에 특이적으로 결합할 수 있다.
본원에 사용된 바와 같이, "Cas9"(이전에 Cas5, Csn1 또는 Csx12라고 지칭됨) 또는 "Cas9 엔도뉴클레아제"라고 지칭되거나 "Cas9 엔도뉴클레아제 활성"을 갖는 폴리펩타이드는 DNA 표적 서열의 전부 또는 일부에 특이적으로 결합하고, 선택적으로 이를 닉킹하거나 절단하기 위해 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드와 복합체를 형성하는 Cas 엔도뉴클레아제를 지칭한다. Cas9 엔도뉴클레아제는 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인을 포함하며, 이들 각각은 표적 서열에서 단일 DNA 가닥을 절단할 수 있다(도메인 둘 다의 공동 작용은 DNA 이중 가닥 절단으로 이어지는 반면, 하나의 도메인의 활성은 닉(nick)으로 이어짐). 일반적으로, RuvC 도메인은 서브도메인 I, II 및 III을 포함하며, 여기서 도메인 I은 Cas9의 N 말단 근처에 위치하고, 서브도메인 II 및 III은 HNH 도메인을 플랭킹하는 단백질의 중간에 위치한다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15, Hsu et al, 2013, Cell 157:1262-1278). Cas9 엔도뉴클레아제는 통상적으로 II형 CRISPR 시스템으로부터 유래되는데, 이 시스템은 적어도 하나의 폴리뉴클레오타이드 성분과의 복합체인 Cas9 엔도뉴클레아제를 사용하는 DNA 절단 시스템을 포함한다. 예를 들어, Cas9는 CRISPR RNA(crRNA) 및 전사-촉진 CRISPR RNA(tracrRNA)와의 복합체일 수 있다. 다른 예에서, Cas9는 단일 가이드 RNA와의 복합체일 수 있다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15).
Cas 엔도뉴클레아제의 "기능적 단편", "기능적으로 동등한 단편" 및 "기능적 동등 단편"은 본원에서 상호 교환적으로 사용되며, 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단(표적 부위에서 단일 또는 이중 가닥 절단을 도입)하는 능력이 유지되는 Cas 엔도뉴클레아제의 일부 또는 하위서열을 지칭한다.
본 발명의 Cas 엔도뉴클레아제의 "기능적 변이체", "기능적으로 동등한 변이체" 및 "기능적 동등 변이체"라는 용어는 본원에서 상호 교환적으로 사용되며, 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단하는 능력이 유지되는 본 발명의 Cas 엔도뉴클레아제의 변이체를 지칭한다.
특정 표적 DNA 서열에 대한 본원의 Cas 단백질의 결합 활성 및/또는 엔도뉴클레오리틱 활성을 결정하는 것은 본원에 참조로 개시된 미국 특허 제8697359호에 개시된 바와 같이 당해 분야에 공지된 임의의 적합한 분석법에 의해 평가될 수 있다. 예를 들어, 숙주 세포/유기체에서 Cas 단백질과 적합한 RNA 성분을 발현한 후, 삽입-결실(indel)의 존재에 대해 예측되는 DNA 표적 부위를 조사함으로써 결정이 이루어질 수 있다(이러한 특별한 분석법에서 Cas 단백질은 엔도뉴클레오리틱 활성[단일 또는 이중 가닥 절단 활성]을 가질 것이다). 예측되는 표적 부위에서 삽입-결실의 존재를 조사하는 것은, 예를 들어, DNA 시퀀싱 방법을 통해 또는 표적 서열의 기능 상실을 분석하여 삽입-결실의 형성을 추정함으로써 수행될 수 있다. 다른 예에서, Cas 단백질 활성은, 표적 부위 또는 그 부근의 서열에 상동성인 서열을 포함하는 공여 DNA를 제공한 숙주 세포/유기체에서 Cas 단백질과 적합한 RNA 성분을 발현시킴으로써 결정할 수 있다. (공여 서열과 표적 서열 사이의 성공적인 HR에 의해 예측되는 바와 같은) 표적 부위에서의 공여 DNA 서열의 존재는 표적화가 일어났음을 나타낼 것이다.
"Cas 엔도뉴클레아제 변이체"라고도 칭하는 Cas 엔도뉴클레아제의 변이체는 모 Cas 엔도뉴클레아제의 변이체를 지칭하고, 여기서 Cas 엔도뉴클레아제 변이체는 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드(예컨대, 본원에 기재된 가이드 폴리뉴클레오타이드)와 회합될 때 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단하는 능력을 보유한다. Cas 엔도뉴클레아제 변이체는 본원에 기재된 Cas 엔도뉴클레아제 변이체를 포함하고, 여기서 Cas 엔도뉴클레아제 변이체는 (표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) Cas 엔도뉴클레아제 변이체가 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 모 Cas 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 감소된 타깃오프 절단, 또는 임의의 이들의 조합을 갖는 방식으로 모 Cas 엔도뉴클레아제와 다르다.
본원에 사용된 바와 같이, 용어 "형질전환 효율"은 Cas9 변이체가 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 PGEN 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 형질전환된 세포의 수를 모(야생형) Cas9가 동일한 표적 부위를 변형시킬 수 있는 PGEN의 Cas 엔도뉴클레아제 성분으로서 PGEN 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 형질전환된 세포의 수로 나눈 것으로 정의된다. 이 수에 100을 곱해 %로 표현할 수 있다.
Figure pct00001
1(또는 100%)의 형질전환 효율은 Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수가 WT Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수와 거의 동일하거나 동일하다는 것을 나타낸다. 이 경우에, Cas9 변이체는 이의 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 특성을 갖지 않을 것이다. 반대로, 1 초과의 형질전환 효율은 Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수가 WT Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수보다 크다는 것을 나타낸다. 이 경우에, Cas9 변이체는 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 특성, 예를 들어 개선된 형질전환 효율을 갖는다.
본원에 사용된 바와 같이, 용어 "편집 효율" 또는 "DNA 편집 효율"은 본원에서 상호 교환적으로 사용되며, Cas9 변이체가 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 PGEN 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 DNA 편집을 포함하는 세포(편집된 세포)의 수를 모(야생형) Cas9가 동일한 표적 부위를 변형시킬 수 있는 PGEN의 Cas 엔도뉴클레아제 성분으로서 PGEN 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와 조합되어 사용될 때 얻은 편집된 세포의 수로 나눈 것으로 정의된다. 이 수에 100을 곱해 %로 표현할 수 있다.
Figure pct00002
1(또는 100%)의 DNA 편집 효율은 Cas9 변이체가 사용될 때 얻은 편집된 세포의 수가 WT Cas9 변이체가 사용될 때 얻은 편집된 세포의 수와 거의 동일하거나 동일하다는 것을 나타낸다. 이 경우에, Cas9 변이체는 이의 모 cas9 엔도뉴클레아제와 비교할 때 개선된 특성을 갖지 않을 것이다. 반대로, 1 초과의 DNA 편집 효율은 Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수가 모(WT) Cas9 변이체가 사용될 때 얻은 형질전환된 세포의 수보다 크다는 것을 나타낸다. 이 경우에, Cas9 변이체는 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 특성, 예를 들어 개선된 편집 효율을 갖는다.
Cas 엔도뉴클레아제 변이체는 모 Cas 엔도뉴클레아제의 아미노산 서열과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함할 수 있다.
변이체 Cas 엔도뉴클레아제 유전자(변이체 cas 유전자)는 모 Cas 엔도뉴클레아제 뉴클레오타이드 서열과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 뉴클레오타이드 서열을 포함할 수 있다.
본원에서 모 Cas 엔도뉴클레아제의 비제한적인 예는 임의의 하기 속으로부터의 Cas 엔도뉴클레아제일 수 있다: 아에로피룸(Aeropyrum), 피로바쿨룸(Pyrobaculum), 술폴로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로아르쿨라(Haloarcula), 메타노박테리움(Methanobacterium), 메타노코커스(Methanococcus), 메타노사르시나(Methanosarcina), 메타노피러스(Methanopyrus), 피로코커스(Pyrococcus), 피크로필러스(Picrophilus), 써니오플라스니아(Thernioplasnia), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobacterium), 스트렙토마이세스(Streptomyces), 아퀴펙스(Aquifex), 포르피로모나스(Porphyromonas), 클로로비움(Chlorobium), 써머스(Thermus), 바실러스(Bacillus), 리스테리아(Listeria), 스타필로코커스(Staphylococcus), 클로스트리디움(Clostridium), 써모아나에로박터(Thermoanaerobacter), 마이코플라스마(Mycoplasma), 푸소박테리움(Fusobacterium), 아자쿠스(Azarcus), 크로모박테리움(Chromobacterium), 네이세리아(Neisseria), 니트로소모나스(Nitrosomonas), 디설포비브리오(Desulfovibrio), 게오박터(Geobacter), 미로코커스(Myrococcus), 캄필로박터(Campylobacter), 볼리넬라(Wolinella), 아시네토박터(Acinetobacter), 에르위니아(Erwinia), 에스케리치아(Escherichia), 레지오넬라(Legionella), 메틸로코커스(Methylococcus), 파스퇴렐라(Pasteurella), 포토박테리움(Photobacterium), 살모넬라(Salmonella), 잔토모나스(Xanthomonas), 예시니아(Yersinia), 스트렙토코커스(Streptococcus), 트레포네마(Treponema), 프란시셀라(Francisella) 또는 써모토가(Thermotoga). 더욱이, 본원에서 모 Cas 엔도뉴클레아제는 미국 출원 공보 제2010/0093617호(본원에서 참조로 포함됨)에 개시된 바와 같은, 예를 들어 임의의 서열 번호 462 내지 465, 467 내지 472, 474 내지 477, 479 내지 487, 489 내지 492, 494 내지 497, 499 내지 503, 505 내지 508, 510 내지 516, 또는 517 내지 521에 의해 암호화될 수 있다.
더욱이, 본원에서 모 Cas9 엔도뉴클레아제는 예를 들어 스트렙토코커스(예를 들어, S. 피오제네스(pyogenes), S. 뉴모니애(pneumoniae), S. 써모필러스(thermophilus), S. 아갈락티아(agalactiae), S. 파라상귀니스(parasanguinis), S. 오랄리스(oralis), S. 살리바리우스(salivarius), S. 마카카(macacae), S. 디스갈락티애(dysgalactiae), S. 안지노서스(anginosus), S. 콘스텔라투스(constellatus), S. 슈도포르시누스(pseudoporcinus), S. 뮤탄스(mutans)), 리스테리아(예를 들어, L. 인노쿠아(innocua)), 스피로플라즈마(Spiroplasma)(예를 들어, S. 아피스(apis), S. 시르피디콜라(syrphidicola)), 펩토스트렙토코카세(Peptostreptococcaceae), 아토포비움(Atopobium), 포르피로모나스(Porphyromonas)(예를 들어, P. 카토니아(catoniae)), 프레보텔라(Prevotella)(예를 들어, P. 인테르메디아(intermedia)), 베일로넬라(Veillonella), 트레포네마(Treponema)(예를 들어, T. 소크란스키(socranskii), T. 덴티콜라(denticola)), 카프노사이토파가(Capnocytophaga), 피네골디아(Finegoldia)(예를 들어, F. 마그나(magna)), 코리오박테리아세아에(Coriobacteriaceae)(예를 들어, C. 박테리움(bacterium)), 올세넬라(Olsenella)(예를 들어, O. 프로푸사(profusa)), 헤모필루스(Haemophilus)(예를 들어, H. 스푸토룸(sputorum), H. 피트마니아에(pittmaniae)), 파스퇴렐라(Pasteurella)(예를 들어, P. 베티아에(bettyae)), 올리비박터(Olivibacter)(예를 들어, O. 시티엔시스(sitiensis)), 에필리토니모나스(Epilithonimonas)(예를 들어, E. 테낙스(tenax)), 메소니아(Mesonia)(예를 들어, M. 모빌리스(mobilis)), 락토바실루스(Lactobacillus)(예를 들어, L. 플란타룸(plantarum)), 바실루스(예를 들어, B. 세레우스(cereus)), 아퀴마리나(Aquimarina)(예를 들어, A. 무엘레리(muelleri)), 크리세오박테리움(Chryseobacterium)(예를 들어, C. 파루스트레(palustre)), 박테로이데스(Bacteroides)(예를 들어, B. 그라미니솔벤스(graminisolvens)), 네이세리아(예를 들어, N. 메닝기티디스(meningitidis)), 프란시셀라(Francisella)(예를 들어, F. 노비시다(novicida)) 또는 플라보박테리움(Flavobacterium)(예를 들어, F. 프리기다리움(frigidarium), F. 솔리(soli)) 종으로부터 유래될 수 있다. 일 양태에서, S. 피오제네스 모 Cas9 엔도뉴클레아제가 본원에 기재된다. 다른 예로서, 모 Cas9 엔도뉴클레아제는 Chylinski et al. (RNA Biology 10:726-737)(본원에 참조로 포함됨)에 개시된 임의의 Cas9 단백질일 수 있다.
본원에서 모 Cas9 엔도뉴클레아제의 서열은, 예를 들어, 참조로 포함되는 진뱅크(GenBank) 등록번호 G3ECR1(S. 써모필러스), WP_026709422, WP_027202655, WP_027318179, WP_027347504, WP_027376815, WP_027414302, WP_027821588, WP_027886314, WP_027963583, WP_028123848, WP_028298935, Q03JI6(S. 써모필러스), EGP66723, EGS38969, EGV05092, EHI65578(S. 슈도포르시누스), EIC75614(S. 오랄리스), EID22027(S. 콘스텔라투스), EIJ69711, EJP22331(S. 오랄리스), EJP26004(S. 안지노서스), EJP30321, EPZ44001(S. 피오제네스), EPZ46028(S. 피오제네스), EQL78043(S. 피오제네스), EQL78548(S. 피오제네스), ERL10511, ERL12345, ERL19088(S. 피오제네스), ESA57807(S. 피오제네스), ESA59254(S. 피오제네스), ESU85303(S. 피오제네스), ETS96804, UC75522, EGR87316(S. 디스갈락티애), EGS33732, EGV01468(S. 오랄리스), EHJ52063(S. 마카카), EID26207(S. 오랄리스), EID33364, EIG27013(S. 파라상귀니스), EJF37476, EJO19166(스트렙토코커스 종 BS35b), EJU16049, EJU32481, YP_006298249, ERF61304, ERK04546, ETJ95568(S. 아갈락티아), TS89875, ETS90967(스트렙토코커스 종 SR4), ETS92439, EUB27844(스트렙토코커스 종 BS21), AFJ08616, EUC82735(스트렙토코커스 종 CM6), EWC92088, EWC94390, EJP25691, YP_008027038, YP_008868573, AGM26527, AHK22391, AHB36273, Q927P4, G3ECR1 또는 Q99ZW2(S. 피오제네스)에 개시된 Cas9 아미노산 서열 중 임의의 것을 포함할 수 있다. 대안적으로, 본원의 Cas9 단백질은, 예를 들어, (본원에 참조로 포함된) 미국 출원 공개 제2010/0093617호에 개시된 바와 같은 서열 번호 462(S. 써모필러스), 474(S. 써모필러스), 489(S. 아갈락티아), 494(S. 아갈락티아), 499(S. 뮤탄스), 505(S. 피오제네스) 또는 518(S. 피오제네스) 중 임의의 것에 의해 암호화될 수 있다.
소정의 아미노산이 서로 유사한 구조적 특징 및/또는 전하 특징을 공유함(즉, 보존)을 고려하면, Cas9에서의 각 위치에서의 아미노산은 개시된 서열에서 제공된 것과 같거나, 다음과 같이 보존된 아미노산 잔기로 치환될 수 있다("보존적 아미노산 치환"):
1. 다음과 같은 작은 지방족의 비극성 또는 약간 극성인 잔기가 서로를 대체할 수 있다: Ala (A), Ser (S), Thr(T), Pro (P), Gly (G);
2. 다음과 같은 극성의 음으로 하전된 잔기 및 그들의 아미드가 서로를 대체할 수 있다: Asp (D), Asn (N), Glu (E), Gln (Q);
3. 다음과 같은 극성의 양으로 하전된 잔기가 서로를 대체할 수 있다: His (H), Arg (R), Lys (K);
4. 다음과 같은 지방족의 비극성 잔기가 서로를 대체할 수 있다: Ala (A), Leu (L), Ile (I), Val (V), Cys (C), Met (M); 및
5. 다음과 같은 큰 방향족 잔기가 서로를 대체할 수 있다: Phe (F), Tyr (Y), Trp (W).
단편 및 변이체는 부위 지정 돌연변이유발 및 합성 제조와 같은 방법을 통해 수득될 수 있다. 엔도뉴클레아제 활성을 측정하는 방법은, 예컨대, 비제한적인 예로서 본원에 참조로 포함되는, 2013년 5월 1일 출원된 PCT/US13/39011, 2016년 5월 12일 출원된 PCT/US16/32073, 2016년 5월 12일 출원된 PCT/US16/32028에 잘 알려져 있다.
일 구현예에서, Cas 엔도뉴클레아제 변이체는 본원에 기재된 Cas9 엔도뉴클레아제 변이체이다. 본원에 사용된 바와 같이, "Cas9 엔도뉴클레아제 변이체" 또는 "Cas9 변이체"는 Cas9 엔도뉴클레아제 변이체가 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 본원에 기재된 단일 가이드 폴리뉴클레오타이드(예컨대, 가이드 폴리뉴클레오타이드)와 회합될 때 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 풀거나 닉킹하거나 절단하는 능력을 보유하는 모 Cas9 엔도뉴클레아제의 변이체를 지칭한다. Cas9 엔도뉴클레아제 변이체는 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하고, 여기서 Cas 엔도뉴클레아제 변이체는 (표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) Cas9 엔도뉴클레아제 변이체가 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 감소된 타깃오프 절단, 또는 임의의 이들의 조합을 갖는 방식으로 모 Cas9 엔도뉴클레아제와 다르다.
본원에 기재된 Cas9 엔도뉴클레아제 변이체는 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드와 회합될 때 이중 가닥 DNA 표적 부위에 결합하고 이를 닉킹할 수 있는 변이체를 포함하는 반면, 모 Cas 엔도뉴클레아제는 cr뉴클레오타이드 및 tracr뉴클레오타이드와, 또는 단일 가이드 폴리뉴클레오타이드와 회합될 때 표적 부위에서 이중 가닥 파괴(절단)에 결합하고 만들 수 있다.
본원에 기재된 바와 같이, (표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) HNH 및 RuvC 도메인 밖에 적어도 하나의 아미노산 변형을 갖는 Cas9 엔도뉴클레아제 변이체가 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대, 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 또는 이들의 조합을 가질 수 있다는 것이 놀랍게도 그리고 예상치 못하게 발견되었다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인, 및 HNH 및 RuvC 도메인 밖에 위치한 적어도 하나의 아미노산 변형(적어도 하나의 아미노산의 결실, 치환 또는 삽입)을 포함한다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 포함한다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 이의 HNH 및 RuvC 도메인 밖에 아미노산 변형을 갖고, 여기서 상기 Cas9 엔도뉴클레아제는 상기 아미노산 변형을 포함하지 않는 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율 및/또는 DNA 편집 효율을 갖고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 상기 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체를 형성할 수 있다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 동일성을 갖고, 155번 위치에서의 적어도 하나의 아미노산 치환을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
155번 위치에서의 Cas9 엔도뉴클레아제 변이체 치환은 각각 Cas9 Y155H 변이체(서열 번호 58), Cas9 Y155N 변이체(서열 번호 123), Cas9 Y155E 변이체(서열 번호 125 및 Cas9 Y155F 변이체(서열 번호 127)를 생성시키는 Y155H, Y155N, Y155E, Y155F로 이루어진 군으로부터 선택될 수 있다. Cas9 Y155 변이체를 암호화하는 DNA 서열은 당해 분야에 널리 공지된 바와 같이 특정 숙주 유기체에서의 발현을 위해 최적화될 수 있다. Cas9Y155 변이체 단백질을 암호화하는 DNA 서열의 예는 서열 번호 122, 124, 126 및 128에 기재되어 있다.
일 양태에서, 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 동일성을 갖고, 86번 위치에서의 하나 및 98번 위치에서의 다른 하나인 적어도 2개의 아미노산 치환을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
86번 위치에서의 Cas9 엔도뉴클레아제 변이체 치환은 Cas9 F86A 변이체를 생성시키는 F86A 치환일 수 있다.
89번 위치에서의 Cas9 엔도뉴클레아제 변이체는 Cas9 F98A 변이체를 생성시키는 F98A 치환일 수 있다.
Cas9 엔도뉴클레아제 변이체는 서열 번호 129에 기재된 Cas9 F86A-F98A 변이체를 생성시키는 F86A 치환과 같은 86번 위치에서의 제1 치환 및 F98A 치환과 같은 98번 위치에서의 제2 치환인 적어도 2개의 치환을 포함할 수 있다.
Cas9 엔도뉴클레아제 변이체는 적어도 3개의 치환을 포함할 수 있고, 적어도 3개의 치환은 F86A 치환과 같은 86번 위치에서의 제1 치환, F98A 치환과 같은 98번 위치에서의 제2 치환 및 Y155H, Y155N, Y155E, Y155F로 이루어진 군으로부터 선택된 제3 치환을 포함한다.
Cas9 Y155 변이체를 암호화하는 DNA 서열은 당해 분야에 널리 공지된 바와 같이 특정 숙주 유기체에서의 발현을 위해 최적화될 수 있다. Cas9Y155 변이체 단백질을 암호화하는 DNA 서열의 예는 서열 번호 122, 124, 126 및 128에 기재되어 있다. Cas9F86A-F98A 변이체 단백질을 암호화하는 DNA 서열의 예는 서열 번호 130에 기재되어 있다.
(표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 가이드 폴리뉴클레오타이드와의 복합체일 때) 86번, 98번 및 155번 위치, 또는 임의의 이들의 조합으로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개 또는 적어도 3개의 치환을 포함하는 Cas9 엔도뉴클레아제 변이체는 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 이의 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 또는 이들의 조합을 가질 수 있다.
86번, 98번 및 155번 위치(또는 임의의 조합)로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개 또는 적어도 3개의 치환은 당업자에게 공지된 임의의 다른 아미노산 변형과 조합될 수 있다. 일 양태에서, 본원에 기재된 86번, 98번 및 155번 위치로 이루어진 군으로부터 선택된 임의의 하나의 치환(또는 임의의 하나의 이들의 조합)은 Cas9 엔도뉴클레아제가 닉카아제로서 작용하게 하도록 당업자에게 공지된 HNH 및 RuvC 도메인에 위치한 임의의 아미노산 치환과 조합될 수 있다(Trevino A. E. and Feng Zhang, 2014, Methods in Enzymology, volume 546 pg 161-174). "닉카아제" Cas9(Cas9n)는 HNH 또는 RuvC 도메인 내에 핵심 촉매 잔기에서 알라닌 치환에 의해 생성될 수 있고, SpCas9 D10A는 RuvC를 불활성화하는 반면(Jinek, M, et al, 2012, Science, 337(6096), 816-821), N863A는 HNH를 불활성화하는 것으로 밝혀졌다(Nishimasu et al., 2014; Shen et al 2014 Nature Methods 11, 399-402). H840A 돌연변이(Shen et al 2014 Nature Methods 11, 399-402)는 또한 Cas9를 닉킹 효소로 전환시킨다고 보고되었지만, 이 돌연변이체는 N863A와 비교될 때 포유류 세포에서 감소된 활성 수준을 가졌다(Nishimasu et al. 2014, Cell, 156(5), 935-949).
일 양태에서, Cas9(N863A), Cas9(D10A) 및/또는 Cas9(H840A)는 본원에 기재된 86번, 98번 및 155번 위치(또는 임의의 조합)로 이루어진 군으로부터 선택된 적어도 하나의 치환을 포함하도록 추가로 변형될 수 있어, 선택적으로 각각 변형된 Cas9(N863A), Cas9(D10A) 및/또는 Cas9(H840A)의 특성을 개선시킨다.
일 양태에서, 본원에 기재된 86번, 98번 및 155번 위치(또는 임의의 이들의 조합)로 이루어진 군으로부터 선택된 치환들 중 어느 하나는 D10A, H840A 또는 N863A 및 H840A로 이루어진 군으로부터 선택된 아미노산 치환과 조합될 수 있다.
일 양태에서, 변이체의 아미노산 위치가 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는 155번 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율, 증가된 DNA 편집 효율, 또는 이들의 조합으로부터 선택된 적어도 하나의 개선된 특성을 갖는다.
일 양태에서, 변이체의 아미노산 위치가 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는 155번 위치에서 Y155H 치환을 갖는 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율을 갖는다. 일 양태에서, 이 증가된 형질전환 효율은 원핵생물 숙주 세포, 예컨대 비제한적인 예로서 바실러스 종 또는 에스케리치아 콜라이(E. 콜라이) 숙주 세포에서 관찰된다.
일 양태에서, 변이체의 아미노산 위치가 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는 155번 위치에서 Y155H 치환을 갖는 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 형질전환 효율 및 증가된 DNA 편집 효율을 갖는다. 일 양태에서, 이 증가된 형질전환 효율 및 증가된 DNA 편집 효율은 원핵생물 숙주 세포, 예컨대 비제한적인 예로서 바실러스 종 또는 에스체리치아 콜라이(E. 콜라이) 숙주 세포에서 관찰된다.
본원에 기재된 Cas9 변이체의 개선된 특성은 증가된 형질전환 효율을 포함하고, 여기서 모 Cas 엔도뉴클레아제와 비교할 때 형질전환 효율은 모 Cas 엔도뉴클레아제와 비교할 때 적어도 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배 이하로 증가된다.
본원에 기재된 Cas9 변이체의 개선된 특성은 증가된 DNA 편집 효율을 포함하고, 여기서 모 Cas 엔도뉴클레아제와 비교할 때 DNA 편집 효율은 모 Cas 엔도뉴클레아제와 비교할 때 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 210%, 220%, 230% 또는 250%, 또는 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배 이하 증가한다.
본원에 기재된 Cas 엔도뉴클레아제 변이체는 본원에 추가로 기재된 바와 같은 원핵생물 및 진핵생물 세포 및 유기체의 게놈 변형에 사용될 수 있다.
개시된 방법에서 사용하기 위한 Cas 엔도뉴클레아제, 또는 이의 기능적 단편 또는 변이체는 유전적으로 변형된 숙주 세포(예를 들어, 박테리아 세포, 곤충 세포, 진균 세포, 효모 세포 또는 인간-유래 세포주)가 Cas 단백질을 암호화하는 핵산 서열을 발현하도록 변형된 재조합 원천으로부터 단리될 수 있다. 대안적으로, Cas 단백질은 무세포 단백질 발현 시스템을 사용하여 생산되거나 합성적으로 생산될 수 있다.
본원에 기재된 Cas9 Y155 엔도뉴클레아제 변이체를 포함하는 Cas 엔도뉴클레아제는 Cas 폴리펩타이드의 변형된 형태를 포함할 수 있다. Cas 폴리펩타이드의 변형된 형태는 Cas 단백질의 자연 발생 뉴클레아제 활성을 감소시키는 아미노산 변화(예를 들어, 결실, 삽입 또는 치환)를 포함할 수 있다. 예를 들어, 일부 경우에, 본원에 기재된 Cas9 Y155 엔도뉴클레아제 변이체를 포함하는 Cas 단백질의 변형된 형태는 상응하는 야생형 Cas 폴리펩타이드의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만을 갖는다(2014년 3월 6일 공개된 미국 특허 출원 US20140068797 A1). 일부 경우에, Cas 폴리펩타이드의 변형된 형태는 실질적인 뉴클레아제 활성을 갖지 않으며, 촉매적으로 "불활성화된 Cas" 또는 "탈활성화된 Cas(dCas)"로 지칭된다. 불활성화된 Cas/탈활성화된 Cas는 탈활성화된 Cas 엔도뉴클레아제(dCas)를 포함한다. 본원에 기재된 Cas9 Y155 엔도뉴클레아제 변이체로부터 기원하는 것을 포함하는 촉매적으로 불활성인 Cas는 본원에 기재된 바와 같은 이종 서열에 융합될 수 있다.
본원에 기재된 Cas 엔도뉴클레아제 및 가이드 폴리뉴클레오타이드를 발현하는 재조합 DNA 작제물(이의 기능적 단편, 박테리아-, 진균-, 식물-, 미생물- 또는 포유류-코돈 최적화된 Cas 단백질을 포함)은 유기체의 게놈으로 안정하게 통합될 수 있다. 예를 들어, 미생물의 게놈에 안정하게 통합된 Cas 유전자를 포함하는 미생물이 생산될 수 있다.
본원에 기재된 Cas 엔도뉴클레아제(예컨대, 비제한적인 예로서 본원에 기재된 Cas9 엔도뉴클레아제 Y155 변이체)는 당해 분야에 공지된 방법(예컨대, 2016년 11월 24일 공개된 WO2016/186946(본원에 참조로 포함됨)의 실시예 2에 기재된 것)에 의해 발현되고 정제될 수 있다.
Cas 단백질 융합
본원에 기재된 Cas 엔도뉴클레아제, 또는 Cas 엔도뉴클레아제 변이체는 하나 이상의 이종 단백질 도메인(예를 들어, Cas 폴리펩타이드 이외의 1개, 2개, 3개 이상의 도메인)을 포함하는 융합 단백질의 일부일 수 있다. 이러한 융합 단백질은 임의의 추가적인 단백질 서열, 및 선택적으로 임의의 2개의 도메인들 사이, 예컨대, Cas 폴리펩타이드와 제1 이종 도메인 사이의 링커 서열을 포함할 수 있다. Cas 폴리펩타이드에 융합될 수 있는 단백질 도메인의 예는 제한 없이 에피토프 태그(예를 들어, 히스티딘[His], V5, FLAG, 인플루엔자 혈구응집소[HA], myc, VSV-G, 티오레독신[Trx]), 리포터(예를 들어, 글루타티온-5-트랜스퍼라아제[GST], 홀스래디쉬 퍼옥시다아제[HRP], 클로람페니콜 아세틸트랜스퍼라아제[CAT], 베타-갈락토시다아제, 베타-글루쿠로니다아제[GUS], 루시퍼라아제, 녹색 형광 단백질[GFP], HcRed, DsRed, 청록색 형광 단백질[CFP], 황색 형광 단백질[YFP], 청색 형광 단백질[BFP]) 및 메틸라아제 활성, 탈메틸라아제 활성, 전사 활성화 활성(예를 들어, VP16 또는 VP64), 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성 중 하나 이상을 갖는 도메인을 포함한다. Cas 엔도뉴클레아제는 DNA 분자 또는 다른 분자에 결합하는 단백질, 예컨대 말토스 결합 단백질(MBP: maltose binding protein), S-태그, Lex A DNA 결합 도메인(DBD), GAL4A DNA 결합 도메인 및 단순 포진 바이러스(HSV: herpes simplex virus) VP16과 또한 융합될 수도 있다.
Cas 엔도뉴클레아제는 이종 조절 요소, 예컨대 핵 국재화 서열(NLS: nuclear localization sequence)을 포함할 수 있다. 이종 NLS 아미노산 서열은 본원의 세포의 핵에서 검출 가능한 양으로 Cas 엔도뉴클레아제의 축적을 유도하기에 충분한 강도일 수 있다. NLS는 염기성의, 양으로 하전된 잔기(예를 들어, 라이신 및/또는 아르기닌)의 하나(1부분(monopartite)) 이상(예를 들어, 2부분(bipartite))의 짧은 서열(예를 들어, 2 내지 20개의 잔기)을 포함할 수 있으며, Cas 아미노산 서열 중 어디에도 위치할 수 있지만 단백질 표면 상에 노출되어야 한다. NLS는, 예를 들어, 본원의 Cas 단백질의 N 말단 또는 C 말단에 작동 가능하게 연결될 수 있다. 2개 이상의 NLS 서열이 Cas 단백질에 연결될 수 있는데, 예를 들어, Cas 단백질의 N 말단과 C 말단 모두에 연결될 수 있다. Cas 유전자는 Cas 코돈 영역 상류의 SV40 핵 표적화 신호 및 Cas 코돈 영역 하류의 2부분 VirD2 핵 국재화 신호에 작동 가능하게 연결될 수 있다(Tinland et al. (1992) Proc. Natl. Acad. Sci. USA 89:7442-6). 본원의 적합한 NLS 서열의 비제한적 예는 미국 특허 제6660830호 및 제7309576호에 개시된 것들을 포함하며, 둘 다 본원에 참조로 포함된다. 이종 NLS 아미노산 서열은 식물, 바이러스 및 포유류 핵 국재화 신호를 포함한다.
촉매적으로 활성인 및/또는 불활성인 Cas 엔도뉴클레아제는 이종 서열에 융합될 수 있다(2014년 3월 6일 공개된 미국 특허 출원 US20140068797 A1). 적합한 융합 상대는 직접 표적 DNA 상에 또는 표적 DNA와 결합된 폴리펩타이드(예를 들어, 히스톤 또는 다른 DNA-결합 단백질) 상에 작용하여 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩타이드를 포함하지만, 이에 한정되는 것은 아니다. 추가적인 적합한 융합 상대는 메틸트랜스퍼라아제 활성, 탈메틸라아제 활성, 아세틸트랜스퍼라아제 활성, 탈아세틸라아제 활성, 키나아제 활성, 포스파타아제 활성, 유비퀴틴 리가아제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성을 제공하는 폴리펩타이드를 포함하지만, 이에 한정되는 것은 아니다. 추가의 적합한 융합 상대는 표적 핵산의 증가된 전사를 직접적으로 제공하는 폴리펩타이드(예를 들어, 전사 활성인자 또는 이의 단편, 전사 활성인자를 모집하는 단백질 또는 이의 단편, 소분자/약물 반응성 전사 조절인자 등)를 포함하지만, 이에 한정되는 것은 아니다. 촉매적으로 불활성인 Cas9 엔도뉴클레아제는 또한 이중 가닥 파괴를 생성하기 위해 FokI 뉴클레아제에 융합될 수 있다(Guilinger et al. Nature biotechnology, volume 32, number 6, June 2014).
가이드 폴리뉴클레오타이드
본원에 사용된 바와 같이, 용어 "가이드 폴리뉴클레오타이드"는 Cas 엔도뉴클레아제와 복합체를 형성할 수 있고, Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단할 수 있게 하는 폴리뉴클레오타이드 서열을 지칭한다. 가이드 폴리뉴클레오타이드는 단일 분자 또는 이중 분자일 수 있다. 가이드 폴리뉴클레오타이드 서열은 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다. 선택적으로, 가이드 폴리뉴클레오타이드는 적어도 하나의 뉴클레오타이드, 포스포디에스테르 결합 또는 연결 변형, 예컨대, 잠김 핵산(LNA: Locked Nucleic Acid), 5-메틸 dC, 2,6-디아미노퓨린, 2'-플루오로 A, 2'-플루오로 U, 2'-O-메틸 RNA, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18(헥사에틸렌 글리콜 사슬) 분자에 대한 연결, 또는 고리화를 초래하는 5'에서 3'으로의 공유 연결을 포함할 수 있지만, 이에 한정되는 것은 아니다. 단독으로 리보핵산을 포함하는 가이드 폴리뉴클레오타이드는 "가이드 RNA" 또는 "gRNA"라고도 지칭된다.
가이드 폴리뉴클레오타이드는 cr뉴클레오타이드 서열 및 tracr뉴클레오타이드 서열을 포함하는 이중 분자(듀플렉스 가이드 폴리뉴클레오타이드라고도 함)일 수 있다. cr뉴클레오타이드는 표적 DNA에서의 뉴클레오타이드 서열에 혼성화될 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인(Variable Targeting domain) 또는 VT 도메인이라고 칭함) 및 Cas 엔도뉴클레아제 인식(CER: Cas endonuclease recognition) 도메인의 일부인 제2 뉴클레오타이드 서열(tracr 메이트 서열이라고도 칭함)을 포함한다. tracr 메이트 서열은 상보성 영역을 따라 tracr뉴클레오타이드에 혼성화될 수 있고, 함께 Cas 엔도뉴클레아제 인식 도메인 또는 CER 도메인을 형성할 수 있다. CER 도메인은 Cas 엔도뉴클레아제 폴리펩타이드와 상호작용할 수 있다. 듀플렉스 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드는 RNA, DNA, 및/또는 RNA-DNA-조합 서열일 수 있다. (2015년 3월 19일 공개된 미국 특허 출원 US20150082478 및 2015년 2월 26일 공개된 US20150059010, 둘 다 본원에 참조로 포함됨). 일부 구현예에서, 듀플렉스 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 분자는 "crDNA"(연속된 DNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "crRNA"(연속된 RNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "crDNA-RNA"(DNA와 RNA 뉴클레오타이드의 조합으로 구성되는 경우)로 지칭된다. cr뉴클레오타이드는 박테리아 및 고세균에서 자연적으로 발생하는 crRNA의 단편을 포함할 수 있다. 박테리아 및 고세균에서 자연적으로 발생하고 본원에 개시된 cr뉴클레오타이드에 존재할 수 있는 crRNA의 단편의 크기는 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 이상의 뉴클레오타이드 범위를 가질 수 있지만, 이들 범위로 제한되는 것은 아니다. 일부 구현예에서, tracr뉴클레오타이드는 "tracrRNA"(연속된 RNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "tracrDNA"(연속된 DNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "tracrDNA-RNA"(DNA와 RNA 뉴클레오타이드의 조합으로 구성되는 경우)로 지칭된다. 특정 구현예에서, RNA/Cas9 엔도뉴클레아제 복합체를 유도하는 RNA는 듀플렉스 crRNA-tracrRNA를 포함하는 듀플렉스화된 RNA이다.
일 양태에서, 가이드 폴리뉴클레오타이드는 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 PGEN을 형성할 수 있는 가이드 폴리뉴클레오타이드이고, 여기서 상기 가이드 폴리뉴클레오타이드는 표적 DNA에서 뉴클레오타이드 서열에 상보적인 제1 뉴클레오타이드 서열 도메인(VT 도메인) 및 상기 Cas 엔도뉴클레아제 폴리펩타이드와 상호작용하는 제2 뉴클레오타이드 서열 도메인을 포함한다.
일 양태에서, 가이드 폴리뉴클레오타이드는 본원에 기재된 가이드 폴리뉴클레오타이드이고, 여기서 제1 뉴클레오타이드 서열 도메인(VT 도메인) 및 제2 뉴클레오타이드 서열 도메인은 DNA 서열, RNA 서열, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일 양태에서, 가이드 폴리뉴클레오타이드는 본원에 기재된 가이드 폴리뉴클레오타이드이고, 여기서 제1 뉴클레오타이드 서열 및 제2 뉴클레오타이드 서열 도메인은 안정성을 향상시키는 RNA 골격 변형, 안정성을 향상시키는 DNA 골격 변형 및 이들의 조합으로 이루어진 군으로부터 선택된다(문헌[Kanasty et al., 2013, Common RNA-backbone modifications, Nature Materials 12:976-977] 참조).
가이드 폴리뉴클레오타이드는 적어도 하나의 tracrRNA에 (비공유로) 연결된 키메라성 비자연 발생 crRNA를 포함하는 이중 RNA 분자를 포함한다. 키메라성 비자연 발생 crRNA는 자연에서 함께 발견되지 않는 영역을 포함하는 crRNA를 포함한다(즉, 이들은 서로 이종임). 예를 들어, 비자연 발생 crRNA는 자연 발생 스페이서 서열이 이종 가변 표적화 도메인에 대해 교환되는 crRNA이다. 비자연 발생 crRNA는 제2 뉴클레오타이드 서열(tracr 메이트 서열이라고도 칭함)에 연결된 표적 DNA에서 뉴클레오타이드 서열에 혼성화할 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 칭함)을 포함하여서 제1 서열과 제2 서열은 자연에서 함께 연결되는 것으로 발견되지 않는다.
가이드 폴리뉴클레오타이드는 또한 tracr뉴클레오타이드 서열에 연결된 cr뉴클레오타이드 서열을 포함하는 단일 분자(단일 가이드 폴리뉴클레오타이드라고도 함)일 수 있다. 단일 가이드 폴리뉴클레오타이드는 표적 DNA에서의 뉴클레오타이드 서열에 혼성화할 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 칭함) 및 Cas 엔도뉴클레아제 폴리펩타이드와 상호작용하는 Cas 엔도뉴클레아제 인식 도메인(CER 도메인)을 포함한다. "도메인"은 RNA, DNA, 및/또는 RNA-DNA 조합 서열일 수 있는 연속된 뉴클레오타이드 스트레치를 의미한다. 단일 가이드 폴리뉴클레오타이드의 VT 도메인 및/또는 CER 도메인은 RNA 서열, DNA 서열, 또는 RNA-DNA-조합 서열을 포함할 수 있다. cr뉴클레오타이드 및 tracr뉴클레오타이드로부터의 서열들로 구성되는 단일 가이드 폴리뉴클레오타이드는 "단일 가이드 RNA"(연속된 RNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "단일 가이드 DNA"(연속된 DNA 뉴클레오타이드 스트레치로 구성되는 경우) 또는 "단일 가이드 RNA-DNA"(RNA와 DNA 뉴클레오타이드의 조합으로 구성되는 경우)로 지칭될 수 있다. 단일 가이드 폴리뉴클레오타이드는 Cas 엔도뉴클레아제와 복합체를 형성할 수 있으며, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템이라고도 칭함)는 Cas 엔도뉴클레아제를 게놈 표적 부위로 지시하여 Cas 엔도뉴클레아제가 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일 또는 이중 가닥 파괴를 도입)하게 할 수 있다.
용어 "가변 표적화 도메인" 또는 "VT 도메인"은 본원에서 상호 교환적으로 사용되며, 이중 가닥 DNA 표적 부위의 한 가닥(뉴클레오타이드 서열)에 혼성화할 수 있는(상보적인) 뉴클레오타이드 서열을 포함한다. 제1 뉴클레오타이드 서열 도메인(VT 도메인)과 표적 서열 사이의 상보성%는 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 63%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%일 수 있다. 가변 표적화 도메인은 적어도 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개 또는 30개 뉴클레오타이드의 길이일 수 있다.
가변 표적화 도메인은 12개 내지 30개, 12개 내지 29개, 12개 내지 28개, 12개 내지 27개, 12개 내지 26개, 12개 내지 25개, 12개 내지 26개, 12개 내지 25개, 12개 내지 24개, 12개 내지 23개, 12개 내지 22개, 12개 내지 21개, 12개 내지 20개, 12개 내지 19개, 12개 내지 18개, 12개 내지 17개, 12개 내지 16개, 12개 내지 15개, 12개 내지 14개, 12개 내지 13개, 13개 내지 30개, 13개 내지 29개, 13개 내지 28개, 13개 내지 27개, 13개 내지 26개, 13개 내지 25개, 13개 내지 26개, 13개 내지 25개, 13개 내지 24개, 13개 내지 23개, 13개 내지 22개, 13개 내지 21개, 13개 내지 20개, 13개 내지 19개, 13개 내지 18개, 13개 내지 17개, 13개 내지 16개, 13개 내지 15개, 13개 내지 14개, 14개 내지 30개, 14개 내지 29개, 14개 내지 28개, 14개 내지 27개, 14개 내지 26개, 14개 내지 25개, 14개 내지 26개, 14개 내지 25개, 14개 내지 24개, 14개 내지 23개, 14개 내지 22개, 14개 내지 21개, 14개 내지 20개, 14개 내지 19개, 14개 내지 18개, 14개 내지 17개, 14개 내지 16개, 14개 내지 15개, 15개 내지 30개, 15개 내지 29개, 15개 내지 28개, 15개 내지 27개, 15개 내지 26개, 15개 내지 25개, 15개 내지 26개, 15개 내지 25개, 15개 내지 24개, 15개 내지 23개, 15개 내지 22개, 15개 내지 21개, 15개 내지 20개, 15개 내지 19개, 15개 내지 18개, 15개 내지 17개, 15개 내지 16개, 16개 내지 30개, 16개 내지 29개, 16개 내지 28개, 16개 내지 27개, 16개 내지 26개, 16개 내지 25개, 16개 내지 24개, 16개 내지 23개, 16개 내지 22개, 16개 내지 21개, 16개 내지 20개, 16개 내지 19개, 16개 내지 18개, 16개 내지 17개, 17개 내지 30개, 17개 내지 29개, 17개 내지 28개, 17개 내지 27개, 17개 내지 26개, 17개 내지 25개, 17개 내지 24개, 17개 내지 23개, 17개 내지 22개, 17개 내지 21개, 17개 내지 20개, 17개 내지 19개, 17개 내지 18개, 18개 내지 30개, 18개 내지 29개, 18개 내지 28개, 18개 내지 27개, 18개 내지 26개, 18개 내지 25개, 18개 내지 24개, 18개 내지 23개, 18개 내지 22개, 18개 내지 21개, 18개 내지 20개, 18개 내지 19개, 19개 내지 30개, 19개 내지 29개, 19개 내지 28개, 19개 내지 27개, 19개 내지 26개, 19개 내지 25개, 19개 내지 24개, 19개 내지 23개, 19개 내지 22개, 19개 내지 21개, 19개 내지 20개, 20개 내지 30개, 20개 내지 29개, 20개 내지 28개, 20개 내지 27개, 20개 내지 26개, 20개 내지 25개, 20개 내지 24개, 20개 내지 23개, 20개 내지 22개, 20개 내지 21개, 21개 내지 30개, 21개 내지 29개, 21개 내지 28개, 21개 내지 27개, 21개 내지 26개, 21개 내지 25개, 21개 내지 24개, 21개 내지 23개, 21개 내지 22개, 22개 내지 30개, 22개 내지 29개, 22개 내지 28개, 22개 내지 27개, 22개 내지 26개, 22개 내지 25개, 22개 내지 24개, 22개 내지 23개, 23개 내지 30개, 23개 내지 29개, 23개 내지 28개, 23개 내지 27개, 23개 내지 26개, 23개 내지 25개, 23개 내지 24개, 24개 내지 30개, 24개 내지 29개, 24개 내지 28개, 24개 내지 27개, 24개 내지 26개, 24개 내지 25개, 25개 내지 30개, 25개 내지 29개, 25개 내지 28개, 25개 내지 27개, 25개 내지 26개, 26개 내지 30개, 26개 내지 29개, 26개 내지 28개, 26개 내지 27개, 27개 내지 30개, 27개 내지 29개, 27개 내지 28개, 28개 내지 30개, 28개 내지 29개, 또는 29개 내지 30개의 연속된 뉴클레오타이드의 스트레치를 포함할 수 있다.
가변 표적화 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열, 또는 임의의 이들의 조합으로 구성될 수 있다. VT 도메인은 원핵생물 또는 진핵생물 DNA로부터 유래된 표적 서열에 상보적일 수 있다.
용어 (가이드 폴리뉴클레오타이드의) "Cas 엔도뉴클레아제 인식 도메인" 또는 "CER 도메인"은 본원에서 상호 교환적으로 사용되며, Cas 엔도뉴클레아제 폴리펩타이드와 상호작용하는 뉴클레오타이드 서열을 포함한다. CER 도메인은 tracr뉴클레오타이드 메이트 서열 다음에 tracr뉴클레오타이드 서열을 포함한다. CER 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열(예를 들어, 그 전체가 본원에 참조로 포함된, 2015년 2월 26일 공개된 US 2015-0059010 A1 참조), 또는 임의의 이들의 조합으로 구성될 수 있다.
단일 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드를 연결하는 뉴클레오타이드 서열은 RNA 서열, DNA 서열, 또는 RNA-DNA 조합 서열을 포함할 수 있다. 일 구현예에서, 단일 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드를 연결하는 뉴클레오타이드 서열("루프"라고도 칭함)은 적어도 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개, 71개, 72개, 73개, 74개, 75개, 76개, 77개, 78개, 78개, 79개, 80개, 81개, 82개, 83개, 84개, 85개, 86개, 87개, 88개, 89개, 90개, 91개, 92개, 93개, 94개, 95개, 96개, 97개, 98개, 99개 또는 100개의 뉴클레오타이드의 길이일 수 있다. 루프는 3개 내지 4개, 3개 내지 5개, 3개 내지 6개, 3개 내지 7개, 3개 내지 8개, 3개 내지 9개, 3개 내지 10개, 3개 내지 11개, 3개 내지 12개, 3개 내지 13개, 3개 내지 14개, 3개 내지 15개, 3개 내지 20개, 3개 내지 30개, 3개 내지 40개, 3개 내지 50개, 3개 내지 60개, 3개 내지 70개, 3개 내지 80개, 3개 내지 90개, 3개 내지 100개, 4개 내지 5개, 4개 내지 6개, 4개 내지 7개, 4개 내지 8개, 4개 내지 9개, 4개 내지 10개, 4개 내지 11개, 4개 내지 12개, 4개 내지 13개, 4개 내지 14개, 4개 내지 15개, 4개 내지 20개, 4개 내지 30개, 4개 내지 40개, 4개 내지 50개, 4개 내지 60개, 4개 내지 70개, 4개 내지 80개, 4개 내지 90개, 4개 내지 100개, 5개 내지 6개, 5개 내지 7개, 5개 내지 8개, 5개 내지 9개, 5개 내지 10개, 5개 내지 11개, 5개 내지 12개, 5개 내지 13개, 5개 내지 14개, 5개 내지 15개, 5개 내지 20개, 5개 내지 30개, 5개 내지 40개, 5개 내지 50개, 5개 내지 60개, 5개 내지 70개, 5개 내지 80개, 5개 내지 90개, 5개 내지 100개, 6개 내지 7개, 6개 내지 8개, 6개 내지 9개, 6개 내지 10개, 6개 내지 11개, 6개 내지 12개, 6개 내지 13개, 6개 내지 14개, 6개 내지 15개, 6개 내지 20개, 6개 내지 30개, 6개 내지 40개, 6개 내지 50개, 6개 내지 60개, 6개 내지 70개, 6개 내지 80개, 6개 내지 90개, 6개 내지 100개, 7개 내지 8개, 7개 내지 9개, 7개 내지 10개, 7개 내지 11개, 7개 내지 12개, 7개 내지 13개, 7개 내지 14개, 7개 내지 15개, 7개 내지 20개, 7개 내지 30개, 7개 내지 40개, 7개 내지 50개, 7개 내지 60개, 7개 내지 70개, 7개 내지 80개, 7개 내지 90개, 7개 내지 100개, 8개 내지 9개, 8개 내지 10개, 8개 내지 11개, 8개 내지 12개, 8개 내지 13개, 8개 내지 14개, 8개 내지 15개, 8개 내지 20개, 8개 내지 30개, 8개 내지 40개, 8개 내지 50개, 8개 내지 60개, 8개 내지 70개, 8개 내지 80개, 8개 내지 90개, 8개 내지 100개, 9개 내지 10개, 9개 내지 11개, 9개 내지 12개, 9개 내지 13개, 9개 내지 14개, 9개 내지 15개, 9개 내지 20개, 9개 내지 30개, 9개 내지 40개, 9개 내지 50개, 9개 내지 60개, 9개 내지 70개, 9개 내지 80개, 9개 내지 90개, 9개 내지 100개, 10개 내지 20개, 20개 내지 30개, 30개 내지 40개, 40개 내지 50개, 50개 내지 60개, 70개 내지 80개, 80개 내지 90개, 또는 90개 내지 100개의 뉴클레오타이드 길이일 수 있다.
다른 양태에서, 단일 가이드 폴리뉴클레오타이드의 cr뉴클레오타이드 및 tracr뉴클레오타이드를 연결하는 뉴클레오타이드 서열은 테트라루프 서열, 예컨대, GAAA 테트라루프 서열을 포함할 수 있지만, 이에 한정되는 것은 아니다.
단일 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 단일 가이드 RNA를 포함한다. 용어 "단일 가이드 RNA" 및 "sgRNA"는 본원에서 상호 교환적으로 사용되며, tracrRNA(전사-촉진 CRISPR RNA)에 융합된 (tracrRNA에 혼성화하는 tracr 메이트 서열에 연결된) 가변 표적화 도메인을 포함하는 crRNA(CRISPR RNA)인, 2개의 RNA 분자의 합성 융합과 관련된다. 자연에서 함께 발견되지 않는(즉, 이들은 서로 이종성임) 영역을 포함하는 키메라성 비자연 발생 가이드 RNA. 예를 들어, 제1 뉴클레오타이드 서열 및 제2 뉴클레오타이드 서열이 자연에서 함께 연결되는 것으로 발견되지 않도록, Cas 엔도뉴클레아제를 인식할 수 있는 제2 뉴클레오타이드 서열에 연결된 표적 DNA에서 뉴클레오타이드 서열에 혼성화할 수 있는 제1 뉴클레오타이드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 칭함)을 포함하는 키메라성 비자연 발생 가이드 RNA.
키메라성 비자연 발생 가이드 RNA는 II형 Cas 엔도뉴클레아제, 예컨대 본원에 기재된 Cas9 엔도뉴클레아제 변이체와 복합체를 형성할 수 있는 II형 CRISPR/Cas 시스템의 crRNA 및/또는 tracrRNA를 포함할 수 있고, 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 지시하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일-이중 가닥 파괴를 도입)하게 할 수 있다.
가이드 폴리뉴클레오타이드의 생산 및 안정화
가이드 폴리뉴클레오타이드는 가이드 폴리뉴클레오타이드(예컨대, 비제한적인 예로서 Hendel et al. 2015, Nature Biotechnology 33, 985-989), 시험관내 생성된 가이드 폴리뉴클레오타이드, 및/또는 자가-스플라이싱 가이드 RNA(예컨대, 비제한적인 예로서 Xie et al. 2015, PNAS 112:3570-3575)를 화학적으로 합성하는 것을 포함하여 당해 분야에 공지된 임의의 방법에 의해 생산될 수 있다.
Cas9-매개 DNA 표적화를 수행하기 위한 진핵생물 세포에서의 가이드 RNA와 같은 RNA 성분을 발현하는 방법은 정확히 정의되고 변형되지 않은 5'- 및 3'-말단을 갖는 RNA의 전사를 허용하는 RNA 중합효소 III(Pol III) 프로모터를 사용하는 것이었다(DiCarlo et al., Nucleic Acids Res. 41: 4336-4343; Ma et al., Mol. Ther. Nucleic Acids 3:e161). 상기 전략은 옥수수 및 대두를 포함하는 몇몇 상이한 종의 세포에서 성공적으로 적용되었다(2015년 3월 19일 공개된 US20150082478). 5' 캡을 갖지 않는 RNA 성분을 발현하는 방법이 기술되었다(2016년 2월 18일 공개된 WO2016/025131).
일부 양태에서, 당해 핵산(예를 들어, 가이드 폴리뉴클레오타이드, 가이드 폴리뉴클레오타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산; Cas 단백질을 암호화하는 핵산; crRNA, crRNA를 암호화하는 뉴클레오타이드 또는 tracrRNA 또는 tracrRNA를 암호화하는 뉴클레오타이드, VT 도메인을 암호화하는 뉴클레오타이드, CPR 도메인을 암호화하는 뉴클레오타이드 등)은 추가적인 원하는 특징(예를 들어, 변형된 또는 조절된 안정성; 세포이하 표적화; 추적, 예를 들어, 형광 표지; 단백질 또는 단백질 복합체에 대한 결합 부위; 등)을 제공하는 변형 또는 서열을 포함한다. 가이드 폴리뉴클레오타이드, VT 도메인 및/또는 CER 도메인의 뉴클레오타이드 서열 변형은 5' 캡, 3' 폴리아데닐화 꼬리, 리보스위치 서열, 안정성 조절 서열, dsRNA 듀플렉스를 형성하는 서열, 가이드 폴리뉴클레오타이드를 세포이하 위치로 표적화하는 변형 또는 서열, 추적을 제공하는 변형 또는 서열, 단백질에 대한 결합 부위를 제공하는 변형 또는 서열, 잠김 핵산(LNA), 5-메틸 dC 뉴클레오타이드, 2,6-디아미노퓨린 뉴클레오타이드, 2'-플루오로 A 뉴클레오타이드, 2'-플루오로 U 뉴클레오타이드; 2'-O-메틸 RNA 뉴클레오타이드, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18 분자에 대한 연결, 5'에서 3'으로의 공유 연결, 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택될 수 있지만, 이에 한정되는 것은 아니다. 이러한 변형은 적어도 하나의 추가적인 유리한 특징을 가져올 수 있고, 여기서 추가적인 유리한 특징은 변형된 또는 조절된 안정성, 세포이하 표적화, 추적, 형광 표지, 단백질 또는 단백질 복합체에 대한 결합 부위, 상보적인 표적 서열에 대한 변형된 결합 친화도, 세포 분해에 대한 변형된 저항성 및 증가된 세포 투과성의 군으로부터 선택된다.
용어 "5'-캡" 및 "7-메틸구아닐레이트(m7G) 캡"은 본원에서 상호 교환적으로 사용된다. 7-메틸구아닐레이트 잔기는 진핵생물에서 메신저 RNA(mRNA)의 5' 말단에 위치한다. RNA 중합효소 II(Pol II)는 진핵생물에서 mRNA를 전사한다. 메신저 RNA 캡핑은 일반적으로 다음과 같이 일어난다: mRNA 전사체의 가장 말단 5' 포스페이트기가 RNA 말단 포스파타아제에 의해 제거되어 2개의 말단 포스페이트를 남긴다. 구아노신 모노포스페이트(GMP)가 구아닐릴 트랜스퍼라아제에 의해 전사체의 말단 포스페이트에 부가되어 전사체 말단에 5'-5' 트리포스페이트-연결된 구아닌을 남긴다. 마지막으로, 이 말단 구아닌의 7-질소가 메틸 트랜스퍼라아제에 의해 메틸화된다.
유도된 Cas 시스템
본원에 사용된 바와 같이, 용어 "가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체", "가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템", "가이드 폴리뉴클레오타이드/Cas 복합체", "가이드 폴리뉴클레오타이드/Cas 시스템", "유도된 Cas 시스템", "폴리뉴클레오타이드-유도된 엔도뉴클레아제", "PGEN"은 본원에서 상호 교환적으로 사용되며, 복합체를 형성할 수 있는 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 Cas 엔도뉴클레아제를 지칭하며, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 지시하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일 또는 이중 가닥 파괴를 도입)하게 할 수 있다. 본원에서 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 Cas 단백질(들), 또는 이의 단편 및 변이체, 및 임의의 공지된 CRISPR 시스템의 적합한 폴리뉴클레오타이드 성분(들)을 포함할 수 있다(Horvath and Barrangou, 2010, Science 327:167-170; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15; Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13). Cas 엔도뉴클레아제는 표적 서열에서 DNA 듀플렉스를 풀고, Cas 단백질과의 복합체인 폴리뉴클레오타이드(예컨대, 비제한적인 예로서 crRNA 또는 가이드 RNA)에 의한 표적 서열의 인식에 의해 매개되는 것처럼 적어도 하나의 DNA 가닥을 선택적으로 절단한다. 통상적으로 Cas 엔도뉴클레아제에 의한 이러한 표적 서열의 인식 및 절단은 정확한 프로토스페이서-인접 모티프(PAM: protospacer-adjacent motif)가 DNA 표적 서열의 3' 말단에 위치하거나 인접한 경우 발생한다. 대안적으로, 본원의 Cas 단백질은 DNA 절단 또는 닉킹 활성이 없을 수 있지만, 적합한 RNA 성분과 복합체를 형성한 경우 여전히 DNA 표적 서열에 특이적으로 결합할 수 있다.
DNA 표적 서열의 가닥 둘 다를 절단할 수 있는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 통상적으로 이의 엔도뉴클레아제 도메인 모두를 기능적 상태(functional state)로 가지는 Cas 단백질을 포함한다(예를 들어, 야생형 엔도뉴클레아제 도메인 또는 각각의 엔도뉴클레아제 도메인에서 일부 또는 모든 활성을 보유하는 이들의 변이체). 따라서, 야생형 Cas 단백질(예를 들어, 본원에 개시된 Cas 단백질) 또는 Cas 단백질의 각각의 엔도뉴클레아제 도메인에서 일부 또는 모든 활성을 보유하는 이의 변이체는 DNA 표적 서열의 가닥 둘 다를 절단할 수 있는 Cas 엔도뉴클레아제의 적절한 예이다.
DNA 표적 서열의 한 가닥을 절단할 수 있는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 본원에서 닉카아제 활성(예를 들어, 부분 절단 능력)을 갖는 것을 특징으로 할 수 있다. Cas 닉카아제는 통상적으로, Cas가 DNA 표적 서열 중 한 가닥만 절단하도록 하는(즉, 닉을 형성하도록 하는) 하나의 기능적 엔도뉴클레아제 도메인을 포함한다. 예를 들어, Cas9 닉카아제는 (i) 돌연변이체, 기능장애 RuvC 도메인 및 (ii) 기능적 HNH 도메인(예를 들어, 야생형 HNH 도메인)을 포함할 수 있다. 다른 예로서, Cas9 닉카아제는 (i) 기능적 RuvC 도메인(예를 들어, 야생형 RuvC 도메인) 및 (ii) 돌연변이체, 기능장애 HNH 도메인을 포함할 수 있다. 다른 예로서, Cas9 닉카아제는 (i) 기능적 RuvC 도메인(예를 들어, 야생형 RuvC 도메인) 및 (ii) 돌연변이체, 기능장애 HNH 도메인을 포함할 수 있다.
본원에서 사용하기에 적합한 Cas9 닉카아제의 비제한적인 예는 문헌[Gasiunas et al. (Proc. Natl. Acad. Sci. U.S.A. 109:E2579-E2586), Jinek et al. (Science 337:816-821), Sapranauskas et al. (Nucleic Acids Res. 39:9275-9282)] 및 미국 특허 출원 공개 제2014/0189896호(본원에 참조로 포함됨)에 의해 개시된다.
예를 들어, 본원의 Cas9 닉카아제는 Asp-31 치환(예를 들어, Asp-31-Ala)(돌연변이체 RuvC 도메인의 예), 또는 His-865 치환(예를 들어, His-865-Ala), Asn-882 치환(예를 들어, Asn-882-Ala), 또는 Asn-891 치환(예를 들어, Asn-891-Ala)(돌연변이체 HNH 도메인의 예)을 갖는 S. 써모필러스 Cas9를 포함할 수 있다. 또한, 예를 들어, 본원의 Cas9 닉카아제는 Asp-10 치환(예를 들어, Asp-10-Ala), Glu-762 치환(예를 들어, Glu-762-Ala), 또는 Asp-986 치환(예를 들어, Asp-986-Ala)(돌연변이체 RuvC 도메인의 예), 또는 His-840 치환(예를 들어, His-840-Ala), Asn-854 치환(예를 들어, Asn-854-Ala), 또는 Asn-863 치환(예를 들어, Asn-863-Ala)(돌연변이체 HNH 도메인의 예)을 갖는 S. 피오제네스 Cas9를 포함할 수 있다. S. 피오제네스 Cas9에 관하여, 3개의 RuvC 서브도메인은 일반적으로 각각 1번 내지 59번, 718번 내지 769번 및 909번 내지 1098번 아미노산 잔기에 위치하고, HNH 도메인은 775번 내지 908번 아미노산 잔기에 위치한다(Nishimasu et al., Cell 156:935-949).
본원의 Cas9 닉카아제는 개시된 발명의 숙주 세포에서 다양한 목적을 위해 사용될 수 있다. 예를 들어, Cas9 닉카아제는 적합한 공여 폴리뉴클레오타이드를 갖는 DNA 표적 부위 서열에서 또는 그 부근에서 HR을 촉진하도록 사용될 수 있다. 닉킹된 DNA는 NHEJ 과정에 대한 기질은 아니지만 HR 과정에 의해 인식되므로, 특정 표적 부위에서 DNA를 닉킹하는 것은 그 자리가 적합한 공여 폴리뉴클레오타이드로 HR을 더 잘 수용할 수 있게 해야 한다.
DNA 표적화의 특이성을 증가시키기 위해 한 쌍의 Cas 닉카아제가 사용될 수 있다. 일반적으로, 이는, RNA 성분이 상이한 가이드 서열과 회합되어 있기 때문에, 원하는 표적화를 위한 영역에서 반대 가닥 상의 가까운 DNA 서열을 표적화하고 닉킹하는 2개의 Cas 닉카아제를 제공함으로써 수행될 수 있다. 각각의 DNA 가닥의 이러한 가까운 절단은 이중 가닥 파괴(즉, 단일-가닥 오버행을 갖는 DSB)를 생성하고, 이는 이어서 비상동 말단 연결, NHEJ(돌연변이로 이어지는 불완전한 복구 경향이 있음) 또는 HR인 상동성 재결합을 위한 기질로서 인정된다. 이러한 구현예에서 각각의 닉은 예를 들어 서로 적어도 약 5개, 10개, 15개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개 또는 100개(또는 5개와 100개 사이의 임의의 정수)의 염기만큼 이격될 수 있다. 본원의 1개 또는 2개의 Cas 닉카아제 단백질이 Cas 닉카아제 쌍에서 사용될 수 있다. 예를 들어, 돌연변이체 RuvC 도메인을 갖지만 기능적 HNH 도메인을 갖는 Cas9 닉카아제(즉, Cas9 HNH+/RuvC-)(예를 들어, 스트렙토코커스 피오제네스 Cas9 HNH+/RuvC-)가 사용될 수 있다. 각각의 Cas9 닉카아제(예를 들어, Cas9 HNH+/RuvC-)는 각각의 닉카아제를 각각의 특정 DNA 부위로 표적화하는 가이드 RNA 서열을 갖는 본원의 적합한 RNA 성분들을 사용하여 서로 가까운(100개 이하의 염기 쌍만큼 이격된) 특정 DNA 부위로 지시될 수 있다.
소정의 구현예에서 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 임의의 가닥을 절단하지 않는다. 이러한 복합체는 모든 뉴클레아제 도메인이 돌연변이체 기능장애인 Cas 단백질을 포함할 수 있다. 예를 들어, DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 임의의 가닥을 절단하지 않는 본원의 Cas9 단백질은 돌연변이체 기능장애 RuvC 도메인 및 돌연변이체 기능장애 HNH 도메인 둘 다를 포함할 수 있다. 이러한 Cas9 단백질의 비제한적인 예는 상기 개시된 RuvC 및 HNH 뉴클레아제 도메인 돌연변이 중 임의의 것(예를 들어, Asp-10 치환, 예컨대 Asp-10-Ala 및 His-840 치환, 예컨대 His-840-Ala을 갖는 S. 피오제네스 Cas9)이 포함된다. 표적 DNA 서열에 결합하지만 이를 절단하지 않는 본원의 Cas 단백질은 유전자 발현을 조절하는 데 사용될 수 있으며, 예를 들어, 이 경우 Cas 단백질은 전사 인자(또는 이의 일부)(예를 들어, 억제물질 또는 활성물질, 예컨대, 본원에 개시된 것들 중 임의의 것)와 융합될 수 있다. 예를 들어, Asp-10 치환(예를 들어, Asp-10-Ala) 및 His-840 치환(예를 들어, His-840-Ala)을 갖는 S. 피오제네스 Cas9를 포함하는 Cas9는 VP16 또는 VP64 전사 활성인자 도메인에 융합될 수 있다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 본원에 기재된 Cas 엔도뉴클레아제 변이체, 또는 이의 활성 단편을 포함할 수 있고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있다.
일 양태에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체이고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체는 (동일한 표적 부위를 변형시킬 수 있는 폴리뉴클레오타이드-유도된 엔도뉴클레아제 복합체를 형성하기 위해 동일한 가이드 폴리뉴클레오타이드와의 복합체인) 이의 모 Cas 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성, 예컨대, 비제한적인 예로서 증가된 형질전환 효율, 증가된 DNA 편집 효율, 감소된 오프타깃 절단, 또는 임의의 이들의 조합을 갖는다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체이고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 이의 HNH 및 RuVC 도메인 밖의 위치에서 적어도 하나의 아미노산 치환을 갖는 본원에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체일 수 있고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 155번 위치에서 적어도 하나의 아미노산 치환을 갖는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오타이드 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 복합체일 수 있고, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편은 86번 위치에서 제1 아미노산 치환 및 98번 위치에서 제2 아미노산 치환의 적어도 2개의 아미노산 치환을 갖는 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 변이체의 아미노산 위치는 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는다.
용어 "가이드 RNA/Cas 엔도뉴클레아제 복합체", "가이드 RNA/Cas 엔도뉴클레아제 시스템", "가이드 RNA/Cas 복합체", "가이드 RNA/Cas 시스템", "gRNA/Cas 복합체", "gRNA/Cas 시스템", "RNA-유도된 엔도뉴클레아제", "RGEN"은 본원에서 상호 교환적으로 사용되며, 복합체를 형성할 수 있는 적어도 하나의 RNA 성분 및 적어도 하나의 Cas 엔도뉴클레아제를 지칭하고, 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 지시하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 절단(단일 또는 이중 가닥 파괴를 도입)하게 할 수 있다.
본원에 기재된 유도된 Cas 시스템은 하나 이상의 발현 작제물로부터 숙주 세포에서 발현될 수 있다. 일부 양태에서, 본원에 기재된 Cas 엔도뉴클레아제 변이체는 원핵생물 또는 진핵생물 세포에서의 Cas 단백질의 발현을 지시하는 발현 카세트로부터 발현될 수 있고, 가이드 폴리뉴클레오타이드는 원핵생물 또는 진핵생물 세포에서의 가이드 폴리뉴클레오타이드의 발현을 지시하는 제2 발현 카세트로부터 발현될 수 있다.
본 발명은 원핵생물 또는 진핵생물 세포/유기체에서 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 가이드 RNA/Cas 시스템을 발현하기 위한 발현 작제물을 추가로 제공한다.
발현 카세트 및 재조합 DNA 작제물
본원에 개시된 폴리뉴클레오타이드는 관심 유기체에서의 발현을 위해 발현 카세트(DNA 작제물이라고도 칭함)에 제공될 수 있다. 본원에 사용된 바와 같이, 용어 "발현"은 전구체 또는 성숙 형태의 기능적 최종 산물(예컨대, crRNA, tracrRNA, mRNA, 가이드 RNA 또는 폴리펩타이드(단백질))의 생산을 지칭한다. 용어 "발현"은 폴리펩타이드의 생산에 관여된 임의의 단계를 포함하며, 이것은 전사, 전사 후 변형, 번역, 번역 후 변형 및 분비를 포함하지만, 이에 한정되는 것은 아니다.
발현 카세트는 본원에 개시된 바와 같은 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다.
"작동 가능하게 연결된"은 2개 이상의 요소들 사이에 기능적 연결을 의미하도록 의도된다. 예를 들어, 관심 폴리뉴클레오타이드와 조절 서열(예를 들어, 프로모터) 사이의 작동적 연결은 관심 폴리뉴클레오타이드의 발현을 허용하는 기능적 연결이다(즉, 관심 폴리뉴클레오타이드는 프로모터의 전사 제어 하에 있음). 작동 가능하게 연결된 요소는 연속 또는 불연속일 수 있다. 작동 가능하게 연결되었다는 것은 2개의 단백질 암호화 영역의 연결을 지칭하도록 사용될 때 암호화 영역이 동일한 리딩 프레임에 있다는 것이 의도된다.
본원에 개시된 발현 카세트는 5'-3' 방향으로 숙주 세포(예를 들어, 진핵생물 세포)에서 기능적인 전사, 전사 및 번역 개시 영역(즉, 프로모터), 관심 폴리뉴클레오타이드, 및 전사 및 번역 종결 영역(즉, 종결 영역)을 포함할 수 있다. 발현 카세트는 또한 본원에서 그 외 기재된 조절 영역의 전사 조절 하에 있는 폴리뉴클레오타이드의 삽입을 위해 복수의 제한 부위 및/또는 재조합 부위가 제공된다. 조절 영역(즉, 프로모터, 전사 조절 영역 및 번역 종결 영역) 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 자연적/유사할 수 있다. 대안적으로, 조절 영역 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 이종일 수 있다. 본원에 사용된 바와 같이, 폴리뉴클레오타이드 또는 폴리펩타이드 서열과 관련하여 "이종"은 외래 종으로부터 기원한 서열이거나, 동일한 종 유래이면 의도적인 인간 중재에 의해 조성물에서의 이의 자연적인 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형된다. 예를 들어, 이종 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터는 폴리뉴클레오타이드가 유래된 종과 상이한 종 기원이거나, 동일한/유사한 종 유래이면 하나 또는 둘 다는 이의 원래의 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형되거나, 프로모터는 작동 가능하게 연결된 폴리뉴클레오타이드에 대해 자연적인 프로모터가 아니다. 본원에 사용된 바와 같이, 달리 기재되지 않는 한, 키메라성 폴리뉴클레오타이드는 암호화 서열에 이종인 전사 개시 영역에 작동 가능하게 연결된 암호화 서열을 포함한다.
소정의 구현예에서, 본원에 개시된 폴리뉴클레오타이드는 본원에서 그 외 개시되거나 당해 분야에 공지된 바대로 관심 폴리뉴클레오타이드 서열 또는 발현 카세트의 임의의 조합에 의해 포개질 수 있다. 포개진 폴리뉴클레오타이드는 초기 폴리뉴클레오타이드와 동일한 프로모터에 작동 가능하게 연결될 수 있거나, 별도의 프로모터 폴리뉴클레오타이드에 작동 가능하게 연결될 수 있다.
발현 카세트는 상응하는 종결 영역과 함께 관심 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함할 수 있다. 종결 영역은 전사 개시 영역에 자연적일 수 있거나, 작동 가능하게 연결된 관심 폴리뉴클레오타이드에 또는 프로모터 서열에 자연적일 수 있거나, 숙주 유기체에 자연적일 수 있거나, 또 다른 원천으로부터 유래(즉, 외래 또는 이종)될 수 있다. 편리한 종결 영역은 원핵생물 리보솜 RNA 오페론으로부터의 람다 파지 t0 종결 영역 또는 강한 종결자와 같은 파지 서열로부터 이용 가능하다. 편리한 종결 영역은 옥토핀 합성효소 및 노팔린 합성효소 종결 영역과 같은 A. 투메파시엔스의 Ti-플라스미드로부터 이용 가능하다. 또한 문헌[Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al. (1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell 2:1261-1272; Munroe et al. (1990) Gene 91:151-158; Ballas et al. (1989) Nucleic Acids Res. 17:7891-7903; 및 Joshi et al. (1987) Nucleic Acids Res. 15:9627-9639]을 참조한다.
적절한 경우, 관심 폴리뉴클레오타이드는 형질전환된 또는 표적화된 유기체에서 증가된 발현을 위해 최적화될 수 있다. 예를 들어, 폴리뉴클레오타이드는 개선된 발현을 위한 유기체-바람직한 코돈을 사용하도록 합성되거나 변경될 수 있다.
추가적인 서열 변형은 세포 숙주에서 유전자 발현을 향상시키는 것으로 공지되어 있다. 이들은 가짜 폴리아데닐화 신호를 암호화하는 서열, 엑손-인트론 스플라이스 부위 신호, 트랜스포존-유사 반복부 및 유전자 발현에 유해할 수 있는 다른 이러한 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 세포에서 발현되는 공지된 유전자를 참조하여 계산되는 주어진 세포 숙주에 대해 평균인 수준으로 조정될 수 있다. 가능한 경우, 서열은 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
발현 카세트는 5' 리더 서열을 추가로 함유할 수 있다. 이러한 리더 서열은 번역을 향상시키도록 작용할 수 있다. 5' 비번역된 영역과 상호 교환적으로 사용되는 5' 리더 서열은 널리 공지되고 잘 규명된 박테리아 UTR, 예컨대 바실러스 서브틸리스 aprE 유전자 또는 바실러스 리케니포르미스 amyl 유전자 또는 임의의 박테리아 리보솜 단백질 유전자로부터의 것에서 나올 수 있다. 번역 리더는 당해 분야에 공지되어 있고, 피코르나바이러스 리더, 예를 들어, EMCV 리더(뇌심근염 5' 비암호화 영역)(Elroy-Stein et al. (1989) Proc. Natl. Acad. Sci. USA 86:6126-6130); 포티바이러스 리더, 예를 들어, TEV 리더(담배 식각 바이러스(Tobacco Etch Virus))(Gallie et al. (1995) Gene 165(2):233-238), MDMV 리더(옥수수 위축 모자이크 바이러스(Maize Dwarf Mosaic Virus))(Johnson et al. (1986) Virology 154:9-20) 및 인간 면역글로불린 중쇄 결합 단백질(BiP)(Macejak et al. (1991) Nature 353:90-94); 알팔파 모자이크 바이러스의 코트 단백질 mRNA(AMV RNA 4)로부터의 비번역된 리더(Jobling et al. (1987) Nature 325:622-625); 담배 모자이크 바이러스 리더(TMV(tobacco mosaic virus leader))(Gallie et al. (1989) in Molecular Biology of RNA, ed. Cech (Liss, New York), pp. 237-256); 및 옥수수 황색얼룩 반점 바이러스 리더(MCMV(maize chlorotic mottle virus leader))(Lommel et al. (1991) Virology 81:382-385)를 포함한다. 또한, 문헌[Della-Cioppa et al. (1987) Plant Physiol. 84:965-968]을 참조한다. 번역을 향상시키는 것으로 공지된 다른 방법, 예를 들어 인트론 등을 또한 사용할 수 있다.
발현 카세트를 제조할 때에, 다양한 DNA 단편은 적절한 배향으로, 그리고 적절한 바대로, 적절한 리딩 프레임에서 DNA 서열을 제공하도록 조작될 수 있다. 이를 위해, 어댑터 또는 링커는 DNA 단편을 연결하도록 사용될 수 있거나, 다른 조작은 편리한 제한 부위, 필요치 않은 DNA의 제거, 제한 부위의 제거 등을 제공하도록 관여될 수 있다. 이 목적을 위해, 시험관내 돌연변이유발, 프라이머 보수, 제한, 어닐링, 재치환, 예를 들어 전이 및 전환이 관여될 수 있다.
일부 구현예에서, 가이드 뉴클레오타이드 및/또는 Cas 단백질을 암호화하는 뉴클레오타이드 서열은 제어 요소, 예를 들어 전사 제어 요소, 예컨대 프로모터에 작동 가능하게 연결된다. 전사 제어 요소는 진핵생물 세포, 예를 들어 식물, 포유류 세포 또는 진균 세포; 또는 원핵생물 세포(예를 들어, 박테리아 또는 고세균 세포) 중 어느 하나에서 기능성일 수 있다. 일부 구현예에서, 가이드 뉴클레오타이드 및/또는 Cas 단백질을 암호화하는 뉴클레오타이드 서열은 원핵생물 및 진핵생물 세포 둘 다에서 가이드 뉴클레오타이드 및/또는 Cas 단백질을 암호화하는 뉴클레오타이드 서열의 발현을 허용하는 다수의 제어 요소에 작동 가능하게 연결된다.
적합한 진핵생물 프로모터(진핵생물 세포에서 기능적인 프로모터)의 비제한적인 예는 사이토메갈로바이러스(CMV) 급초기, 단순 포진 바이러스(HSV) 티미딘 키나제, 초기 및 후기 SV40, 레트로바이러스로부터의 긴 말단 반복부(LTR: long terminal repeat) 및 마우스 메탈로티오네인-I로부터의 것을 포함한다. 발현 카세트는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 함유할 수 있다. 발현 카세트는 또한 진핵생물 세포에서 가이드 뉴클레오타이드 및/또는 Cas 단백질을 핵으로 지시하도록 하나 이상의 핵 국재화 서열(NLS 서열)을 함유할 수 있다. 발현 카세트는 또한 발현을 증폭시키기 위한 적절한 서열을 포함할 수 있다. 발현 카세트는 또한 Cas 단백질에 융합되어 키메라성 폴리펩타이드를 생성시키는 단백질 태그(예를 들어, 6x His 태그, 혈구응집소 태그, 녹색 형광 단백질 등)를 암호화하는 뉴클레오타이드 서열을 포함할 수 있다.
진균 숙주에서의 전사를 위해, 유용한 프로모터의 비제한적인 예는 아스퍼질러스 오리자에 TAKA 아밀라아제, 리조무코르 미에헤이 아스파르트산 단백질가수분해효소, 아스퍼질러스 니게르 중성 α-아밀라아제, 아스퍼질러스 니게르 산 안정 α-아밀라아제, 아스퍼질러스 니게르 글루코아밀라아제, 리조무코르 미에헤이 리파아제, 아스퍼질러스 오리자에 알칼리 프로테아제, 아스퍼질러스 오리자에 트리오스 포스페이트 아이소머라제, 아스퍼질러스 니둘란스 아세트아미다제 등을 암호화하는 유전자로부터 유래된 것을 포함한다. Cas 엔도뉴클레아제를 암호화하는 유전자가 E. 콜라이와 같은 박테리아 종에서 발현될 때, 적합한 프로모터는 예를 들어 T7 프로모터 및 파지 람다 프로모터를 포함하는 박테리오파지 프로모터로부터 선택될 수 있다. 앞서와 비슷한 방식으로, 효모 종에서의 발현에 적합한 프로모터의 예는 사카로마이세스 세레비시아에 및 피치아 파스토리스 AOX1 또는 AOX2 프로모터의 Gal 1 및 Gal 10 프로모터를 포함하지만, 이에 한정되는 것은 아니다. 사상균 숙주 세포에서의 발현은 대개 T. 레세이로부터의 내인성, 유도성 프로모터인 cbh1, 또는 구성적 해당성 프로모터(glycolytic promoter)(예를 들어, pki)를 수반한다. 예를 들어, 문헌[Liu et al. 2008]을 참조한다.
박테리아 숙주에서 DNA 서열(예컨대, 비제한적인 예로서 본원에 기재된 Cas 엔도뉴클레아제 변이체를 암호화하는 DNA 서열)의 전사를 지시하기 위한 프로모터의 비제한적인 예는 이. 콜라이의 lac 오페론의 프로모터, 스트렙토마이세스 코엘리컬러 아가라제 유전자 dagA 또는 celA 프로모터, 바실러스 리케니포르미스 아밀라아제 유전자(amyL)의 프로모터, 바실러스 스테아로써모필루스 말토제닉 아밀라아제 유전자(amyM)의 프로모터, 바실러스 아밀로리쿼파시엔스 아밀라아제(amyQ)의 프로모터, 바실러스 서브틸리스 xylAxylB 유전자의 프로모터 등를 포함한다.
발현 카세트는 선형 DNA에, 원형 DNA에, 재조합 DNA에, 플라스미드 또는 벡터에 포함될 수 있다.
본원에 사용된 바와 같이 "재조합"은 예를 들어 화학적 합성에 의한, 또는 유전자 조작 기술에 의한 단리된 핵산 분절의 조작에 의한, 분리되었을 2개의 서열 분절의 인공 조합을 지칭한다. 용어 "재조합"은, 생물학적 성분 또는 조성물(예를 들어, 세포, 핵산, 폴리펩타이드/효소, 벡터 등)과 관련하여 사용될 때, 생물학적 성분 또는 조성물이 자연에서 발견되지 않는 상태로 있음을 나타낸다. 환언하면, 생물학적 성분 또는 조성물은 인간 개입에 의해 그의 자연 상태로부터 변형되었다. 예를 들어, 재조합 세포는 그의 자연적 모(즉, 비-재조합) 세포에서는 발견되지 않는 하나 이상의 유전자를 발현하는 세포, 하나 이상의 자연적 유전자를 그의 자연적 모 세포와는 상이한 양으로 발현하는 세포, 및/또는 하나 이상의 자연적 유전자를 그의 자연적 모 세포와는 상이한 조건 하에 발현하는 세포를 포함한다. 재조합 핵산은 하나 이상의 뉴클레오타이드에 의해 자연적 서열과 다를 수 있고/있거나, 이종 서열(예컨대, 이종 프로모터, 비자연적 또는 변이체 신호 서열을 암호화하는 서열 등)에 작동 가능하게 연결될 수 있고/있거나, 인트론 서열이 없을 수 있고/있거나 단리된 형태로 있을 수 있다. 재조합 폴리펩타이드/효소는 하나 이상의 아미노산에 의해 자연적 서열과 상이할 수 있고/있거나, 이종 서열과 융합될 수 있고/있거나, 절두될 수 있거나 아미노산의 내부 결실을 가질 수 있고/있거나, 자연적 세포에서 발견되지 않는 방식으로 (예컨대, 폴리펩타이드를 암호화하는 발현 벡터의 세포에서의 존재로 인해 폴리펩타이드를 과발현시키는 재조합 세포로부터) 발현될 수 있고/있거나, 단리된 형태로 있을 수 있다. 일부 구현예에서, 재조합 폴리뉴클레오타이드 또는 폴리펩타이드/효소는 이의 야생형 대응물과 동일하지만, (예를 들어, 단리된 또는 농후화된 형태의) 비자연적 형태로 있는 서열을 갖는다는 것이 강조된다.
본원에 사용된 바와 같이, "재조합 DNA 작제물" 또는 "재조합 DNA"는 핵산 단편의 인공 조합을 포함하는 발현 카세트를 지칭한다. 재조합 DNA 작제물은 본원에 개시된 바대로 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다.
예를 들어, 재조합 DNA 작제물은 상이한 원천으로부터 유래된 조절 서열 및 암호화 서열을 포함할 수 있다. 이러한 작제물은 자체적으로 사용되거나 벡터와 함께 사용될 수 있다. 벡터가 사용되는 경우, 벡터의 선택은 당업자에게 널리 공지된 바와 같이 숙주 세포로 벡터를 도입하기 위해 사용되는 방법에 따라 달라진다. 예를 들어, 플라스미드 벡터가 사용될 수 있다. 당업자는 숙주 세포를 성공적으로 형질전환시키고 선택하고 증식시키기 위해 벡터에 존재해야 하는 유전 요소를 잘 알고 있다. 당업자는 또한 상이한 독립적인 형질전환 이벤트가 상이한 발현 수준 및 발현 패턴으로 일어날 수 있고(Jones et al., (1985) EMBO J 4:2411-2418; De Almeida et al., (1989) Mol Gen Genetics 218:78-86), 이에 따라 원하는 발현 수준 및 발현 패턴을 디스플레이하는 세포주를 얻기 위해 여러 이벤트가 통상적으로 선별됨을 또한 인식할 것이다. 이러한 선별은 표준 분자 생물학적 분석법, 생화학적 분석법, 및 DNA의 서던 분석, mRNA 발현의 노던 분석, PCR, 실시간 정량 PCR(qPCR), 역전사 PCR(RT-PCR), 단백질 발현의 면역블로팅 분석, 효소 또는 활성 분석법, 및/또는 표현형 분석을 비롯한 기타 분석법에 의해 달성될 수 있다.
본원에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기법은 당해 분야에 널리 공지되어 있고, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)]에 보다 자세히 기술되어 있다.
일 양태에서, 재조합 DNA 작제물은 본원에 개시된 바와 같은 Cas9 엔도뉴클레아제 변이체에 작동 가능하게 연결된 이종 5' 및 3' 조절 서열을 포함한다. 이 조절 서열은 숙주 세포(예컨대, 박테리아 또는 진균 세포)에서 기능적인 전사 및 번역 개시 영역(즉, 프로모터), 핵 국재화 신호, 및 전사 및 번역 종결 영역(즉, 종결 영역)을 포함하지만, 이에 한정되는 것은 아니다.
일 양태에서, 재조합 DNA 작제물은 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 암호화하는 DNA를 포함하고, 상기 Cas9 엔도뉴클레아제 변이체는 이종 조절 요소, 예컨대 핵 국재화 서열(NLS)에 작동 가능하게 연결되거나 이를 포함한다.
일 양태에서, 본원의 발현 카세트 또는 재조합 DNA는 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터 및 본 발명의 가이드 RNA에 작동 가능하게 연결된 프로모터를 포함한다. 프로모터는 원핵생물 또는 진핵생물 세포/유기체에서 작동 가능하게 연결된 뉴클레오타이드 서열의 발현을 유도할 수 있다.
용어 "플라스미드" 또는 "벡터"는 종종 세포의 중심 대사의 일부가 아니며, 보통 이중 가닥 DNA 형태인 유전자를 보유하는 선형 또는 원형 염색체외 요소를 지칭한다. 이러한 요소는 임의의 원천으로부터 유래된 단일 또는 이중 가닥 폴리뉴클레오타이드의, 선형 또는 원형 형태의, 자율적 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있고, 다수의 뉴클레오타이드 서열은 세포로 관심 폴리뉴클레오타이드를 도입할 수 있는 고유의 구조에 연결되거나 재조합된다.
표적 부위
용어 "표적 부위", "표적 서열", "표적 부위 서열", "표적 DNA", "표적 유전자위", "게놈 표적 부위", "게놈 표적 서열", "게놈 표적 유전자위" 및 "프로토스페이서"는 본원에서 상호 교환적으로 사용되며, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체가 인식하고 결합하고 선택적으로 닉킹하거나 절단할 수 있는 세포 게놈에서의 폴리뉴클레오타이드 서열, 예컨대 비제한적인 예로서 염색체, 에피솜, 유전자이식 유전자위, 또는 임의의 다른 DNA 분자(염색체 DNA, 엽록체 DNA, 미토콘드리아 DNA, 플라스미드 DNA를 포함)에서의 뉴클레오타이드 서열을 지칭한다.
표적 부위가 세포 게놈에서의 내인성 부위일 수 있거나, 대안적으로, 표적 부위가 세포에 이종이어서 세포의 게놈에서 자연 발생하지 않을 수 있거나, 표적 부위가 자연에서 일어나는 곳과 비교하여 이종 게놈 위치에서 확인될 수 있다. 본원에 사용된 바와 같이, 용어 "내인성 표적 서열" 및 "자연적 표적 서열"은 세포 게놈에 내인성이거나 자연적이고 세포 게놈에서의 그 표적 서열의 내인성 또는 자연적 위치에 있는 표적 서열을 지칭하도록 본원에서 상호 교환적으로 사용된다. "인공 표적 부위" 또는 "인공 표적 서열"은 본원에서 상호 교환적으로 사용되며, 세포 게놈 내로 도입된 표적 서열을 지칭한다. 이러한 인공 표적 서열은 세포 게놈에서 서열이 내인성 또는 자연적 표적 서열과 동일할 수 있지만, 세포 게놈에서의 상이한 위치(즉, 비내인성 또는 비자연적 위치)에 위치할 수 있다.
"변경된 표적 부위", "변경된 표적 서열", "변형된 표적 부위", "변형된 표적 서열"은 본원에서 상호 교환적으로 사용되며, 변경되지 않은 표적 서열과 비교할 때 적어도 하나의 변경을 포함하는 본원에 개시된 바와 같은 표적 서열을 지칭한다. 이러한 "변경"은 예를 들어 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.
Cas 엔도뉴클레아제에 대한 표적 부위는 매우 특이적이고 종종 정확한 뉴클레오타이드 위치로 정의될 수 있는 반면, 일부 경우에는 원하는 게놈 변형을 위한 표적 부위는 단지 DNA 절단이 일어나는 부위, 예를 들어 게놈으로부터 결실될 게놈 유전좌위 또는 영역보다 더 광범위하게 정의될 수 있다. 따라서, 소정의 경우에, Cas/가이드 RNA DNA 절단의 활성을 통해 일어나는 게놈 변형은 표적 부위"에서 또는 그 근처에서" 일어나는 것으로 기재된다.
"표적 부위를 변형하기 위한" 및 "표적 부위를 변경하기 위한" 방법은 본원에서 상호 교환적으로 사용되며, 변경된 표적 부위를 생성하는 방법을 지칭한다.
선별 가능한 마커 표현형을 사용하지 않고 표적 부위에서 또는 그 근처에서 변경된 게놈을 갖는 세포를 확인하기 위해 다양한 방법이 이용 가능하다. 비제한적인 예로서 PCR 방법, 시퀀싱 방법, 뉴클레아제 소화, 서던 블롯, 및 이들의 임의의 조합을 포함하여 이러한 방법은 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 검출하는 것으로 볼 수 있다.
표적 DNA 서열(표적 부위)의 길이는 변할 수 있으며, 예를 들어, 길이가 적어도 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개 이상의 뉴클레오타이드 길이인 표적 부위를 포함한다. 표적 부위는 회문구조일 수도 있는데, 즉 한 가닥 상에 있는 서열이 상보적 가닥 상에서 반대 방향으로 동일하게 해독되는 것이 추가로 가능하다. 닉/절단 부위는 표적 서열 내에 있을 수 있거나, 닉/절단 부위는 표적 서열의 외부에 있을 수 있다. 또 다른 변형에서, 절단은 무딘 말단 절단부를 생성하기 위해 서로 바로 마주 보는 뉴클레오타이드 위치에서 발생할 수 있거나, 다른 경우에 "점착성 말단(sticky ends)"이라고도 불리는, 5' 오버행 또는 3' 오버행일 수 있는 단일 가닥 오버행을 생성하도록 절개가 엇갈릴 수 있다. 게놈 표적 부위의 활성 변이체가 사용될 수도 있다. 이러한 활성 변이체는 주어진 표적 부위와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있고, 활성 변이체는 생물학적 활성을 보유함으로써 Cas 엔도뉴클레아제에 의해 인식되고 절단될 수 있다.
엔도뉴클레아제에 의한 표적 부위의 단일 또는 이중 가닥 파괴를 측정하기 위한 분석법은 당해 분야에 공지되어 있고, 일반적으로 인식 부위를 함유하는 DNA 기질에서 물질의 전체 활성 및 특이성을 측정한다.
포로토스페이서 인접 모티프(PAM)
본원의 "프로토스페이서 인접 모티프"(PAM)는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제(PGEN) 시스템에 의해 인식(표적화)되는 표적 서열에 인접한 짧은 뉴클레오타이드 서열(프로토스페이서)을 지칭한다. 표적 DNA 서열 다음에 PAM 서열이 없는 경우 Cas 엔도뉴클레아제는 표적 DNA 서열을 성공적으로 인식하지 않을 수 있다. 본원의 PAM의 서열과 길이는 사용되는 Cas 단백질 또는 Cas 단백질 복합체에 따라 다를 수 있다. PAM 서열은 임의의 길이일 수 있지만, 통상적으로 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 뉴클레오타이드의 길이이다.
본원의 PAM은 통상적으로 사용되는 PGEN의 유형을 고려하여 선택된다. 본원의 PAM 서열은 예를 들어 Cas가 유래될 수 있는 본원에 개시된 임의의 종으로부터 유래된 본원에 기재된 Cas9 변이체와 같은 Cas를 포함하는 PGEN에 의해 인식되는 것일 수 있다. 소정의 구현예에서, 이러한 PAM 서열은 S. 피오제네스, S. 써모필러스, S. 아갈락티아, N. 메닝기티디스, T. 덴티콜라 또는 F. 노비시다로부터 유래된 Cas9를 포함하는 RGEN에 의해 인식되는 것일 수 있다. 예를 들어, 본원에 기재된 Cas9 Y155 변이체를 포함하는 S. 피오제네스로부터 유래된 적합한 Cas9는 NGG의 PAM 서열(N은 A, C, T 또는 G일 수 있음)을 갖는 게놈 서열을 표적화하는 데 사용될 수 있다. 다른 예로서, 적합한 Cas9는 다음과 같은 PAM 서열을 갖는 DNA 서열을 표적화하는 경우 다음의 종 중 임의의 것으로부터 유래될 수 있다: S. 써모필러스(NNAGAA), S. 아갈락티아(NGG, NNAGAAW[W는 A 또는 T임], NGGNG), N. 메닝기티디스(NNNNGATT), T. 덴티콜라(NAAAAC) 또는 F. 노비시다(NG)(여기서, 이러한 모든 특정 PAM 서열에서 N은 A, C, T 또는 G임). 본원에 유용한 Cas9/PAM의 다른 예는 문헌[Shah et al. (RNA Biology 10:891-899) 및 Esvelt et al. (Nature Methods 10:1116-1121)(본원에 참조로 포함됨)에 개시된 것을 포함한다.
유도된 Cas 단백질 시스템의 사용
본원에 제공된 조성물 및 방법은 매우 다양한 숙주 세포를 사용한다. 본원에 사용된 바와 같이, "숙주 세포"는 핵산에 대한 또는 게놈 변형 시스템(예컨대, 본원에 기재된 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템)에 대한 수혜자로서 사용되는 임의의 세포 유형(예컨대, 비제한적인 예로서 생체내 또는 시험관내 세포, 진핵생물 세포, 원핵생물 세포, 또는 단세포 집합체로서 배양된 다세포 유기체(예를 들어, 세포주)로부터의 세포)을 지칭한다. 용어 "숙주 세포"는 본원에 기재된 핵산 또는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체에 의해 형질전환된, 형질주입된 또는 형질도입된 원래의 세포의 자손을 포함한다. "재조합 숙주 세포"("유전자 변형된 숙주 세포"라고도 칭함)는 이종 핵산, 예를 들어 재조합 DNA 작제물이 도입되거나, 게놈 변형 시스템, 예컨대 본원에 기재된 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템이 도입되고 이를 포함하는 숙주 세포이다. 예를 들어, 해당 박테리아 숙주 세포는 외인성 핵산(예를 들어, 플라스미드 또는 재조합 DNA 작제물)의 적합한 박테리아 숙주 세포로의 도입에 의해 유전자 변형된 박테리아 숙주 세포를 포함하고, 해당 진핵생물 숙주 세포는 외인성 핵산의 적합한 진핵생물 숙주 세포로의 도입에 의해 유전자 변형된 진핵생물 숙주 세포(예를 들어, 진균, 포유류 생식 세포 또는 식물 세포)를 포함한다.
일부 구현예에서, 숙주 세포는 고세균 세포, 박테리아 세포, 진핵생물 세포, 진핵생물 단세포 유기체, 체세포, 생식 세포, 줄기 세포, 식물 세포, 조류 세포, 동물 세포, 무척추동물 세포, 척추동물 세포, 어류 세포, 개구리 세포, 조류 세포, 곤충 세포, 포유류 세포, 돼지 세포, 소 세포, 염소 세포, 양 세포, 설치류 세포, 래트 세포, 마우스 세포, 비인간 영장류 세포 및 인간 세포로 이루어진 군으로부터 선택된다. 일부 경우에, 세포는 시험관내이다. 일부 경우에, 세포는 생체내이다.
본원에 기재된 가이드 폴리뉴클레오타이드/Cas 시스템은 유전자 표적화를 위해 사용될 수 있다.
용어 "유전자 표적화", "표적화" 및 "DNA 표적화"는 본원에서 상호 교환적으로 사용된다. 본원의 DNA 표적화는 세포의 염색체 또는 플라스미드에서와 같은 특정 DNA 서열에서의 녹아웃, 편집 또는 녹인의 특이적 도입일 수 있다. 일반적으로, DNA 표적화는 본원에서 Cas 엔도뉴클레아제가 적합한 폴리뉴클레오타이드 성분과 회합된 세포에서의 특정 DNA 서열에서 하나의 가닥 또는 두 가닥을 절단함으로써 수행될 수 있다. 단일 또는 또는 이중 가닥 파괴가 DNA에서 유도되면, 세포의 DNA 복구 메커니즘이 활성화되어 표적 부위에서 변형을 야기할 수 있는 비상동 말단 연결(NHEJ: nonhomologous end-joining) 또는 상동 직접 복구(HDR: Homology-Directed Repair) 과정을 통해 파괴를 복구한다.
용어 "녹아웃", "유전자 녹아웃" 및 "유전적 녹아웃"은 본원에서 상호 교환적으로 사용된다. 녹아웃은 본원에 기재된 Cas9 엔도뉴클레아제 변이체와 같은 Cas 엔도뉴클레아제로 표적화함으로써 부분적으로 또는 완전히 작동하지 않게 된 세포의 DNA 서열을 나타내며; 녹아웃 이전의 이러한 DNA 서열은, 예를 들어, 아미노산 서열을 암호화할 수 있었거나 조절 기능(예를 들어, 프로모터)을 가졌을 수 있다.
본원에 기재된 바와 같이, 유도된 Cas 엔도뉴클레아제는 DNA 표적 서열을 인식하고, 이에 결합하고, 단일 가닥 파괴(닉) 또는 이중 가닥 파괴를 도입할 수 있다. 단일 또는 이중 가닥 파괴가 DNA에서 유도되면, 세포의 DNA 복구 메커니즘이 활성화되어 파괴를 복구한다. 오류가 발생하기 쉬운 DNA 복구 메커니즘은 이중 가닥 파괴 부위에서 돌연변이를 생성할 수 있다. 파괴된 말단을 하나로 합치는 가장 일반적인 복구 메커니즘은 비상동 말단 연결(NHEJ) 경로이다(Bleuyard et al., (2006) DNA Repair 5:1-12). 염색체의 구조적 완전성은 통상적으로 복구에 의해 보존되지만, 결실, 삽입 또는 다른 재배열(예컨대, 염색체 전위)이 가능하다(Siebert and Puchta, 2002, Plant Cell 14:1121-31; Pacher et al., 2007, Genetics 175:21-9).
녹아웃은 삽입-결실(표적 DNA 서열에서의 NHEJ를 통한 뉴클레오타이드 염기의 삽입 또는 결실)에 의해, 또는 표적화 부위에서의 또는 그 근처에서의 서열의 기능을 감소시키거나 완전히 파괴하는 서열의 특이적 제거에 의해 생성될 수 있다. 본원에서 용어 "삽입-결실"은 염색체 또는 에피솜에서의 표적 DNA 서열에서의 뉴클레오타이드 염기의 삽입(insertion) 또는 결실(deletion)을 지칭한다. 이러한 삽입 또는 결실은, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 염기일 수 있다. 소정의 구현예에서 삽입-결실은 더욱 커서, 적어도 약 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개 또는 100개 염기일 수 있다. 삽입-결실이 유전자의 오픈 리딩 프레임(ORF: open reading frame) 내에 도입되면, 때때로 삽입-결실은 프레임이동 돌연변이를 생성하여 ORF에 의해 암호화되는 단백질의 야생형 발현을 방해한다.
일 구현예에서, 본 발명은 세포의 게놈에서 표적 부위를 변형시키는 방법을 기재하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 도입하는 단계(여기서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체(PGEN)를 형성할 수 있음) 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계(여기서, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택됨)를 포함한다.
가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템은 적어도 하나의 폴리뉴클레오타이드 변형 주형과 조합되어 사용되어 관심 게놈 뉴클레오타이드 서열의 편집(변형)을 가능하게 한다.
"변형된 뉴클레오타이드" 또는 "편집된 뉴클레오타이드"는 비변형된 뉴클레오타이드 서열과 비교할 때 적어도 하나의 변경을 포함하는 관심 뉴클레오타이드 서열을 지칭한다. 이러한 "변경"은 예를 들어 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.
용어 "폴리뉴클레오타이드 변형 주형"은 편집될 뉴클레오타이드 서열과 비교할 때 적어도 하나의 뉴클레오타이드 변형을 포함하는 폴리뉴클레오타이드를 포함한다. 뉴클레오타이드 변형은 적어도 하나의 뉴클레오타이드 치환, 부가 또는 결실일 수 있다. 선택적으로, 폴리뉴클레오타이드 변형 주형은 적어도 하나의 뉴클레오타이드 변형에 플랭킹한 상동 뉴클레오타이드 서열을 더 포함할 수 있고, 플랭킹한 상동 뉴클레오타이드 서열은 편집될 원하는 뉴클레오타이드 서열에 충분한 상동성을 제공한다.
일 구현예에서, 본 발명은 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드, 본원에 기재된 적어도 하나의 Cas9 엔도뉴클레아제 변이체 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계(여기서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체(PGEN)를 형성할 수 있고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함함)를 포함하고, 선택적으로 편집된 뉴클레오타이드 서열을 포함하는 적어도 하나의 세포를 선택하는 단계를 추가로 포함한다.
편집될 뉴클레오타이드는 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위 내에 또는 외부에 위치할 수 있다. 일 구현예에서, 적어도 하나의 뉴클레오타이드 변형은 본원에 기재된 Cas9 엔도뉴클레아제 변이체와 같은 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위에서의 변형이 아니다. 다른 구현예에서, 편집될 적어도 하나의 뉴클레오타이드와 게놈 표적 부위 사이에는 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 30개, 40개, 50개, 100개, 200개, 300개, 400개, 500개, 600개, 700개, 900개 또는 1000개의 뉴클레오타이드가 존재한다.
세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법은 2017년 4월 27 공개된 WO2017/070029 및 2017년 4월 27 공개된 WO2017/070032에 기재된 바와 같은 비기능적 유전자 산물에 대한 기능을 복구함으로써 외인성 선택 가능한 마커의 사용이 없는 방법일 수 있다.
용어 "녹인", "유전자 녹인", "유전자 삽입" 및 "유전적 녹인"은 본원에서 상호 교환적으로 사용된다. 녹인은 (적절한 공여 DNA 폴리뉴클레오타이드가 또한 사용되는, 상동 재조합(HR)에 의해) Cas 단백질에 의한 표적화에 의한 세포에서의 특정 DNA 서열에서의 DNA 서열의 치환 또는 삽입을 나타낸다. 녹인의 예는 유전자의 암호화 영역에서 이종 아미노산 암호화 서열의 특이적 삽입, 또는 유전자위에서 전사 조절 요소의 특이적 삽입을 들 수 있다.
Cas 엔도뉴클레아제에 대한 표적 부위에서 삽입된 관심 폴리뉴클레오타이드를 갖는 세포 또는 유기체를 얻기 위해 다양한 방법 및 조성물을 사용할 수 있다. 이러한 방법은 상동 재조합(HR)을 사용하여 표적 부위에서 관심 폴리뉴클레오타이드의 통합을 제공할 수 있다. 본원에 기재된 하나의 방법에서, 관심 폴리뉴클레오타이드는 공여 DNA 작제물을 통해 유기체 세포로 도입된다. 본원에 사용된 바와 같이, "공여 DNA"는 Cas 엔도뉴클레아제의 표적 부위로 삽입될 관심 폴리뉴클레오타이드를 포함하는 DNA 작제물이다. 공여 DNA 작제물은 관심 폴리뉴클레오타이드를 플랭킹한 제1 상동성 영역 및 제2 상동성 영역을 더 포함한다. 공여 DNA의 제1 상동성 영역 및 제2 상동성 영역은 세포 또는 유기체 게놈의 표적 부위에 존재하거나 이를 플랭킹한 제1 게놈 영역 및 제2 게놈 영역에 대해 각각 상동성을 공유한다.
공여 DNA는 가이드 폴리뉴클레오타이드로 테더링될 수 있다. 테더링된 공여 DNA는, 게놈 편집, 유전자 삽입 및 표적화된 게놈 조절에 유용한, 표적과 공여 DNA의 공동 국재화를 허용할 수 있고, 내인성 HR 기구의 기능이 매우 약해질 것으로 예상되는 유사분열 후 세포를 표적화하는 데에도 유용할 수 있다(Mali et al., 2013, Nature Methods Vol. 10: 957-963).
에피솜 DNA 분자가 이중 가닥 파괴에 결찰될 수 있는데, 예컨대 염색체 이중 가닥 파괴로 T-DNA가 통합될 수도 있다(Chilton and Que, (2003) Plant Physiol 133:956-65; Salomon and Puchta, (1998) EMBO J 17:6086-95). 예를 들어, 이중 가닥 파괴의 성숙에 관여된 엑소뉴클레아제 활성에 의해 이중 가닥 파괴 주위의 서열이 변경되면, 비분열 체세포에서의 상동 염색체, 또는 DNA 복제 후 자매 염색분체와 같은 상동 서열이 이용 가능한 경우 유전자 전환 경로는 원래의 구조를 복구할 수 있다(Molinier et al., 2004, Plant Cell 16:342-52). 이소성 및/또는 후성적 DNA 서열이 상동 재조합을 위한 DNA 복구 주형으로서 작용할 수도 있다(Puchta, (1999) Genetics 152:1173-81).
상동성 직접 복구(HDR)는 이중 가닥 및 단일 가닥 DNA 파괴를 복구하는 세포에서의 메커니즘이다. 상동성 직접 복구는 상동 재조합(HR) 및 단일 가닥 어닐링(SSA: ingle-strand annealing)을 포함한다(Lieber. 2010 Annu. Rev. Biochem. 79:181-211). 가장 일반적인 형태의 HDR은 상동 재조합(HR)이라고 하며, 공여 DNA와 수용 DNA 간의 가장 긴 서열 상동성 요건을 갖는다. 다른 형태의 HDR은 단일 가닥 어닐링(SSA) 및 절단 유도 복제를 포함하며, 이들은 HR에 비해 더 짧은 서열 상동성을 필요로 한다. 닉(단일 가닥 파괴)에서의 상동성 직접 복구는 이중 가닥 파괴에서의 HDR과 다른 메커니즘을 통해 일어날 수 있다(Davis and Maizels. PNAS (0027-8424), 111 (10), p. E924-E932).
"상동성"이란 유사한 DNA 서열을 의미한다. 예를 들어, 공여 DNA에서 발견되는 "게놈 영역에 대한 상동 영역"은 세포 또는 유기체 게놈에서의 주어진 "게놈 영역"과 유사한 서열을 갖는 DNA 영역이다. 상동성 영역은 절단된 표적 부위에서의 상동 재조합을 촉진시키는 데 충분한 임의의 길이일 수 있다. 예를 들어, 상동성 영역이 대응 게놈 영역과 상동 재조합을 겪는 데 충분한 상동성을 갖도록 상동성 영역은 적어도 5개 내지 10개, 5개 내지 15개, 5개 내지 20개, 5개 내지 25개, 5개 내지 30개, 5개 내지 35개, 5개 내지 40개, 5개 내지 45개, 5개 내지 50개, 5개 내지 55개, 5개 내지 60개, 5개 내지 65개, 5개 내지 70개, 5개 내지 75개, 5개 내지 80개, 5개 내지 85개, 5개 내지 90개, 5개 내지 95개, 5개 내지 100개, 5개 내지 200개, 5개 내지 300개, 5개 내지 400개, 5개 내지 500개, 5개 내지 600개, 5개 내지 700개, 5개 내지 800개, 5개 내지 900개, 5개 내지 1000개, 5개 내지 1100개, 5개 내지 1200개, 5개 내지 1300개, 5개 내지 1400개, 5개 내지 1500개, 5개 내지 1600개, 5개 내지 1700개, 5개 내지 1800개, 5개 내지 1900개, 5개 내지 2000개, 5개 내지 2100개, 5개 내지 2200개, 5개 내지 2300개, 5개 내지 2400개, 5개 내지 2500개, 5개 내지 2600개, 5개 내지 2700개, 5개 내지 2800개, 5개 내지 2900개, 5개 내지 3000개, 5개 내지 3100개 이상의 염기 길이를 포함할 수 있다. "충분한 상동성"은 2개의 폴리뉴클레오타이드 서열이 상동 재조합 반응을 위한 기질로서 작용하기에 충분한 구조적 유사성을 갖는다는 것을 나타낸다. 구조적 유사성은 각각의 폴리뉴클레오타이드 단편의 전체 길이뿐만 아니라 폴리뉴클레오타이드의 서열 유사성을 포함한다. 서열 유사성은 전체 서열 길이에 걸친 서열 동일성 백분율 및/또는 100%의 서열 동일성을 갖는 연속된 뉴클레오타이드와 같은 국재화된 유사성 및 서열 길이의 일부에 걸친 서열 동일성 백분율을 포함하는 보존된 영역에 의해 기술될 수 있다.
표적 및 공여 폴리뉴클레오타이드가 공유하는 상동성 또는 서열 동일성의 양은 변할 수 있으며, 총 길이 및/또는 약 1 내지 20 bp, 20 내지 50 bp, 50 내지 100 bp, 75 내지 150 bp, 100 내지 250 bp, 150 내지 300 bp, 200 내지 400 bp, 250 내지 500 bp, 300 내지 600 bp, 350 내지 750 bp, 400 내지 800 bp, 450 내지 900 bp, 500 내지 1000 bp, 600 내지 1250 bp, 700 내지 1500 bp, 800 내지 1750 bp, 900 내지 2000 bp, 1 내지 2.5 kb, 1.5 내지 3 kb, 2 내지 4 kb, 2.5 내지 5 kb, 3 내지 6 kb, 3.5 내지 7 kb, 4 내지 8 kb, 5 내지 10 kb, 또는 표적 부위의 전체 길이까지를 포함하는 범위의 단위 적분 값을 갖는 영역을 포함한다. 이들 범위는 범위 내의 모든 정수를 포함하며, 예를 들어 1 내지 20 bp 범위는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20 bp를 포함한다. 상동성의 양은 2개의 폴리뉴클레오타이드의 전체 정렬된 길이에 걸친 서열 동일성 백분율에 의해 기술될 수도 있는데, 이는 적어도 약 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성 백분율을 포함한다. 충분한 상동성은 폴리뉴클레오타이드 길이, 전체 서열 동일성 백분율 및 선택적으로 연속된 뉴클레오타이드의 보존된 영역 또는 국소 서열 동일성 백분율의 임의의 조합을 포함하며, 예를 들어 충분한 상동성은 표적 유전자위의 영역과 적어도 80%의 서열 동일성을 갖는 75 내지 150 bp의 영역으로서 기술될 수 있다. 충분한 상동성은 또한 높은 엄격성 조건 하에 특이적으로 혼성화하는 2개의 폴리뉴클레오타이드의 예측된 능력에 의해 기술될 수 있고, 예를 들어, 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols, (Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.); 및 Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, (Elsevier, New York)]을 참조한다.
본원에 사용된 바와 같이, "게놈 영역"은 표적 부위의 어느 한 측에 존재하거나 대안적으로 표적 부위의 일부를 또한 포함하는 세포 게놈에서의 염색체의 분절이다. 게놈 영역이 대응 상동성 영역과 상동 재조합을 겪는 데 충분한 상동성을 갖도록 게놈 영역은 적어도 5개 내지 10개, 5개 내지 15개, 5개 내지 20개, 5개 내지 25개, 5개 내지 30개, 5개 내지 35개, 5개 내지 40개, 5개 내지 45개, 5개 내지 50개, 5개 내지 55개, 5개 내지 60개, 5개 내지 65개, 5개 내지 70개, 5개 내지 75개, 5개 내지 80개, 5개 내지 85개, 5개 내지 90개, 5개 내지 95개, 5개 내지 100개, 5개 내지 200개, 5개 내지 300개, 5개 내지 400개, 5개 내지 500개, 5개 내지 600개, 5개 내지 700개, 5개 내지 800개, 5개 내지 900개, 5개 내지 1000개, 5개 내지 1100개, 5개 내지 1200개, 5개 내지 1300개, 5개 내지 1400개, 5개 내지 1500개, 5개 내지 1600개, 5개 내지 1700개, 5개 내지 1800개, 5개 내지 1900개, 5개 내지 2000개, 5개 내지 2100개, 5개 내지 2200개, 5개 내지 2300개, 5개 내지 2400개, 5개 내지 2500개, 5개 내지 2600개, 5개 내지 2700개, 5개 내지 2800개, 5개 내지 2900개, 5개 내지 3000개, 5개 내지 3100개 이상의 염기를 포함할 수 있다.
주어진 게놈 영역과 공여 DNA에서 발견되는 대응 상동성 영역 사이의 구조적 유사성은 상동 재조합이 일어날 수 있게 하는 임의의 서열 동일성 정도일 수 있다. 예를 들어, 공여 DNA의 "상동성 영역"과 유기체 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 그 서열이 상동 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성일 수 있다.
공여 DNA 상의 상동성 영역은 표적 부위에 플랭킹한 임의의 서열과 상동성을 가질 수 있다. 일부 경우에 상동성 영역은 표적 부위에 바로 플랭킹한 게놈 서열과 상당한 서열 상동성을 공유하지만, 상동성 영역은 표적 부위에 추가로 5' 또는 3'일 수 있는 영역과 충분한 상동성을 갖도록 설계될 수 있음이 인식된다. 상동성 영역은 또한 하류 게놈 영역을 따라 표적 부위의 단편과 상동성을 가질 수 있다.
일 구현예에서, 제1 상동성 영역은 표적 부위의 제1 단편을 추가로 포함하고, 제2 상동성 영역은 표적 부위의 제2 단편을 포함하며, 제1 단편 및 제 2 단편은 상이하다.
본원에 사용된 바와 같이, "상동 재조합"은 상동성 부위에서 2개의 DNA 분자 간의 DNA 단편의 교환을 포함한다. 상동 재조합의 빈도는 여러 인자에 영향을 받는다. 상이한 유기체는 상동 재조합의 양 및 상동 재조합과 비상동 재조합의 상대 비율이 다르다. 일반적으로, 상동성 영역의 길이는 상동 재조합 이벤트의 빈도에 영향을 미치고: 상동성 영역이 길수록 빈도는 더 높다. 상동 재조합을 관찰하는 데 필요한 상동성 영역의 길이는 또한 종에 따라 다르다. 많은 경우에, 적어도 5 kb의 상동성이 이용되었지만, 상동 재조합은 25 내지 50 bp만큼의 적은 상동성으로 관찰되었다. 예를 들어, 문헌[Singer et al., (1982) Cell 31:25-33; Shen and Huang, (1986) Genetics 112:441-57; Watt et al., (1985) Proc. Natl. Acad. Sci. USA 82:4768-72, Sugawara and Haber, (1992) Mol Cell Biol 12:563-75, Rubnitz and Subramani, (1984) Mol Cell Biol 4:2253-8; Ayares et al., (1986) Proc. Natl. Acad. Sci. USA 83:5199-203; Liskay et al., (1987) Genetics 115:161-7]을 참조한다.
예를 들어, 상동 재조합(HR)을 통한 원핵생물 및 진핵생물 세포 또는 유기체의 게놈의 변경은 유전자 조작을 위한 강력한 도구이다. 상동 재조합은 식물(Halfter et al., (1992) Mol Gen Genet 231:186-93) 및 곤충(Dray and Gloor, 1997, Genetics 147:689-99)에서 입증되었다. 상동 재조합은 다른 유기체에서도 이루어졌다. 예를 들어, 기생 원생동물 리슈마니아에서의 상동 재조합에 적어도 150 내지 200 bp의 상동성이 필요했다(Papadopoulou and Dumas, (1997) Nucleic Acids Res 25:4278-86). 사상균 아스퍼질러스 니둘란스(Aspergillus nidulans)에서, 50 bp만큼의 적은 플랭킹 상동성으로 유전자 대체가 이루어졌다(Chaveroche et al., (2000) Nucleic Acids Res 28:e97). 표적화된 유전자 대체는 섬모 테트라하이메나 써모필라(Tetrahymena thermophila)에서도 입증되었다(Gaertig et al., (1994) Nucleic Acids Res 22:5391-8). 포유류에서, 상동 재조합은 배양물에서 성장하고, 형질전환되고, 선택되고 마우스 배아로 도입될 수 있는 다능성 배아 줄기 세포주(ES: embryonic stem cell line)를 사용하여 마우스에서 가장 성공적이었다(Watson et al., 1992, Recombinant DNA, 2nd Ed., WH Freeman & Co.에서 배포한 Scientific American Books).
DNA 이중 가닥 파괴는 상동 재조합 경로를 자극하는 효과적인 인자로 보인다(Puchta et al., (1995) Plant Mol Biol 28:281-92; Tzfira and White, (2005) Trends Biotechnol 23:567-9; Puchta, (2005) J Exp Bot 56:1-14). DNA 파괴제를 사용하여, 식물에서의 인공적으로 작제된 상동 DNA 반복부 사이에 상동 재조합의 2배 내지 9배 증가가 관찰되었다(Puchta et al., (1995) Plant Mol Biol 28:281-92). 옥수수 원형질체에서, 선형 DNA 분자를 이용한 실험은 플라스미드 간의 향상된 상동 재조합을 입증하였다(Lyznik et al., (1991) Mol Gen Genet 230:209-18).
일 양태에서, 본 발명은 세포의 게놈에서 표적 부위를 변형시키는 방법을 포함하고, 상기 방법은 세포로 적어도 하나의 가이드 폴리뉴클레오타이드, 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체 및 적어도 하나의 공여 DNA를 도입하는 단계(여기서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체(PGEN)를 형성할 수 있고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함함)를 포함하고, 선택적으로, 상기 관심 폴리뉴클레오타이드가 상기 표적 부위에서 또는 그 근처에서 통합된 적어도 하나의 세포를 확인하는 단계를 추가로 포함한다.
일 양태에서, 본 발명은 바실러스 숙주 세포의 게놈을 변형시키는 방법을 포함하고, 상기 방법은
변형되는 적어도 하나의 표적 서열을 포함하는 바실러스 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 제공하는 단계(여기서, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있음); 및
적어도 하나의 바실러스 숙주 세포를 확인하는 단계(여기서, 적어도 하나의 게놈 표적 서열은 변형됨)를 포함한다. 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택될 수 있다.
일 양태에서, 본 발명은 E. 콜라이 숙주 세포의 게놈을 변형시키는 방법을 포함하고, 상기 방법은
변형되는 적어도 하나의 표적 서열을 포함하는 E. 콜라이 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 제공하는 단계(여기서, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있음); 및
적어도 하나의 E. 콜라이 숙주 세포를 확인하는 단계(여기서, 적어도 하나의 게놈 표적 서열은 변형됨)를 포함한다.
일 양태에서, 본 발명은 사카로마이세스 세레비시아에 숙주 세포의 게놈을 변형시키는 방법을 포함하고, 상기 방법은
변형되는 적어도 하나의 표적 서열을 포함하는 사카로마이세스 세레비시아에 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 제공하는 단계(여기서, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있음); 및
적어도 하나의 사카로마이세스 세레비시아에 숙주 세포를 확인하는 단계(여기서, 적어도 하나의 게놈 표적 서열은 변형됨)를 포함한다.
가이드 RNA/Cas 엔도뉴클레아제 시스템에 대한 추가 용도는 기술되어 있고(본원에 참조로 포함되는 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1, 2015년 2월 26일 공개된 WO2015/026886 A1, 2015년 2월 26일 공개된 US 2015-0059010 A1, 2014년 7월 7일 출원된 미국 출원 62/023246 및 2014년 8월 13일 출원된 미국 출원 62/036,652 참조), 관심 뉴클레오타이드 서열(예컨대, 조절 요소)의 변형 또는 대체, 관심 폴리뉴클레오타이드의 삽입, 유전자 녹아웃, 유전자 녹인, 스플라이싱 부위의 변형 및/또는 대안적인 스플라이싱 부위의 도입, 관심 단백질, 아미노산 및/또는 단백질 융합체를 암호화하는 뉴클레오타이드 서열의 변형, 및 관심 유전자로의 역위 반복부의 발현에 의한 유전자 침묵화를 포함하지만, 이에 한정되는 것은 아니다.
다중화
본원의 표적화 방법은 예를 들어 2개 이상의 DNA 표적 부위가 표적화되는 방식으로 수행될 수 있다. 이러한 방법은 선택적으로 다중 방법으로 특징지어질 수 있다. 소정의 구현예에서 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 표적 부위가 동시에 표적화될 수 있다. 통상적으로 다중 방법은 복수의 상이한 RNA 성분들이 제공되며 각각이 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체를 고유의 DNA 표적 부위로 유도하도록 설계된 본원의 표적화 방법에 의해 수행된다.
본원에 기재된 Cas9 엔도뉴클레아제 변이체는 (일방 및 다중 이중 가닥 파괴 및 닉을 통한) 표적화된 게놈 편집 및 (Cas9 또는 sgRNA로의 후성학적 효과기 도메인의 테더링을 통한) 표적화된 게놈 조절에 사용될 수 있다. 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 RNA-유도된 재조합효소로서 기능하도록 또한 조작될 수 있으며, RNA 테더를 통해 다중 단백질과 핵산 복합체의 조립을 위한 스캐폴드의 역할을 할 수 있다(Mali et al. 2013 Nature Methods Vol. 10: 957-963).
복합 형질 유전좌위
관심 폴리뉴클레오타이드 및/또는 형질은, 둘 다 본원에 참조로 포함되는 2013년 3월 14일 공개된 W02012/129373 및 2013년 1월 24일 공개된 PCT/US13/22891에 기재된 바와 같이, 복합 형질 유전자위에 함께 쌓일 수 있다. 본원에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하는 시스템과 같은 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템은 단일 또는 이중 가닥 파괴를 생성하는 데 효율적인 시스템을 제공하고, 복합 형질 유전자위에 형질이 쌓이도록 할 수 있다.
폴리뉴클레오타이드, 폴리펩타이드, 발현 카세트, 재조합 DNA, 또는 유도된 Cas 단백질 시스템의 임의의 하나의 성분의 도입
본원에 개시된 폴리뉴클레오타이드, 폴리펩타이드, 발현 카세트 또는 재조합 DNA는 당해 분야에 공지된 임의의 방법을 사용하여 유기체로 도입될 수 있다. 가이드 폴리뉴클레오타이드/Cas 시스템의 어느 하나의 성분, 가이드 폴리뉴클레오타이드/Cas 복합체 자체뿐만 아니라 폴리뉴클레오타이드 변형 주형(들) 및/또는 공여 DNA(들)가 당해 분야에 공지된 임의의 방법에 의해 세포로 도입될 수 있다.
"도입"은, 성분(들)이 유기체 세포의 내부로의 또는 세포 자체로의 접근을 획득하는 방식으로의, 유기체, 예컨대 세포 또는 유기체, 폴리뉴클레오타이드 또는 폴리펩타이드 또는 폴리뉴클레오타이드-단백질 복합체(예컨대, RGEN 또는 PGEN)로의 제시를 의미하려는 것이다. 그 방법 및 조성물은 폴리뉴클레오타이드 또는 폴리펩타이드가 유기체의 적어도 하나의 세포의 내부로의 접근을 획득하는 한 유기체 또는 세포로 서열을 도입하기 위한 특정 방법에 의존하지 않는다. 도입은 핵산이 세포의 게놈으로 혼입될 수 있는 진핵생물 또는 원핵생물 세포로의 핵산의 혼입에 대한 언급을 포함하며, 핵산, 단백질 또는 폴리뉴클레오타이드-단백질 복합체(PGEN, RGEN)의 세포로의 일시적인(직접적인) 제공에 대한 언급을 포함한다.
비제한적인 예로서 자연 능력(WO2017/075195, WO2002/14490 및 WO2008/7989에 기재된 바와 같음), 마이크로주사(Crossway et al., (1986) Biotechniques 4:320-34 및 미국 특허 제6,300,543호), 분열조직 형질전환(미국 특허 제5,736,369호), 전기천공(Riggs et al., (1986) Proc. Natl. Acad. Sci. USA 83:5602-6), 안정한 형질전환 방법, 일시적인 형질전환 방법, 탄도 입자 가속화(입자 충돌)(미국 특허 제4,945,050호; 제5,879,918호; 제5,886,244호; 제5,932,782호), 휘스커 매개 형질전환(Ainley et al. 2013, Plant Biotechnology Journal 11:1126-1134; Shaheen A. and M. Arshad 2011 Properties and Applications of Silicon Carbide (2011), 345-358 Editor(s): Gerhardt, Rosario. Publisher: InTech, Rijeka, Croatia. CODEN: 69PQBP; ISBN: 978-953-307-201-2), 아그로박테리움-매개 형질전환(미국 특허 제5,563,055호 및 제5,981,840호), 직접적인 유전자 전달(Paszkowski et al., (1984) EMBO J 3:2717-22), 바이러스-매개 도입(미국 특허 제5,889,191호, 제5,889,190호, 제5,866,785호, 제5,589,367호 및 제5,316,931), 형질주입, 형질도입, 세포-침투 펩타이드, 메조포러스 실리카 나노입자(MSN: mesoporous silica nanoparticle)-매개 직접 단백질 전달, 국소 도포, 유성 교잡, 유성 교배, 및 임의의 이들의 조합을 포함하는, 세포 또는 유기체로 폴리뉴클레오타이드, 폴리펩타이드, 발현 카세트, 재조합 DNA 또는 폴리뉴클레오타이드-단백질 복합체(PGEN, RGEN)를 도입하는 방법이 당해 분야에 공지되어 있다. 안정한 형질전환은 유기체로 도입된 뉴클레오타이드 작제물이 유기체의 게놈으로 통합되며 이의 자손에 의해 유전될 수 있음을 의미하려는 것이다. 일시적인 형질전환은 폴리뉴클레오타이드가 (직접적으로 또는 간접적으로) 유기체로 도입되고 유기체의 게놈으로 통합되지 않거나 폴리펩타이드가 유기체로 도입됨을 의미하려는 것이다. 일시적인 형질전환은 도입된 조성물이 단지 일시적으로 유기체에서 발현되거나 존재함을 나타낸다.
가이드 폴리뉴클레오타이드(가이드 RNA, cr뉴클레오타이드 + tracr뉴클레오타이드, 가이드 DNA 및/또는 가이드 RNA-DNA 분자)는 단일 가닥 또는 이중 가닥 폴리뉴클레오타이드 분자로서 세포로 직접적으로(일시적으로) 도입될 수 있다. 가이드 RNA(또는 crRNA + tracrRNA)는 또한 상기 세포에서 가이드 RNA(crRNA+tracrRNA 분자)를 전사할 수 있는 특정 프로모터에 작동 가능하게 연결된 가이드 RNA(또는 crRNA + tracrRNA)를 암호화하는 이종 핵산 단편을 포함하는 재조합 DNA 분자를 도입하여 간접적으로 세포로 도입될 수 있다. 특정 프로모터는 정확히 정의된, 비변형된 5'- 및 3'-말단을 갖는 RNA의 전사를 허용하는 RNA 중합효소 III 프로모터일 수 있지만, 이에 한정되는 것은 아니다(Ma et al., 2014, Mol. Ther. Nucleic Acids 3:e161; DiCarlo et al., 2013, Nucleic Acids Res. 41: 4336-4343; WO2015026887, 2015년 2월 26일 공개). 세포에서 가이드 RNA를 전사할 수 있는 임의의 프로모터가 사용될 수 있고, 가이드 RNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 열 충격/열 유도성 프로모터를 포함한다.
본원의 Cas 엔도뉴클레아제는 당해 분야에 공지된 임의의 방법을 사용하여 Cas 폴리펩타이드 자체(Cas 엔도뉴클레아제의 직접적인 전달이라고 칭함), Cas 단백질을 암호화하는 mRNA, 및/또는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체 자체를 직접적으로 도입함으로써 세포로 도입될 수 있다. Cas 엔도뉴클레아제는 또한 Cas 엔도뉴클레아제를 암호화하는 재조합 DNA 분자를 도입함으로써 간접적으로 세포로 도입될 수 있다. 엔도뉴클레아제는 당해 분야에 공지된 임의의 방법을 사용하여 세포로 일시적으로 도입되거나 숙주 세포의 게놈으로 혼입될 수 있다. 엔도뉴클레아제 및/또는 유도된 폴리뉴클레오타이드의 세포로의 흡수는 2016년 5월 12일 공개된 WO2016/073433에 기술된 바와 같이 세포 투과 펩타이드(CPP: Cell Penetrating Peptide)로 촉진될 수 있다. 세포에서 본원의 Cas 엔도뉴클레아제 변이체를 발현할 수 있는 임의의 프로모터가 사용될 수 있고, Cas 엔도뉴클레아제를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 열 충격/열 유도성 프로모터를 포함한다.
세포로 폴리뉴클레오타이드 변형 주형을 직접적으로 전달하는 것은 입자 매개 전달을 통해 달성될 수 있고, 임의의 다른 직접적인 전달 방법, 예컨대 비제한적인 예로서 원형질체로의 폴리에틸렌 글리콜(PEG)-매개 형질주입, 휘스커 매개 형질전환, 전기천공, 입자 충돌, 세포-침투 펩타이드, 또는 메조포러스 실리카 나노입자(MSN)-매개 직접 단백질 전달은 진핵생물 세포와 같은 세포에서 폴리뉴클레오타이드 변형 주형을 전달하기 위해 성공적으로 사용될 수 있다.
공여 DNA는 당해 분야에 공지된 임의의 수단에 의해 도입될 수 있다. 공여 DNA는, 예를 들어, 아그로박테리움-매개 형질전환 또는 바이올리스틱 입자 충돌을 포함하는, 당해 분야에 공지된 임의의 형질전환 방법에 의해 제공될 수 있다. 공여 DNA는 세포에 일시적으로 존재할 수 있거나, 바이러스성 레플리콘을 통해 도입될 수 있다. Cas 엔도뉴클레아제 및 표적 부위의 존재 하에, 공여 DNA는 식물과 같은 유기체의 형질전환된 게놈으로 삽입된다.
본원에 기재된 유도된 Cas 시스템 성분들 중 임의의 하나의 직접적인 전달은 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체 성분을 수용하는 세포의 농후화 및/또는 가시화를 촉진할 수 있는 다른 mRNA의 직접적인 전달(공동-전달)이 동반될 수 있다. 예를 들어, 표현형 마커를 암호화하는 mRNA(예컨대, 비제한적인 예로서 전사 활성제, 예컨대 CRC(Bruce et al. 2000 The Plant Cell 12:65-79)와 함께 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 성분(및/또는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체 자체)의 직접적인 동시전달은 2017년 4월 27일 공개된 WO2017/070029 및 2017년 4월 27일 공개된 WO 2017/070032에 기재된 바대로 비기능적 유전자 산물로 기능을 복구함으로써 외인성 선택 가능한 마커의 사용 없이 세포의 선택 및 농후화가 가능하게 할 수 있다.
본원에 기재된 바와 같은 가이드 RNA/Cas 엔도뉴클레아제 복합체(RGEN)를 세포로 도입하는 것은 가이드 RNA/Cas 엔도뉴클레아제 복합체를 리보뉴클레오타이드-단백질로서 세포로 도입하는 것을 포함한다. 리보뉴클레오타이드-단백질은 본원에 기재된 바와 같이 세포로 도입되기 전에 조립될 수 있다. 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오타이드 단백질을 포함하는 성분은 시험관내 조립되거나 (본원에 기재된 바대로 게놈 변형에 표적화된) 세포로 도입되기 전에 당해 분야에 공지된 임의의 수단에 의해 조립될 수 있다.
식물, 진균 및 박테리아 세포는 식물, 진균 및 박테리아 세포가 RGEN 리보핵단백질의 직접 전달 및/또는 RGEN 성분의 직접 전달에 대한 장벽으로 작용할 수 있는 세포벽을 포함한다는 점에서 인간 및 동물 세포와 다르다.
식물, 진균 및 박테리아 세포로의 RGEN 리보핵단백질의 직접 전달은 입자 매개 전달(입자 충격)을 통해 달성될 수 있다. 본원에 기재된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대 비제한적인 예로서 원형질체로의 폴리에틸렌 글리콜(PEG) 매개 형질감염, 전기천공, 세포 침투 펩타이드 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 단백질 전달이 진균 및 박테리아 세포에 RGEN 리보핵단백질을 전달하기 위해 성공적으로 사용될 수 있음을 구상할 수 있다.
RGEN 리보핵단백질의 직접 전달은 세포의 게놈에서의 표적 부위에서의 게놈 편집 후 복합체가 빠르게 분해되고, 복합체가 세포에 일시적으로만 존재할 수 있게 한다. 이러한 RGEN 복합체의 일시적인 존재는 표적 이탈 효과의 감소로 이어질 수 있다. 이와 반대로, 플라스미드 DNA 서열을 통한 RGEN 성분(가이드 RNA, Cas9 엔도뉴클레아제)의 전달은 표적 이탈 효과를 가중시킬 수 있는 이러한 플라스미드로부터의 RGEN의 일정한 발현을 초래할 수 있다(Cradick, T. J. et al (2013) Nucleic Acids Res 41:9584-9592; Fu, Y et al (2014) Nat. Biotechnol. 31:822-826).
직접적인 전달은 본원에 기재된 가이드 RNA/Cas 엔도뉴클레아제 복합체(RGEN)(예컨대, 적어도 하나의 가이드 RNA, 적어도 하나의 Cas9 엔도뉴클레아제 변이체) 중 임의의 하나의 성분을 비제한적인 예로서 금 입자, 텅스텐 입자 및 탄화규소 휘스커 입자와 같은 마이크로입자를 포함하는 입자 전달 매트릭스와 조합함으로써 달성될 수 있다(또한 2017년 4월 27일 공개된 WO2017/070029 및 2017년 4월 27일 공개된 WO 2017/070032(본원에 그 전문이 참조로 포함됨) 참조).
일 양태에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(RGEN)는 복합체이고, 여기서 가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성하는 가이드 RNA 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 각각 RNA 및 단백질로서 세포로 도입된다.
일 양태에서, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 복합체이고, 여기서 가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성하는 가이드 RNA 및 본원에 기재된 Cas9 엔도뉴클레아제 변이체는 시험관내 예비조립되고, 리보뉴클레오타이드-단백질 복합체로서 세포로 도입된다.
핵산 및 단백질은 유도된 Cas 시스템의 어느 한 성분 또는 모든 성분(단백질 및/또는 핵산)의 흡수를 촉진하기 위해 분자, 예컨대 세포 침투 펩타이드 및 나노캐리어를 사용하는 방법을 비롯한 임의의 방법에 의해 세포에 제공될 수 있다(참조로 본원에 포함된 2011년 2월 20일 공개된 US20110035836).
세포, 유기체
현재 개시된 Cas 엔도뉴클레아제 변이체, 폴리뉴클레오타이드, 펩타이드, 가이드 폴리뉴클레오타이드, Cas 엔도뉴클레아제, 폴리뉴클레오타이드 변형 주형, 공여 DNA, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 시스템 및 이의 임의의 하나의 조합은 세포로 도입될 수 있다.
세포는 인간, 비인간, 동물, 박테리아, 균류, 곤충, 효모, 비통상적인 효모, 미생물 및 식물 세포뿐만 아니라 본원에 기재된 방법에 의해 생산된 식물 및 종자를 포함하지만, 이에 한정되는 것은 아니다.
본원에 개시된 방법 및 조성물에 사용되는 미생물 세포는 임의의 진균 숙주 세포, 사상균 세포 및 박테리아 세포일 수 있다. 본원에 사용된 바와 같이, 용어 "진균 세포", "진균", "진균 숙주 세포" 등은 본원에 사용된 바와 같이 문 자낭균류(Ascomycota), 담자균류(Basidiomycota), 호상균류(Chytridiomycota) 및 접합균류(Zygomycota)(Hawksworth et al., 1995에 의해 정의된 바와 같음) 및 난균류(Hawksworth et al., 1995) 및 모든 불완전 진균(Hawksworth et al., 1995)을 포함한다. 소정의 구현예에서, 진균 숙주 세포는 효모 세포이고, 여기서 용어 "효모"는 자낭홀씨생산 효모(엔도마이세탈레스(Endomycetales)), 담자균류 효모 및 불완전 균류(Fungi Imperfecti)(블라스토마이세테스(Blastomycetes))에 속하는 효모를 의미한다. 이와 같이, 효모 숙주 세포는 칸디다(Candida), 한세누라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피치아(Pichia), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces) 또는 야로위아(Yarrowia) 세포를 포함한다. 효모의 종은 사카로마이세스 칼스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 세레비시아에(Saccharomyces cerevisiae), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 도우글라시(Saccharomyces douglasii), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 오비포르미스(Saccharomyces oviformis), 클루이베로마이세스 락티스(Kluyveromyces lactis) 및 야로위아 리폴리티카(Yarrowia lipolytica)를 포함하지만, 이에 한정되는 것은 아니다.
본원에서 용어 "비통상적인 효모"는 사카로마이세스(예컨대, S. 세레비시아에) 또는 스키조사카로마이세스 효모 종이 아닌 임의의 효모를 지칭한다. (문헌[Non-Conventional Yeasts in Genetics, Biochemistry and Biotechnology: Practical Protocols" (K. Wolf, K.D. Breunig, G. Barth, Eds., Springer-Verlag, Berlin, Germany, 2003]을 참조한다). 비통상적인 효모는 야로위아(Yarrowia), 피치아(Pichia), 쉬반니오마이세스(Schwanniomyces), 클루이베로마이세스(Kluyveromyces), 아르술라(Arxula), 트리코스포론(Trichosporon), 칸디다(Candida), 유스틸라고(Ustilago), 토룰롭시스(Torulopsis), 자이고사카로마이세스(Zygosaccharomyces), 트리고놉시스(Trigonopsis), 크립토코커스(Cryptococcus), 로도토룰라(Rhodotorula), 파피아(Phaffia), 스포로볼로마이세스(Sporobolomyces) 및 파치솔렌(Pachysolen)으로 이루어진 군으로부터 선택된 속의 구성원을 포함한다. 비통상적인 효모는 상동 재조합(HR)에 의해 매개되는 복구 과정보다 비상동 말단 연결(NHEJ) DNA 복구 과정을 선호하는 효모를 포함한다. 이러한 계통(HR보다 NHEJ 선호)에 따른 비통상적인 효모의 정의는 본원에 참조로 포함되는 Chen 등(PLoS ONE 8:e57952)에 의해 추가로 개시되어 있다. 본원에서 용어 "효모"는 주로 단세포 형태로 존재하는 진균 종을 지칭한다. 효모는 본원에서 대안적으로 "효모 세포"로 지칭될 수 있다. 야로위아 종의 적합한 예는 Y. 리폴리티카이다. 피치아 종의 적합한 예는 P. 파스토리스, P. 메타놀리카(methanolica), P. 스티피티스, P. 아노말라(anomala) 및 P. 앙구스타(angusta)를 포함한다. 쉬반니오마이세스 종의 적합한 예는 S. 카스텔리이(castellii), S. 알루비우스(alluvius), S. 호미니스(hominis), S. 옥시덴탈리스(occidentalis), S. 카프리오티이(capriottii), S. 에트첼시이(etchellsii), S. 폴리모르푸스(polymorphus), S. 슈도폴리모르푸스(pseudopolymorphus), S. 반리자(vanrijiae) 및 S. 야마다에(yamadae)를 포함한다. 클루이베로마이세스 종의 적합한 예는 K. 락티스, K. 마르시아누스(marxianus), K. 프라길리스(fragilis), K. 드로소필라룸(drosophilarum), K. 써모톨레란스(thermotolerans), K. 파세올로스포루스(phaseolosporus), K. 바누데니이(vanudenii), K. 왈티이(waltii), K. 아프리카누스(africanus) 및 K. 폴리스포루스(polysporus)를 포함한다. 아르술라 종의 적합한 예는 A. 아데니니보란스(adeninivorans) 및 A. 테레스트레(terrestre)를 포함한다. 트리코스포론 종의 적합한 예는 T. 쿠타네움(cutaneum), T. 카피타툼(capitatum), T. 인킨(inkin) 및 T. 비메리(beemeri)를 포함한다. 칸디다 종의 적합한 예는 C. 알비칸스(albicans), C. 아스칼라피다룸(ascalaphidarum), C. 암피시아에(amphixiae), C. 안타르티카(antarctica), C. 아르젠티아(argentea), C. 아틀란티카(atlantica), C. 아트모스패리카(atmosphaerica), C. 블랏타에(blattae), C. 브로멜리아세아룸(bromeliacearum), C. 카르포필라(carpophila), C. 카르바잘리스(carvajalis), C. 세람비시다룸(cerambycidarum), C. 차울리오데스(chauliodes), C. 코리달리(corydali), C. 도스세이(dosseyi), C. 듀블리니엔시스(dubliniensis), C. 얼가텐시스(ergatensis), C. 프룩투스(fructus), C. 글라브라타(glabrata), C. 퍼멘타티(fermentati), C. 귈리어몬디이(guilliermondii), C. 해뮬로니이(haemulonii), C. 인섹타멘스(insectamens), C. 인섹토룸(insectorum), C. 인터메디아(intermedia), C. 제프레시이(jeffresii), C. 케피르(kefyr), C. 케로세네아에(keroseneae), C. 크루세이(krusei), C. 루시타니아에(lusitaniae), C. 릭소소필라(lyxosophila), C. 말토사(maltosa), C. 마리나(marina), C. 멤브라니파시엔스(membranifaciens), C. 밀러리(milleri), C. 모기이(mogii), C. 올레오필라(oleophila), C. 오레고넨시스(oregonensis), C. 파라프실로시스(parapsilosis), C. 퀴어시트루사(quercitrusa), C. 루고사(rugosa), C. 사케(sake), C. 쉐하테아(shehatea), C. 템노칠라에(temnochilae), C. 테누이스(tenuis), C. 테아에(theae), C. 톨러란스(tolerans), C. 트로피칼리스(tropicalis), C. 츠시이아에(tsuchiyae), C. 시놀라보란티움(sinolaborantium), C. 소자에(sojae), C. 수브하쉬이(subhashii), C. 비스와나치이(viswanathii), C. 유틸리스(utilis), C. 우바투벤시스(ubatubensis) 및 C. 젬플리니나(zemplinina)를 포함한다. 유스틸라고 종의 적합한 예는 U. 아베나에(avenae), U. 에스쿨렌타(esculenta), U. 호르데이(hordei), U. 마이디스(maydis), U. 누다(nuda) 및 U. 트리티치(tritici)를 포함한다. 토룰롭시스 종의 적합한 예는 T. 게오차레스(geochares), T. 아지마(azyma), T. 글라브라타(glabrata) 및 T. 칸디다를 포함한다. 자이고사카로마이세스 종의 적합한 예는 Z. 바일리이(bailii), Z. 비스포루스(bisporus), Z. 시드리(cidri), Z. 퍼멘타티(fermentati), Z. 플로렌티누스(florentinus), Z. 콤부차엔시스(kombuchaensis), Z. 렌투스(lentus), Z. 멜리스(mellis), Z. 미크로엘립소이데스(microellipsoides), Z. 엠라키이(mrakii), Z. 슈도룩시이(pseudorouxii) 및 Z. 룩시이(rouxii)를 포함한다. 트리고놉시스 종의 적합한 예는 T. 바리아빌리스(variabilis)를 포함한다. 크립토코커스 종의 적합한 예는 C. 라우렌티이(laurentii), C. 알비두스(albidus), C. 네오포르만스(neoformans), C. 가티이(gattii), C. 유니구툴라투스(uniguttulatus), C. 아델리엔시스(adeliensis), C. 아에리우스(aerius), C. 알비도시밀리스(albidosimilis), C. 안타르크티쿠스(antarcticus), C. 아쿠아티쿠스(aquaticus), C. 아테르(ater), C. 부타넨시스(bhutanensis), C. 콘소르티오니스(consortionis), C. 쿠르바투스(curvatus), C. 페놀리쿠스(phenolicus), C. 스킨네리(skinneri), C. 테레우스(terreus) 및 C. 비쉬니아치(vishniacci)를 포함한다. 로도토룰라 종의 적합한 예는 R. 아체니오룸(acheniorum), R. 툴라(tula), R. 아쿠타(acuta), R. 아메리카나(americana), R. 아라우카리아에(araucariae), R. 아르티카(arctica), R. 아르메니아카(armeniaca), R. 아우란티아카(aurantiaca), R. 아우리쿨라리아에(auriculariae), R. 바카룸(bacarum), R. 벤티카(benthica), R. 비오우르게이(biourgei), R. 보고리엔시스(bogoriensis), R. 브론치알리스(bronchialis), R. 부포니이(buffonii), R. 칼립토게나에(calyptogenae), R. 충나멘시스(chungnamensis), R. 클라디엔시스(cladiensis), R. 코랄리나(corallina), R. 크레솔리카(cresolica), R. 크로세아(crocea), R. 사이클로클라스티카(cycloclastica), R. 다이레넨시스(dairenensis), R. 디플루엔스(diffluens), R. 에베르글라디엔시스(evergladiensis), R. 페룰리카(ferulica), R. 폴리오룸(foliorum), R. 프라가리아(fragaria), R. 푸지사넨시스(fujisanensis), R. 푸트로넨시스(futronensis), R. 겔라티노사(gelatinosa), R. 글라시알리스(glacialis), R. 글루티니스(glutinis), R. 그라실리스(gracilis), R. 그라미니스(graminis), R. 그린베르그시이(grinbergsii), R. 히말라옌시스(himalayensis), R. 힌눌레아(hinnulea), R. 히스톨리티카(histolytica), R. 힐로필라(hylophila), R. 인카르나타(incarnata), R. 인게니오사(ingeniosa), R. 자바니카(javanica), R. 코이쉬카웬시스(koishikawensis), R. 락토사(lactosa), R. 라멜리브라치아에(lamellibrachiae), R. 라린기스(laryngis), R. 리그노필라(lignophila), R. 리니(lini), R. 론기스시마(longissima), R. 루드위기이(ludwigii), R. 리시노필라(lysinophila), R. 마리나(marina), R. 마르티니아에-프라간티스(martyniae-fragantis), R. 마트리텐시스(matritensis), R. 멜리(meli), R. 미누타(minuta), R. 무실라기노사(mucilaginosa), R. 니텐스(nitens), R. 노쏘파기(nothofagi), R. 오리자에(oryzae), R. 파시피카(pacifica), R. 팔리다(pallida), R. 페네아우스(peneaus), R. 필릴라(philyla), R. 필로플라나(phylloplana), R. 필라티이(pilatii), R. 필리마나에(pilimanae), R. 피니콜라(pinicola), R. 플리카타(plicata), R. 폴리모르파(polymorpha), R. 사이크로페놀리카(psychrophenolica), R. 사이크로필라(psychrophila), R. 푸스툴라(pustula), R. 레티노필라(retinophila), R. 로사세아(rosacea), R. 로술라타(rosulata), R. 루베파시엔스(rubefaciens), R. 루벨라(rubella), R. 루베센스(rubescens), R. 루브라(rubra), R. 루브로루고사(rubrorugosa), R. 루풀라(rufula), R. 루틸라(rutila), R. 산구이네아(sanguinea), R. 산니에이(sanniei), R. 사르토리이(sartoryi), R. 실베스트리스(silvestris), R. 심플렉스(simplex), R. 시넨시스(sinensis), R. 슬루피아에(slooffiae), R. 순키이(sonckii), R. 스트라미네아(straminea), R. 수베리콜라(subericola), R. 수가니이(suganii), R. 타이와넨시스(taiwanensis), R. 타이와니아나(taiwaniana), R. 테르페노이달리스(terpenoidalis), R. 테레아(terrea), R. 텍센시스(texensis), R. 토쿄엔시스(tokyoensis), R. 울자마에(ulzamae), R. 바닐리카(vanillica), R. 부일레미니이(vuilleminii), R. 야로위이, R. 윤나넨시스(yunnanensis) 및 R. 졸티이(zsoltii)를 포함한다. 파피아 종의 적합한 예는 P. 로도지마(rhodozyma)를 포함한다. 스포로볼로마이세스 종의 적합한 예는 S. 알보루베센스(alborubescens), S. 반나엔시스(bannaensis), S. 베이징엔시스(beijingensis), S. 비스초피아에(bischofiae), S. 클라바투스(clavatus), S. 코프로스마에(coprosmae), S. 코프로스미콜라(coprosmicola), S. 코랄리누스(corallinus), S. 디메나에(dimmenae), S. 드라코필리(dracophylli), S. 에론가투스(elongatus), S. 그라실리스(gracilis), S. 이노시토필루스(inositophilus), S. 존소니이(johnsonii), S. 코알라에(koalae), S. 마그니스포루스(magnisporus), S. 노보제알란디쿠스(novozealandicus), S. 오도루스(odorus), S. 파타고니쿠스(patagonicus), S. 프로덕투스(productus), S. 로세우스(roseus), S. 사시콜라(sasicola), S. 쉬바타누스(shibatanus), S. 신굴라리스(singularis), S. 수브룬네우스(subbrunneus), S. 시메트리쿠스(symmetricus), S. 시지기이(syzygii), S. 타우포엔시스(taupoensis), S. 츠가에(tsugae), S. 잔투스(xanthus) 및 S. 윤나넨시스를 포함한다. 파키솔렌 종의 적합한 예는 P. 탄노필루스(P. tannophilus)를 포함한다.
본원에 사용된 바와 같이, 용어 "사상균 세포"는 아문 유마이코티나(Eumycotina)의 모든 사상 형태를 포함한다. 사상균 속의 적합한 세포는 아크레모늄(Acremonium), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 베르칸데라(Bjerkandera), 세리포리옵시스(Ceriporiopsis), 크리소포륨(Chrysoporium), 코프리누스(Coprinus), 코리올루스(Coriolus), 코리나스쿠스(Corynascus), 카에르토뮴(Chaertomium), 크립토코커스(Cryptococcus), 필로바시듐(Filobasidium), 푸사리움(Fusarium), 기베렐라(Gibberella), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 무코르(Mucor), 마이셀리오프토라(Myceliophthora), 무코르, 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로마이세스(Paecilomyces), 페니실리움(Penicillium), 파네로카에테(Phanerochaete), 플레비아(Phlebia), 피로마이세스(Piromyces), 플뢰로투스(Pleurotus), 스키탈듐(Scytaldium), 스키조필룸(Schizophyllum), 스포로트리춤(Sporotrichum), 탈라로마이세스(Talaromyces), 테르모아스쿠스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 트라메테스(Trametes) 및 트리쵸데르마(Trichoderma)의 세포를 포함하지만, 이에 한정되는 것은 아니다.
사상균 종의 적합한 세포들은 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 푸미가투스(Aspergillus fumigatus), 아스퍼질러스 포에티두스(Aspergillus foetidus), 아스퍼질러스 자포니쿠스(Aspergillus japonicus), 아스퍼질러스 니두란스(Aspergillus nidulans), 아스퍼질러스 니게르(Aspergillus niger), 아스퍼질러스 오리자에(Aspergillus oryzae), 크리소스포리움 루크노웬스(Chrysosporium lucknowense), 푸사리움 박트리디오이데스(Fusarium bactridioides), 푸사리움 세레아리스(Fusarium cerealis), 푸사리움 크룩웰렌스(Fusarium crookwellense), 푸사리움 쿨모룸(Fusarium culmorum), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 그라미눔(Fusarium graminum), 푸사리움 헤테로스포룸(Fusarium heterosporum), 푸사리움 네군디(Fusarium negundi), 푸사리움 옥시스포룸(Fusarium oxysporum), 푸사리움 렉티쿠라툼(Fusarium reticulatum), 푸사리움 로세움(Fusarium roseum), 푸사리움 삼부시눔(Fusarium sambucinum), 푸사리움 사르코크로움(Fusarium sarcochroum), 푸사리움 스포로트리키오이데스(Fusarium sporotrichioides), 푸사리움 술푸레움(Fusarium sulphureum), 푸사리움 토루로숨(Fusarium torulosum), 푸사리움 트리코테시오이데스(Fusarium trichothecioides), 푸사리움 베네나툼(Fusarium venenatum), 베르칸데라 아두스타(Bjerkandera adusta), 세리포리옵시스 아네이리나(Ceriporiopsis aneirina), 세리포리옵시스 아네이리나, 세리포리옵시스 카레기에아(Ceriporiopsis caregiea), 세리포리옵시스 길베센스(Ceriporiopsis gilvescens), 세리포리옵시스 파노신타(Ceriporiopsis pannocinta), 세리포리옵시스 리불로사(Ceriporiopsis rivulosa), 세리포리옵시스 서브루파(Ceriporiopsis subrufa), 세리포리옵시스 서브베르미스포라(Ceriporiopsis subvermispora), 코프리누스 시네레우스(Coprinus cinereus), 코프리누스 히르수투스(Coriolus hirsutus), 후미콜라 인솔렌스(Humicola insolens), 후미콜라 라누지노사(Humicola lanuginosa), 무코르 미에헤이, 마이셀리오프토라 써모필라(Myceliophthora thermophila), 뉴로스포라 크라싸(Neurospora crassa), 뉴로스포라 인테르메디아(Neurospora intermedia), 페니실리움 푸르푸로게눔(Penicillium purpurogenum), 페니실리움 카네센스(Penicillium canescens), 페니실리움 소리툼(Penicillium solitum), 페니실리움 푸니쿠로숨(Penicillium funiculosum), 파네로채테 크리소스포리움(Phanerochaete chrysosporium), 플레비아 라디아테(Phlebia radiate), 플뢰로투스 에린기(Pleurotus eryngii), 타라로마이세스 플라부스(Talaromyces flavus), 티에라비아 테레스트리스(Thielavia terrestris), 트라메테스 빌로사(Trametes villosa), 트라메테스 베르시칼라(Trametes versicolor), 트리코데르마 하르지아눔(Trichoderma harzianum), 트리코데르마 코닌지(Trichoderma koningii), 트리코데르마 롱지브라키아툼(Trichoderma longibrachiatum), 트리코데르마 레세이이(Trichoderma reesei) 및 트리코데르마 비리데(Trichoderma viride)를 포함하지만, 이에 한정되지는 않는다.
소정의 구현예에서, 미생물 숙주 세포는 박테리아 세포, 예를 들어, 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 아밀로리쿼파시엔스(Bacillus amyloliquefaciens), 바실러스 브레비스(Bacillus brevis), 바실러스 서르쿨란스(Bacillus circulans), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리케니포르미스, 바실러스 메가테리움(Bacillus megaterium), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 서브틸리스 또는 바실러스 투린기엔시스, 또는 예를 들어, 스트렙토마이세스 리비단스(Streptomyces lividans) 또는 스트렙토마이세스 무리누스(Streptomyces murinus)와 같은 스트렙토마이세스, 또는 예를 들어 E. 콜라이 또는 슈도모나스 종과 같은 그람 음성 박테리아이다.
전술된 종에 대해, 본 발명 및 원천 종은 이것이 공지된 종 명칭과 무관하게 이러한 유기체의 완전한 상태 및 불완전한 상태 둘 다, 및 이의 다른 분류학상 등가물, 예를 들어 무성생식형을 포괄한다고 이해된다. 당업자는 이러한 원천 종의 적절한 등가물의 식별을 용이하게 인식할 것이다.
상기 언급된 종의 균주는 다수의 배양 수집, 예컨대 미국 균주 보존 센터(ATCC: American Type Culture Collection), 독일 생물 자원 센터(DSM: Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH), Centraalbureau Voor Schimmelcultures(CBS) 및 미국 농무성 특허 균주 보존 센터(Agricultural Research Service Patent Culture Collection), Northern Regional Research Center(NRRL)에서 공중에 용이하게 접근 가능하다.
본원에 기재된 Cas9 엔도뉴클레아제 변이체는 미생물 세포에서 상동 재조합을 위한 방법 및/또는 미생물 세포에서 게놈 편집을 위한 방법에 사용될 수 있다. 미생물 세포(예를 들어, 사상균 세포)의 게놈에서 표적 부위에서 하나 이상의 짧은 상동성 아암을 갖는 공여 DNA를 삽입하기 위한 가이드 RNA/Cas 엔도뉴클레아제 시스템을 사용하는 방법이 개시되어 있다(2017년 2월 2일 공개된 WO2017/019867). 미생물 세포의 게놈의 변형이 표현형 효과를 가져올 때, 표현형 마커인(또는 표현형 마커를 암호화하는) 관심 폴리뉴클레오타이드를 포함하는 공여 DNA가 종종 사용된다. 흔히 특정 배양 조건 하에 이것을 함유하는 진균 세포를 확인하거나 이를 또는 이에 반하여 선택할 수 있게 하는 임의의 선택 가능한 또는 선별 가능한 마커를 포함하여 임의의 편리한 표현형 마커가 사용될 수 있다. 따라서, 본 발명의 일부 양태에서, 원하는 게놈 변형을 갖는 미생물 세포의 확인은 표적 부위에서 변형을 갖는 세포를 선택하는 조건 하에 Cas9 엔도뉴클레아제 변이체 및 가이드 폴리뉴클레오타이드(그리고 선택적으로 공여 DNA)를 받은 미생물 세포 집단을 배양하는 것을 포함한다. 진균 세포에서의 효소 활성의 증가 또는 감소, 예를 들어 항생제 내성의 획득 또는 영양요구성 마커의 증가/감소를 평가하는 것을 포함하는 임의의 유형의 선택 시스템(선택 가능한 마커라고도 칭함)을 사용할 수 있다.
본원에 사용된 바와 같이, 용어 "식물"은 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 덩어리, 및 식물 또는 식물 부분, 예컨대 배아, 꽃가루, 난세포, 종자, 잎, 꽃, 가지, 과일, 속씨, 이삭, 속대, 껍질, 줄기, 뿌리, 뿌리 끝, 꽃밥, 낟알 등에서 온전한 식물 세포를 지칭한다. 본원에 사용된 바와 같이 "낟알"이란 종의 성장 또는 생식 이외의 목적을 위해 상업적 재배업자에 의해 생산되는 성숙 종자를 의도한다. 재생된 식물의 자손, 변이체 및 돌연변이체는 이 부분들이 재생된 식물의 게놈 변형, 예컨대 형질전환 또는 게놈 편집으로부터 생긴 것을 포함하는 한 본 발명의 범위 내로 포함된다.
외떡잎 식물 및 쌍떡잎 식물 또는 식물 부분을 포함하는 임의의 식물 또는 식물 부분이 사용될 수 있다.
사용될 수 있는 외떡잎 식물의 예는 옥수수(제아 메이스(Zea mays)), 벼(오리자 사티바(Oryza sativa)), 호밀(세칼레 세레알레(Secale cereale)), 수수(소르검 비칼라(Sorghum bicolor), 소르검 불가레(Sorghum vulgare)), 기장(예컨대, 펄 밀렛(페니세툼 글라쿰(Pennisetum glaucum)), 프로소 밀렛(파니쿰 밀리아세움(Panicum miliaceum)), 조(세타리아 이탈리카(Setaria italica)), 손가락조(엘류신 코라카나(Eleusine coracana)), 밀(트리티쿰 종, 트리티쿰 아에스티붐(Triticum aestivum), 트리티쿰 모노코컴(Triticum monococcum)), 사탕수수(사카룸(Saccharum) 종), 귀리(아베나(Avena)), 보리(호르데움(Hordeum)), 스위치그래스(파니쿰 비르가툼(Panicum virgatum)), 파인애플(아나나스 코모수스(Ananas comosus)), 바나나(무사(Musa) 종), 야자, 관상용 식물, 잔디 및 기타 풀을 포함할 수 있지만, 이에 한정되는 것은 아니다.
용어 "쌍떡잎식물(dicotyledonous)" 또는 "쌍떡잎 식물(dicot)"은 "디코틸레도네아에(dicotyledoneae)"로도 공지된 속씨 식물의 하위강을 지칭하며, 전체 식물, 식물 기관(예컨대, 잎, 줄기, 뿌리 등), 종자, 식물 세포 및 그 자손에 대한 언급을 포함한다. 사용될 수 있는 쌍떡잎 식물의 예는 대두(글리신 맥스(Glycine max)), 브라시카(Brassica) 종(카놀라)(브라시카 나푸스(Brassica napus), B. 캄페스트리스(campestris), 브라시카 라파(Brassica rapa), 브라시카 준세아(Brassica. juncea)), 알팔파(메디카고 사티바(Medicago sativa)), 알팔파(메디카고 사티바(Medicago sativa)), 담배(니코티아나 타바쿰(Nicotiana tabacum)), 애기장대(아라비돕시스 탈리아나(Arabidopsis thaliana)), 해바라기(헬리안투스 안누우스(Helianthus annuus)), 목화(고시피움 아르보레움(Gossypium arboreum), 고시피움 바르바덴스(Gossypium barbadense)) 및 땅콩(아라키스 하이포가에아(Arachis hypogaea)), 토마토(솔라눔 라이코페르시쿰(Solanum lycopersicum)), 감자(솔라눔 투베로섬(Solanum tuberosum))을 포함하지만, 이에 한정되는 것은 아니다.
사용될 수 있는 식물은 잇꽃(카르타무스 팅토리우스(Carthamus tinctorius)), 고구마(이포모에아 바타투스(Ipomoea batatus)), 카싸바(마니호트 에스쿨렌타(Manihot esculenta)), 커피(커피나무 종), 코코넛(코코스 누시페라(Cocos nucifera)), 시트러스 나무(시트러스 종), 코코아(테오브로마 카카오(Theobroma cacao)), 차(카멜리아 시넨시스(Camellia sinensis)), 바나나(무사(Musa) 종), 아보카도(페르시아 아메리카나(Persea americana)), 무화과(피쿠스 카시카(Ficus casica)), 구아바(프시디움 구아자바(Psidium guajava)), 망고(망기페라 인디카(Mangifera indica)), 올리브(올레아 유로파에아(Olea europaea)), 파파야(카리카 파파야(Carica papaya)), 캐슈(아나카르디움 옥시덴탈레(Anacardium occidentale)), 마카다미아(마카다미아 인테그리폴리아(Macadamia integrifolia)), 아몬드(프루누스 아미그달루스(Prunus amygdalus)), 사탕무(베타 불가리스(Beta vulgaris)), 야채, 관상용 식물 및 침엽수를 포함한다.
야채는 토마토(라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)), 상추(예를 들어, 락투카 사티바(Lactuca sativa)), 그린 빈(파세올러스 불가리스(Phaseolus vulgaris)), 리마 콩(파세올러스 리멘시스(Phaseolus limensis)), 완두콩(라티루스(Lathyrus) 종), 및 쿠쿠미스(Cucumis) 속의 구성원, 예컨대 오이(C. 사티부스(sativus)), 캔탈로프(C. 칸탈루펜시스(cantalupensis)) 및 머스크 멜론(C. 멜로(melo))을 포함한다. 관상용 식물은 진달래(로도덴드론(Rhododendron) 종), 수국(마크로필라 하이드랑게아(Macrophylla hydrangea)), 히비스커스(히비스커스 로사사넨시스(Hibiscus rosasanensis)), 장미(로자(Rosa) 종), 튤립(튤리파(Tulipa) 종), 수선화(나르시서스(Narcissus) 종), 페튜니아(페튜니아 하이브리다(Petunia hybrida)), 카네이션(디안투스 카리오필러스(Dianthus caryophyllus)), 포인세티아(유포르비아 풀케리마(Euphorbia pulcherrima)) 및 국화를 포함한다.
본 발명의 실시에서 이용될 수 있는 침엽수는, 예를 들어, 소나무, 예컨대 테다 소나무(피너스 태다(Pinus taeda)), 슬래시 소나무(피너스 엘리오티이(Pinus elliotii)), 폰데로사 소나무(피너스 폰데로사(Pinus ponderosa)), 로지폴 소나무(피너스 콘토르타(Pinus contorta)) 및 몬테레이 소나무(피너스 라디아타(Pinus radiata)); 미송(슈도추가 멘지에시이(Pseudotsuga menziesii)); 미국 솔송나무(추가 카나덴시스(Tsuga canadensis)); 시트카 가문비나무(피세아 글라우카(Picea glauca)); 미국삼나무(세쿠오이아 셈페르비렌스(Sequoia sempervirens)); 전나무, 예컨대 유럽 전나무(애비스 아마빌리스(Abies amabilis)) 및 발삼 전나무(애비스 발사메아(Abies balsamea)); 및 개잎갈나무, 예컨대 미국 삼나무(투자 플리카타(Thuja plicata)) 및 알래스카 측백나무(카매사이파리스 누트카텐시스(Chamaecyparis nootkatensis))를 포함한다.
용어 "식물"은 전체 식물, 식물 기관, 식물 조직, 종자, 식물 세포, 종자 및 그 자손을 포함한다. 식물 세포는 제한 없이 종자로부터의 세포, 현탁액 배양물, 배아, 분열부, 캘러스 조직, 잎, 뿌리, 어린 싹, 배우체, 포자체, 꽃가루 및 미포자를 포함한다. 식물 부분은 비제한적인 예로서 뿌리, 줄기, 어린 싹, 잎, 꽃가루, 종자, 종양 조직 및 다양한 형태의 세포 및 배양물(예를 들어, 단일 세포, 원형질체, 배아 및 캘러스 조직)을 포함하는 분화 및 미분화 조직을 포함한다. 식물 조직은 식물에, 또는 식물 기관, 조직 또는 세포 배양물에 있을 수 있다. 용어 "식물 기관"은 형태학적으로 및 기능적으로 구별되는 식물 부분을 구성하는 식물 조직 또는 조직들의 군을 지칭한다. 용어 "게놈"은 유기체 또는 바이러스의 각각의 세포 또는 세포 소기관에 존재하는 유전 물질(유전자 및 비암호화 서열)의 전체 보체; 및/또는 한쪽 부모로부터 (반수체) 단위로서 유전된 완전한 염색체 세트를 지칭한다. "자손"은 식물의 임의의 후속 세대를 포함한다.
본원에 사용된 바와 같이, 용어 "식물 부분"은 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 덩어리, 및 식물 또는 식물 부분, 예컨대 배아, 꽃가루, 난세포, 종자, 잎, 꽃, 가지, 과일, 속씨, 이삭, 속대, 껍질, 줄기, 뿌리, 뿌리 끝, 꽃밥 등에서 온전한 식물 세포뿐만 아니라 그 부분 자체를 지칭한다. 낟알은 종의 성장 또는 생식 이외의 목적을 위해 상업적 재배업자에 의해 생산되는 성숙 종자를 의미하려는 것이다. 재생된 식물의 자손, 변이체 및 돌연변이체는 또한 이 부분들이 도입된 폴리뉴클레오타이드를 포함하는 한 본 발명의 범위 내로 포함된다.
유전자이식 식물은, 예를 들어, 형질전환 단계에 의해 도입된 이종 폴리뉴클레오타이드를 그 게놈 내에 포함하는 식물을 포함한다. 이종 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대대로 전달되도록 게놈 내에 안정하게 통합될 수 있다. 이종 폴리뉴클레오타이드는 단독으로 또는 재조합 DNA 작제물의 일부로서 게놈으로 통합될 수 있다. 유전자이식 식물은 그 게놈 내에 하나 초과의 이종 폴리뉴클레오타이드를 포함할 수도 있다. 각각의 이종 폴리뉴클레오타이드는 유전자이식 식물에 상이한 형질을 부여할 수 있다. 이종 폴리뉴클레오타이드는 외래 종으로부터 기원하는 서열을 포함할 수 있거나, 동일 종으로부터 유래하는 경우, 그 자연적인 형태로부터 실질적으로 변형될 수 있다. 유전자이식체는 초기에 그렇게 변경된 유전자이식체뿐만 아니라 초기의 유전자이식체로부터 유성 교배 또는 무성 번식에 의해 생성된 것들을 비롯하여, 이종 핵산의 존재에 의해 유전형이 변경된 임의의 세포, 세포주, 캘러스, 조직, 식물 부분 또는 식물을 포함할 수 있다. 종래의 식물 육종 방법, 외래 폴리뉴클레오타이드의 삽입을 초래하지 않는 본원에 기재된 게놈 편집 절차, 또는 자연적으로 발생하는 이벤트, 예컨대, 무작위 타가 수정, 비-재조합 바이러스 감염, 비-재조합 박테리아 형질전환, 비-재조합 전위, 또는 자연 돌연변이에 의한 (염색체 또는 염색체외) 게놈의 변경은 유전자이식으로 간주되지 않는다.
번식성 식물은 생존 가능한 웅성 및 자성 생식세포를 생산하는 식물이며, 자가 수정한다. 이러한 자가 수정 식물은 임의의 다른 생식세포 식물 및 그 안에 함유된 유전 물질의 기여 없이 자손 식물을 생산할 수 있다.
정의
"대립유전자" 또는 "대립유전자 변이체"는 염색체 상의 주어진 유전자위를 차지하는 몇 가지 대안적 유전자 형태 중 하나이다. 염색체 상의 주어진 유전자위에 존재하는 모든 대립 유전자가 동일한 경우, 그 유기체는 그 유전자위에서 동형접합성이다. 염색체 상의 주어진 유전자위에 존재하는 대립유전자가 상이한 경우, 그 유기체는 그 유전자위에서 이형접합성이다. 폴리뉴클레오타이드의 대립유전자 변이체는 유전자의 대립유전자 변이체에 의해 암호화된 폴리펩타이드이다.
"암호화 서열"은 특정 아미노산 서열을 암호화하는 폴리뉴클레오타이드 서열을 지칭한다. 암호화 서열의 경계는 일반적으로 오픈 리딩 프레임에 의해 결정되며, 이는 시작 코돈, 예컨대 ATG, GTG 또는 TTG로 시작하고 정지 코돈, 예컨대 TAA, TAG 또는 TGA로 끝난다. 암호화 서열은 게놈 DNA, cDNA, 합성 DNA 또는 이들의 조합일 수 있다.
"조절 서열"은 암호화 서열의 상류에(5' 비암호화 서열), 내에 또는 하류(3' 비암호화 서열)에 위치하며, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, 5' 비번역 서열, 3' 비번역 서열, 인트론, 폴리아데닐화 표적 서열, RNA 가공 부위, 효과기 결합 부위 및 줄기-루프 구조를 포함하지만, 이에 한정되는 것은 아니다.
"코돈 변형 유전자" 또는 "코돈 선호 유전자" 또는 "코돈 최적화 유전자"는 숙주 세포의 선호되는 코돈 사용의 빈도를 모방하도록 설계된 코돈 사용 빈도를 갖는 유전자이다. 유전자를 코돈 최적화하도록 이루어진 핵산 변경은 "동의어"이며, 이는 이들이 모 유전자의 암호화된 폴리펩타이드의 아미노산 서열을 변경시키지 않는다는 것을 의미한다. 그러나, 자연적 유전자 및 변이체 유전자 둘 다는 특정 숙주 세포에 대해 코돈 최적화될 수 있으며, 이와 관련하여 이와 같은 제한은 의도되지 않는다. 코돈 선호 유전자를 합성하는 방법들은 당해 분야에서 이용 가능하다. 예를 들어, 본원에 참조로 포함된 미국 특허 제5,380,831호, 및 제5,436,391호, 및 문헌[Murray et al. (1989) Nucleic Acids Res. 17:477-498]을 포함한다.
추가적인 서열 변형은 숙주 유기체에서 유전자 발현을 향상시키는 것으로 공지되어 있다. 이들은, 예를 들어, 가짜 폴리아데닐화 신호를 암호화하는 하나 이상의 서열, 하나 이상의 엑손-인트론 스플라이스 부위 신호, 하나 이상의 트랜스포존-유사 반복부 및 유전자 발현에 유해할 수 있는 기타 이러한 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 세포에서 발현되는 공지된 유전자를 참조하여 계산되는 주어진 숙주 유기체(예컨대, 식물)에 대해 평균인 수준으로 조정될 수 있다. 가능한 경우, 서열은 하나 이상의 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
용어 "보존된 도메인" 또는 "모티프"는 진화적으로 관련된 단백질의 정렬된 서열을 따라 특정 위치에 보존된 아미노산 세트를 의미한다. 다른 위치에서의 아미노산은 상동 단백질 간에 변할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 활성에 필수적인 아미노산을 나타낸다. 이들은 단백질 상동체 패밀리의 정렬된 서열에서 높은 보존 정도에 의해 확인되기 때문에, 새로 결정된 서열을 가진 단백질이 이전에 확인된 단백질 패밀리에 속하는지를 결정하기 위한 식별자 또는 "서명"으로 사용될 수 있다.
본원에 사용된 바와 같이, "핵산"은 폴리뉴클레오타이드를 의미하고 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 가닥 중합체 또는 이중 가닥 중합체를 포함한다. 핵산은 또한 단편 및 변형된 뉴클레오타이드를 포함할 수 있다. 따라서, 용어 "폴리뉴클레오타이드", "핵산 서열", "뉴클레오타이드 서열" 및 "핵산 단편"은 선택적으로 합성, 비천연 또는 변경된 뉴클레오타이드 염기를 함유하는 단일 또는 이중 가닥인 RNA 및/또는 DNA 및/또는 RNA-DNA의 중합체를 나타내기 위해 상호 교환적으로 사용된다. (보통 이의 5'-모노포스페이트 형태로 발견되는) 뉴클레오타이드는 다음과 같이 단일 문자 표시에 의해 지칭된다: 아데노신 또는 데옥시아데노신에 대해서(각각 RNA 또는 DNA에 있어서) "A", 시토신 또는 데옥시시토신에 대해서 "C", 구아노신 또는 데옥시구아노신에 대해서 "G", 유리딘에 대해서 "U", 데옥시티미딘에 대해서 "T", 퓨린(A 또는 G)에 대해서 "R", 피리미딘(C 또는 T)에 대해서 "Y", G 또는 T에 대해서 "K", A 또는 C 또는 T에 대해서 "H", 이노신에 대해서 "I", 및 임의의 뉴클레오타이드에 대해서 "N"(예를 들어, DNA 서열을 지칭하는 경우 N은 A, C, T 또는 G일 수 있고; RNA 서열을 지칭하는 경우 N은 A, C, U, 또는 G일 수 있다).
본원에 사용된 바와 같이 용어 "증가된"은 증가된 분량 또는 활성이 비교되는 분량 또는 활성보다 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100%, 또는 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배 높은 분량 또는 활성을 지칭할 수 있다. 용어 "증가된", "더 높은" 및 "개선된"은 본 명세서에서 상호 교환적으로 사용된다. 용어 "증가된"은 단백질, 예컨대 본원에 기재된 Cas9 엔도뉴클레아제 변이체의 형질전환 또는 유전자 편집 효율을 규명하기 위해 사용될 수 있다.
일 양태에서, 증가는 본원에 기재된 Cas9 변이체, 예컨대 비제한적인 예로서 Cas9 Y155 변이체 또는 Cas9 F86A+F98A 변이체가 PGEN의 일부로서 사용될 때, 이의 모 (야생형) Cas9를 대신에 포함함을 제외하고는 동일한 PGEN과 비교한 원핵생물 또는 진핵생물 세포의 형질전환 효율의 증가이고, 여기서 형질전환 효율의 증가는 적어도 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배이다.
일 양태에서, 증가는 본원에 기재된 Cas9 변이체, 예컨대 비제한적인 예로서 Cas9 Y155 변이체 또는 Cas9 F86A+F98A 변이체가 PGEN의 일부로서 사용될 때, 이의 모 (야생형) Cas9를 대신에 포함함을 제외하고는 동일한 PGEN과 비교한 원핵생물 또는 진핵생물 세포의 DNA 편집 효율의 증가이고, 여기서 유전자 편집 효율의 증가는 적어도 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%이다.
"오픈 리딩 프레임"은 ORF로 약칭된다.
"유전자"는 비제한적인 예로서 암호화 서열 앞의 조절 서열(5' 비암호화 서열) 및 뒤의 조절 서열(3' 비암호화 서열)을 포함하는 특정 단백질과 같은 기능적 분자를 발현하는 핵산 단편을 포함한다. "자연적 유전자"는 그 자신의 조절 서열과 자연에서 발견되는 유전자를 지칭한다.
"돌연변이된 유전자"는 인간 개입을 통해 변경된 유전자이다. 이러한 "돌연변이된 유전자"는 적어도 하나의 뉴클레오타이드 부가, 결실 또는 치환에 의해 대응하는 비돌연변이된 유전자의 서열과 다른 서열을 갖는다. 본 발명의 소정의 구현예에서, 돌연변이된 유전자는 본원에 개시된 가이드 폴리뉴클레오타이드/Cas 단백질 시스템에서 생긴 변경을 포함한다. 돌연변이된 세포 또는 유기체는 돌연변이된 유전자를 포함하는 세포 또는 유기체이다.
용어 "게놈"은 원핵생물 및 진핵생물 세포 또는 유기체 세포에 적용되면서 핵 내에서 발견되는 염색체 DNA뿐만 아니라 세포의 세포내 성분(예를 들어, 미토콘드리아 또는 색소체) 내에서 발견되는 세포소기관 DNA를 포함한다.
관심 폴리뉴클레오타이드는 본원에 추가로 기재되어 있고, 효소 생성(예컨대, 비제한적인 예로서 박테리아 또는 진균의 발효로 효소를 생성하는 것을 통해 또는 효소를 생성하는 식물에 의해) 및 작물 발생에 관여된 것의 상업 시장 및 관심을 반영하는 폴리뉴클레오타이드를 포함한다.
관심 작물 및 시장은 변화하며, 개발 도상국이 세계 시장을 개방함에 따라 새로운 작물과 기술이 또한 등장할 것이다. 또한, 수확량과 잡종 강세와 같은 작물학적 형질 및 특성에 대한 이해가 높아짐에 따라 유전자 조작을 위한 유전자의 선택은 그에 따라 변할 것이다. 관심 폴리뉴클레오타이드는 농약, 제초제-내성, 살충제 내성, 질환 내성, 선충 내성, 제초제 내성, 미생물 내성, 진균 내성, 바이러스 내성, 생식력 또는 불임성, 낟알 특징 및 상업적 제품을 위해 중요한 형질을 암호화하는 폴리뉴클레오타이드를 포함하지만, 이에 한정되는 것은 아니다.
관심 폴리뉴클레오타이드의 일반적인 범주는, 예를 들어, 징크 핑거와 같은 정보 관련 관심 유전자, 키나아제와 같은 커뮤니케이션 관련 유전자, 및 열 충격 단백질과 같은 하우스키핑 관련 유전자를 포함한다. 보다 구체적인 관심 폴리뉴클레오타이드는 작물 수확량, 낟알 품질, 작물 영양소 함량, 전분 및 탄수화물 품질 및 양에 관련된 유전자뿐만 아니라 속씨 크기, 수크로스 부하, 단백질 품질 및 양, 질소 고정 및/또는 이용, 지방산 및 오일 조성에 영향을 미치는 유전자, 비생물 스트레스에 저항성을 부여하는 단백질을 암호화하는 유전자(예컨대, 가뭄, 질소, 온도, 염도, 독성 금속 또는 미량 원소, 또는 독소, 예컨대 살해충제 및 제초제에 대한 저항성을 부여하는 유전자), 생물 스트레스(예컨대, 진균, 바이러스, 박테리아, 곤충 및 선충에 의한 공격, 및 이러한 유기체와 연관되는 질병의 발생)에 저항성을 부여하는 단백질을 암호화하는 유전자를 포함하지만, 이에 한정되는 것은 아니다.
또한, 관심 폴리뉴클레오타이드는 표적화된 관심 유전자 서열에 대한 메신저 RNA(mRNA)의 적어도 일부에 상보적인 안티센스 서열을 포함할 수도 있는 것으로 인식된다. 안티센스 뉴클레오타이드는 대응 mRNA와 혼성화하도록 작제된다. 안티센스 서열의 변형은 서열이 대응 mRNA에 혼성화하고 이의 발현을 방해하는 한 제조될 수 있다. 이러한 방식으로, 대응 안티센스 서열과 70%, 80% 또는 85%의 서열 동일성을 갖는 안티센스 구성이 사용될 수 있다. 또한, 안티센스 뉴클레오타이드의 일부는 표적 유전자의 발현을 방해하는 데 사용될 수 있다. 일반적으로, 적어도 50개 뉴클레오타이드, 100개 뉴클레오타이드, 200개 뉴클레오타이드 이상의 서열이 사용될 수 있다.
또한, 관심 폴리뉴클레오타이드는 유기체에서 내인성 유전자 발현을 억제하기 위해 센스 방향으로 사용될 수도 있다. 폴리뉴클레오타이드를 센스 방향으로 사용하여 유기체에서의 유전자 발현을 억제하는 방법은 당해 분야에 공지되어 있다. 상기 방법은 일반적으로 내인성 유전자의 전사체에 대응하는 뉴클레오타이드 서열의 적어도 일부에 작동 가능하게 연결된 유기체에서 발현을 유도하는 프로모터를 포함하는 DNA 작제물로 유기체를 형질전환시키는 단계를 수반한다. 통상적으로, 이러한 뉴클레오타이드 서열은 내인성 유전자의 전사체의 서열에 대해 일반적으로 약 65%의 서열 동일성, 약 85%의 서열 동일성보다 크거나, 약 95%의 서열 동일성보다 큰 상당한 서열 동일성을 갖는다. 본원에 참조로 포함되는 미국 특허 5,283,184호 및 5,034,323호를 참조한다.
관심 폴리뉴클레오타이드는 표현형 마커일 수도 있다. 표현형 마커는, 시각적 마커 및 그것이 양성의 선택 가능한 마커든 음성의 선택 가능한 마커든 선택 가능한 마커를 포함하는, 선별 가능한 또는 선택 가능한 마커이다. 임의의 표현형 마커가 사용될 수 있다. 구체적으로, 선택 가능한 또는 선별 가능한 마커는 종종 특정 조건 하에 그것을 포함하는 분자 또는 세포를 확인하거나, 이를 또는 이에 반하여 선택할 수 있게 하는 DNA 분절을 포함한다. 이들 마커는 활성, 예컨대 비제한적인 예로서 RNA, 펩타이드 또는 단백질의 생성을 암호화할 수 있거나, RNA, 펩타이드, 단백질, 무기 및 유기 화합물 또는 조성물 등에 대한 결합 부위를 제공할 수 있다.
선택 가능한 마커의 예는 제한 효소 부위를 포함하는 DNA 분절; 항생제, 예컨대, 스펙티노마이신, 암피실린, 카나마이신, 테트라사이클린, 바스타(Basta), 네오마이신 포스포트랜스퍼라아제 II(NEO) 및 히그로마이신 포스포트랜스퍼라아제(HPT)를 포함하는, 다른 경우에는 독성일 수 있는 화합물에 대해 내성을 제공하는 산물을 암호화하는 DNA 분절; 수용 세포에 없을 수 있는 산물을 암호화하는 DNA 분절(예컨대, tRNA 유전자, 영양요구성 마커); 용이하게 확인될 수 있는 산물을 암호화하는 DNA 분절(예를 들어, 표현형 마커, 예컨대, β-갈락토시다아제, GUS; 형광 단백질, 예컨대, 녹색 형광 단백질(GFP), 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP) 및 세포 표면 단백질); PCR을 위한 새로운 프라이머 부위(예를 들어, 이전에는 병치되지 않은 2개의 DNA 서열의 병치)의 생성, 제한 엔도뉴클레아제 또는 기타 DNA 변형 효소, 화학물질 등에 의해 영향받지 않거나 영향받는 DNA 서열의 포함; 및 확인을 가능하게 하는 특이적인 변형(예를 들어, 메틸화)을 위해 필요한 DNA 서열의 포함을 포함하지만, 이에 한정되는 것은 아니다.
추가적인 선택 가능한 마커는 제초제 화합물, 예컨대, 설포닐우레아, 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 내성을 부여하는 유전자를 포함한다. 예를 들어, 설포닐우레아, 이미다졸리논, 트리아졸로피리미딘 설폰아미드, 피리미디닐살리실레이트 및 설포닐아미노카보닐-트리아졸리논에 대한 내성을 위한 아세토락타제 합성효소(ALS: Acetolactase synthase)(Shaner and Singh, 1997, Herbicide Activity: Toxicol Biochem Mol Biol 69-110); 글리포세이트 내성 5-엔올피루빌쉬키메이트-3-포스페이트(EPSPS)(Saroha et al. 1998, J. Plant Biochemistry & Biotechnology Vol 7:65-72)를 참조한다.
관심 폴리뉴클레오타이드는 다른 형질, 예컨대 비제한적인 예로서 제초제 내성 또는 본원에 기재된 임의의 다른 형질과 함께 쌓이거나 조합되어 사용될 수 있는 유전자를 포함한다. 관심 폴리뉴클레오타이드 및/또는 형질은, 둘 다 본원에 참조로 포함되는 2013년 10월 3일 공개된 US-2013-0263324-A1 및 2013년 1월 24일 공개된 PCT/US13/22891에 기술된 바와 같이, 복합 형질 유전자위에서 함께 쌓일 수 있다.
표적 부위에서 또는 그 근처에서 게놈으로의 삽입을 갖는 세포를 확인하기 위해 다양한 방법을 사용할 수 있다. 비제한적인 예로서 PCR 방법, 시퀀싱 방법, 뉴클레아제 소화, 서던 블롯, 및 이들의 임의의 조합을 포함하여, 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 검출하는 것과 같은 방법을 들 수 있다. 예를 들어, 본원에 기재된 방법에 필요한 정도로 본원에 참조로 포함되는 미국 특허 출원 12/147,834를 참조한다. 상기 방법은 또한 그 게놈으로 통합된 관심 폴리뉴클레오타이드를 포함하는 세포로부터 유기체를 회수하는 단계를 포함한다.
관심 폴리펩타이드는 본원에 기재된 관심 폴리뉴클레오타이드에 의해 암호화되는 임의의 단백질 또는 폴리펩타이드를 포함한다.
폴리뉴클레오타이드 및 폴리펩타이드 서열, 이의 변이체, 및 이들 서열의 구조적 관계는 본원에서 상호 교환적으로 사용되는 용어 "상동성", "상동", "실질적으로 동일한", "실질적으로 유사한" 및 "실질적으로 대응하는"에 의해 기술될 수 있다. 이들은 하나 이상의 아미노산 또는 뉴클레오타이드 염기에서의 변화가 분자의 기능, 예컨대, 유전자 발현을 매개하거나 소정의 표현형을 생성하는 능력에 영향을 미치지 않는 폴리펩타이드 또는 핵산 서열을 지칭한다. 이들 용어는 또한, 초기의 비변형된 핵산에 비해 생성된 핵산의 기능적 특성을 실질적으로 변경하지 않는 핵산 서열의 변형(들)을 지칭한다. 이들 변형은 핵산 단편에서의 하나 이상의 뉴클레오타이드의 결실, 치환, 및/또는 삽입을 포함한다.
포함되는 실질적으로 유사한 핵산 서열은 (적당히 엄격한 조건, 예를 들어 0.5X SSC, 0.1% SDS, 60℃에서) 본원에 예시된 서열과 혼성화하거나, 본원에 개시된 뉴클레오타이드 서열의 임의의 일부에 혼성화하고, 본원에 개시된 임의의 핵산 서열과 기능적으로 동등한 능력에 의해 정의될 수 있다. 엄격성 조건은 원연(distantly-related) 유기체로부터의 상동 서열과 같은 적당히 유사한 단편에 대해 매우 유사한 단편, 예컨대, 근연(closely-related) 유기체로부터의 기능적 효소를 복제하는 유전자로 선별하도록 조정될 수 있다. 혼성화 후 세척이 엄격성 조건을 결정한다.
용어 "선택적으로 혼성화한다"는 엄격한 혼성화 조건 하에 비표적 핵산 서열에의 혼성화보다 검출 가능하게 더 큰 정도(예를 들어, 배경에 비해 적어도 2배)의 핵산 서열의 특정 핵산 표적 서열에의 혼성화 및 비표적 핵산의 실질적 배제에 대한 언급을 포함한다. 선택적으로 혼성화하는 서열은 통상적으로 서로 적어도 약 80%의 서열 동일성, 또는 90%의 서열 동일성을 가지며, 100%의 서열 동일성(즉, 완전히 상보적)까지를 포함한다.
용어 "엄격한 조건" 또는 "엄격한 혼성화 조건"은 시험관내 혼성화 분석법에서 프로브가 그 표적 서열에 선택적으로 혼성화하는 조건에 대한 언급을 포함한다. 엄격한 조건은 서열 의존적이며 상황에 따라 상이할 것이다. 혼성화 및/또는 세척 조건의 엄격성을 제어함으로써, 프로브와 100% 상보적인 표적 서열을 확인할 수 있다(상동 프로빙). 대안적으로, 엄격성 조건은 서열에서 일부 불일치를 허용하여 더 낮은 정도의 유사도가 검출되도록 조정될 수 있다(이종 프로빙). 일반적으로 프로브는 약 1000개 미만의 뉴클레오타이드 길이, 선택적으로 500개 미만의 뉴클레오타이드 길이이다.
통상적으로, 엄격한 조건은 pH 7.0 내지 8.3에서 그리고 짧은 프로브(예를 들어 10개 내지 50개의 뉴클레오타이드)의 경우 적어도 약 30℃에서, 긴 프로브(예를 들어 50개 초과의 뉴클레오타이드)의 경우 적어도 약 60℃에서 염 농도가 약 1.5 M Na 이온 미만, 통상적으로 약 0.01 내지 1.0 M Na 이온 농도(또는 다른 염(들))인 조건일 것이다. 엄격한 조건은 포름아미드와 같은 불안정화제의 첨가로 달성될 수도 있다. 예시적인 낮은 엄격성 조건은 37℃에서의 30 내지 35% 포름아미드, 1 M NaCl, 1% SDS(나트륨 도데실 설페이트) 완충 용액으로의 혼성화, 및 50 내지 55℃에서의 1X 내지 2X SSC(20X SSC = 3.0 M NaCl/0.3 M 삼나트륨 시트레이트) 중 세척을 포함한다. 예시적인 보통의 엄격성 조건은 37℃에서의 40 내지 45% 포름아미드, 1 M NaCl, 1% SDS 중 혼성화, 및 55 내지 60℃에서의 0.5X 내지 1X SSC 중 세척을 포함한다. 예시적인 높은 엄격성 조건은 37℃에서의 50% 포름아미드, 1 M NaCl, 1% SDS 중 혼성화, 및 60 내지 65℃에서의 0.1X SSC 중 세척을 포함한다.
본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 조절할 수 있는 DNA 서열을 지칭한다. 프로모터 서열은 근위의 상류 요소 및 더 원위의 상류 요소로 구성되고, 후자는 종종 인핸서로 지칭된다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이고, 프로모터 고유의 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종 요소일 수 있다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터들로부터 유래된 상이한 요소들로 구성될 수 있고/있거나, 합성 DNA 분절을 포함할 수 있다. 당업자는 상이한 프로모터가 상이한 조직 또는 세포 유형으로, 또는 상이한 발달 단계에서 또는 상이한 환경 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 또한, 대부분의 경우, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 일부 변형을 갖는 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 더 인식된다. 당해 분야에서 잘 알려진 것처럼, 프로모터들은 이들의 강도 및/또는 이들이 활성인 조건, 예컨대 항시성(constitutive) 프로모터, 강한 프로모터, 약한 프로모터, 유도성/억제성 프로모터, 조직 특이적/발달 조절 프로모터, 세포주기 의존성 프로모터 등에 따라 분류될 수 있다.
본원에서 유용한 강력한 프로모터의 예는 본원에 참조로 포함되는 미국 특허 출원 공개 번호 2012/0252079(DGAT2), 2012/0252093(EL1), 2013/0089910(ALK2), 2013/0089911(SPS19), 2006/0019297(GPD 및 GPM), 2011/0059496(GPD 및 GPM), 2005/0130280(FBA, FBAIN, FBAINm), 2006/0057690(GPAT) 및 2010/0068789(YAT1)에 개시된 것들을 포함한다. 적합한 강한 프로모터의 다른 예는 2016년 2월 19일 공개된 WO2016/025131(본원에 참조로 포함됨)의 표 2에 기재된 것을 포함한다.
핵산 또는 폴리펩타이드 서열의 문맥에서 "서열 동일성" 또는 "동일성"은, 특정 비교 창에 걸쳐 최대 관련성을 위해 정렬될 때, 동일한 2개의 서열에서의 핵산 염기 또는 아미노산 잔기를 지칭한다.
용어 "서열 동일성 백분율"은 비교 창에 걸쳐 최적으로 정렬된 2개의 서열을 비교하여 결정된 값을 지칭하며, 비교 창 내의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 일부는 2개의 서열의 최적 정렬을 위한 (부가 또는 결실을 포함하지 않는) 기준 서열과 비교하여 부가 또는 결실(즉, 갭)을 포함할 수 있다. 서열 둘 다에서 동일한 핵산 염기 또는 아미노산 잔기가 나타나는 위치의 개수를 결정하여 일치된 위치의 개수를 산출하고, 일치된 위치의 개수를 비교 창에서의 위치의 총 개수로 나누고, 그 결과에 100을 곱하여 백분율을 계산함으로써, 서열 동일성 백분율을 산출한다. 서열 동일성 백분율의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 한정되는 것은 아니다. 이들 동일성은 본원에 기재된 프로그램 중 임의의 것을 사용하여 결정될 수 있다.
서열 정렬 및 동일성 또는 유사성 백분율 계산은 비제한적인 예로서 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨))의 MegAlign™ 프로그램을 포함하는 상동 서열을 검출하도록 설계된 다양한 비교 방법을 사용하여 결정될 수 있다. 본 출원의 문맥에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 달리 명시되지 않는 한, 분석 결과는 언급된 프로그램의 "디폴트 값"에 기초함이 이해될 것이다. 본원에 사용된 바와 같이, "디폴트 값"은 최초로 초기화될 때, 원래 소프트웨어로 로딩되는 임의의 값 또는 파라미터 세트를 의미할 것이다.
"Clustal V 정렬 방법"은 Clustal V(Higgins and Sharp, (1989) CABIOS 5:151-153; Higgins et al., (1992) Comput Appl Biosci 8:189-191에 기술됨)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨))의 MegAlign™ 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬의 경우, 디폴트 값은 GAP PENALTY = 10 및 GAP LENGTH PENALTY = 10에 해당한다. Clustal 방법을 사용하는 단백질 서열의 동일성 백분율의 계산 및 쌍 정렬을 위한 디폴트 파라미터는 KTUPLE = 1, GAP PENALTY = 3, WINDOW = 5 및 DIAGONALS SAVED = 5이다. 핵산의 경우, 이들 파라미터는 KTUPLE = 2, GAP PENALTY = 5, WINDOW = 4 및 DIAGONALS SAVED = 4이다. Clustal V 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성 백분율"을 얻을 수 있다.
"Clustal W 정렬 방법"은 Clustal W(Higgins and Sharp, (1989) CABIOS 5:151-153; Higgins et al., (1992) Comput Appl Biosci 8:189-191에 기술됨)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨))의 MegAlign™ v6.1 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬을 위한 디폴트 파라미터(GAP PENALTY = 10, GAP LENGTH PENALTY = 0.2, 지연 발산 서열(%) = 30, DNA 전이 가중치 = 0.5, 단백질 가중치 매트릭스 = Gonnet 시리즈, DNA 가중치 매트릭스 = IUB). Clustal W 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성 백분율"을 얻을 수 있다.
달리 명시되지 않는 한, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하여, GAP 버전 10(GCG, Accelrys(캘리포니아주 샌 디에고))을 사용하여 얻은 값을 지칭한다: 뉴클레오타이드 서열에 대한 동일성% 및 유사성%는 갭 생성 페널티 가중치 50 및 갭 길이 연장 페널티 가중치 3 및 nwsgapdna.cmp 점수 매트릭스를 사용하며; 아미노산 서열에 대한 동일성% 및 유사성%는 GAP 생성 페널티 가중치 8 및 갭 길이 연장 페널티 2 및 BLOSUM62 점수 매트릭스를 사용함(Henikoff and Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89:10915). GAP는 Needleman and Wunsch, (1970) J Mol Biol 48:443-53의 알고리즘을 사용하여 일치의 수를 최대화하고 갭의 수를 최소화하는 2개의 전체 서열의 정렬을 찾는다. GAP는 가능한 모든 정렬 및 갭 위치를 고려하고, 일치된 염기의 단위로 갭 생성 페널티 및 갭 연장 페널티를 사용하여 가장 많은 수의 일치된 염기와 가장 적은 갭을 갖는 정렬을 생성한다.
"BLAST"는 생물학적 서열 간의 유사성 영역을 찾는 데 사용되는 미국 국립 생물공학 정보 센터(NCBI: National Center for Biotechnology Information)에 의해 제공된 검색 알고리즘이다. 이 프로그램은 뉴클레오타이드 또는 단백질 서열을 서열 데이터베이스와 비교하고, 일치의 통계적 유의성을 계산하여 유사성이 무작위로 발생한 것으로 예측되지 않도록 쿼리 서열과 충분한 유사성을 갖는 서열을 확인한다. BLAST는 확인된 서열 및 이들의 쿼리 서열에 대한 국소 정렬을 보고한다.
당업자는 여러 수준의 서열 동일성이 다른 종 또는 자연적으로 또는 합성적으로 변형된 종으로부터 폴리펩타이드를 확인하는 데 유용하고, 이러한 폴리펩타이드가 동일하거나 유사한 기능 또는 활성을 갖는다는 것을 잘 이해한다. 백분율 동일성의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 한정되는 것은 아니다. 실제로, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%와 같은 50% 내지 100%의 임의의 정수의 아미노산 동일성은 본 발명을 기술하는 데 유용할 수 있다.
"번역 리더 서열"은 유전자의 프로모터 서열과 암호화 서열 사이에 위치한 폴리뉴클레오타이드 서열을 지칭한다. 번역 리더 서열은 번역 시작 서열의 상류 mRNA에 존재한다. 번역 리더 서열은 mRNA에 대한 1차 전사체의 가공, mRNA 안정성 또는 번역 효율에 영향을 미칠 수 있다. 번역 리더 서열의 예가 기술되어 있다(예를 들어, Turner and Foster, (1995) Mol Biotechnol 3:225-236).
"3' 비암호화 서열", "전사 종결자" 또는 "종결 서열"은 암호화 서열의 하류에 위치한 DNA 서열을 지칭하며, 폴리아데닐화 인식 서열, 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 다른 서열을 포함한다. 폴리아데닐화 신호는 보통 mRNA 전구체 3' 말단에 대한 폴리아데닐산 영역 추가에 영향을 주는 것을 특징으로 한다. 다른 3' 비암호화 서열의 사용은 문헌[Ingelbrecht et al., (1989) Plant Cell 1:671-680]에 예시되어 있다.
본원에 사용된 바와 같이, "RNA 전사체"는 DNA 서열의 RNA 중합효소-촉매된 전사로부터 생긴 산물을 지칭한다. RNA 전사체가 DNA 서열의 완벽한 상보적인 카피인 경우, 이를 1차 전사체 또는 프리-mRNA라고 지칭된다. RNA 전사체는 1차 전사체 프리-mRNA의 전사 후 가공으로부터 유래된 RNA 서열일 때 성숙 RNA 또는 mRNA라고 지칭된다. "메신저 RNA" 또는 "mRNA"는, 인트론이 없고 세포에 의해 단백질로 번역될 수 있는 RNA를 지칭한다. "cDNA"는 효소 역전사효소를 사용하는 mRNA 주형에 상보적이고 그로부터 합성되는 DNA를 지칭한다. cDNA는 단일 가닥이거나, DNA 중합효소 I의 Klenow 단편을 사용하여 이중 가닥 형태로 변환될 수 있다. "센스" RNA는 mRNA를 포함하는 RNA 전사체를 지칭하며 세포내 또는 시험관내 단백질로 번역될 수 있다. "안티센스 RNA"는, 표적 1차 전사체 또는 mRNA의 전부 또는 일부에 상보적이고 표적 유전자의 발현을 차단하는 RNA 전사체를 지칭한다(예를 들어, 미국 특허 5,107,065호 참조). 안티센스 RNA의 상보성은 특정 유전자 전사체의 임의의 부분, 즉 5' 비암호화 서열, 3' 비암호화 서열, 인트론 또는 암호화 서열에 있을 수 있다. "기능적 RNA"는 번역되지 않을 수 있지만 세포 과정에 영향을 미치는 안티센스 RNA, 리보자임 RNA 또는 기타 RNA를 지칭한다. 용어 "보체(complement)" 및 "역보체(reverse complement)"는 mRNA 전사체에 대하여 본원에서 상호 교환적으로 사용되며, 메시지의 안티센스 RNA를 정의하기 위한 의미이다.
"성숙" 단백질은 번역 후 가공된 폴리펩타이드(즉, 1차 번역 산물에 존재하는 임의의 프리펩타이드 또는 프로펩타이드가 제거된 것)를 지칭한다. "전구체" 단백질은 mRNA의 일차 번역 산물(즉, 프리펩타이드 및 프로펩타이드가 여전히 존재하는 것)을 지칭한다. 프리펩타이드 및 프로펩타이드는 세포내 국재화 신호일 수 있으나, 이에 한정되는 것은 아니다.
본원에 사용되는 바와 같이, "표적화된 돌연변이"는 유도 Cas 단백질 시스템을 수반하는 방법을 포함하는 당업자에게 공지된 임의의 방법을 사용하여 표적 유전자 내에 표적 서열을 변경함으로써 제조된 자연적 유전자를 포함하는 유전자(표적 유전자로 지칭됨)에서의 돌연변이이다. Cas 단백질이 cas 엔도뉴클레아제일 때 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 유도된 표적된 돌연변이는 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 게놈 표적 부위 내에 또는 밖에 위치하는 뉴클레오타이드 서열에서 발생할 수 있다.
단백질은 아미노산 치환, 결실, 절두 및 삽입을 비롯한 다양한 방식으로 변경될 수 있다. 이러한 조작 방법은 일반적으로 공지되어 있다. 예를 들어, 단백질(들)의 아미노산 서열 변이체는 DNA에서의 돌연변이에 의해 제조될 수 있다. 돌연변이유발 및 뉴클레오타이드 서열 변경을 위한 방법은 예를 들어 문헌[Kunkel, (1985) Proc. Natl. Acad. Sci. USA 82:488-92; Kunkel et al., (1987) Meth Enzymol 154:367-82; 미국 특허 제4,873,192호; Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York] 및 여기에 인용된 문헌을 포함한다. 단백질의 생물학적 활성에 영향을 미치지 않을 것 같은 아미노산 치환에 관한 지침은, 예를 들어, Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl Biomed Res Found, Washington, D.C.)의 모델에서 발견된다. 하나의 아미노산을 유사한 성질을 갖는 다른 아미노산과 교환하는 것과 같은 보존적 치환이 바람직할 수 있다. 보존적 결실, 삽입 및 아미노산 치환은 단백질의 특징에 근본적인 변화를 일으킬 것으로 예상되지 않으며, 임의의 치환, 결실, 삽입, 또는 이들의 조합의 효과는 통상적인 스크리닝 분석법에 의해 평가될 수 있다. 이중 가닥 파괴 유도 활성에 대한 분석법은 공지되어 있고, 일반적으로 표적 부위를 포함하는 DNA 기질 상에서 물질의 전체 활성 및 특이성을 측정한다.
표준 DNA 단리, 정제, 분자 클로닝, 벡터 작제 및 검증/특성화 방법은 잘 확립되어 있다(예를 들어, Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY) 참조). 벡터 및 작제물은 원형 플라스미드, 및 관심 폴리뉴클레오타이드와 선택적으로 링커, 어댑터, 조절 또는 분석을 비롯한 다른 성분을 포함하는 선형 폴리뉴클레오타이드를 포함한다. 일부 예에서, 인식 부위 및/또는 표적 부위는 인트론, 암호화 서열, 5' UTR, 3' UTR, 및/또는 조절 영역 내에 함유될 수 있다.
약어의 의미는 다음과 같다: "sec"는 초를 의미하고, "min"은 분을 의미하고, "h"는 시간을 의미하고, "d"는 일을 의미하고, "㎕"는 마이크로리터를 의미하고, "㎖"는 밀리리터를 의미하고, "ℓ"는 리터를 의미하고, "μM"은 마이크로몰을 의미하고, "mM"은 밀리몰을 의미하고, "M"은 몰을 의미하고, "mmol"은 밀리몰을 의미하고, "μmole"은 마이크로몰을 의미하고, "g"은 그램을 의미하고, "㎍"은 마이크로그램을 의미하고, "ng"는 나노그램을 의미하고, "U"는 단위를 의미하고, "bp"는 염기 쌍을 의미하고, "kb"는 킬로염기를 의미한다.
본원에 개시된 조성물 및 방법의 비제한적인 예는 다음과 같다:
1. 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편으로서, 변이체의 아미노산 위치는 상기 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
2. 구현예 1에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는, Cas9 엔도뉴클레아제 변이체.
3. 구현예 1에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는, Cas9 엔도뉴클레아제 변이체.
4. 구현예 1 내지 3 중 어느 하나에 있어서, 상기 변이체는 서열 번호 1의 아미노산 서열과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
5. 구현예 3에 있어서, 개선된 특성은 개선된 형질전환 효율이고, 상기 변이체, 또는 이의 활성 단편은 또한 개선된 편집 효율을 갖는, Cas9 엔도뉴클레아제 변이체.
6. 구현예 1 내지 5 중 어느 하나에 있어서, 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
7. 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 조성물.
8. 구현예 7에 있어서, 상기 조성물은 가이드 폴리뉴클레오타이드/Cas9 엔도뉴클레아제 복합체, 가이드 RNA/Cas9 엔도뉴클레아제 복합체, 및 상기 Cas9 엔도뉴클레아제 변이체를 포함하는 융합 단백질로 이루어진 군으로부터 선택되는, 조성물.
9. 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드.
10. 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN)로서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN).
11. 구현예 9의 폴리뉴클레오타이드를 포함하는 재조합 DNA 작제물.
12. 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 숙주 세포.
13. 구현예 9의 폴리뉴클레오타이드를 포함하는 숙주 세포.
14. 구현예 13에 있어서, 세포는 원핵생물 세포 또는 진핵생물 세포인, 숙주 세포.
15. 구현예 14에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
15b. 구현예 7의 PGEN을 포함하는 키트.
15c. 구현예 1, 2, 3, 4, 5 또는 6에 따른 Cas9 엔도뉴클레아제 변이체를 포함하는 전달 입자.
15d. 구현예 15c에 있어서, Cas9 엔도뉴클레아제 변이체 단백질은 가이드 폴리뉴클레오타이드와 복합체화된, 전달 입자.
16. 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 구현예 10의 PGEN을 도입하는 단계 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계를 포함하고, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법
17. 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법으로서, 상기 방법은 적어도 하나의 구현예 10의 PGEN 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계를 포함하고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함하는 방법.
18. 구현예 17에 있어서, 편집된 뉴클레오타이드 서열을 포함하는 적어도 하나의 세포를 선택하는 단계를 추가로 포함하는 방법.
19. 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 구현예 10의 PGEN 및 적어도 하나의 공여 DNA를 도입하는 단계를 포함하고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함하는 방법.
20. 구현예 19에 있어서, 상기 관심 폴리뉴클레오타이드가 상기 표적 부위에서 또는 그 근처에서 통합된 적어도 하나의 세포를 확인하는 단계를 추가로 포함하는 방법.
21. 구현예 16 내지 21 중 어느 하나에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는 방법.
22. 구현예 16 내지 21 중 어느 하나에 있어서, PGEN은 예비조립된 폴리뉴클레오타이드-단백질 복합체로서 세포로 도입되는 방법.
23. 구현예 16 내지 21 중 어느 하나에 있어서, 가이드 폴리뉴클레오타이드 /Cas 엔도뉴클레아제는 가이드 RNA/Cas 엔도뉴클레아제인 방법.
24. 구현예 22에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체는 리보뉴클레오타이드-단백질 복합체로서 세포로 도입되기 전에 시험관내 조립되는 방법.
25. Cas9 엔도뉴클레아제 변이체의 적어도 하나의 특성을 개선하는 방법으로서, 상기 방법은 모 Cas9 엔도뉴클레아제에서 적어도 하나의 아미노산 변형을 도입하여 상기 Cas9 엔도뉴클레아제 변이체를 생성하는 단계를 포함하고, 상기 적어도 하나의 아미노산 변형은 모 Cas9 엔도뉴클레아제의 RuVC 및 HNH 도메인 밖에 위치하고, 상기 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 특성의 개선을 나타내는 방법.
26. 구현예 25에 있어서, 상기 적어도 하나의 아미노산 변형은 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서의 아미노산 치환이고, 변이체의 아미노산 위치는 상기 모 Cas9 엔도뉴클레아제의 아미노산 서열과의 관련성에 의해 넘버링되는 방법.
27. 구현예 26에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는 방법.
28. 구현예 25에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는 방법.
29. 구현예 24 내지 27 중 어느 하나의 방법에 의해 생산된 Cas9 엔도뉴클레아제 변이체.
30. 바실러스 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 바실러스 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 바실러스 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
31. 구현예 30에 있어서, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
32. 구현예 29에 있어서, 바실러스 숙주 세포는 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 알티투디니스(Bacillus altitudinis), 바실러스 아밀로리쿼파시엔스(Bacillus amyloliquefaciens), B. 아밀로리쿼파시엔스 아종 플란타룸(plantarum), 바실러스 브레비스(Bacillus brevis), 바실러스 서르쿨란스(Bacillus circulans), 바실러스 클라우시(Bacillus clausii), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 피르무스(Bacillus firmus), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 메틸로트로피쿠스(Bacillus methylotrophicus), 바실러스 푸밀루스(Bacillus pumilus), 바실러스 사펜시스(Bacillus safensis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 서브틸리스(Bacillus subtilis) 및 바실러스 투린기엔시스(Bacillus thuringiensis)로 이루어진 바실러스 종의 군으로부터 선택되는 방법.
33. E. 콜라이 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 E. 콜라이 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 E. 콜라이 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
34. 사카로마이세스 세레비시아에 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 사카로마이세스 세레비시아에 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 사카로마이세스 세레비시아에 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
35. 진균 숙주 세포의 게놈을 변형시키는 방법으로서,
변형되는 적어도 하나의 표적 서열을 포함하는 진균 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 구현예 1 내지 6 중 어느 하나의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
적어도 하나의 진균 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
36. 세포에서 표적 부위의 변형을 위한 Cas9 엔도뉴클레아제 변이체로서, 상기 Cas9 엔도뉴클레아제 변이체는 이의 HNH 도메인 및 RuVC 도메인 밖에 아미노산 변형을 포함하고, 상기 Cas9 엔도뉴클레아제는 상기 아미노산 변형을 포함하지 않는 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 개선된 특성을 갖고, Cas9 엔도뉴클레아제 변이체는 상기 가이드 폴리뉴클레오타이드와 복합체를 형성할 수 있고, 상기 복합체는 상기 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는, Cas9 엔도뉴클레아제 변이체.
37. 구현예 34에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율, 개선된 배수 형질전환, 개선된 편집 효율 및 개선된 배수 편집으로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는, Cas9 엔도뉴클레아제 변이체.
38. 세포에서 관심 게놈 유전좌위에서의 표적 부위의 변형을 위한 Cas9 엔도뉴클레아제 변이체를 사용하여 편집 효율을 증가시킴으로써 유기체 또는 비인간 유기체를 변형시키는 방법으로서, 상기 방법은 상기 세포에 비자연 발생 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체를 제공하는 단계를 포함하고, 상기 Cas9 엔도뉴클레아제 변이체는 이의 HNH 도메인 및 RuVC 도메인 밖에 아미노산 변형을 포함하고, 상기 Cas9 엔도뉴클레아제는 상기 아미노산 변형을 포함하지 않는 모 Cas9 엔도뉴클레아제와 비교할 때 증가된 유전자 편집 효율을 갖고, 상기 가이드 폴리뉴클레오타이드 및 Cas9 엔도뉴클레아제 변이체는 상기 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 복합체를 형성할 수 있는 방법.
39. 원핵생물 또는 진핵생물 세포에서 Cas 엔도뉴클레아제 변이체를 발현하는 방법으로서,
(a) 원핵생물 또는 진핵생물 세포에 구현예 11의 재조합 DNA 작제물을 도입하는 단계; 및
(b) 상기 Cas 엔도뉴클레아제 변이체의 발현을 허용하는 조건 하에 단계 (a)의 원핵생물 또는 진핵생물 세포를 항온처리하는 단계를 포함하는 방법.
38. 서열 번호 58(CasY155H 변이체), 서열 번호 123(CasY155N 변이체), 서열 번호 125(Cas9 Y155E 변이체), 서열 번호 127(Cas9 Y155F 변이체), 서열 번호 129(Cas9 F86A-F98A 변이체)로 이루어진 군으로부터 선택된 Cas9 엔도뉴클레아제 변이체.
실시예
다음 실시예들에서, 달리 언급되지 않는 한, 부(parts) 및 백분율은 중량 기준이고, 도(degree)는 섭씨이다. 이 실시예들은 본 발명의 구현예들을 나타내면서 단지 예시로 제공되는 것임을 이해해야 한다. 상기 논의 및 이들 실시예로부터, 당업자는 다양한 용도 및 조건에 맞도록 본 발명을 다양하게 변화 및 변형시킬 수 있다. 이러한 변형도 첨부된 청구범위의 범위 내에 속하는 것으로 의도된다.
실시예 1
바실러스에서 표적 부위 1 및 표적 부위 2를 표적화하는 Cas9 발현 카세트의 작제.
스트렙토코커스 피오제네스로부터의 Cas9 단백질(서열 번호 1)을 바실러스(서열 번호 2)에서 N-말단 핵 국재화 서열(NLS; "APKKKRKV"; 서열 번호 3), C-말단 NLS("KKKKLK"; 서열 번호 4), deca-히스티딘 태그("HHHHHHHHHH"; 서열 번호 5), B. 서브틸리스로부터의 aprE 프로모터(서열 번호 6) 및 종결자 서열(서열 번호 7)의 첨가에 의해 발현에 대해 코돈 최적화하고, 제조사의 지시에 따라 Q5 DNA 중합효소(NEB)를 사용하여 하기 표 1에 기재된 정방향/역방향 프라이머 쌍으로 증폭시켰다.
Figure pct00003
플라스미드 pKB320(서열 번호 11)의 골격(서열 번호 10)을 제조사의 지시에 따라 Q5 DNA 중합효소(NEB)를 사용하여 하기 표 2에 기재된 정방향/역방향 프라이머 쌍으로 증폭시켰다.
Figure pct00004
PCR 산물을 제조사의 지시에 따라 Zymo 투명 및 농축물 5 칼럼을 사용하여 정제하였다. 후속하여, PCR 산물을 등몰 비율의 2개의 단편을 혼합하는 Q5 중합효소(NEB)로 연장된 오버랩 연장 PCR(POE-PCR)을 사용하여 조립하였다. POE-PCR 반응을 순환시켰다: 30회 사이클 동안 오(5)초 동안 98℃, 십(10)초 동안 64℃, 사(4)분 십오(15)초 동안 72℃. 오(5) ㎕의 POE-PCR(DNA)을 제조사의 지시에 따라 Top10 E. 콜라이(Invitrogen)로 형질전환시키고, 오십(50) ㎍/㎖의 황산카나마이신을 함유하는 용원성(L) 브로스(Miller 레시피; 1%(w/v) 트립톤, 0.5% 효모 추출물(w/v), 1% NaCl(w/v))에서 선택하고, 1.5% 한천으로 고화시켰다. 콜로니를 37℃에서 열여덟(18)시간 동안 성장하게 하였다. 콜로니를 선별하고, 제조사의 지시에 따라 Qiaprep DNA miniprep 키트를 사용하여 플라스미드 DNA를 제조하고, 오십오(55) ㎕의 ddH2O에 용리시켰다. 하기 표 3에 기재된 서열분석 프라이머를 사용하여 정확한 조립을 검증하기 위해 플라스미드 DNA를 Sanger 서열분석하였다.
Figure pct00005
정확히 조립된 플라스미드, pRF694(서열 번호 25)를 사용하여 하기 기재된 바와 같은 표적 부위 1(서열 번호 28) 및 표적 부위 2(서열 번호 29)에서 바실러스 리케니포르미스 게놈을 편집하기 위한 플라스미드 pRF801(서열 번호 26) 및 pRF806(서열 번호 27)을 작제하였다.
B. 리케니포르미스의 serA1 오픈 리딩 프레임(서열 번호 30)은 역방향 배향에서 고유한 표적 부위, 표적 부위 1(서열 번호 28)을 함유한다. 표적 부위는 역방향 배향에서 프로토스페이서 인접한 모티프(서열 번호 31)에 인접하게 있다. 표적 부위는 가변 표적화 도메인(서열 번호 32)을 암호화하는 DNA로 전환될 수 있다. VT 도메인(서열 번호 32)을 암호화하는 DNA 서열은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 1(서열 번호 34)을 표적화하는 기능적 gRNA를 생산하도록 Cas9 엔도뉴클레아제 인식 도메인(CER, 서열 번호 33)을 암호화하는 DNA 서열에 작동 가능하게 융합된다. 프로모터가 gRNA(서열 번호 33)를 암호화하는 DNA의 5'에 위치하고 종결자가 gRNA(서열 번호 33)를 암호화하는 DNA의 3'에 위치하도록 gRNA를 암호화하는 DNA는 바실러스 종 세포에 작동 가능한 프로모터(예를 들어, spac 프로모터; 서열 번호 35) 및 바실러스 종 세포에 작동 가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열 번호 36)에 작동 가능하게 연결되었다.
B. 리케니포르미스 게놈 DNA(gDNA)로부터 2개의 상동성 아암의 증폭에 의해 Cas9/gRNA 절단에 반응하여 serA1 유전자를 결실시키는 폴리뉴클레오타이드 변형 주형(편집 주형이라고도 칭함)을 생성하였다. 제1 단편은 serA1 오픈 리딩 프레임(서열 번호 37)의 바로 500 bp 상류에 해당한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 4에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에서 제2 단편의 5' 말단에 상동인 18 bp 및 제1 단편의 5' 말단에서 pRF694에 상동인 20 bp를 도입한다.
Figure pct00006
제2 단편은 serA1 오픈 리딩 프레임(서열 번호 40)의 3' 말단의 바로 500 bp 하류에 대응한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 5에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에서 제1 단편의 3' 말단에 상동인 28 bp 및 제2 단편의 3' 말단에서 pRF694에 상동인 21 bp를 도입한다.
Figure pct00007
pRF801(서열 번호 26), Cas9 발현 카세트를 함유하는 E. 콜라이-B. 리케니포르미스 셔틀 플라스미드(서열 번호 2), serA1 오픈-리딩 프레임 내에 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열 번호 43) 및 제1 상동성 아암(서열 번호 37) 및 제2 상동성 아암(서열 번호 40)으로 이루어진 편집 주형(서열 번호 44)을 생성하는 표준 분자 생물학 기법을 사용하여 표적 부위 1 gRNA 발현 카세트(서열 번호 43), 제1 상동성 아암(서열 번호 37) 및 제2 상동성 아암(서열 번호 40)을 암호화하는 DNA를 pRF694(서열 번호 25)로 조립하였다. 플라스미드는 표 3에 기재된 올리고로 Sanger 서열분석에 의해 검증되었다.
B. 리케니포르미스의 rghR1 오픈 리딩 프레임(서열 번호 45)은 역방향 가닥에서 고유한 표적 부위, 표적 부위 2(서열 번호 46)를 함유한다. 표적 부위는 역방향 가닥에서 프로토스페이서 인접한 모티프(서열 번호 47의 마지막 3개의 염기)에 인접하게 있다. 표적 부위는 가이드 RNA의 가변 표적화(VT) 도메인(서열 번호 48)을 암호화하는 DNA로 전환될 수 있다. VT 도메인(서열 번호 48)을 암호화하는 DNA 서열은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 2(서열 번호 49)를 표적화하는 기능적 가이드 RNA(gRNA)를 생산하도록 Cas9 엔도뉴클레아제 인식 도메인(CER, 서열 번호 33)을 암호화하는 DNA 서열에 작동 가능하게 융합된다. 프로모터가 gRNA(서열 번호 43)를 암호화하는 DNA의 5'에 위치하고 종결자가 gRNA(서열 번호 43)를 암호화하는 DNA의 3'에 위치하도록 gRNA를 암호화하는 DNA는 바실러스 종 세포에 작동 가능한 프로모터(예를 들어, B. 쿠틸리스로부터의 spac 프로모터; 서열 번호 35) 및 바실러스 종 세포에 작동 가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열 번호 36)에 작동 가능하게 연결되었다.
B. 리케니포르미스 게놈 DNA(gDNA)로부터 2개의 상동성 아암의 증폭에 의해 Cas9/gRNA 절단에 반응하여 rghR1 유전자를 변형시키는 폴리뉴클레오타이드 변형 주형(편집 주형이라고도 칭함)을 생성하였다. 제1 단편은 rghR1 오픈 리딩 프레임(서열 번호 50)의 바로 500 bp 상류에 해당한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 6에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에서 제2 단편의 5' 말단에 상동인 23 bp 및 제1 단편의 5' 말단에서 pRF694에 상동인 20 bp를 도입한다.
Figure pct00008
제2 단편은 rghR1 오픈 리딩 프레임(서열 번호 53)의 3' 말단의 바로 500 bp 하류에 대응한다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 7에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에서 제1 단편의 3' 말단에 상동인 20 bp 및 제2 단편의 3' 말단에서 pRF694에 상동인 21 bp를 도입한다.
Figure pct00009
pRF806(서열 번호 27), Cas9 발현 카세트를 함유하는 E. 콜라이-B. 리케니포르미스 셔틀 플라스미드(서열 번호 2), rghR1 오픈-리딩 프레임 내에 표적 부위 2를 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열 번호 56) 및 제1 상동성 아암(서열 번호 50) 및 제2 상동성 아암(서열 번호 53)으로 이루어진 편집 주형(서열 번호 57)을 생성하는 표준 분자 생물학 기법을 사용하여 표적 부위 2 gRNA 발현 카세트(서열 번호 56), 제1 상동성 아암(서열 번호 50) 및 제2 상동성 아암(서열 번호 53)을 암호화하는 DNA를 pRF694(서열 번호 25)로 조립하였다. 플라스미드는 표 3에 기재된 올리고로 Sanger 서열분석에 의해 검증되었다.
실시예 2
Cas9 Y155 변이체의 생성
본 실시예에서, S. 피오제네스 Cas9의 Y155H 변이체(본원에서 Cas9 Y155H 변이체라고 칭함, 서열 번호 58)를 pRF801(서열 번호 26) 및 pRF806 플라스미드(서열 번호 27)에서 생성하였다. pRF801 플라스미드(서열 번호 26) 또는 pRF806 플라스미드(서열 번호 27)에서 Cas9 Y155H 변이체를 도입하기 위해 부위-지시된 돌연변이유발을 제조사의 지시에 따라 Quikchange 돌연변이유발 키트 및 주형 DNA로서 pRF801(서열 번호 26) 또는 pRF806(서열 번호 27)을 사용하여 하기 표 8에서 올리고를 사용하여 수행하였다.
Figure pct00010
반응의 생성된 산물인, pRF827(서열 번호 61)은 Cas9 Y155H 변이체 발현 카세트(서열 번호 62), serA1 오픈 리딩 프레임 내에 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열 번호 43) 및 제1 상동성 아암(서열 번호 37) 및 제2 상동성 아암(서열 번호 40)으로 이루어진 편집 주형(서열 번호 44)을 함유하거나, pRF856(서열 번호 63)은 Cas9 Y155H 변이체 발현 카세트(서열 번호 62), rghR1 오픈 리딩 프레임 내에 표적 부위 2를 표적화하는 gRNA 발현 카세트(서열 번호 56) 및 제1 상동성 아암(서열 번호 50) 및 제2 상동성 아암(서열 번호 53)으로 이루어진 편집 주형(서열 번호 57)을 함유하였다. 표 3에 기재된 서열분석 프라이머를 사용하여 정확한 조립을 검증하기 위해 플라스미드 DNA를 Sanger 서열분석하였다.
다른 Cas9 Y155 변이체가 상기 기재된 바와 유사한 상황에서 생성되었다. Cas9 Y155N 변이체가 생성되고, 서열 번호 123(서열 번호 124에 의해 암호화된 아미노산 서열)에 기재되고, Cas9 Y155E 변이체가 생성되고, 서열 번호 125(서열 번호 126에 의해 암호화된 아미노산 서열)에 기재되고, Cas9 Y155F 변이체가 생성되고, 서열 번호 127(서열 번호 128에 의해 암호화된 아미노산 서열)에 기재된다.
실시예 3
스트렙토코커스 피오제네스 Cas9의 Y155H 변이체(Cas9 Y155H 변이체)는 야생형 스트렙토코커스 피오제네스 Cas9(WT Cas9)와 비교하여 바실러스 세포에서 증가된 형질전환 효율 및 동등하거나 증가된 DNA 편집 효율을 갖는다.
본 실시예에서, 제조사의 지시에 따라 회전 환 증폭(Sygnis)을 사용하여 18시간 동안 상기 기재된 pRF694(서열 번호 25), pRF801(서열 번호 26), pRF806(서열 번호 27), pRF827(서열 번호 61), 및 pRF856(서열 번호 63) 플라스미드를 증폭시켰다. 국제 PCT 공보 WO2017/075195호, WO2002/14490호 및 WO2008/7989호에 일반적으로 기재된 바대로 회전 환 증폭된 플라스미드를 pBL.comK 플라스미드(서열 번호 64)를 포함하는 수용성 (모) B. 리케니포르미스 세포로 형질전환시켰다. 세포/DNA 형질전환 혼합물을 20 ㎍/㎖의 카나마이신을 함유하는 L-브로스(Miller 레시피)에 플레이팅하고, 1.5% 한천으로 고화시켰다. 콜로니가 37℃에서 형성하도록 두었다. 카나마이신을 함유하는 L 한천 플레이트에서 성장한 콜로니를 선별하고, L 한천 플레이트에 획선도말하여 회수하였다. 제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 9에 기재된 정방향/역방향 프라이머 쌍을 사용하여 표적 부위 1 유전좌위(서열 번호 65)를 증폭시켜 pRF801(서열 번호 26) 및 pRF827(서열 번호 61)을 갖는 형질전환으로부터의 콜로니를 편집에 대해 스크리닝하였다. 바실러스 세포에서의 WT 및 편집된 표적 부위 1 유전좌위는 증폭된 유전좌위의 크기에 기초하여 분류될 수 있고, WT 앰플리콘(서열 번호 65)은 크기가 편집된 앰플리콘(서열 번호 66)보다 더 컸다.
Figure pct00011
제조사의 지시에 따라 Q5 DNA 중합효소 및 하기 표 10에 기재된 정방향/역방향 프라이머 쌍을 사용하여 표적 부위 2 유전좌위(서열 번호 69)를 증폭시켜 플라스미드 pRF806(서열 번호 27) 또는 pRF856(서열 번호 63)을 갖는 형질전환으로부터의 콜로니를 편집 효율에 대해 분석하였다. WT(서열 번호 69) 및 편집된 표적 부위 2 유전좌위(서열 번호 70)는 편집된 유전좌위(서열 번호 70)의 크기에 기초하여 분류될 수 있고, WT 앰플리콘(서열 번호 69)은 크기가 더 컸다.
Figure pct00012
플라스미드에 선택적인 배지에서 얻은 형질전환체의 수(20 ㎍·㎖-1 황산카나마이신을 함유하는 L 한천)는 표 11에 표시되어 있다. 형질전환 효율은 동일한 gRNA 발현 카세트 및 편집 주형을 갖는 모(WT) Cas9로부터의 형질전환체의 수에 의한 특정 gRNA 및 편집 주형을 갖는 주어진 Cas9 변이체로부터 얻은 형질전환체의 수의 비율이다. 결과는 표 11에 표시되어 있는데, Cas9 Y155H 변이체가 (플라스미드에 의해 전달된) Cas9 변이체의 형질전환 효율을 적어도 84배 내지 402배 증가시킨다는 것을 나타낸다.
Figure pct00013
표 11에 기재된 결과는 Cas9 Y155H 변이체가 WT Cas9의 DNA 편집 효율과 적어도 동일하거나 이보다 적어도 2.3배(또는 230%) 큰 편집 효율을 갖는다는 것을 나타낸다.
실시예 4
Cas9 F86A-F98A 변이체의 작제.
본 실시예에서, Cas9 F86A-F98A 변이체(서열 번호 129)는 B. 리케니포르미스에서 형질전환 효율 및 편집 빈도에 대해 Cas9 F86A-F98A 변이체를 시험하기 위해 pRF801 플라스미드(서열 번호 26)의 골격에서 작제되었다.
F86A 및 F98A(서열 번호 130)를 포함하는 Cas9의 일부를 함유하는 합성 단편은 외부 벤더로부터 주문되었다. 표준 PCR 기법을 사용하여 표 12에 기재된 올리고를 사용하여 pRF801(서열 번호 131)의 골격을 증폭시켰다.
Figure pct00014
표준 PCR 기법을 사용하여 하기 표 13에 기재된 올리고를 사용하여 합성 단편(서열 번호 130)을 증폭시켰다.
Figure pct00015
플라스미드 pRF866(서열 번호 137)을 생성시키기 위해 표준 분자 생물학 기법을 사용하여 F86A-F98A 합성 단편으로 pRF801 골격 단편(서열 번호 131)을 조립하였다. pRF866은 바실러스에 대한 F86A F98A Cas9 발현 카세트(서열 번호 136), serA1 ts1을 표적화하는 gRNA에 대한 발현 카세트를 암호화하는 DNA(서열 번호 43) 및 serA1 결실 편집 주형(서열 번호 44)을 함유한다.
플라스미드 pRF866을 B. 리케니포르미스 세포로 형질전환시켰다.
실시예 5
F86에서의 제1 아미노산 치환 및 F98에서의 제2 아미노산 치환을 포함하는 스트렙토코커스 피오제네스의 Cas9 변이체는 이의 모 (야생형) 스트렙토코커스 피오제네스 Cas9(WT Cas9)와 비교하여 바실러스 세포에서 증가된 형질전환 효율 및 동일한 DNA 편집 효율을 갖는다.
변이체의 아미노산 위치가 서열 번호 1(스트렙토코커스 피오제네스 WT Cas9)에 기재된 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되는, F86(예컨대, F86A)에서의 제1 아미노산 치환 및 F98(예컨대, F98A)에서의 제2 아미노산 치환을 포함하는 스트렙토코커스 피오제네스의 Cas9 변이체(Cas9 F86-F98 변이체라고도 칭함)는 실시예 4에 기재된 바대로 생성되었다. 실시예 3에 기재되고 표 14에 기재된 바대로 형질전환 효율 및 편집 효율을 분석하였다.
Figure pct00016
표 14는 Cas9 F86-F98A 변이체가 WT Cas9와 비교할 때 형질전환 효율을 248배(또는 24,800%) 증가시킨다는 것을 명확히 보여준다. 원하는 편집을 함유하는 스크리닝된 콜로니의 백분율을 결정함으로써 편집 효율에 대해 실시예 3에 기재된 바대로 편집 플라스미드로 형질전환된 콜로니를 스크리닝하였다. 표 14에 기재된 결과는 Cas9 F86A-F98A 변이체가 WT Cas9와 동일한 편집 효율을 갖는다는 것을 나타낸다.
실시예 6
에스체리치아 콜라이 Cas9 벡터의 작제
본 실시예에서, 에스체리치아 콜라이(E. 콜라이)에서의 게놈 편집을 위한 유도성 Cas9 발현 벡터를 작제하였다. 유도제에 반응한 Cas9 발현이 확인되었다.
스트렙토코커스 피오제네스 M1 GAS SF370으로부터의 Cas9 단백질(서열 번호 1)은 당해 분야에 공지된 표준 기법에 따라 코돈 최적화되었다(서열 번호 73). 세포의 핵에 Cas9 단백질을 국재화하기 위해, Cas9 오픈 리딩 프레임의 카복시 말단에서 유인원 바이러스 40(SV40) 1부분(MAPKKKRKV, 서열 번호 74) 핵 국재화 신호를 도입하였다. 야로위아 코돈 최적화된 Cas9 유전자를 표준 분자 생물학 기법에 의해 야로위아 항시성 프로모터, FBA1(서열 번호 75)에 융합시켰다. 야로위아 코돈 최적화된 Cas9 발현 카세트(서열 번호 76)의 예는 항시성 FBA 프로모터, 야로위아 코돈 최적화된 Cas9, 및 SV40 핵 국재화 신호를 함유한다. Cas9 발현 카세트를 플라스미드 pZuf로 클로닝하고, 새로운 작제물을 pZufCas9(서열 번호 77)로 칭했다.
하기 표 15로부터의 프라이머를 사용하여 표준 분자 생물학 기법을 사용하여 pZufCas9로부터 야로위아 코돈 최적화된 Cas9-SV40 융합 유전자(서열 번호 78)를 증폭시켰다.
Figure pct00017
표 12에서의 프라이머는 5' EcoRI 부위 및 3' HindIII 부위를 융합체에 부가한다. 표준 기법을 사용하여 PCR 산물(서열 번호 81)을 정제하였다. pRF48(서열 번호 83)을 생성하도록 정제된 단편을 life technologies로부터의 pBAD/HisB의 EcoRI 및 HindIII 부위(서열 번호 82)로 클로닝하였다.
Cas9 발현 카세트를 함유하는 저카피 E. 콜라이 플라스미드인 pRF97(서열 번호 86)을 생성하도록 E. 콜라이 Cas9 발현 카세트(서열 번호 84)를 저카피 플라스미드 pKO3(서열 번호 85)으로 삽입하였다.
실시예 7
E. 콜라이 Cas9 플라스미드에서의 Cas9 Y155H 변이체의 생성
본 실시예에서, Cas9 Y155H 변이체를 pRF97(서열 번호 86)에 암호화된 Cas9 단백질로 도입하였다.
pRF97로부터의 Cas9 단백질의 일부를 암호화하지만 Y155H 변이체(서열 번호 87)를 암호화하는 치환을 함유하는 합성 DNA 단편을 제조하였다. 표준 PCR 조건 및 표 16에 기재된 프라이머를 사용하여 합성 단편을 증폭시켰다.
Figure pct00018
pRF97-Y155H 단편(서열 번호 90)을 제조하도록 표준 PCR 기법 및 하기 표 17에 기재된 프라이머를 사용하여 Y155H 합성 단편(서열 번호 87)의 삽입을 허용하도록 pRF97 플라스미드(서열 번호 86)를 증폭시켰다.
Figure pct00019
Cas9 Y155H 변이체에 대한 E. 콜라이 발현 카세트를 함유하는 저카피 플라스미드인 pRF861(서열 번호 93)을 생성하기 위해 Y155H 합성 단편(서열 번호 87) 및 pRF97-Y155H 단편(서열 번호 90)을 조합하였다.
실시예 8
WT Cas9 및 Cas9 Y155H 변이체를 사용한 E. 콜라이의 질소 동화 제어 유전자의 결실.
본 실시예에서, WT Cas9 또는 Cas9 Y155H 변이체를 사용하여 E. 콜라이의 질소 동화 제어 유전자를 암호화하는 nac 유전자를 결실시켰다.
E. 콜라이 nac 유전자(서열 번호 94)는 2개의 표적 부위; 표적 부위 1(서열 번호 95) 및 PAM(서열 번호 96의 마지막 3개 염기), 및 표적 부위 2(서열 번호 97) 및 PAM(서열 번호 98의 마지막 3개 염기)을 함유한다. 실시예 1에 기재된 바대로 표적 부위를 암호화하는 DNA의 3' 말단에 CER 도메인(서열 번호 33)을 암호화하는 DNA를 첨가하여 표적 부위의 5' 말단에 E. 콜라이에서 활성인 프로모터(예를 들어, N25 파지 프로모터(서열 번호 99)) 및 CER 도메인 3' 말단에 E. 콜라이에서 활성인 종결자(예를 들어, 람다 파지 t0 종결자(서열 번호 36))를 작동 가능하게 융합함으로써 작동 가능한 gRNA 발현 카세트가 nac 부위 1(서열 번호 100) 및 nac 부위 2(서열 번호 101)에 대해 만들어질 수 있다. E. 콜라이는 상동성 직접 복구를 통해 DNA를 주로 복구하고, 효율을 위해 Cas9 매개된 편집은 편집 주형을 요한다.
nac 오픈 리딩 프레임(서열 번호 104)의 처음의 3개 및 마지막 3개의 코돈을 제외한 모두를 결실시키는 편집 주형을 생성하도록 nac 시작 코돈 및 처음의 3개의 코돈의 상류 491 bp(서열 번호 102)는 nac 오픈 리딩 프레임의 nac 중지 코돈 및 마지막 3개의 코돈의 하류 491 bp(서열 번호 103)에 작동 가능하게 연결되었다.
부위 1 gRNA 발현 카세트(서열 번호 100) 또는 부위 2 gRNA 발현 카세트(서열 번호 102)는 nac 결실 편집 주형(서열 번호 104)에 5' 말단(서열 번호 105)에서 pRF97(서열 번호 86) 및 pRF861(서열 번호 93)과 동일성의 20 bp 및 3' 말단에서 pRF97(서열 번호 86) 및 pRF861(서열 번호 93)과 동일성(서열 번호 106)의 21 bp로 작동 가능하게 연결되고, nacETsite1(서열 번호 107) 및 nacETsite2(서열 번호 108) 합성 DNA 단편으로 순서화되었다.
선형 단편 pRF97-카세트(서열 번호 109) 또는 pRF861-카세트(서열 번호 110)를 생성하기 위해 하기 표 18에 기재된 프라이머 및 표준 분자 생물학 기법을 사용하여 pRF97(서열 번호 86) 또는 pRF861(서열 번호 93)을 증폭시켰다.
Figure pct00020
pRF97/nacETsite1(서열 번호 113), pRF97/nacETsite2(서열 번호 114), pRF861/nacETsite1(서열 번호 115), 및 pRF861/nacETsite2(서열 번호 116)를 생성하도록 표준 분자 생물학 기법을 사용하여 nacETsite1(서열 번호 107) 또는 nacETsite1(서열 번호 108)로 pRF97-카세트(서열 번호 109) 또는 pRF861-카세트(서열 번호 110)를 조립하였다.
MG1655 E. 콜라이 세포는 이전에 기재된 바대로 전자수용성이게 되고(분자 생물학에서 짧은 프로토콜), 1 ㎕의 pRF97/nacETsite1(서열 번호 113), pRF97/nacETsite2(서열 번호 114), pRF861/nacETsite1(서열 번호 115), 또는 pRF861/nacETsite2(서열 번호 116)로 형질전환되었다. 세포를 (Cas9 발현을 유도하도록) 25 ㎍·㎖-1 클로르암페니콜 및 0.1% w·v-1 L-아라비노스를 함유하는 1.5% w·v-1 한천으로 고화된 L 브로스에 플레이팅하였다. 30℃에서 24시간 성장 후 형질전환으로부터의 콜로니를 계수하였다.
콜로니가 편집된 대립유전자를 함유하는지를 결정하기 위해 각각의 형질전환으로부터의 8개의 콜로니는 하기 표 19에서 프라이머 및 표준 기법을 사용하여 PCR 증폭에 의해 WT nac 유전좌위(서열 번호 117) 또는 편집된 nac 유전좌위(서열 번호 118)의 존재에 대해 PCR에 의해 스크리닝되었다.
Figure pct00021
WT nac 유전좌위(서열 번호 117)보다 작은 편집된 nac 유전좌위(서열 번호 118)에 대응하는 증폭 산물을 생성시킨 콜로니는 편집 빈도의 계산을 위해 편집된 바대로 계수되었다. 편집 빈도는 스크리닝된 세포의 백분율이고, 이는 PCR로부터 편집된 nac 유전좌위(서열 번호 118)의 존재를 나타낸다. 표 20에서의 결과는 편집 빈도 및 형질전환 효율(형질전환체/형질전환체 WT Cas9)을 보여준다.
Figure pct00022
표 20은 Cas9 Y155H 변이체가 E. 콜라이에서 작동 가능하고, WTCas9 편집 빈도와 비교할 때 적어도 15% 내지 59%의 편집 효율의 증가를 보여준다는 것을 명확히 나타낸다.
실시예 9
사카로마이세스 세레비시아에 염색체 URA3 유전자 결실을 편집하기 위한 cas9-gRNA 벡터의 작제
사카로마이세스 세레비시아에 염색체 URA3 유전자 결실을 편집하기 위한 Cas9 Y155H 변이체 대 Cas9 야생형(wt)의 형질전환 및 편집 효율을 시험하기 위해, 선택 마커로서 G-418 내성 유전자(KanMX)를 갖는 Cas9 Y155H-gRNA 및 Cas9 wt-gRNA 발현 플라스미드를 하기 기재된 바대로 제조하였다.
제조사의 지시에 따라 하기 표 21에 기재된 정방향/역방향 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pRF694 플라스미드(서열 번호 25)로부터 N-말단 핵 국재화 서열(NLS; "APKKKRKV"; 서열 번호 3), C-말단 NLS("KKKKLK"; 서열 번호 4) 및 deca-히스티딘 태그("HHHHHHHHHH"; 서열 번호 5)를 포함하는 S. 피오제네스(서열 번호 1)로부터 Cas9 야생형 단백질을 암호화하는 합성 폴리뉴클레오타이드를 함유하는 단편 A(Cas9 wt)를 증폭시켰다. 제조사의 지시에 따라 하기 표 21에 기재된 정방향(서열 번호 138)/역방향(서열 번호 138) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pRF827 플라스미드(서열 번호 61)로부터 N-말단 핵 국재화 서열, C-말단 NLS 및 deca-히스티딘 태그를 포함하는 Cas9 Y115H 변이체(서열 번호 58)를 암호화하는 합성 폴리뉴클레오타이드를 함유하는 단편 A'(Cas9 Y115H)를 증폭시켰다.
Figure pct00023
제조사의 지시에 따라 하기 표 22에 기재된 정방향(서열 번호 145)/역방향(서열 번호 146) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pSE087 플라스미드(서열 번호 144)로부터 RNR2p 프로모터(서열 번호 140), 2-미크론 복제 기원 1(서열 번호 141), KanMX 발현 카세트(서열 번호 142) 및 SNR52p 프로모터(서열 번호 143)를 함유하는 단편 B를 증폭시켰다.
Figure pct00024
pSE087 플라스미드는 이종 KanMX 발현 카세트를 갖는 셔틀 벡터이다. 플라스미드는 표적화 sgRNA + T(6) 종결자(서열 번호 147)를 함유하는 스터퍼 단편의 상류에 RNR2 프로모터, SNR52 프로모터의 제어 하에 S. 피오제네스로부터의 cas9 유전자를 함유한다. BsmBI에 의한 플라스미드의 선형화가 sgRNA 스터퍼를 방출시켜 소화된 플라스미드에서 비양립성 오버행을 남기도록 배향된 BsmBI 결합 부위에 의해 sgRNA는 플랭킹된다.
제조사의 지시에 따라 하기 표 23에 기재된 정방향(서열 번호 151)/역방향(서열 번호 152) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 50 bp 상류 상동성 아암(서열 번호 148), URA3 표적화 sgRNA + T(6) 종결자(서열 번호 149) 및 50 bp 하류(서열 번호 150)의 합성 폴리뉴클레오타이드를 함유하는 단편 C를 증폭시켰다.
Figure pct00025
제조사의 지시에 따라 하기 표 24에 기재된 정방향(서열 번호 156)/역방향(서열 번호 157) 프라이머 쌍으로 Q5 DNA 중합효소(NEB)를 사용하여 pSE087 플라스미드로부터 2-미크론 복제 기원 2(서열 번호 153), 암피실린 내성 유전자(서열 번호 154) 및 RNR2 종결자(서열 번호 155)를 함유하는 단편 D를 증폭시켰다.
Figure pct00026
제조사의 지시에 따라 Qiagen PCR 정제 키트(QIAGEN, Inc)를 사용하여 PCR 단편을 정제하였다. 후속하여, 하기 프로토콜에 따라 효모에서 갭 복구에 의해 PCR 단편을 2-미크론 플라스미드 골격에 조립하였다.
제조사의 지시에 따라 동결된-EZ 효모 형질전환 II™ 키트(Zymo Research, Inc)를 사용하여 S. 세레비시아에 ura3Δ 수용성 세포를 제조하였다. 50 ㎕의 S. 세레비시아에 ura3Δ 수용성 세포를 단편 A, B, C 및 D의 각각의 PCR 산물의 DNA 0.1 내지 0.2 ㎍과 혼합하여 pWS572(Cas9 wt)를 생성하였다. 50 ㎕의 S. 세레비시아에 ura3Δ 수용성 세포를 단편 A', B, C 및 D의 각각의 PCR 산물의 DNA 0.1 내지 0.2 ㎍과 혼합하여 pWS573(Cas9 Y115H)을 생성하였다. 키트로부터 제공된 500 ㎕의 EZ 3 용액을 첨가하고 완전히 혼합하였다. 혼합물을 30℃에서 45분 동안 항온처리 후, 50 내지 150 ㎕의 형질전환 혼합물을 200 ㎍/㎖의 게네티신(G418) 항생제가 보충된 YPD 배지 플레이트에 분산시켰다. 플레이트를 30℃에서 2일 내지 4일 동안 항온처리하여 형질전환체가 성장하게 하였다.
ChargeSwitch® Plasmid Yeast Mini kit(Invitrogen, Inc)를 사용하여 200 ㎍/㎖의 게네티신(G418) 항생제가 보충된 YPD 배지에서 성장한 1 ㎖의 형질전환체로부터 pWS572(Cas9 wt) 및 pWS573(Cas9 Y155H)의 생성된 플라스미드를 제조하였다.
실시예 10
pWS572(Cas9 wt) 및 pWS573(Cas9 Y155H)을 사용한 사카로마이세스 세레비시아에 염색체 URA3 유전자 결실
본 실시예에서, 사카로마이세스 세레비시아에 염색체 URA3 유전자 결실에 대한 pWS573(Cas9 Y155H) 대 pWS572(Cas9 wt)의 형질전환 및 편집 효율을 비교하였다. 제조사의 지시에 따라 동결된-EZ 효모 형질전환 II™ 키트(Zymo Research, Inc)를 사용하여 S. 세레비시아에 야생형 수용성 세포를 제조하고, 별개로 pWS573(Cas9 Y155H) 및 pWS572(Cas9 wt)의 100 ng의 플라스미드 DNA로 형질전환시켰다. 50 내지 150 ㎕의 형질전환 혼합물은 200 ㎍/㎖의 게네티신(G418) 항생제가 보충된 YPD 배지 플레이트에 분산시켰다. 플레이트를 30℃에서 2일 내지 4일 동안 항온처리하여 형질전환체가 성장하게 하였다. 2 g/ℓ의 글루코스가 보충된 합성 완전 배지(아미노산이 없는 1X 효모 질소 베이스, 우라실이 부족한 1X 아미노산 혼합물)에 형질전환체를 획선도말하고 형질전환체가 성장하게 하도록 30℃에서 2일 내지 4일 동안 세포를 항온처리하여 정확한 ura3Δ 콜로니를 우라실 영양요구체에 대해 스크리닝하였다. URA3 유전자의 결실은 PCR 및 URA3 표적 영역의 플랭킹 프라이머에 의한 서열분석에 의해 확인되었다. 시험된 콜로니의 총 수로 ura3Δ 콜로니의 수를 나누어 각각의 플라스미드에 대한 편집 빈도를 결정한다.
SEQUENCE LISTING <110> Danisco US Inc. Frisch, Ryan L. He, Hongxian L. <120> CAS9 VARIANTS AND METHODS OF USE <130> NB41317-PCT <150> US 62/599176 <151> 2017-12-15 <160> 157 <170> PatentIn version 3.5 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 2 <211> 5056 <212> DNA <213> Artificial sequence <220> <223> Bacillus codon optimized Cas9 <400> 2 aattcctcca ttttcttctg ctatcaaaat aacagactcg tgattttcca aacgagcttt 60 caaaaaagcc tctgcccctt gcaaatcgga tgcctgtcta taaaattccc gatattggtt 120 aaacagcggc gcaatggcgg ccgcatctga tgtctttgct tggcgaatgt tcatcttatt 180 tcttcctccc tctcaataat tttttcattc tatccctttt ctgtaaagtt tatttttcag 240 aatactttta tcatcatgct ttgaaaaaat atcacgataa tatccattgt tctcacggaa 300 gcacacgcag gtcatttgaa cgaatttttt cgacaggaat ttgccgggac tcaggagcat 360 ttaacctaaa aaagcatgac atttcagcat aatgaacatt tactcatgtc tattttcgtt 420 cttttctgta tgaaaatagt tatttcgagt ctctacggaa atagcgagag atgatatacc 480 taaatagaga taaaatcatc tcaaaaaaat gggtctacta aaatattatt ccatctatta 540 caataaattc acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag 600 ggtaactagt ggccccaaaa aagaaacgca aggttatgga taaaaaatac agcattggtc 660 tggatatcgg aaccaacagc gttgggtggg cagtaataac agatgaatac aaagtgccgt 720 caaaaaaatt taaggttctg gggaatacag atcgccacag cataaaaaag aatctgattg 780 gggcattgct gtttgattcg ggtgagacag ctgaggccac gcgtctgaaa cgtacagcaa 840 gaagacgtta cacacgtcgt aaaaatcgta tttgctactt acaggaaatt ttttctaacg 900 aaatggccaa ggtagatgat agtttcttcc atcgtctcga agaatctttt ctggttgagg 960 aagataaaaa acacgaacgt caccctatct ttggcaatat cgtggatgaa gtggcctatc 1020 atgaaaaata ccctacgatt tatcatcttc gcaagaagtt ggttgatagt acggacaaag 1080 cggatctgcg tttaatctat cttgcgttag cgcacatgat caaatttcgt ggtcatttct 1140 taattgaagg tgatctgaat cctgataact ctgatgtgga caaattgttt atacaattag 1200 tgcaaaccta taatcagctg ttcgaggaaa accccattaa tgcctctgga gttgatgcca 1260 aagcgatttt aagcgcgaga ctttctaagt cccggcgtct ggagaatctg atcgcccagt 1320 taccagggga aaagaaaaat ggtctgtttg gtaatctgat tgccctcagt ctggggctta 1380 ccccgaactt caaatccaat tttgacctgg ctgaggacgc aaagctgcag ctgagcaaag 1440 atacttatga tgatgacctc gacaatctgc tcgcccagat tggtgaccaa tatgcggatc 1500 tgtttctggc agcgaagaat ctttcggatg ctatcttgct gtcggatatt ctgcgtgtta 1560 ataccgaaat caccaaagcg cctctgtctg caagtatgat caagagatac gacgagcacc 1620 accaggacct gactcttctt aaggcactgg tacgccaaca gcttccggag aaatacaaag 1680 aaatattctt cgaccagtcc aagaatggtt acgcgggcta catcgatggt ggtgcatcac 1740 aggaagagtt ctataaattt attaaaccaa tccttgagaa aatggatggc acggaagagt 1800 tacttgttaa acttaaccgc gaagacttgc ttagaaagca acgtacattc gacaacggct 1860 ccatcccaca ccagattcat ttaggtgaac ttcacgccat cttgcgcaga caagaagatt 1920 tctatccctt cttaaaagac aatcgggaga aaatcgagaa gatcctgacg ttccgcattc 1980 cctattatgt cggtcccctg gcacgtggta attctcggtt tgcctggatg acgcgcaaaa 2040 gtgaggaaac catcacccct tggaactttg aagaagtcgt ggataaaggt gctagcgcgc 2100 agtcttttat agaaagaatg acgaacttcg ataaaaactt gcccaacgaa aaagtcctgc 2160 ccaagcactc tcttttatat gagtacttta ctgtgtacaa cgaactgact aaagtgaaat 2220 acgttacgga aggtatgcgc aaacctgcct ttcttagtgg cgagcagaaa aaagcaattg 2280 tcgatcttct ctttaaaacg aatcgcaagg taactgtaaa acagctgaag gaagattatt 2340 tcaaaaagat cgaatgcttt gattctgtcg agatctcggg tgtcgaagat cgtttcaacg 2400 cttccttagg gacctatcat gatttgctga agataataaa agacaaagac tttctcgaca 2460 atgaagaaaa tgaagatatt ctggaggata ttgttttgac cttgacctta ttcgaagata 2520 gagagatgat cgaggagcgc ttaaaaacct atgcccacct gtttgatgac aaagtcatga 2580 agcaattaaa gcgccgcaga tatacggggt ggggccgctt gagccgcaag ttgattaacg 2640 gtattagaga caagcagagc ggaaaaacta tcctggattt cctcaaatct gacggatttg 2700 cgaaccgcaa ttttatgcag cttatacatg atgattcgct tacattcaaa gaggatattc 2760 agaaggctca ggtgtctggg caaggtgatt cactccacga acatatagca aatttggccg 2820 gctctcctgc gattaagaag gggatcctgc aaacagttaa agttgtggat gaacttgtaa 2880 aagtaatggg ccgccacaag ccggagaata tcgtgataga aatggcgcgc gagaatcaaa 2940 cgacacaaaa aggtcaaaag aactcaagag agagaatgaa gcgcattgag gaggggataa 3000 aggaacttgg atctcaaatt ctgaaagaac atccagttga aaacactcag ctgcaaaatg 3060 aaaaattgta cctgtactac ctgcagaatg gaagagacat gtacgtggat caggaattgg 3120 atatcaatag actctcggac tatgacgtag atcacattgt ccctcagagc ttcctcaagg 3180 atgattctat agataataaa gtacttacga gatcggacaa aaatcgcggt aaatcggata 3240 acgtcccatc ggaggaagtc gttaaaaaga tgaaaaacta ttggcgtcaa ctgctgaacg 3300 ccaagctgat cacacagcgt aagtttgata atctgactaa agccgaacgc ggtggtctta 3360 gtgaactcga taaagcagga tttataaaac ggcagttagt agaaacgcgc caaattacga 3420 aacacgtggc tcagatcctc gattctagaa tgaatacaaa gtacgatgaa aacgataaac 3480 tgatccgtga agtaaaagtc attaccttaa aatctaaact tgtgtccgat ttccgcaaag 3540 attttcagtt ttacaaggtc cgggaaatca ataactatca ccatgcacat gatgcatatt 3600 taaatgcggt tgtaggcacg gcccttatta agaaataccc taaactcgaa agtgagtttg 3660 tttatgggga ttataaagtg tatgacgttc gcaaaatgat cgcgaaatca gaacaggaaa 3720 tcggtaaggc taccgctaaa tacttttttt attccaacat tatgaatttt tttaagaccg 3780 aaataactct cgcgaatggt gaaatccgta aacggcctct tatagaaacc aatggtgaaa 3840 cgggagaaat cgtttgggat aaaggtcgtg actttgccac cgttcgtaaa gtcctctcaa 3900 tgccgcaagt taacattgtc aagaagacgg aagttcaaac agggggattc tccaaagaat 3960 ctatcctgcc gaagcgtaac agtgataaac ttattgccag aaaaaaagat tgggatccaa 4020 aaaaatacgg aggctttgat tcccctaccg tcgcgtatag tgtgctggtg gttgctaaag 4080 tcgagaaagg gaaaagcaag aaattgaaat cagttaaaga actgctgggt attacaatta 4140 tggaaagatc gtcctttgag aaaaatccga tcgacttttt agaggccaag gggtataagg 4200 aagtgaaaaa agatctcatc atcaaattac cgaagtatag tctttttgag ctggaaaacg 4260 gcagaaaaag aatgctggcc tccgcgggcg agttacagaa gggaaatgag ctggcgctgc 4320 cttccaaata tgttaatttt ctgtaccttg ccagtcatta tgagaaactg aagggcagcc 4380 ccgaagataa cgaacagaaa caattattcg tggaacagca taagcactat ttagatgaaa 4440 ttatagagca aattagtgaa ttttctaagc gcgttatcct cgcggatgct aatttagaca 4500 aagtactgtc agcttataat aaacatcggg ataagccgat tagagaacag gccgaaaata 4560 tcattcattt gtttacctta accaaccttg gagcaccagc tgccttcaaa tatttcgata 4620 ccacaattga tcgtaaacgg tatacaagta caaaagaagt cttggacgca accctcattc 4680 atcaatctat tactggatta tatgagacac gcattgatct ttcacagctg ggcggagaca 4740 agaagaaaaa actgaaactg caccatcatc accatcatca tcaccatcat tgataactcg 4800 agaaagctta cataaaaaac cggccttggc cccgccggtt ttttattatt tttcttcctc 4860 cgcatgttca atccgctcca taatcgacgg atggctccct ctgaaaattt taacgagaaa 4920 cggcgggttg acccggctca gtcccgtaac ggccaagtcc tgaaacgtct caatcgccgc 4980 ttcccggttt ccggtcagct caatgccgta acggtcggcg gcgttttcct gataccggga 5040 gacggcattc gtaatc 5056 <210> 3 <211> 8 <212> PRT <213> Artificial sequence <220> <223> N-terminal NLS <400> 3 Ala Pro Lys Lys Lys Arg Lys Val 1 5 <210> 4 <211> 6 <212> PRT <213> Artificial sequence <220> <223> C-terminal NLS <400> 4 Lys Lys Lys Lys Leu Lys 1 5 <210> 5 <211> 10 <212> PRT <213> Artificial sequence <220> <223> deca-Histidine tag <400> 5 His His His His His His His His His His 1 5 10 <210> 6 <211> 607 <212> DNA <213> Bacillus subtilis <400> 6 attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60 aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120 aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180 cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240 atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300 cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360 taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420 ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480 aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540 aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600 gtaacta 607 <210> 7 <211> 247 <212> DNA <213> Artificial sequence <220> <223> synthesized terminator DNA sequence <400> 7 acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct ccgcatgttc 60 aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa acggcgggtt 120 gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg cttcccggtt 180 tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg agacggcatt 240 cgtaatc 247 <210> 8 <211> 50 <212> DNA <213> Artificial sequence <220> <223> Cas9 forward primer <400> 8 atatatgagt aaacttggtc tgacagaatt cctccatttt cttctgctat 50 <210> 9 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Cas9 revers primer <400> 9 tgcggccgcg aattcgatta cgaatgccgt ctccc 35 <210> 10 <211> 3290 <212> DNA <213> Artificial sequence <220> <223> plasmid pKB320 backbone <400> 10 gaattcgcgg ccgcacgcgt ccatggggat ccccgcgggt cgacctcgag agttacgcta 60 gggataacag ggtaatatag gagctccagt cggcttaaac cagttttcgc tggtgcgaaa 120 aaagagtgtc ttgtgacacc taaattcaaa atctatcggt cagatttata ccgatttgat 180 tttatatatt cttgaataac atacgccgag ttatcacata aaagcgggaa ccaatcataa 240 aatttaaact tcattgcata atccattaaa ctcttaaatt ctacgattcc ttgttcatca 300 ataaactcaa tcatttcttt aattaattta tatctatctg ttgttgtttt ctttaataat 360 tcattaacat ctacaccgcc ataaactatc atatcttctt tttgatattt aaatttatta 420 ggatcgtcca tgtgaagcat atatctcaca agacctttca cacttcctgc aatctgcgga 480 atagtcgcat tcaattcttc tgttaattat ttttatctgt tcataagatt tattaccctc 540 atacatcact agaatatgat aatgctcttt tttcatccta ccttctgtat cagtatccct 600 atcatgtaat ggagacacta caaattgaat gtgtaactct tttaaatact ctaaccactc 660 ggcttttgct gattctggat ataaaacaaa tgtccaatta cgtcctcttg aatttttctt 720 gttttcagtt tcttttatta cattttcgct catgatataa taacggtgct aatacactta 780 acaaaattta gtcatagata ggcagcatgc cagtgctgtc tatctttttt tgtttaaaat 840 gcaccgtatt cctcctttgc atattttttt attagaatac cggttgcatc tgatttgcta 900 atattatatt tttctttgat tctatttaat atctcatttt cttctgttgt aagtcttaaa 960 gtaacagcaa cttttttctc ttcttttcta tctacaacta tcactgtacc tcccaacatc 1020 tgtttttttc actttaacat aaaaaacaac cttttaacat taaaaaccca atatttattt 1080 atttgtttgg acaatggaca ctggacacct aggggggagg tcgtagtacc cccctatgtt 1140 ttctccccta aataacccca aaaatctaag aaaaaaagac ctcaaaaagg tctttaatta 1200 acatctcaaa tttcgcattt attccaattt cctttttgcg tgtgatgcga gctcatcggc 1260 tccgtcgata ctatgttata cgccaacttt caaaacaact ttgaaaaagc tgttttctgg 1320 tatttaaggt tttagaatgc aaggaacagt gaattggagt tcgtcttgtt ataattagct 1380 tcttggggta tctttaaata ctgtagaaaa gaggaaggaa ataataaatg gctaaaatga 1440 gaatatcacc ggaattgaaa aaactgatcg aaaaataccg ctgcgtaaaa gatacggaag 1500 gaatgtctcc tgctaaggta tataagctgg tgggagaaaa tgaaaaccta tatttaaaaa 1560 tgacggacag ccggtataaa gggaccacct atgatgtgga acgggaaaag gacatgatgc 1620 tatggctgga aggaaagctg cctgttccaa aggtcctgca ctttgaacgg catgatggct 1680 ggagcaatct gctcatgagt gaggccgatg gcgtcctttg ctcggaagag tatgaagatg 1740 aacaaagccc tgaaaagatt atcgagctgt atgcggagtg catcaggctc tttcactcca 1800 tcgacatatc ggattgtccc tatacgaata gcttagacag ccgcttagcc gaattggatt 1860 acttactgaa taacgatctg gccgatgtgg attgcgaaaa ctgggaagaa gacactccat 1920 ttaaagatcc gcgcgagctg tatgattttt taaagacgga aaagcccgaa gaggaacttg 1980 tcttttccca cggcgacctg ggagacagca acatctttgt gaaagatggc aaagtaagtg 2040 gctttattga tcttgggaga agcggcaggg cggacaagtg gtatgacatt gccttctgcg 2100 tccggtcgat cagggaggat atcggggaag aacagtatgt cgagctattt tttgacttac 2160 tggggatcaa gcctgattgg gagaaaataa aatattatat tttactggat gaattgtttt 2220 agtgactgca gtgagatctg gtaatgactc tctagcttga ggcatcaaat aaaacgaaag 2280 gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg 2340 agtaggacaa atccgccgct ctagctaagc agaaggccat cctgacggat ggcctttttg 2400 cgtttctaca aactcttgtt aactctagag ctgcctgccg cgtttcggtg atgaagatct 2460 tcccgatgat taattaattc agaacgctcg gttgccgccg ggcgtttttt atgaagcttc 2520 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 2580 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 2640 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 2700 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 2760 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 2820 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 2880 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 2940 gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 3000 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 3060 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 3120 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 3180 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 3240 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 3290 <210> 11 <211> 4204 <212> DNA <213> Artificial sequence <220> <223> pKB320 plasmid <400> 11 gcggccgcac gcgtccatgg ggatccccgc gggtcgacct cgagagttac gctagggata 60 acagggtaat ataggagctc cagtcggctt aaaccagttt tcgctggtgc gaaaaaagag 120 tgtcttgtga cacctaaatt caaaatctat cggtcagatt tataccgatt tgattttata 180 tattcttgaa taacatacgc cgagttatca cataaaagcg ggaaccaatc ataaaattta 240 aacttcattg cataatccat taaactctta aattctacga ttccttgttc atcaataaac 300 tcaatcattt ctttaattaa tttatatcta tctgttgttg ttttctttaa taattcatta 360 acatctacac cgccataaac tatcatatct tctttttgat atttaaattt attaggatcg 420 tccatgtgaa gcatatatct cacaagacct ttcacacttc ctgcaatctg cggaatagtc 480 gcattcaatt cttctgttaa ttatttttat ctgttcataa gatttattac cctcatacat 540 cactagaata tgataatgct cttttttcat cctaccttct gtatcagtat ccctatcatg 600 taatggagac actacaaatt gaatgtgtaa ctcttttaaa tactctaacc actcggcttt 660 tgctgattct ggatataaaa caaatgtcca attacgtcct cttgaatttt tcttgttttc 720 agtttctttt attacatttt cgctcatgat ataataacgg tgctaataca cttaacaaaa 780 tttagtcata gataggcagc atgccagtgc tgtctatctt tttttgttta aaatgcaccg 840 tattcctcct ttgcatattt ttttattaga ataccggttg catctgattt gctaatatta 900 tatttttctt tgattctatt taatatctca ttttcttctg ttgtaagtct taaagtaaca 960 gcaacttttt tctcttcttt tctatctaca actatcactg tacctcccaa catctgtttt 1020 tttcacttta acataaaaaa caacctttta acattaaaaa cccaatattt atttatttgt 1080 ttggacaatg gacactggac acctaggggg gaggtcgtag taccccccta tgttttctcc 1140 cctaaataac cccaaaaatc taagaaaaaa agacctcaaa aaggtcttta attaacatct 1200 caaatttcgc atttattcca atttcctttt tgcgtgtgat gcgagctcat cggctccgtc 1260 gatactatgt tatacgccaa ctttcaaaac aactttgaaa aagctgtttt ctggtattta 1320 aggttttaga atgcaaggaa cagtgaattg gagttcgtct tgttataatt agcttcttgg 1380 ggtatcttta aatactgtag aaaagaggaa ggaaataata aatggctaaa atgagaatat 1440 caccggaatt gaaaaaactg atcgaaaaat accgctgcgt aaaagatacg gaaggaatgt 1500 ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa cctatattta aaaatgacgg 1560 acagccggta taaagggacc acctatgatg tggaacggga aaaggacatg atgctatggc 1620 tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga acggcatgat ggctggagca 1680 atctgctcat gagtgaggcc gatggcgtcc tttgctcgga agagtatgaa gatgaacaaa 1740 gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag gctctttcac tccatcgaca 1800 tatcggattg tccctatacg aatagcttag acagccgctt agccgaattg gattacttac 1860 tgaataacga tctggccgat gtggattgcg aaaactggga agaagacact ccatttaaag 1920 atccgcgcga gctgtatgat tttttaaaga cggaaaagcc cgaagaggaa cttgtctttt 1980 cccacggcga cctgggagac agcaacatct ttgtgaaaga tggcaaagta agtggcttta 2040 ttgatcttgg gagaagcggc agggcggaca agtggtatga cattgccttc tgcgtccggt 2100 cgatcaggga ggatatcggg gaagaacagt atgtcgagct attttttgac ttactgggga 2160 tcaagcctga ttgggagaaa ataaaatatt atattttact ggatgaattg ttttagtgac 2220 tgcagtgaga tctggtaatg actctctagc ttgaggcatc aaataaaacg aaaggctcag 2280 tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 2340 acaaatccgc cgctctagct aagcagaagg ccatcctgac ggatggcctt tttgcgtttc 2400 tacaaactct tgttaactct agagctgcct gccgcgtttc ggtgatgaag atcttcccga 2460 tgattaatta attcagaacg ctcggttgcc gccgggcgtt ttttatgaag cttcgttgct 2520 ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 2580 gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 2640 cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2700 gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2760 tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2820 cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 2880 cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 2940 gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 3000 agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 3060 cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 3120 tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 3180 tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 3240 ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 3300 cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 3360 cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 3420 accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 3480 ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 3540 ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 3600 tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 3660 acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 3720 tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 3780 actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 3840 ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 3900 aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 3960 ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 4020 cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 4080 aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 4140 actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgga 4200 attc 4204 <210> 12 <211> 35 <212> DNA <213> Artificial sequence <220> <223> pKB320 forward primer <400> 12 gggagacggc attcgtaatc gaattcgcgg ccgca 35 <210> 13 <211> 50 <212> DNA <213> Artificial sequence <220> <223> pKB320 reverse primer <400> 13 atagcagaag aaaatggagg aattctgtca gaccaagttt actcatatat 50 <210> 14 <211> 23 <212> DNA <213> Artificial sequence <220> <223> plasmid RSP1 <400> 14 ccgactggag ctcctatatt acc 23 <210> 15 <211> 20 <212> DNA <213> Artificial sequence <220> <223> plasmid RSP2 <400> 15 gctgtggcga tctgtattcc 20 <210> 16 <211> 22 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP1 <400> 16 gtcttttaag taagtctact ct 22 <210> 17 <211> 20 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP2 <400> 17 ccaaagcgat tttaagcgcg 20 <210> 18 <211> 20 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP3 <400> 18 cctggcacgt ggtaattctc 20 <210> 19 <211> 20 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP4 <400> 19 ggatttcctc aaatctgacg 20 <210> 20 <211> 21 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP5 <400> 20 gtagaaacgc gccaaattac g 21 <210> 21 <211> 20 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP6 <400> 21 gctggtggtt gctaaagtcg 20 <210> 22 <211> 20 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP7 <400> 22 ggacgcaacc ctcattcatc 20 <210> 23 <211> 20 <212> DNA <213> Artificial sequence <220> <223> plasmid RSP3 <400> 23 caggcatccg atttgcaagg 20 <210> 24 <211> 19 <212> DNA <213> Artificial sequence <220> <223> plasmid FSP8 <400> 24 gcaagcagca gattacgcg 19 <210> 25 <211> 8347 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF694 <400> 25 gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60 tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120 taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180 ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240 gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300 agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360 tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420 tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480 ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540 acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600 gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660 ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720 tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780 ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840 agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900 gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960 gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020 catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080 gcggatctgc gtttaatcta tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140 ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200 gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260 aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320 ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380 accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440 gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500 ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560 aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620 caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680 gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740 caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800 ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860 tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920 ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980 ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040 agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100 cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160 cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220 tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280 gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340 ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400 gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460 aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520 agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580 aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640 ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700 gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760 cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820 ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880 aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940 acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000 aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060 gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120 gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180 gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240 aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300 gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360 agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420 aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480 ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540 gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600 ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660 gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720 atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780 gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840 acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900 atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960 tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020 aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080 gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140 atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200 gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260 ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320 ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380 cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440 attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500 aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560 atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620 accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680 catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740 aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800 gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860 ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920 acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980 cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040 agacggcatt cgtaatcgaa ttcgcggccg cacgcgtcca tggggatccc cgcgggtcga 5100 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 5160 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 5220 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 5280 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 5340 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 5400 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 5460 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 5520 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 5580 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 5640 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 5700 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 5760 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 5820 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 5880 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 5940 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 6000 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 6060 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 6120 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 6180 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 6240 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 6300 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 6360 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 6420 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 6480 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 6540 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 6600 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 6660 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 6720 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 6780 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 6840 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 6900 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 6960 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 7020 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 7080 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 7140 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 7200 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 7260 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 7320 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 7380 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 7440 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 7500 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 7560 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 7620 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 7680 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 7740 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7800 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7860 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7920 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7980 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 8040 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 8100 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 8160 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 8220 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 8280 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 8340 tctgaca 8347 <210> 26 <211> 9724 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF801 <400> 26 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240 tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720 gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780 ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840 taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900 ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960 aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020 actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080 tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140 tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200 caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260 ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320 gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380 atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440 gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500 aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560 gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620 tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 27 <211> 9724 <212> DNA <213> Artificial sequence <220> <223> pRF806 plasmid <400> 27 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240 catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720 atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780 tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840 actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900 tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960 caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020 ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080 ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140 ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200 ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260 tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320 tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380 aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440 agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500 cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560 tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620 ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 28 <211> 20 <212> DNA <213> Bacillus licheniformis <400> 28 ctcgacttcg aatacatcca 20 <210> 29 <211> 20 <212> DNA <213> Bacillus licheniformis <400> 29 gatgccatca gttcctcata 20 <210> 30 <211> 1578 <212> DNA <213> Bacillus licheniformis <400> 30 atgtttcgag tattggtctc agataaaatg tccagcgacg gcctcaaacc attaatggaa 60 gcagatttta ttgaaattgt agaaaagaat gttgcggaag cggaagacga gcttcatacg 120 tttgacgcgc tcttggtgcg gagcgccacg aaggtaaccg aagagctgtt taaaaagatg 180 acttcgctga aaatcgtcgc cagagcaggt gtcggcgtcg acaatatcga tattgacgag 240 gcgacaaaac acggtgttat cgtcgtaaac gcgccaaacg ggaatacaat ttcaaccgct 300 gaacatacct ttgcaatgtt ttcagcgtta atgagacata ttccgcaggc aaacatctcc 360 gtgaaatcaa gggagtggaa tcgttcggct tacgtcggtt cagagcttta cggaaaaacg 420 ctcggcatca tcggaatggg ccgcatcgga agcgaaatcg cgagccgcgc aaaagcattc 480 ggtatgaccg ttcatgtatt tgacccgttc ctgacccaag aaagggcaag caagctcggc 540 gttaacgcga acagctttga agaagttctg gcatgcgccg acatcattac ggttcatacc 600 ccgctcacga aagaaacgaa gggacttttg aacaaagaaa ccatcgcaaa aacgaaaaaa 660 ggcgttcgtc tcgttaactg tgcaagaggc ggcatcatcg atgaagcagc gcttttggaa 720 gctctggaaa gcggacatgt cgctggcgct gccttggatg tattcgaagt cgagcctccg 780 gtcgattcaa aactgatcga tcatccgctt gtagtcgcga ctcctcactt gggcgcctca 840 acaaaagaag cccagctgaa tgtcgctgca caagtgtccg aagaagtcct tcagtatgcg 900 caaggaaacc ctgtgatgtc cgcgatcaac cttccggcca tgacaaagga ttcattcgaa 960 aaaatccagc cttatcatca gtttgccaat acgatcggaa accttgtgtc tcagtgcatg 1020 aatgagcctg ttcaagatgt agccatccaa tatgaaggct ccatcgccaa acttgaaacg 1080 tcatttatta cgaaaagcct tttggccgga tttctgaagc cgagggtcgc ggctaccgtt 1140 aacgaagtga atgccggcac cgttgcgaaa gagcgcggca tcagcttcag cgaaaaaatt 1200 tcttccaatg agtcaggcta tgaaaactgc atctctgtga ctgtcacggg agatgtaaca 1260 acattctctt taagagcgac gtacattccg cacttcggcg gacgcatcgt tgccttaaac 1320 ggctttgata ttgattttta tccggctgga caccttgtct acattcacca ccaggataaa 1380 ccaggggcta tcggccatgt cggacgaatt ttaggagacc atgacatcaa tatcgccact 1440 atgcaggtag gccgaaaaga aaaaggcgga gaagcgatca tgatgctttc ctttgaccgc 1500 caccttgagg acgatatttt agctgagctg aaaaacatcc cggatatcgt gtctgttaaa 1560 gccatcgacc ttccttaa 1578 <210> 31 <211> 23 <212> DNA <213> Bacillus licheniformis <400> 31 ctcgacttcg aatacatcca agg 23 <210> 32 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthesized DNA encoding variable targeting domain <400> 32 ctcgacttcg aatacatcca 20 <210> 33 <211> 76 <212> DNA <213> Artificial sequence <220> <223> synthesized DNA encoding CER domain <400> 33 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtgc 76 <210> 34 <211> 96 <212> RNA <213> Artificial sequence <220> <223> synthesized gRNA targeting target site 1 <400> 34 cucgacuucg aauacaucca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugc 96 <210> 35 <211> 224 <212> DNA <213> artificial sequence <220> <223> synthesized spac promoter <400> 35 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tgga 224 <210> 36 <211> 95 <212> DNA <213> Artificial sequence <220> <223> synthesized t0 terminator <400> 36 gactcctgtt gatagatcca gtaatgacct cagaactcca tctggatttg ttcagaacgc 60 tcggttgccg ccgggcgttt tttattggtg agaat 95 <210> 37 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 37 aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60 tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120 ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180 gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240 gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300 aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360 ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420 gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480 tatttaggag gaaatcttac 500 <210> 38 <211> 40 <212> DNA <213> Artificial sequence <220> <223> serA1 homology arm 1 forward primer <400> 38 tgagtaaact tggtctgaca aatggttctt tcccctgtcc 40 <210> 39 <211> 46 <212> DNA <213> Artificial sequence <220> <223> serA1 homology arm 1 forward primer <400> 39 aggttccgca gcttctgtgt aagatttcct cctaaataag cgtcat 46 <210> 40 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 40 acagaagctg cggaacctga aaagaattcc tttcaggttc cgtttttttt aggaattctc 60 cctgatctca agcatctggc ggggataaat ccgctctcct ttcaaatcgt tccattcttt 120 gaggcgctgt acagttacgc ccattttttc ggcgatatga tgaagcgtat cccctttccg 180 cactacatat gtaccggtct tcgattcatc gtcatgaagg cggagtgttt ggccggcctt 240 gagatttgaa tgtttcaacc cgtttattct catgatctcc tcgatggata taccgctatc 300 cttgctgatt ctccagagcg tgtccccttt ttgaacggtc accgcaccgc tcattgtccc 360 ggcgttttga taaacgtgga tagaattttg ccggaacgcc tcctcacgaa gcaccgtcag 420 cggattgatt gcatatcttt tatcttcagt ccatgaaccg tgatgcattt caaaatgcag 480 gtgggttccg gtcgatattc 500 <210> 41 <211> 46 <212> DNA <213> Artificial sequence <220> <223> serA1 homology arm 2 forward primer <400> 41 atgacgctta tttaggagga aatcttacac agaagctgcg gaacct 46 <210> 42 <211> 41 <212> DNA <213> Artificial sequence <220> <223> serA1 homology arm 2 reverse primer <400> 42 cagaagaaaa tggaggaatt cgaatatcga ccggaaccca c 41 <210> 43 <211> 415 <212> DNA <213> Artificial sequence <220> <223> DNA encoding ts1 gRNA expression cassette <400> 43 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240 tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415 <210> 44 <211> 1000 <212> DNA <213> Artificial sequence <220> <223> serA1 deletion editing template <400> 44 aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60 tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120 ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180 gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240 gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300 aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360 ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420 gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480 tatttaggag gaaatcttac acagaagctg cggaacctga aaagaattcc tttcaggttc 540 cgtttttttt aggaattctc cctgatctca agcatctggc ggggataaat ccgctctcct 600 ttcaaatcgt tccattcttt gaggcgctgt acagttacgc ccattttttc ggcgatatga 660 tgaagcgtat cccctttccg cactacatat gtaccggtct tcgattcatc gtcatgaagg 720 cggagtgttt ggccggcctt gagatttgaa tgtttcaacc cgtttattct catgatctcc 780 tcgatggata taccgctatc cttgctgatt ctccagagcg tgtccccttt ttgaacggtc 840 accgcaccgc tcattgtccc ggcgttttga taaacgtgga tagaattttg ccggaacgcc 900 tcctcacgaa gcaccgtcag cggattgatt gcatatcttt tatcttcagt ccatgaaccg 960 tgatgcattt caaaatgcag gtgggttccg gtcgatattc 1000 <210> 45 <211> 402 <212> DNA <213> Bacillus licheniformis <400> 45 atgacgaact ttggacacca tttacgacaa ttaagggaac ggaaaaaact gaccgtcaat 60 caactggcga tgtattccgg cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag 120 cgcggcgtgc cgaagccggc gacgatcaga aaactggcgg acgctttgaa agtcccgtat 180 gaggaactga tggcatctgc aggctatatc agcgcgtcta cagtccagga agcaagaagc 240 agctatgatt ccatttacga catcgtgtca cagtacgatt tagaggacct ttctctgttt 300 gacagcgaaa agtggaaggt gctttcaaaa aaagacatcg aaaacctgga caaatatttc 360 gactttctcg tgcaggaagc aagcagccga aacaaaaact ga 402 <210> 46 <211> 20 <212> DNA <213> Bacillus licheniformis <400> 46 gatgccatca gttcctcata 20 <210> 47 <211> 23 <212> DNA <213> Bacillus licheniformis <400> 47 gatgccatca gttcctcata cgg 23 <210> 48 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthesized DNA encoding variable targeting domain 2 <400> 48 gatgccatca gttcctcata 20 <210> 49 <211> 96 <212> RNA <213> Artificial sequence <220> <223> synthesized gRNA targeting target site 2 <400> 49 gaugccauca guuccucaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugc 96 <210> 50 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 50 ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60 ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120 acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180 catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240 cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300 gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360 taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420 tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480 gagattgcga ggttttggcc 500 <210> 51 <211> 40 <212> DNA <213> artificial sequence <220> <223> rghR1 homology arm 1 forward primer <400> 51 tgagtaaact tggtctgaca ttgatattca gcaccctgcg 40 <210> 52 <211> 38 <212> DNA <213> Artificial sequence <220> <223> rghR1 homology arm 1 reverse primer <400> 52 tgtgccgcgg agaagtatgg ccaaaacctc gcaatctc 38 <210> 53 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 53 atacttctcc gcggcacact ctcctctcta tcattttcgt ctgtttacga tcctgctgtt 60 attttatccc ttatgttaac ttttgtcaat atttttcctg tctaagtatt tcctatagtc 120 aacatttgta ttaaaatgtt catatcatga atttgcgggg gggatggcga tgacaaggtt 180 cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg tcggttaatc agcttgccat 240 gtatgccggt gtgagcgccg cagccatttc cagagccgca gccatttcca gaatcgaaaa 300 cggccaccgc ggcgttccca agcccgcgac gatcagaaaa ttggccgagg ctctgaaaat 360 gccgtacgag cagctcatgg atattgccgg ttatatgaga gctgacgaga ttcgcgaaca 420 gccgcgcggc tatgtcacga tgcaggagat cgcggccaag cacggcgtcg aagacctgtg 480 gctgtttaaa cccgagaaat 500 <210> 54 <211> 38 <212> DNA <213> Artificial sequence <220> <223> rghR1 homology arm 2 forward primer <400> 54 gagattgcga ggttttggcc atacttctcc gcggcaca 38 <210> 55 <211> 44 <212> DNA <213> Artificial sequence <220> <223> rghR1 homology arm 2 reverse primer <400> 55 cagaagaaaa tggaggaatt catttctcgg gtttaaacag ccac 44 <210> 56 <211> 415 <212> DNA <213> Artificial sequence <220> <223> DNA encoding ts2 expression cassette <400> 56 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240 catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415 <210> 57 <211> 1000 <212> DNA <213> Artificial sequence <220> <223> synthesized rghR1 deletion editing template <400> 57 ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60 ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120 acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180 catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240 cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300 gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360 taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420 tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480 gagattgcga ggttttggcc atacttctcc gcggcacact ctcctctcta tcattttcgt 540 ctgtttacga tcctgctgtt attttatccc ttatgttaac ttttgtcaat atttttcctg 600 tctaagtatt tcctatagtc aacatttgta ttaaaatgtt catatcatga atttgcgggg 660 gggatggcga tgacaaggtt cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg 720 tcggttaatc agcttgccat gtatgccggt gtgagcgccg cagccatttc cagagccgca 780 gccatttcca gaatcgaaaa cggccaccgc ggcgttccca agcccgcgac gatcagaaaa 840 ttggccgagg ctctgaaaat gccgtacgag cagctcatgg atattgccgg ttatatgaga 900 gctgacgaga ttcgcgaaca gccgcgcggc tatgtcacga tgcaggagat cgcggccaag 960 cacggcgtcg aagacctgtg gctgtttaaa cccgagaaat 1000 <210> 58 <211> 1368 <212> PRT <213> Artificial sequence <220> <223> synthesized Cas9 Y155H variant <400> 58 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile His Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 59 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Y155H forward primer <400> 59 gatctgcgtt taatccatct tgcgttagcg cac 33 <210> 60 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Y155H reverse primer <400> 60 gtgcgctaac gcaagatgga ttaaacgcag atc 33 <210> 61 <211> 9724 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF827 <400> 61 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240 tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720 gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780 ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840 taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900 ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960 aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020 actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080 tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140 tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200 caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260 ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320 gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380 atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440 gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500 aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560 gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620 tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 62 <211> 5042 <212> DNA <213> Artificial sequence <220> <223> synthesized Y155H variant expression cassette <400> 62 attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60 aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120 aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180 cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240 atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300 cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360 taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420 ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480 aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540 aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600 gtaactagtg gccccaaaaa agaaacgcaa ggttatggat aaaaaataca gcattggtct 660 ggatatcgga accaacagcg ttgggtgggc agtaataaca gatgaataca aagtgccgtc 720 aaaaaaattt aaggttctgg ggaatacaga tcgccacagc ataaaaaaga atctgattgg 780 ggcattgctg tttgattcgg gtgagacagc tgaggccacg cgtctgaaac gtacagcaag 840 aagacgttac acacgtcgta aaaatcgtat ttgctactta caggaaattt tttctaacga 900 aatggccaag gtagatgata gtttcttcca tcgtctcgaa gaatcttttc tggttgagga 960 agataaaaaa cacgaacgtc accctatctt tggcaatatc gtggatgaag tggcctatca 1020 tgaaaaatac cctacgattt atcatcttcg caagaagttg gttgatagta cggacaaagc 1080 ggatctgcgt ttaatccatc ttgcgttagc gcacatgatc aaatttcgtg gtcatttctt 1140 aattgaaggt gatctgaatc ctgataactc tgatgtggac aaattgttta tacaattagt 1200 gcaaacctat aatcagctgt tcgaggaaaa ccccattaat gcctctggag ttgatgccaa 1260 agcgatttta agcgcgagac tttctaagtc ccggcgtctg gagaatctga tcgcccagtt 1320 accaggggaa aagaaaaatg gtctgtttgg taatctgatt gccctcagtc tggggcttac 1380 cccgaacttc aaatccaatt ttgacctggc tgaggacgca aagctgcagc tgagcaaaga 1440 tacttatgat gatgacctcg acaatctgct cgcccagatt ggtgaccaat atgcggatct 1500 gtttctggca gcgaagaatc tttcggatgc tatcttgctg tcggatattc tgcgtgttaa 1560 taccgaaatc accaaagcgc ctctgtctgc aagtatgatc aagagatacg acgagcacca 1620 ccaggacctg actcttctta aggcactggt acgccaacag cttccggaga aatacaaaga 1680 aatattcttc gaccagtcca agaatggtta cgcgggctac atcgatggtg gtgcatcaca 1740 ggaagagttc tataaattta ttaaaccaat ccttgagaaa atggatggca cggaagagtt 1800 acttgttaaa cttaaccgcg aagacttgct tagaaagcaa cgtacattcg acaacggctc 1860 catcccacac cagattcatt taggtgaact tcacgccatc ttgcgcagac aagaagattt 1920 ctatcccttc ttaaaagaca atcgggagaa aatcgagaag atcctgacgt tccgcattcc 1980 ctattatgtc ggtcccctgg cacgtggtaa ttctcggttt gcctggatga cgcgcaaaag 2040 tgaggaaacc atcacccctt ggaactttga agaagtcgtg gataaaggtg ctagcgcgca 2100 gtcttttata gaaagaatga cgaacttcga taaaaacttg cccaacgaaa aagtcctgcc 2160 caagcactct cttttatatg agtactttac tgtgtacaac gaactgacta aagtgaaata 2220 cgttacggaa ggtatgcgca aacctgcctt tcttagtggc gagcagaaaa aagcaattgt 2280 cgatcttctc tttaaaacga atcgcaaggt aactgtaaaa cagctgaagg aagattattt 2340 caaaaagatc gaatgctttg attctgtcga gatctcgggt gtcgaagatc gtttcaacgc 2400 ttccttaggg acctatcatg atttgctgaa gataataaaa gacaaagact ttctcgacaa 2460 tgaagaaaat gaagatattc tggaggatat tgttttgacc ttgaccttat tcgaagatag 2520 agagatgatc gaggagcgct taaaaaccta tgcccacctg tttgatgaca aagtcatgaa 2580 gcaattaaag cgccgcagat atacggggtg gggccgcttg agccgcaagt tgattaacgg 2640 tattagagac aagcagagcg gaaaaactat cctggatttc ctcaaatctg acggatttgc 2700 gaaccgcaat tttatgcagc ttatacatga tgattcgctt acattcaaag aggatattca 2760 gaaggctcag gtgtctgggc aaggtgattc actccacgaa catatagcaa atttggccgg 2820 ctctcctgcg attaagaagg ggatcctgca aacagttaaa gttgtggatg aacttgtaaa 2880 agtaatgggc cgccacaagc cggagaatat cgtgatagaa atggcgcgcg agaatcaaac 2940 gacacaaaaa ggtcaaaaga actcaagaga gagaatgaag cgcattgagg aggggataaa 3000 ggaacttgga tctcaaattc tgaaagaaca tccagttgaa aacactcagc tgcaaaatga 3060 aaaattgtac ctgtactacc tgcagaatgg aagagacatg tacgtggatc aggaattgga 3120 tatcaataga ctctcggact atgacgtaga tcacattgtc cctcagagct tcctcaagga 3180 tgattctata gataataaag tacttacgag atcggacaaa aatcgcggta aatcggataa 3240 cgtcccatcg gaggaagtcg ttaaaaagat gaaaaactat tggcgtcaac tgctgaacgc 3300 caagctgatc acacagcgta agtttgataa tctgactaaa gccgaacgcg gtggtcttag 3360 tgaactcgat aaagcaggat ttataaaacg gcagttagta gaaacgcgcc aaattacgaa 3420 acacgtggct cagatcctcg attctagaat gaatacaaag tacgatgaaa acgataaact 3480 gatccgtgaa gtaaaagtca ttaccttaaa atctaaactt gtgtccgatt tccgcaaaga 3540 ttttcagttt tacaaggtcc gggaaatcaa taactatcac catgcacatg atgcatattt 3600 aaatgcggtt gtaggcacgg cccttattaa gaaataccct aaactcgaaa gtgagtttgt 3660 ttatggggat tataaagtgt atgacgttcg caaaatgatc gcgaaatcag aacaggaaat 3720 cggtaaggct accgctaaat acttttttta ttccaacatt atgaattttt ttaagaccga 3780 aataactctc gcgaatggtg aaatccgtaa acggcctctt atagaaacca atggtgaaac 3840 gggagaaatc gtttgggata aaggtcgtga ctttgccacc gttcgtaaag tcctctcaat 3900 gccgcaagtt aacattgtca agaagacgga agttcaaaca gggggattct ccaaagaatc 3960 tatcctgccg aagcgtaaca gtgataaact tattgccaga aaaaaagatt gggatccaaa 4020 aaaatacgga ggctttgatt cccctaccgt cgcgtatagt gtgctggtgg ttgctaaagt 4080 cgagaaaggg aaaagcaaga aattgaaatc agttaaagaa ctgctgggta ttacaattat 4140 ggaaagatcg tcctttgaga aaaatccgat cgacttttta gaggccaagg ggtataagga 4200 agtgaaaaaa gatctcatca tcaaattacc gaagtatagt ctttttgagc tggaaaacgg 4260 cagaaaaaga atgctggcct ccgcgggcga gttacagaag ggaaatgagc tggcgctgcc 4320 ttccaaatat gttaattttc tgtaccttgc cagtcattat gagaaactga agggcagccc 4380 cgaagataac gaacagaaac aattattcgt ggaacagcat aagcactatt tagatgaaat 4440 tatagagcaa attagtgaat tttctaagcg cgttatcctc gcggatgcta atttagacaa 4500 agtactgtca gcttataata aacatcggga taagccgatt agagaacagg ccgaaaatat 4560 cattcatttg tttaccttaa ccaaccttgg agcaccagct gccttcaaat atttcgatac 4620 cacaattgat cgtaaacggt atacaagtac aaaagaagtc ttggacgcaa ccctcattca 4680 tcaatctatt actggattat atgagacacg cattgatctt tcacagctgg gcggagacaa 4740 gaagaaaaaa ctgaaactgc accatcatca ccatcatcat caccatcatt gataaacata 4800 aaaaaccggc cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc 4860 gctccataat cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc 4920 ggctcagtcc cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg 4980 tcagctcaat gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa 5040 tc 5042 <210> 63 <211> 9724 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF856 <400> 63 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240 catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720 atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780 tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840 actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900 tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960 caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020 ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080 ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140 ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200 ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260 tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320 tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380 aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440 agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500 cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560 tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620 ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 64 <211> 6393 <212> DNA <213> Artificial sequence <220> <223> synthesized pBL.comK-syn <400> 64 aagcttcata tgcaagggtt tattgttttc taaaatctga ttaccaatta gaatgaatat 60 ttcccaaata ttaaataata aaacaaaaaa attgaaaaaa gtgtttccac cattttttca 120 atttttttat aattttttta atctgttatt taaatagttt atagttaaat ttacattttc 180 attagtccat tcaatattct ctccaagata actacgaact gctaacaaaa ttctctccct 240 atgttctaat ggagaagatt cagccactgc atttcccgca atatcttttg gtatgatttt 300 acccgtgtcc atagttaaaa tcatacggca taaagttaat atagagttgg tttcatcatc 360 ctgataatta tctattaatt cctctgacga atccataatg gctcttctca catcagaaaa 420 tggaatatca ggtagtaatt cctctaagtc ataatttccg tatattcttt tattttttcg 480 ttttgcttgg taaagcatta tggttaaatc tgaatttaat tccttctgag gaatgtatcc 540 ttgttcataa agctcttgta accattctcc ataaataaat tcttgtttgg gaggatgatt 600 ccacggtacc atttcttgct gaataataat tgttaattca atatatcgta agttgctttt 660 atctcctatt ttttttgaaa taggtctaat tttttgtata agtatttctt tactttgatc 720 tgtcaatggt tcagatacga cgactaaaaa gtcaagatca ctatttggtt ttagtccact 780 ctcaactcct gatccaaaca tgtaagtacc aataaggtta ttttttaaat gtttccgaag 840 tatttttttc actttattaa tttgttcgta tgtattcaaa tatatcctcc tcactatttt 900 gattagtacc tattttatat ccatagttgt taattaaata aacttaattt agtttattta 960 tggatttcat tggcttctaa attttttatc tagataataa ttattttagt taattttatt 1020 ctagattata tatgatatga tctttcattt ccataaaact aaagtaagtg taaacctatt 1080 cattgtttta aaaatatctc ttgccagtca cgttacgtta ttagttatag ttattataac 1140 atgtattcac gaacgggcgc gccggtatcc gcgcttcttg agcactattt attcaaagcc 1200 gctccagatc aatagcgctt tttcagctcc ctgaggatga attcgtatat cagctgattc 1260 cggtcttctt tcggatagag cataaattcc tgtttcttct gcatggggtt tccttcaatc 1320 ctgtcgataa attttgttct cagccatgcc gttcggtaaa cctggttttc gaaagatgag 1380 atggatacgg gcagctccag cgtttccccg ttgacaaacg tgacaaacgt gttgtcatac 1440 tttgccgcgc aaaactcgtg aacatgcgca tgggaaagcc acccgcactg aggacgagtt 1500 gaggaaaatg tggggaaaag aaaaatgttg tttgagtgat ccaccatgat cggcggttta 1560 tgggaaactt taatgacttc atatgtgccc gcttttcttc ccgcatagct cgatccgaaa 1620 tagcggcagc ttctttcgat aatttgaaac ggcttcatat tgacgcggaa agtcctgtcg 1680 gtctcaagta tttttgaggc ggatttctcc ccctcaccca gaggcaggac agccattgtc 1740 gaactgttta cttcatacgt atcctttgtc atatcctctg tgctcatgtg atttccccct 1800 taaaaataaa ttcattcaaa tacagatgca ttttatttca tatagtaagt acatcaccta 1860 ttagtttgtt gtttaaacaa actaacttat tttcatctta tataacctcg tcagtatttt 1920 caatattttt tttagttttt tatgaacaca ttagatttaa taaagggaag attcgctatg 1980 tactatgttg atacttaatt taaagattaa acaaatggag tggatgaagt ggatatcgct 2040 gatcaaacct ttgtcaaaaa agtaaatcaa aagttattat taaaagaaat ccttaaaaat 2100 tcacctattt caagagcaaa attatctgaa atgactggat taaataaatc aactgtctca 2160 tcacaggtaa acacgttaat gaaagaaagt atggtatttg aaataggtca aggacaatca 2220 agtggcggaa gaagacctgt catgcttgtt tttaataaaa aggcaggata ctccgttgga 2280 atagatgttg gtgtggatta tattaatggc attttaacag accttgaagg aacaatcgtt 2340 cttgatcaat accgccattt ggaatccaat tctccagaaa taacgaaaga cattttgatt 2400 gatatgattc atcactttat tacgcaaatg ccccaatctc cgtacgggtt tattggtata 2460 ggtacttgcg tgcctggact cattgataaa gatcaaaaaa ttgttttcac tccgaactcc 2520 aactggagag atattgactt aaaatcttcg atacaagaga agtacaatgt gtctgttttt 2580 attgaaaatg aggcaaatgc tggcgcatat ggagaaaaac tatttggagc tgcaaaaaat 2640 cacgataaca ttatttacgt aagtatcagc acaggaatag ggatcggtgt tattatcaac 2700 aatcatttat atagaggagt aagcggcttc tctggagaaa tgggacatat gacaatagac 2760 tttaatggtc ctaaatgcag ttgcggaaac cgaggatgct gggaattgta tgcttcagag 2820 aaggctttat ttaaatctct tcagaccaaa gagaaaaaac tgtcctatca agatatcata 2880 aacctcgccc atctgaatga tatcggaacc ttaaatgcat tacaaaattt tggattctat 2940 ttaggaatag gccttaccaa tattctaaat actctcaacc cacaagccgt aattttaaga 3000 aatagcataa ttgaatcgca tcctatggtt ttaaattcaa tgagaagtga agtatcatca 3060 agggtttatt cccaattagg caatagctat gaattattgc catcttcctt aggacagaat 3120 gcaccggcat taggaatgtc ctccattgtg attgatcatt ttctggacat gattacaatg 3180 taatttttta tggaatggac agctcatctt taaagatgag tttttttatt ctaggagtat 3240 ttctgaagca atagtgacat ggcaccttct catatgaaaa aggagttcta aaataaaaat 3300 ctcctttttc atgtgcaaat tatttttctt tataacgaaa atatctaaat gacaatgcat 3360 atgcaagagg ggatcacata aatatatatt ttaaaaatat cccactttat ccaattttcg 3420 tttgttgaac taatgggtgc tttagttgaa gaataaaaga ccacattaaa aaatgtggtc 3480 ttttgtgttt ttttaaagga tttgagcgta gcgaaaaatc cttttctttc ttatcttgat 3540 actatataga aacaacatca tttttcaaaa ttaggtcaaa gccttgtgta tcaagggttt 3600 gatggttctt tgacaggtaa aaactccttc tgctattatt aaatactata tagaaacaac 3660 atcatttttc aaaattaggt caaagccttg tgtatcaagg gtttgatggt tctttgacag 3720 gtaaaaactc cttctgctat tattaaggtg tcgaatcaaa ataatagaat gctagagaac 3780 tagctcagaa ggagtttttt tgttgattta ttcatctgaa aatgattata gcatcctcga 3840 agataaaacc gcaacaggta aaaagcggga ttggaagggg aaaaagagac ggacgaacct 3900 catggcggag cattacgaag cgttagagag taagattggg gcaccttact atggcaaaaa 3960 ggctgaaaaa ctaattagtt gtgcagagta tctttcgttt aagagagacc cggagacggg 4020 caagttaaaa ctgtatcaag cccatttttg taaagtgagg ttatgtccga tgtgtgcgtg 4080 gcgcaggtcg ttaaaaattg cttatcacaa taagttgatc gtagaggaag ccaatagaca 4140 gtacggctgc ggatggattt ttctcacgct gacgattcga aatgtaaagg gagaacggct 4200 gaagccacaa atttctgcga tgatggaagg ctttaggaaa ctgttccagt acaaaaaagt 4260 aaaaacttcg gttcttggat ttttcagagc tttagagatt accaaaaatc atgaagaaga 4320 tacatatcat cctcattttc atgtgttgat accagtaagg aaaaattatt ttgggaaaaa 4380 ctatattaag caggcggagt ggacgagcct ttggaaaaag gcgatgaaat tggattacac 4440 tccaattgtc gatattcgtc gagtgaaagg taaagctaag attgacgctg aacagattga 4500 aaacgatgtg cggaacgcaa tgatggagca aaaagctgtt ctcgaaatct ctaaatatcc 4560 ggttaaggat acggatgttg tgcgcggtaa taaggtgact gaagacaatc tgaacacggt 4620 gctttacttg gatgatgcgt tggcagctcg aaggttaatt ggatacggtg gcattttgaa 4680 ggagatacat aaagagctga atcttggtga tgcggaggac ggcgatctgg tcaagattga 4740 ggaagaagat gacgaggttg caaatggtgc atttgaggtt atggcttatt ggcatcctgg 4800 cattaaaaat tacataatca aataaaaaaa gcagaccttt agaaggcctg cttttttaac 4860 taacccattt gtattgtgtt gaaatatgtt ttgtatggtg cactctcagt acaatctgct 4920 ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 4980 gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 5040 tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 5100 gcctattttt ataggttaat gtcatgataa taatggtttc ttagcgattc acaaaaaata 5160 ggcacacgaa aaacaagtta agggatgcag tttatgcatc ccttaactta aaatactaaa 5220 aatgcccata ttttttcctc cttataaaat tagtataatt atagcacgag atctaaaagg 5280 atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 5340 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5400 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5460 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5520 ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5580 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5640 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5700 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5760 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5820 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5880 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5940 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 6000 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 6060 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 6120 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 6180 cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 6240 ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 6300 cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 6360 ggaaacagct atgaccatga ttacgccgga tcc 6393 <210> 65 <211> 2800 <212> DNA <213> Bacillus licheniformis <400> 65 tagagacgag acgtctcacc ttgttgtgtt tcattttgtc actctctcct tttcgatcac 60 atctcacgaa aagaggaatg gttctttccc ctgtcctaaa caaaaaaccc gctttattga 120 aaaagcgggg ctgttttaca gacaggtcaa ataaacgttt gaaaatgttc atttcaaaac 180 gcgcggaacc tccatcttct cccatccaga ctatactgtc ggcttcggaa tcgcaccgaa 240 tcctgcccat aaaaaggctc gcgggcttag agcgcttgct catcaccgcc ggtagggaat 300 ttcaccctgc cccgaagatt gatcttattt atttttaata ctgatattat tataaattaa 360 ttgtgaaaaa atgtacaggt gcaaagctta ttgcgctgtt ttgggacatc ctgcacgata 420 tttcggtaaa ctcacttttt ccgcatacta aaaaccgcac attcacagtt atttcatttt 480 taattttcgt ctttccgcgt gaaactcatt gacactcttt atggaatatg gtaaattatc 540 agatatttat gacgcttatt taggaggaaa tcttacatgt ttcgagtatt ggtctcagat 600 aaaatgtcca gcgacggcct caaaccatta atggaagcag attttattga aattgtagaa 660 aagaatgttg cggaagcgga agacgagctt catacgtttg acgcgctctt ggtgcggagc 720 gccacgaagg taaccgaaga gctgtttaaa aagatgactt cgctgaaaat cgtcgccaga 780 gcaggtgtcg gcgtcgacaa tatcgatatt gacgaggcga caaaacacgg tgttatcgtc 840 gtaaacgcgc caaacgggaa tacaatttca accgctgaac atacctttgc aatgttttca 900 gcgttaatga gacatattcc gcaggcaaac atctccgtga aatcaaggga gtggaatcgt 960 tcggcttacg tcggttcaga gctttacgga aaaacgctcg gcatcatcgg aatgggccgc 1020 atcggaagcg aaatcgcgag ccgcgcaaaa gcattcggta tgaccgttca tgtatttgac 1080 ccgttcctga cccaagaaag ggcaagcaag ctcggcgtta acgcgaacag ctttgaagaa 1140 gttctggcat gcgccgacat cattacggtt cataccccgc tcacgaaaga aacgaaggga 1200 cttttgaaca aagaaaccat cgcaaaaacg aaaaaaggcg ttcgtctcgt taactgtgca 1260 agaggcggca tcatcgatga agcagcgctt ttggaagctc tggaaagcgg acatgtcgct 1320 ggcgctgcct tggatgtatt cgaagtcgag cctccggtcg attcaaaact gatcgatcat 1380 ccgcttgtag tcgcgactcc tcacttgggc gcctcaacaa aagaagccca gctgaatgtc 1440 gctgcacaag tgtccgaaga agtccttcag tatgcgcaag gaaaccctgt gatgtccgcg 1500 atcaaccttc cggccatgac aaaggattca ttcgaaaaaa tccagcctta tcatcagttt 1560 gccaatacga tcggaaacct tgtgtctcag tgcatgaatg agcctgttca agatgtagcc 1620 atccaatatg aaggctccat cgccaaactt gaaacgtcat ttattacgaa aagccttttg 1680 gccggatttc tgaagccgag ggtcgcggct accgttaacg aagtgaatgc cggcaccgtt 1740 gcgaaagagc gcggcatcag cttcagcgaa aaaatttctt ccaatgagtc aggctatgaa 1800 aactgcatct ctgtgactgt cacgggagat gtaacaacat tctctttaag agcgacgtac 1860 attccgcact tcggcggacg catcgttgcc ttaaacggct ttgatattga tttttatccg 1920 gctggacacc ttgtctacat tcaccaccag gataaaccag gggctatcgg ccatgtcgga 1980 cgaattttag gagaccatga catcaatatc gccactatgc aggtaggccg aaaagaaaaa 2040 ggcggagaag cgatcatgat gctttccttt gaccgccacc ttgaggacga tattttagct 2100 gagctgaaaa acatcccgga tatcgtgtct gttaaagcca tcgaccttcc ttaaacagaa 2160 gctgcggaac ctgaaaagaa ttcctttcag gttccgtttt ttttaggaat tctccctgat 2220 ctcaagcatc tggcggggat aaatccgctc tcctttcaaa tcgttccatt ctttgaggcg 2280 ctgtacagtt acgcccattt tttcggcgat atgatgaagc gtatcccctt tccgcactac 2340 atatgtaccg gtcttcgatt catcgtcatg aaggcggagt gtttggccgg ccttgagatt 2400 tgaatgtttc aacccgttta ttctcatgat ctcctcgatg gatataccgc tatccttgct 2460 gattctccag agcgtgtccc ctttttgaac ggtcaccgca ccgctcattg tcccggcgtt 2520 ttgataaacg tggatagaat tttgccggaa cgcctcctca cgaagcaccg tcagcggatt 2580 gattgcatat cttttatctt cagtccatga accgtgatgc atttcaaaat gcaggtgggt 2640 tccggtcgat attcccgtat tgccgatgat tccgatttgc tcgccttttt tcacccgctc 2700 cttttccttt ttcaggcgtt tgcttaagtg ggcataaacg gtttcatatc cgttgtcatg 2760 tttaataaat atcacttggc cgtaggagtc ggattgatac 2800 <210> 66 <211> 1222 <212> DNA <213> Artificial sequence <220> <223> target site 1 edited locus <400> 66 tagagacgag acgtctcacc ttgttgtgtt tcattttgtc actctctcct tttcgatcac 60 atctcacgaa aagaggaatg gttctttccc ctgtcctaaa caaaaaaccc gctttattga 120 aaaagcgggg ctgttttaca gacaggtcaa ataaacgttt gaaaatgttc atttcaaaac 180 gcgcggaacc tccatcttct cccatccaga ctatactgtc ggcttcggaa tcgcaccgaa 240 tcctgcccat aaaaaggctc gcgggcttag agcgcttgct catcaccgcc ggtagggaat 300 ttcaccctgc cccgaagatt gatcttattt atttttaata ctgatattat tataaattaa 360 ttgtgaaaaa atgtacaggt gcaaagctta ttgcgctgtt ttgggacatc ctgcacgata 420 tttcggtaaa ctcacttttt ccgcatacta aaaaccgcac attcacagtt atttcatttt 480 taattttcgt ctttccgcgt gaaactcatt gacactcttt atggaatatg gtaaattatc 540 agatatttat gacgcttatt taggaggaaa tcttacacag aagctgcgga acctgaaaag 600 aattcctttc aggttccgtt ttttttagga attctccctg atctcaagca tctggcgggg 660 ataaatccgc tctcctttca aatcgttcca ttctttgagg cgctgtacag ttacgcccat 720 tttttcggcg atatgatgaa gcgtatcccc tttccgcact acatatgtac cggtcttcga 780 ttcatcgtca tgaaggcgga gtgtttggcc ggccttgaga tttgaatgtt tcaacccgtt 840 tattctcatg atctcctcga tggatatacc gctatccttg ctgattctcc agagcgtgtc 900 ccctttttga acggtcaccg caccgctcat tgtcccggcg ttttgataaa cgtggataga 960 attttgccgg aacgcctcct cacgaagcac cgtcagcgga ttgattgcat atcttttatc 1020 ttcagtccat gaaccgtgat gcatttcaaa atgcaggtgg gttccggtcg atattcccgt 1080 attgccgatg attccgattt gctcgccttt tttcacccgc tccttttcct ttttcaggcg 1140 tttgcttaag tgggcataaa cggtttcata tccgttgtca tgtttaataa atatcacttg 1200 gccgtaggag tcggattgat ac 1222 <210> 67 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer <400> 67 tagagacgag acgtctcacc 20 <210> 68 <211> 21 <212> DNA <213> Artificial sequence <220> <223> primer <400> 68 gtatcaatcc gactcctacg g 21 <210> 69 <211> 1517 <212> DNA <213> Bacillus licheniformis <400> 69 atcaaacatg ccatgtttgc ggcgtatttt gtcaaaatga tattttcgcc gtcggtatat 60 atttcgagcg ggtccttttc attgatattc agcaccctgc gcatttcgac cgggagaacg 120 actctgccga gctcatcgat tctccggaca atcccggtat ttttcacgtt tgaaaagcct 180 ccttttctcc tttctttatt gacttttgtc aacatcttta taataaaaga gatcttcaaa 240 ttttttgttg aaatactgaa tcatctttcc gatcacaagt tgtccgggcc tcctttcgcc 300 atttaaaact ctgctgagtg tcgccgggga tacgccgatt tcaatggcaa gctgatttaa 360 ggagagattg tgttcaatca tgtactggag aacaaaatct cttttgatat gaatcttttt 420 taccatgatt actccccttt ctaatctctt atgtttcttt ttatctacat tgaacatata 480 cgatttgtta acttttgtca atacttttac catccatatg tttcctatag gcaatattcg 540 tactaaaata ttttataata agagattgcg aggttttggc catgacgaac tttggacacc 600 atttacgaca attaagggaa cggaaaaaac tgaccgtcaa tcaactggcg atgtattccg 660 gcgtcagttc ggcaggcatt tcgcgaatcg aaaacggaaa gcgcggcgtg ccgaagccgg 720 cgacgatcag aaaactggcg gacgctttga aagtcccgta tgaggaactg atggcatctg 780 caggctatat cagcgcgtct acagtccagg aagcaagaag cagctatgat tccatttacg 840 acatcgtgtc acagtacgat ttagaggacc tttctctgtt tgacagcgaa aagtggaagg 900 tgctttcaaa aaaagacatc gaaaacctgg acaaatattt cgactttctc gtgcaggaag 960 caagcagccg aaacaaaaac tgaatacttc tccgcggcac actctcctct ctatcatttt 1020 cgtctgttta cgatcctgct gttattttat cccttatgtt aacttttgtc aatatttttc 1080 ctgtctaagt atttcctata gtcaacattt gtattaaaat gttcatatca tgaatttgcg 1140 ggggggatgg cgatgacaag gttcggcgag cggctcaaag agctgaggga acaaagaagc 1200 ctgtcggtta atcagcttgc catgtatgcc ggtgtgagcg ccgcagccat ttccagagcc 1260 gcagccattt ccagaatcga aaacggccac cgcggcgttc ccaagcccgc gacgatcaga 1320 aaattggccg aggctctgaa aatgccgtac gagcagctca tggatattgc cggttatatg 1380 agagctgacg agattcgcga acagccgcgc ggctatgtca cgatgcagga gatcgcggcc 1440 aagcacggcg tcgaagacct gtggctgttt aaacccgaga aatgggactg tttgtcccgc 1500 gaagacctgc tcaacct 1517 <210> 70 <211> 1115 <212> DNA <213> Artificial sequence <220> <223> target site 2 edited locus <400> 70 atcaaacatg ccatgtttgc ggcgtatttt gtcaaaatga tattttcgcc gtcggtatat 60 atttcgagcg ggtccttttc attgatattc agcaccctgc gcatttcgac cgggagaacg 120 actctgccga gctcatcgat tctccggaca atcccggtat ttttcacgtt tgaaaagcct 180 ccttttctcc tttctttatt gacttttgtc aacatcttta taataaaaga gatcttcaaa 240 ttttttgttg aaatactgaa tcatctttcc gatcacaagt tgtccgggcc tcctttcgcc 300 atttaaaact ctgctgagtg tcgccgggga tacgccgatt tcaatggcaa gctgatttaa 360 ggagagattg tgttcaatca tgtactggag aacaaaatct cttttgatat gaatcttttt 420 taccatgatt actccccttt ctaatctctt atgtttcttt ttatctacat tgaacatata 480 cgatttgtta acttttgtca atacttttac catccatatg tttcctatag gcaatattcg 540 tactaaaata ttttataata agagattgcg aggttttggc catacttctc cgcggcacac 600 tctcctctct atcattttcg tctgtttacg atcctgctgt tattttatcc cttatgttaa 660 cttttgtcaa tatttttcct gtctaagtat ttcctatagt caacatttgt attaaaatgt 720 tcatatcatg aatttgcggg ggggatggcg atgacaaggt tcggcgagcg gctcaaagag 780 ctgagggaac aaagaagcct gtcggttaat cagcttgcca tgtatgccgg tgtgagcgcc 840 gcagccattt ccagagccgc agccatttcc agaatcgaaa acggccaccg cggcgttccc 900 aagcccgcga cgatcagaaa attggccgag gctctgaaaa tgccgtacga gcagctcatg 960 gatattgccg gttatatgag agctgacgag attcgcgaac agccgcgcgg ctatgtcacg 1020 atgcaggaga tcgcggccaa gcacggcgtc gaagacctgt ggctgtttaa acccgagaaa 1080 tgggactgtt tgtcccgcga agacctgctc aacct 1115 <210> 71 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer <400> 71 atcaaacatg ccatgtttgc 20 <210> 72 <211> 18 <212> DNA <213> artificial sequence <220> <223> primer <400> 72 aggttgagca ggtcttcg 18 <210> 73 <211> 4272 <212> DNA <213> Artificial sequence <220> <223> Yarrowia codon optimized Cas9 <400> 73 atggggggtt ctcatcatca tcatcatcat ggtatggcta gcatgactgg tggacagcaa 60 atgggtcggg atctgtacga cgatgacgat aaggatccga gctcgagatc tgcagctggt 120 accatatggg aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc 180 ggctgggctg tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga 240 aacaccgatc gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc 300 gagactgccg aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag 360 aaccgaatct gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg 420 ttctttcatc gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat 480 cccatctttg gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac 540 cacctgcgaa agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc 600 gctctggcac acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc 660 gacaacagcg atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc 720 gaggaaaacc ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc 780 tcgaagagca gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga 840 ctgtttggca acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc 900 gatctggcgg aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac 960 aacctgcttg cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt 1020 tcggatgcta ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc 1080 ctttctgcct ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag 1140 gctcttgtcc gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag 1200 aacggctacg ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc 1260 aagccaattc tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag 1320 gatctgcttc ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc 1380 ggtgagctgc acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac 1440 cgagagaaga tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc 1500 agaggaaact ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg 1560 aacttcgagg aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc 1620 aacttcgaca agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag 1680 tactttacag tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag 1740 cctgccttct tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac 1800 cgaaaggtca ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac 1860 agcgtcgaga tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat 1920 ctgctcaaga ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg 1980 gaggacatcg tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc 2040 aagacatacg ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac 2100 accggctggg gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga 2160 aagaccattc tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc 2220 attcacgacg attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag 2280 ggcgacagct tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc 2340 attctccaga ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc 2400 gagaacattg tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac 2460 tcgcgagagc ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc 2520 aaggagcatc ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg 2580 cagaatggtc gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac 2640 gatgtggacc acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc 2700 cttacacgat ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc 2760 aaaaagatga agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag 2820 ttcgacaatc ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc 2880 atcaagcgtc aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat 2940 tctcggatga acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt 3000 actctcaagt ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga 3060 gagatcaaca attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg 3120 ctcatcaaga aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac 3180 gacgttcgaa agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac 3240 ttcttttact ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag 3300 attcgaaaga gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag 3360 ggtcgagact ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag 3420 aaaaccgagg ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc 3480 gacaagctca tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct 3540 cctaccgtcg cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag 3600 ctcaagtccg tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag 3660 aatcccatcg acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc 3720 aagctgccca agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc 3780 gctggcgagc tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc 3840 tatctggctt ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa 3900 ctcttcgttg agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt 3960 tcgaagcgag tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag 4020 catcgggaca aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc 4080 aacctgggtg ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac 4140 acatccacca aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac 4200 gagacccgaa tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag 4260 cgaaaggtct aa 4272 <210> 74 <211> 9 <212> PRT <213> Simian virus 40 <400> 74 Met Ala Pro Lys Lys Lys Arg Lys Val 1 5 <210> 75 <211> 546 <212> DNA <213> Yarrowia lipolytica <400> 75 tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60 ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120 gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180 gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240 atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300 ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360 ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420 caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480 gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540 accatg 546 <210> 76 <211> 4683 <212> DNA <213> Artificial sequence <220> <223> Yarrowia Cas9 expression cassette <400> 76 tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60 ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120 gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180 gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240 atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300 ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360 ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420 caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480 gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540 accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 600 gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 660 cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 720 gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 780 tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 840 cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 900 ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccacctgcga 960 aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 1020 cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 1080 gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 1140 cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 1200 agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 1260 aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 1320 gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 1380 gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 1440 attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 1500 tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 1560 cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 1620 gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 1680 ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 1740 cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 1800 cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 1860 atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 1920 tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 1980 gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 2040 aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 2100 gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 2160 ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 2220 actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 2280 atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 2340 attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 2400 gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 2460 gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 2520 ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 2580 ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 2640 gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 2700 ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 2760 actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 2820 gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 2880 cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 2940 cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 3000 cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 3060 cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 3120 tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 3180 aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 3240 cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 3300 caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 3360 aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 3420 tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 3480 aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 3540 aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 3600 aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 3660 tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 3720 agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 3780 tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 3840 gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 3900 atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 3960 gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 4020 gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 4080 gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 4140 aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 4200 ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 4260 tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 4320 gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 4380 gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 4440 aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 4500 gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 4560 aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 4620 atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 4680 taa 4683 <210> 77 <211> 10706 <212> DNA <213> Artificial sequence <220> <223> plasmid pZufCas9 <400> 77 catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60 catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120 acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180 agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240 ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300 actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360 caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420 gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480 catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540 tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600 catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660 acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720 cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780 ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840 acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900 tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960 catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020 acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080 tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140 cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200 gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260 cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320 cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380 tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440 agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500 gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560 ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620 gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680 tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740 ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800 tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860 gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920 tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980 aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040 ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100 ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160 gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220 tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280 gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340 gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400 cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460 agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520 cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580 cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640 gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700 taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760 actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820 caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880 caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940 ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000 ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060 gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120 caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180 accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240 tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300 tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360 cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420 ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480 caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540 cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600 gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660 gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720 tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780 gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840 catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900 acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960 tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020 ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080 cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140 agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200 caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260 aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320 ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380 gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440 tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500 aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560 acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620 ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220 agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880 ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180 cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540 ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600 tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660 tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720 tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780 gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840 agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900 cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960 agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020 ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080 acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140 ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200 cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260 catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320 gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380 atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440 atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500 cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560 tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620 acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680 taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740 tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800 agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860 gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920 ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980 gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040 agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100 attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160 acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220 actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280 aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340 cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400 gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460 ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520 agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580 agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640 cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700 agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760 agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820 atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880 ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940 atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000 cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060 tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120 ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180 accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240 gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300 ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360 ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420 ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480 tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540 tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600 atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660 agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720 agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780 ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840 accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900 agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960 gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020 atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080 gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140 aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200 acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260 caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320 aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380 cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440 gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500 tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560 accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620 tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680 ttcgaaatct aaactacaca tcacac 10706 <210> 78 <211> 4144 <212> DNA <213> Artificial sequence <220> <223> Cas9-SV40 fusion <400> 78 acaagaaata ctccatcggc ctggacattg gaaccaactc tgtcggctgg gctgtcatca 60 ccgacgagta caaggtgccc tccaagaaat tcaaggtcct cggaaacacc gatcgacact 120 ccatcaagaa aaacctcatt ggtgccctgt tgttcgattc tggcgagact gccgaagcta 180 ccagactcaa gcgaactgct cggcgacgtt acacccgacg gaagaaccga atctgctacc 240 tgcaggagat cttttccaac gagatggcca aggtggacga ttcgttcttt catcgactgg 300 aggaatcctt cctcgtcgag gaagacaaga aacacgagcg tcatcccatc tttggcaaca 360 ttgtggacga ggttgcttac cacgagaagt atcctaccat ctaccacctg cgaaagaaac 420 tcgtcgattc caccgacaag gcggatctca gacttatcta cctcgctctg gcacacatga 480 tcaagtttcg aggtcatttc ctcatcgagg gcgatctcaa tcccgacaac agcgatgtgg 540 acaagctgtt cattcagctc gttcagacct acaaccagct gttcgaggaa aaccccatca 600 atgcctccgg agtcgatgca aaggccatct tgtctgctcg actctcgaag agcagacgac 660 tggagaacct cattgcccaa cttcctggcg agaaaaagaa cggactgttt ggcaacctca 720 ttgccctttc tcttggtctc acacccaact tcaagtccaa cttcgatctg gcggaggacg 780 ccaagctcca gctgtccaag gacacctacg acgatgacct cgacaacctg cttgcacaga 840 ttggcgatca gtacgccgac ctgtttctcg ctgccaagaa cctttcggat gctattctct 900 tgtctgacat tctgcgagtc aacaccgaga tcacaaaggc tcccctttct gcctccatga 960 tcaagcgata cgacgagcac catcaggatc tcacactgct caaggctctt gtccgacagc 1020 aactgcccga gaagtacaag gagatctttt tcgatcagtc gaagaacggc tacgctggat 1080 acatcgacgg cggagcctct caggaagagt tctacaagtt catcaagcca attctcgaga 1140 agatggacgg aaccgaggaa ctgcttgtca agctcaatcg agaggatctg cttcggaagc 1200 aacgaacctt cgacaacggc agcattcctc atcagatcca cctcggtgag ctgcacgcca 1260 ttcttcgacg tcaggaagac ttctacccct ttctcaagga caaccgagag aagatcgaga 1320 agattcttac ctttcgaatc ccctactatg ttggtcctct tgccagagga aactctcgat 1380 ttgcttggat gactcgaaag tccgaggaaa ccatcactcc ctggaacttc gaggaagtcg 1440 tggacaaggg tgcctctgca cagtccttca tcgagcgaat gaccaacttc gacaagaatc 1500 tgcccaacga gaaggttctt cccaagcatt cgctgctcta cgagtacttt acagtctaca 1560 acgaactcac caaagtcaag tacgttaccg agggaatgcg aaagcctgcc ttcttgtctg 1620 gcgaacagaa gaaagccatt gtcgatctcc tgttcaagac caaccgaaag gtcactgtta 1680 agcagctcaa ggaggactac ttcaagaaaa tcgagtgttt cgacagcgtc gagatttccg 1740 gagttgagga ccgattcaac gcctctttgg gcacctatca cgatctgctc aagattatca 1800 aggacaagga ttttctcgac aacgaggaaa acgaggacat tctggaggac atcgtgctca 1860 ctcttaccct gttcgaagat cgggagatga tcgaggaacg actcaagaca tacgctcacc 1920 tgttcgacga caaggtcatg aaacaactca agcgacgtag atacaccggc tggggaagac 1980 tttcgcgaaa gctcatcaac ggcatcagag acaagcagtc cggaaagacc attctggact 2040 ttctcaagtc cgatggcttt gccaaccgaa acttcatgca gctcattcac gacgattctc 2100 ttaccttcaa ggaggacatc cagaaggcac aagtgtccgg tcagggcgac agcttgcacg 2160 aacatattgc caacctggct ggttcgccag ccatcaagaa aggcattctc cagactgtca 2220 aggttgtcga cgagctggtg aaggtcatgg gacgtcacaa gcccgagaac attgtgatcg 2280 agatggccag agagaaccag acaactcaaa agggtcagaa aaactcgcga gagcggatga 2340 agcgaatcga ggaaggcatc aaggagctgg gatcccagat tctcaaggag catcccgtcg 2400 agaacactca actgcagaac gagaagctgt atctctacta tctgcagaat ggtcgagaca 2460 tgtacgtgga tcaggaactg gacatcaatc gtctcagcga ctacgatgtg gaccacattg 2520 tccctcaatc ctttctcaag gacgattcta tcgacaacaa ggtccttaca cgatccgaca 2580 agaacagagg caagtcggac aacgttccca gcgaagaggt ggtcaaaaag atgaagaact 2640 actggcgaca gctgctcaac gccaagctca ttacccagcg aaagttcgac aatcttacca 2700 aggccgagcg aggcggtctg tccgagctcg acaaggctgg cttcatcaag cgtcaactcg 2760 tcgagaccag acagatcaca aagcacgtcg cacagattct cgattctcgg atgaacacca 2820 agtacgacga gaacgacaag ctcatccgag aggtcaaggt gattactctc aagtccaaac 2880 tggtctccga tttccgaaag gactttcagt tctacaaggt gcgagagatc aacaattacc 2940 accatgccca cgatgcttac ctcaacgccg tcgttggcac tgcgctcatc aagaaatacc 3000 ccaagctcga aagcgagttc gtttacggcg attacaaggt ctacgacgtt cgaaagatga 3060 ttgccaagtc cgaacaggag attggcaagg ctactgccaa gtacttcttt tactccaaca 3120 tcatgaactt tttcaagacc gagatcacct tggccaacgg agagattcga aagagaccac 3180 ttatcgagac caacggcgaa actggagaga tcgtgtggga caagggtcga gactttgcaa 3240 ccgtgcgaaa ggttctgtcg atgcctcagg tcaacatcgt caagaaaacc gaggttcaga 3300 ctggcggatt ctccaaggag tcgattctgc ccaagcgaaa ctccgacaag ctcatcgctc 3360 gaaagaaaga ctgggatccc aagaaatacg gtggcttcga ttctcctacc gtcgcctatt 3420 ccgtgcttgt cgttgcgaag gtcgagaagg gcaagtccaa aaagctcaag tccgtcaagg 3480 agctgctcgg aattaccatc atggagcgat cgagcttcga gaagaatccc atcgacttct 3540 tggaagccaa gggttacaag gaggtcaaga aagacctcat tatcaagctg cccaagtact 3600 ctctgttcga actggagaac ggtcgaaagc gtatgctcgc ctccgctggc gagctgcaga 3660 agggaaacga gcttgccttg ccttcgaagt acgtcaactt tctctatctg gcttctcact 3720 acgagaagct caagggttct cccgaggaca acgaacagaa gcaactcttc gttgagcagc 3780 acaaacatta cctcgacgag attatcgagc agatttccga gttttcgaag cgagtcatcc 3840 tggctgatgc caacttggac aaggtgctct ctgcctacaa caagcatcgg gacaaaccca 3900 ttcgagaaca ggcggagaac atcattcacc tgtttactct taccaacctg ggtgctcctg 3960 cagctttcaa gtacttcgat accactatcg accgaaagcg gtacacatcc accaaggagg 4020 ttctcgatgc caccctgatt caccagtcca tcactggcct gtacgagacc cgaatcgacc 4080 tgtctcagct tggtggcgac tccagagccg atcccaagaa aaagcgaaag gtctaagcgg 4140 ccgc 4144 <210> 79 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Cas9-SV40 forward primer <400> 79 gggggaattc gacaagaaat actccatcgg cctgg 35 <210> 80 <211> 31 <212> DNA <213> Artificial sequence <220> <223> Cas9-SV40 reverse primer <400> 80 ccccaagctt agcggccgct tagacctttc g 31 <210> 81 <211> 4166 <212> DNA <213> Artificial sequence <220> <223> Cas9-SV40 PCR product <400> 81 gggggaattc gacaagaaat actccatcgg cctggacatt ggaaccaact ctgtcggctg 60 ggctgtcatc accgacgagt acaaggtgcc ctccaagaaa ttcaaggtcc tcggaaacac 120 cgatcgacac tccatcaaga aaaacctcat tggtgccctg ttgttcgatt ctggcgagac 180 tgccgaagct accagactca agcgaactgc tcggcgacgt tacacccgac ggaagaaccg 240 aatctgctac ctgcaggaga tcttttccaa cgagatggcc aaggtggacg attcgttctt 300 tcatcgactg gaggaatcct tcctcgtcga ggaagacaag aaacacgagc gtcatcccat 360 ctttggcaac attgtggacg aggttgctta ccacgagaag tatcctacca tctaccacct 420 gcgaaagaaa ctcgtcgatt ccaccgacaa ggcggatctc agacttatct acctcgctct 480 ggcacacatg atcaagtttc gaggtcattt cctcatcgag ggcgatctca atcccgacaa 540 cagcgatgtg gacaagctgt tcattcagct cgttcagacc tacaaccagc tgttcgagga 600 aaaccccatc aatgcctccg gagtcgatgc aaaggccatc ttgtctgctc gactctcgaa 660 gagcagacga ctggagaacc tcattgccca acttcctggc gagaaaaaga acggactgtt 720 tggcaacctc attgcccttt ctcttggtct cacacccaac ttcaagtcca acttcgatct 780 ggcggaggac gccaagctcc agctgtccaa ggacacctac gacgatgacc tcgacaacct 840 gcttgcacag attggcgatc agtacgccga cctgtttctc gctgccaaga acctttcgga 900 tgctattctc ttgtctgaca ttctgcgagt caacaccgag atcacaaagg ctcccctttc 960 tgcctccatg atcaagcgat acgacgagca ccatcaggat ctcacactgc tcaaggctct 1020 tgtccgacag caactgcccg agaagtacaa ggagatcttt ttcgatcagt cgaagaacgg 1080 ctacgctgga tacatcgacg gcggagcctc tcaggaagag ttctacaagt tcatcaagcc 1140 aattctcgag aagatggacg gaaccgagga actgcttgtc aagctcaatc gagaggatct 1200 gcttcggaag caacgaacct tcgacaacgg cagcattcct catcagatcc acctcggtga 1260 gctgcacgcc attcttcgac gtcaggaaga cttctacccc tttctcaagg acaaccgaga 1320 gaagatcgag aagattctta cctttcgaat cccctactat gttggtcctc ttgccagagg 1380 aaactctcga tttgcttgga tgactcgaaa gtccgaggaa accatcactc cctggaactt 1440 cgaggaagtc gtggacaagg gtgcctctgc acagtccttc atcgagcgaa tgaccaactt 1500 cgacaagaat ctgcccaacg agaaggttct tcccaagcat tcgctgctct acgagtactt 1560 tacagtctac aacgaactca ccaaagtcaa gtacgttacc gagggaatgc gaaagcctgc 1620 cttcttgtct ggcgaacaga agaaagccat tgtcgatctc ctgttcaaga ccaaccgaaa 1680 ggtcactgtt aagcagctca aggaggacta cttcaagaaa atcgagtgtt tcgacagcgt 1740 cgagatttcc ggagttgagg accgattcaa cgcctctttg ggcacctatc acgatctgct 1800 caagattatc aaggacaagg attttctcga caacgaggaa aacgaggaca ttctggagga 1860 catcgtgctc actcttaccc tgttcgaaga tcgggagatg atcgaggaac gactcaagac 1920 atacgctcac ctgttcgacg acaaggtcat gaaacaactc aagcgacgta gatacaccgg 1980 ctggggaaga ctttcgcgaa agctcatcaa cggcatcaga gacaagcagt ccggaaagac 2040 cattctggac tttctcaagt ccgatggctt tgccaaccga aacttcatgc agctcattca 2100 cgacgattct cttaccttca aggaggacat ccagaaggca caagtgtccg gtcagggcga 2160 cagcttgcac gaacatattg ccaacctggc tggttcgcca gccatcaaga aaggcattct 2220 ccagactgtc aaggttgtcg acgagctggt gaaggtcatg ggacgtcaca agcccgagaa 2280 cattgtgatc gagatggcca gagagaacca gacaactcaa aagggtcaga aaaactcgcg 2340 agagcggatg aagcgaatcg aggaaggcat caaggagctg ggatcccaga ttctcaagga 2400 gcatcccgtc gagaacactc aactgcagaa cgagaagctg tatctctact atctgcagaa 2460 tggtcgagac atgtacgtgg atcaggaact ggacatcaat cgtctcagcg actacgatgt 2520 ggaccacatt gtccctcaat cctttctcaa ggacgattct atcgacaaca aggtccttac 2580 acgatccgac aagaacagag gcaagtcgga caacgttccc agcgaagagg tggtcaaaaa 2640 gatgaagaac tactggcgac agctgctcaa cgccaagctc attacccagc gaaagttcga 2700 caatcttacc aaggccgagc gaggcggtct gtccgagctc gacaaggctg gcttcatcaa 2760 gcgtcaactc gtcgagacca gacagatcac aaagcacgtc gcacagattc tcgattctcg 2820 gatgaacacc aagtacgacg agaacgacaa gctcatccga gaggtcaagg tgattactct 2880 caagtccaaa ctggtctccg atttccgaaa ggactttcag ttctacaagg tgcgagagat 2940 caacaattac caccatgccc acgatgctta cctcaacgcc gtcgttggca ctgcgctcat 3000 caagaaatac cccaagctcg aaagcgagtt cgtttacggc gattacaagg tctacgacgt 3060 tcgaaagatg attgccaagt ccgaacagga gattggcaag gctactgcca agtacttctt 3120 ttactccaac atcatgaact ttttcaagac cgagatcacc ttggccaacg gagagattcg 3180 aaagagacca cttatcgaga ccaacggcga aactggagag atcgtgtggg acaagggtcg 3240 agactttgca accgtgcgaa aggttctgtc gatgcctcag gtcaacatcg tcaagaaaac 3300 cgaggttcag actggcggat tctccaagga gtcgattctg cccaagcgaa actccgacaa 3360 gctcatcgct cgaaagaaag actgggatcc caagaaatac ggtggcttcg attctcctac 3420 cgtcgcctat tccgtgcttg tcgttgcgaa ggtcgagaag ggcaagtcca aaaagctcaa 3480 gtccgtcaag gagctgctcg gaattaccat catggagcga tcgagcttcg agaagaatcc 3540 catcgacttc ttggaagcca agggttacaa ggaggtcaag aaagacctca ttatcaagct 3600 gcccaagtac tctctgttcg aactggagaa cggtcgaaag cgtatgctcg cctccgctgg 3660 cgagctgcag aagggaaacg agcttgcctt gccttcgaag tacgtcaact ttctctatct 3720 ggcttctcac tacgagaagc tcaagggttc tcccgaggac aacgaacaga agcaactctt 3780 cgttgagcag cacaaacatt acctcgacga gattatcgag cagatttccg agttttcgaa 3840 gcgagtcatc ctggctgatg ccaacttgga caaggtgctc tctgcctaca acaagcatcg 3900 ggacaaaccc attcgagaac aggcggagaa catcattcac ctgtttactc ttaccaacct 3960 gggtgctcct gcagctttca agtacttcga taccactatc gaccgaaagc ggtacacatc 4020 caccaaggag gttctcgatg ccaccctgat tcaccagtcc atcactggcc tgtacgagac 4080 ccgaatcgac ctgtctcagc ttggtggcga ctccagagcc gatcccaaga aaaagcgaaa 4140 ggtctaagcg gccgctaagc ttgggg 4166 <210> 82 <211> 4092 <212> DNA <213> Artificial sequence <220> <223> plasmid pBAD/HisB <400> 82 aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60 tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120 aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180 attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240 atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300 taacaggagg aattaaccat ggggggttct catcatcatc atcatcatgg tatggctagc 360 atgactggtg gacagcaaat gggtcgggat ctgtacgacg atgacgataa ggatccgagc 420 tcgagatctg cagctggtac catatgggaa ttcgaagctt ggctgttttg gcggatgaga 480 gaagattttc agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa 540 tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 600 acgccgtagc gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc 660 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 720 cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc 780 aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc 840 agaaggccat cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc 900 taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 960 tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1020 gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1080 gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1140 cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1200 tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 1260 tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1320 atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1380 ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1440 gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1500 gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1560 gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1620 gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1680 gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 1740 cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 1800 atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 1860 tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 1920 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 1980 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2040 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2100 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 2160 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2220 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2280 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2340 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2400 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2460 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2520 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2580 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2640 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 2700 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 2760 gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820 atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2880 cagtatacac tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa 2940 cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3000 tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3060 ggcagcagat caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg 3120 acgaagcagg gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg 3180 ttaccaatta tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga 3240 actcgctcgg gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt 3300 caaaaccaac attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct 3360 tcgcctggct gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc 3420 ggaaaagatg tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat 3480 caaaattgct gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat 3540 ccatcggtgg atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa 3600 gcagatttat cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt 3660 gcccaaacag gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat 3720 tggcaaatat tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa 3780 cccactggtg ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg 3840 gcgggaacag caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca 3900 ccccctgacc gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga 3960 taaaaaaatc gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat 4020 taaacgagta tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc 4080 cgccattcag ag 4092 <210> 83 <211> 8237 <212> DNA <213> Artificial sequence <220> <223> plamsid pRF48 <400> 83 aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60 tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120 gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180 aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240 gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300 gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360 gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420 agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480 acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540 atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600 ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660 gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720 acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780 aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840 cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900 ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960 ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020 gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080 ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140 tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200 ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260 acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320 tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380 ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440 aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500 agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560 tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620 tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680 ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740 tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800 ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860 tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920 ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980 gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040 tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100 attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160 tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220 ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280 tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340 ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400 ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460 gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520 acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580 ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640 agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700 ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760 aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820 acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880 ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940 attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000 aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060 agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120 ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180 gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240 ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300 ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360 tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420 cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480 tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540 acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600 agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660 tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720 ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780 agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840 tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900 aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960 ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020 aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080 tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140 aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200 ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260 tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320 tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380 tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440 acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500 ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560 ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620 gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680 tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740 tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800 gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860 acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920 tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980 gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040 tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100 accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160 ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220 agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280 gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340 ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400 tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460 ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520 gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580 acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640 aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820 tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940 ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000 ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060 aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120 cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180 gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240 ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300 cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360 tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420 cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480 cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540 tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600 cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660 gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720 tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780 aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840 ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900 gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960 cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020 gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080 tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140 ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200 tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260 ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320 gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380 ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440 agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500 gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560 ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620 ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680 gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740 ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800 tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860 aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920 aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980 ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040 cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100 attaaccatg gggggttctc atcatcatca tcatcatggt atggctagca tgactggtgg 8160 acagcaaatg ggtcgggatc tgtacgacga tgacgataag gatccgagct cgagatctgc 8220 agctggtacc atatggg 8237 <210> 84 <211> 6493 <212> DNA <213> Artificial sequence <220> <223> E.Coli Cas9 expression cassette <400> 84 tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 60 cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 120 gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 180 gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagcag atcaattcgc 240 gcgcgaaggc gaagcggcat gcataatgtg cctgtcaaat ggacgaagca gggattctgc 300 aaaccctatg ctactccgtc aagccgtcaa ttgtctgatt cgttaccaat tatgacaact 360 tgacggctac atcattcact ttttcttcac aaccggcacg gaactcgctc gggctggccc 420 cggtgcattt tttaaatacc cgcgagaaat agagttgatc gtcaaaacca acattgcgac 480 cgacggtggc gataggcatc cgggtggtgc tcaaaagcag cttcgcctgg ctgatacgtt 540 ggtcctcgcg ccagcttaag acgctaatcc ctaactgctg gcggaaaaga tgtgacagac 600 gcgacggcga caagcaaaca tgctgtgcga cgctggcgat atcaaaattg ctgtctgcca 660 ggtgatcgct gatgtactga caagcctcgc gtacccgatt atccatcggt ggatggagcg 720 actcgttaat cgcttccatg cgccgcagta acaattgctc aagcagattt atcgccagca 780 gctccgaata gcgcccttcc ccttgcccgg cgttaatgat ttgcccaaac aggtcgctga 840 aatgcggctg gtgcgcttca tccgggcgaa agaaccccgt attggcaaat attgacggcc 900 agttaagcca ttcatgccag taggcgcgcg gacgaaagta aacccactgg tgataccatt 960 cgcgagcctc cggatgacga ccgtagtgat gaatctctcc tggcgggaac agcaaaatat 1020 cacccggtcg gcaaacaaat tctcgtccct gatttttcac caccccctga ccgcgaatgg 1080 tgagattgag aatataacct ttcattccca gcggtcggtc gataaaaaaa tcgagataac 1140 cgttggcctc aatcggcgtt aaacccgcca ccagatgggc attaaacgag tatcccggca 1200 gcaggggatc attttgcgct tcagccatac ttttcatact cccgccattc agagaagaaa 1260 ccaattgtcc atattgcatc agacattgcc gtcactgcgt cttttactgg ctcttctcgc 1320 taaccaaacc ggtaaccccg cttattaaaa gcattctgta acaaagcggg accaaagcca 1380 tgacaaaaac gcgtaacaaa agtgtctata atcacggcag aaaagtccac attgattatt 1440 tgcacggcgt cacactttgc tatgccatag catttttatc cataagatta gcggatccta 1500 cctgacgctt tttatcgcaa ctctctactg tttctccata cccgtttttt gggctaacag 1560 gaggaattaa ccatgggggg ttctcatcat catcatcatc atggtatggc tagcatgact 1620 ggtggacagc aaatgggtcg ggatctgtac gacgatgacg ataaggatcc gagctcgaga 1680 tctgcagctg gtaccatatg ggaattcgac aagaaatact ccatcggcct ggacattgga 1740 accaactctg tcggctgggc tgtcatcacc gacgagtaca aggtgccctc caagaaattc 1800 aaggtcctcg gaaacaccga tcgacactcc atcaagaaaa acctcattgg tgccctgttg 1860 ttcgattctg gcgagactgc cgaagctacc agactcaagc gaactgctcg gcgacgttac 1920 acccgacgga agaaccgaat ctgctacctg caggagatct tttccaacga gatggccaag 1980 gtggacgatt cgttctttca tcgactggag gaatccttcc tcgtcgagga agacaagaaa 2040 cacgagcgtc atcccatctt tggcaacatt gtggacgagg ttgcttacca cgagaagtat 2100 cctaccatct accacctgcg aaagaaactc gtcgattcca ccgacaaggc ggatctcaga 2160 cttatctacc tcgctctggc acacatgatc aagtttcgag gtcatttcct catcgagggc 2220 gatctcaatc ccgacaacag cgatgtggac aagctgttca ttcagctcgt tcagacctac 2280 aaccagctgt tcgaggaaaa ccccatcaat gcctccggag tcgatgcaaa ggccatcttg 2340 tctgctcgac tctcgaagag cagacgactg gagaacctca ttgcccaact tcctggcgag 2400 aaaaagaacg gactgtttgg caacctcatt gccctttctc ttggtctcac acccaacttc 2460 aagtccaact tcgatctggc ggaggacgcc aagctccagc tgtccaagga cacctacgac 2520 gatgacctcg acaacctgct tgcacagatt ggcgatcagt acgccgacct gtttctcgct 2580 gccaagaacc tttcggatgc tattctcttg tctgacattc tgcgagtcaa caccgagatc 2640 acaaaggctc ccctttctgc ctccatgatc aagcgatacg acgagcacca tcaggatctc 2700 acactgctca aggctcttgt ccgacagcaa ctgcccgaga agtacaagga gatctttttc 2760 gatcagtcga agaacggcta cgctggatac atcgacggcg gagcctctca ggaagagttc 2820 tacaagttca tcaagccaat tctcgagaag atggacggaa ccgaggaact gcttgtcaag 2880 ctcaatcgag aggatctgct tcggaagcaa cgaaccttcg acaacggcag cattcctcat 2940 cagatccacc tcggtgagct gcacgccatt cttcgacgtc aggaagactt ctaccccttt 3000 ctcaaggaca accgagagaa gatcgagaag attcttacct ttcgaatccc ctactatgtt 3060 ggtcctcttg ccagaggaaa ctctcgattt gcttggatga ctcgaaagtc cgaggaaacc 3120 atcactccct ggaacttcga ggaagtcgtg gacaagggtg cctctgcaca gtccttcatc 3180 gagcgaatga ccaacttcga caagaatctg cccaacgaga aggttcttcc caagcattcg 3240 ctgctctacg agtactttac agtctacaac gaactcacca aagtcaagta cgttaccgag 3300 ggaatgcgaa agcctgcctt cttgtctggc gaacagaaga aagccattgt cgatctcctg 3360 ttcaagacca accgaaaggt cactgttaag cagctcaagg aggactactt caagaaaatc 3420 gagtgtttcg acagcgtcga gatttccgga gttgaggacc gattcaacgc ctctttgggc 3480 acctatcacg atctgctcaa gattatcaag gacaaggatt ttctcgacaa cgaggaaaac 3540 gaggacattc tggaggacat cgtgctcact cttaccctgt tcgaagatcg ggagatgatc 3600 gaggaacgac tcaagacata cgctcacctg ttcgacgaca aggtcatgaa acaactcaag 3660 cgacgtagat acaccggctg gggaagactt tcgcgaaagc tcatcaacgg catcagagac 3720 aagcagtccg gaaagaccat tctggacttt ctcaagtccg atggctttgc caaccgaaac 3780 ttcatgcagc tcattcacga cgattctctt accttcaagg aggacatcca gaaggcacaa 3840 gtgtccggtc agggcgacag cttgcacgaa catattgcca acctggctgg ttcgccagcc 3900 atcaagaaag gcattctcca gactgtcaag gttgtcgacg agctggtgaa ggtcatggga 3960 cgtcacaagc ccgagaacat tgtgatcgag atggccagag agaaccagac aactcaaaag 4020 ggtcagaaaa actcgcgaga gcggatgaag cgaatcgagg aaggcatcaa ggagctggga 4080 tcccagattc tcaaggagca tcccgtcgag aacactcaac tgcagaacga gaagctgtat 4140 ctctactatc tgcagaatgg tcgagacatg tacgtggatc aggaactgga catcaatcgt 4200 ctcagcgact acgatgtgga ccacattgtc cctcaatcct ttctcaagga cgattctatc 4260 gacaacaagg tccttacacg atccgacaag aacagaggca agtcggacaa cgttcccagc 4320 gaagaggtgg tcaaaaagat gaagaactac tggcgacagc tgctcaacgc caagctcatt 4380 acccagcgaa agttcgacaa tcttaccaag gccgagcgag gcggtctgtc cgagctcgac 4440 aaggctggct tcatcaagcg tcaactcgtc gagaccagac agatcacaaa gcacgtcgca 4500 cagattctcg attctcggat gaacaccaag tacgacgaga acgacaagct catccgagag 4560 gtcaaggtga ttactctcaa gtccaaactg gtctccgatt tccgaaagga ctttcagttc 4620 tacaaggtgc gagagatcaa caattaccac catgcccacg atgcttacct caacgccgtc 4680 gttggcactg cgctcatcaa gaaatacccc aagctcgaaa gcgagttcgt ttacggcgat 4740 tacaaggtct acgacgttcg aaagatgatt gccaagtccg aacaggagat tggcaaggct 4800 actgccaagt acttctttta ctccaacatc atgaactttt tcaagaccga gatcaccttg 4860 gccaacggag agattcgaaa gagaccactt atcgagacca acggcgaaac tggagagatc 4920 gtgtgggaca agggtcgaga ctttgcaacc gtgcgaaagg ttctgtcgat gcctcaggtc 4980 aacatcgtca agaaaaccga ggttcagact ggcggattct ccaaggagtc gattctgccc 5040 aagcgaaact ccgacaagct catcgctcga aagaaagact gggatcccaa gaaatacggt 5100 ggcttcgatt ctcctaccgt cgcctattcc gtgcttgtcg ttgcgaaggt cgagaagggc 5160 aagtccaaaa agctcaagtc cgtcaaggag ctgctcggaa ttaccatcat ggagcgatcg 5220 agcttcgaga agaatcccat cgacttcttg gaagccaagg gttacaagga ggtcaagaaa 5280 gacctcatta tcaagctgcc caagtactct ctgttcgaac tggagaacgg tcgaaagcgt 5340 atgctcgcct ccgctggcga gctgcagaag ggaaacgagc ttgccttgcc ttcgaagtac 5400 gtcaactttc tctatctggc ttctcactac gagaagctca agggttctcc cgaggacaac 5460 gaacagaagc aactcttcgt tgagcagcac aaacattacc tcgacgagat tatcgagcag 5520 atttccgagt tttcgaagcg agtcatcctg gctgatgcca acttggacaa ggtgctctct 5580 gcctacaaca agcatcggga caaacccatt cgagaacagg cggagaacat cattcacctg 5640 tttactctta ccaacctggg tgctcctgca gctttcaagt acttcgatac cactatcgac 5700 cgaaagcggt acacatccac caaggaggtt ctcgatgcca ccctgattca ccagtccatc 5760 actggcctgt acgagacccg aatcgacctg tctcagcttg gtggcgactc cagagccgat 5820 cccaagaaaa agcgaaaggt ctaagcggcc gctaagcttg gctgttttgg cggatgagag 5880 aagattttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 5940 ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 6000 cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 6060 tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 6120 ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca 6180 acggcccgga gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca 6240 gaaggccatc ctgacggatg gcctttttgc gtttctacaa actcttttgt ttatttttct 6300 aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 6360 attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 6420 cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg 6480 aagatcagtt ggg 6493 <210> 85 <211> 5681 <212> DNA <213> Artificial sequence <220> <223> plasmid pKO3 <220> <221> misc_feature <222> (1039)..(1039) <223> n is a, c, g, or t <220> <221> misc_feature <222> (1109)..(1109) <223> n is a, c, g, or t <220> <221> misc_feature <222> (1661)..(1662) <223> n is a, c, g, or t <220> <221> misc_feature <222> (1665)..(1665) <223> n is a, c, g, or t <220> <221> misc_feature <222> (3573)..(3574) <223> n is a, c, g, or t <220> <221> misc_feature <222> (5648)..(5648) <223> n is a, c, g, or t <400> 85 ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60 tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120 tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180 ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240 atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300 agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360 cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420 gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480 tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540 tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600 cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660 caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720 cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780 ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840 attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900 gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960 aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020 atgtctattg ctggtttant cggtacccgg ggatcgcggc cgcggaccgg atcctctaga 1080 gcggccgcga tcctctagag tcgaccggng aatggcgaat gggacgcgcc ctgtagcggc 1140 gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 1200 ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 1260 cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 1320 gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 1380 gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 1440 ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt 1500 tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 1560 atattaacgc ttacaattta ggtggcactt ttcggggaaa tgtgcgcgga acccctattt 1620 gtttattttt ctaaatacat tcaaatatgt atccgctcat nncangatcc tttttaaccc 1680 atcacatata cctgccgttc actattattt agtgaaatga gatattatga tattttctga 1740 attgtgatta aaaaggcaac tttatgccca tgcaacagaa actataaaaa atacagagaa 1800 tgaaaagaaa cagatagatt ttttagttct ttaggcccgt agtctgcaaa tccttttatg 1860 attttctatc aaacaaaaga ggaaaataga ccagttgcaa tccaaacgag agtctaatag 1920 aatgaggtcg aaaagtaaat cgcgcgggtt tgttactgat aaagcaggca agacctaaaa 1980 tgtgtaaagg gcaaagtgta tactttggcg tcacccctta catattttag gtcttttttt 2040 attgtgcgta actaacttgc catcttcaaa caggagggct ggaagaagca gaccgctaac 2100 acagtacata aaaaaggaga catgaacgat gaacatcaaa aagtttgcaa aacaagcaac 2160 agtattaacc tttactaccg cactgctggc aggaggcgca actcaagcgt ttgcgaaaga 2220 aacgaaccaa aagccatata aggaaacata cggcatttcc catattacac gccatgatat 2280 gctgcaaatc cctgaacagc aaaaaaatga aaaatatcaa gttcctgaat tcgattcgtc 2340 cacaattaaa aatatctctt ctgcaaaagg cctggacgtt tgggacagct ggccattaca 2400 aaacgctgac ggcactgtcg caaactatca cggctaccac atcgtctttg cattagccgg 2460 agatcctaaa aatgcggatg acacatcgat ttacatgttc tatcaaaaag tcggcgaaac 2520 ttctattgac agctggaaaa acgctggccg cgtctttaaa gacagcgaca aattcgatgc 2580 aaatgattct atcctaaaag accaaacaca agaatggtca ggttcagcca catttacatc 2640 tgacggaaaa atccgtttat tctacactga tttctccggt aaacattacg gcaaacaaac 2700 actgacaact gcacaagtta acgtatcagc atcagacagc tctttgaaca tcaacggtgt 2760 agaggattat aaatcaatct ttgacggtga cggaaaaacg tatcaaaatg tacagcagtt 2820 catcgatgaa ggcaactaca gctcaggcga caaccatacg ctgagagatc ctcactacgt 2880 agaagataaa ggccacaaat acttagtatt tgaagcaaac actggaactg aagatggcta 2940 ccaaggcgaa gaatctttat ttaacaaagc atactatggc aaaagcacat cattcttccg 3000 tcaagaaagt caaaaacttc tgcaaagcga taaaaaacgc acggctgagt tagcaaacgg 3060 cgctctcggt atgattgagc taaacgatga ttacacactg aaaaaagtga tgaaaccgct 3120 gattgcatct aacacagtaa cagatgaaat tgaacgcgcg aacgtcttta aaatgaacgg 3180 caaatggtac ctgttcactg actcccgcgg atcaaaaatg acgattgacg gcattacgtc 3240 taacgatatt tacatgcttg gttatgtttc taattcttta actggcccat acaagccgct 3300 gaacaaaact ggccttgtgt taaaaatgga tcttgatcct aacgatgtaa cctttactta 3360 ctcacacttc gctgtacctc aagcgaaagg aaacaatgtc gtgattacaa gctatatgac 3420 aaacagagga ttctacgcag acaaacaatc aacgtttgcg ccaagcttcc tgctgaacat 3480 caaaggcaag aaaacatctg ttgtcaaaga cagcatcctt gaacaaggac aattaacagt 3540 taacaaataa aaacgcaaaa gaaaatgccg atnnccggtt tattgactac cggaagcagt 3600 gtgaccgtgt gcttctcaaa tgcctcaggc tgtctatgtg tgactgttga gctgtaacaa 3660 gttgtctcag gtgttcaatt tcatgttcta gttgctttgt tttactggtt tcacctgttc 3720 tattaggtgt tacatgctgt tcatctgtta cattgtcgat ctgttcatgg tgaacagctt 3780 taaatgcacc aaaaactcgt aaaagctctg atgtatctat cttttttaca ccgttttcat 3840 ctgtgcatat ggacagtttt ccctttgata tctaacggtg aacagttgtt ctacttttgt 3900 ttgttagtct tgatgcttca ctgatagata caagagccat aagaacctca gatccttccg 3960 tatttagcca gtatgttctc tagtgtggtt cgttgttttt gcgtgagcca tgagaacgaa 4020 ccattgagat catgcttact ttgcatgtca ctcaaaaatt ttgcctcaaa actggtgagc 4080 tgaatttttg cagttaaagc atcgtgtagt gtttttctta gtccgttacg taggtaggaa 4140 tctgatgtaa tggttgttgg tattttgtca ccattcattt ttatctggtt gttctcaagt 4200 tcggttacga gatccatttg tctatctagt tcaacttgga aaatcaacgt atcagtcggg 4260 cggcctcgct tatcaaccac caatttcata ttgctgtaag tgtttaaatc tttacttatt 4320 ggtttcaaaa cccattggtt aagcctttta aactcatggt agttattttc aagcattaac 4380 atgaacttaa attcatcaag gctaatctct atatttgcct tgtgagtttt cttttgtgtt 4440 agttctttta ataaccactc ataaatcctc atagagtatt tgttttcaaa agacttaaca 4500 tgttccagat tatattttat gaattttttt aactggaaaa gataaggcaa tatctcttca 4560 ctaaaaacta attctaattt ttcgcttgag aacttggcat agtttgtcca ctggaaaatc 4620 tcaaagcctt taaccaaagg attcctgatt tccacagttc tcgtcatcag ctctctggtt 4680 gctttagcta atacaccata agcattttcc ctactgatgt tcatcatctg agcgtattgg 4740 ttataagtga acgataccgt ccgttctttc cttgtagggt tttcaatcgt ggggttgagt 4800 agtgccacac agcataaaat tagcttggtt tcatgctccg ttaagtcata gcgactaatc 4860 gctagttcat ttgctttgaa aacaactaat tcagacatac atctcaattg gtctaggtga 4920 ttttaatcac tataccaatt gagatgggct agtcaatgat aattactagt ccttttcctt 4980 tgagttgtgg gtatctgtaa attctgctag acctttgctg gaaaacttgt aaattctgct 5040 agaccctctg taaattccgc tagacctttg tgtgtttttt ttgtttatat tcaagtggtt 5100 ataatttata gaataaagaa agaataaaaa aagataaaaa gaatagatcc cagccctgtg 5160 tataactcac tactttagtc agttccgcag tattacaaaa ggatgtcgca aacgctgttt 5220 gctcctctac aaaacagacc ttaaaaccct aaaggcttaa gtagcaccct cgcaagctcg 5280 ggcaaatcgc tgaatattcc ttttgtctcc gaccatcagg cacctgagtc gctgtctttt 5340 tcgtgacatt cagttcgctg cgctcacggc tctggcagtg aatgggggta aatggcacta 5400 caggcgcctt ttatggattc atgcaaggaa actacccata atacaagaaa agcccgtcac 5460 gggcttctca gggcgtttta tggcgggtct gctatgtggt gctatctgac tttttgctgt 5520 tcagcagttc ctgccctctg attttccagt ctgaccactt cggattatcc cgtgacaggt 5580 cattcagact ggctaatgca cccagtaagg cagcggtatc atcaacaggc ttacccgtct 5640 tactgtcngg atcgacgctc tcccttatgc gactcctgca t 5681 <210> 86 <211> 12166 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF97 <400> 86 ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60 tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120 tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180 ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240 atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300 agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360 cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420 gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480 tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540 tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600 cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660 caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720 cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780 ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840 attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900 gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960 aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020 atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260 ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320 agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380 cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440 aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500 tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560 tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620 ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680 caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740 caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800 tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860 acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920 cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980 tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040 ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100 tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160 gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220 gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280 ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340 ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400 cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460 agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520 agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580 cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640 tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700 aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760 cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820 tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880 cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940 aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000 tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060 gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120 ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180 gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240 tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300 aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360 gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420 gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480 cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540 ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600 cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660 tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720 ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780 cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840 gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900 tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960 acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020 aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080 ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140 ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200 tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260 tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320 tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380 cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440 tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500 aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560 gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620 cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680 ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740 cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800 tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860 cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920 gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980 actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040 gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100 gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160 tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220 ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280 tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340 ctcgaaactt gatcatgtgt gccagagcga ggtagataag tctgagatcc gccttgtcgg 5400 tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460 cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520 ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580 agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640 gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700 ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760 tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820 agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880 cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940 gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000 tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060 gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120 ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180 tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240 acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300 agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360 gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420 gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480 gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540 ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600 tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660 acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720 atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780 gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840 aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900 atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960 cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020 ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080 gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140 cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200 aatcagacaa ttgacggctt gacggagtag catagggttt gcagaatccc tgcttcgtcc 7260 atttgacagg cacattatgc atgccgcttc gccttcgcgc gcgaattgat ctgctgcctc 7320 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 7380 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 7440 ggcgggtgtc ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc 7500 ttaactatgc ggcatcagag cagattgtac tgagagtgca ggggatcgcg gccgcggacc 7560 ggatcctcta gagcggccgc gatcctctag agtcgaccgg gaatggcgaa tgggacgcgc 7620 cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 7680 ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 7740 ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 7800 tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc 7860 cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 7920 tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga 7980 ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 8040 attttaacaa aatattaacg cttacaattt aggtggcact tttcggggaa atgtgcgcgg 8100 aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tcagatcctt 8160 tttaacccat cacatatacc tgccgttcac tattatttag tgaaatgaga tattatgata 8220 ttttctgaat tgtgattaaa aaggcaactt tatgcccatg caacagaaac tataaaaaat 8280 acagagaatg aaaagaaaca gatagatttt ttagttcttt aggcccgtag tctgcaaatc 8340 cttttatgat tttctatcaa acaaaagagg aaaatagacc agttgcaatc caaacgagag 8400 tctaatagaa tgaggtcgaa aagtaaatcg cgcgggtttg ttactgataa agcaggcaag 8460 acctaaaatg tgtaaagggc aaagtgtata ctttggcgtc accccttaca tattttaggt 8520 ctttttttat tgtgcgtaac taacttgcca tcttcaaaca ggagggctgg aagaagcaga 8580 ccgctaacac agtacataaa aaaggagaca tgaacgatga acatcaaaaa gtttgcaaaa 8640 caagcaacag tattaacctt tactaccgca ctgctggcag gaggcgcaac tcaagcgttt 8700 gcgaaagaaa cgaaccaaaa gccatataag gaaacatacg gcatttccca tattacacgc 8760 catgatatgc tgcaaatccc tgaacagcaa aaaaatgaaa aatatcaagt tcctgaattc 8820 gattcgtcca caattaaaaa tatctcttct gcaaaaggcc tggacgtttg ggacagctgg 8880 ccattacaaa acgctgacgg cactgtcgca aactatcacg gctaccacat cgtctttgca 8940 ttagccggag atcctaaaaa tgcggatgac acatcgattt acatgttcta tcaaaaagtc 9000 ggcgaaactt ctattgacag ctggaaaaac gctggccgcg tctttaaaga cagcgacaaa 9060 ttcgatgcaa atgattctat cctaaaagac caaacacaag aatggtcagg ttcagccaca 9120 tttacatctg acggaaaaat ccgtttattc tacactgatt tctccggtaa acattacggc 9180 aaacaaacac tgacaactgc acaagttaac gtatcagcat cagacagctc tttgaacatc 9240 aacggtgtag aggattataa atcaatcttt gacggtgacg gaaaaacgta tcaaaatgta 9300 cagcagttca tcgatgaagg caactacagc tcaggcgaca accatacgct gagagatcct 9360 cactacgtag aagataaagg ccacaaatac ttagtatttg aagcaaacac tggaactgaa 9420 gatggctacc aaggcgaaga atctttattt aacaaagcat actatggcaa aagcacatca 9480 ttcttccgtc aagaaagtca aaaacttctg caaagcgata aaaaacgcac ggctgagtta 9540 gcaaacggcg ctctcggtat gattgagcta aacgatgatt acacactgaa aaaagtgatg 9600 aaaccgctga ttgcatctaa cacagtaaca gatgaaattg aacgcgcgaa cgtctttaaa 9660 atgaacggca aatggtacct gttcactgac tcccgcggat caaaaatgac gattgacggc 9720 attacgtcta acgatattta catgcttggt tatgtttcta attctttaac tggcccatac 9780 aagccgctga acaaaactgg ccttgtgtta aaaatggatc ttgatcctaa cgatgtaacc 9840 tttacttact cacacttcgc tgtacctcaa gcgaaaggaa acaatgtcgt gattacaagc 9900 tatatgacaa acagaggatt ctacgcagac aaacaatcaa cgtttgcgcc aagcttcctg 9960 ctgaacatca aaggcaagaa aacatctgtt gtcaaagaca gcatccttga acaaggacaa 10020 ttaacagtta acaaataaaa acgcaaaaga aaatgccgat ccggtttatt gactaccgga 10080 agcagtgtga ccgtgtgctt ctcaaatgcc tcaggctgtc tatgtgtgac tgttgagctg 10140 taacaagttg tctcaggtgt tcaatttcat gttctagttg ctttgtttta ctggtttcac 10200 ctgttctatt aggtgttaca tgctgttcat ctgttacatt gtcgatctgt tcatggtgaa 10260 cagctttaaa tgcaccaaaa actcgtaaaa gctctgatgt atctatcttt tttacaccgt 10320 tttcatctgt gcatatggac agttttccct ttgatatcta acggtgaaca gttgttctac 10380 ttttgtttgt tagtcttgat gcttcactga tagatacaag agccataaga acctcagatc 10440 cttccgtatt tagccagtat gttctctagt gtggttcgtt gtttttgcgt gagccatgag 10500 aacgaaccat tgagatcatg cttactttgc atgtcactca aaaattttgc ctcaaaactg 10560 gtgagctgaa tttttgcagt taaagcatcg tgtagtgttt ttcttagtcc gttacgtagg 10620 taggaatctg atgtaatggt tgttggtatt ttgtcaccat tcatttttat ctggttgttc 10680 tcaagttcgg ttacgagatc catttgtcta tctagttcaa cttggaaaat caacgtatca 10740 gtcgggcggc ctcgcttatc aaccaccaat ttcatattgc tgtaagtgtt taaatcttta 10800 cttattggtt tcaaaaccca ttggttaagc cttttaaact catggtagtt attttcaagc 10860 attaacatga acttaaattc atcaaggcta atctctatat ttgccttgtg agttttcttt 10920 tgtgttagtt cttttaataa ccactcataa atcctcatag agtatttgtt ttcaaaagac 10980 ttaacatgtt ccagattata ttttatgaat ttttttaact ggaaaagata aggcaatatc 11040 tcttcactaa aaactaattc taatttttcg cttgagaact tggcatagtt tgtccactgg 11100 aaaatctcaa agcctttaac caaaggattc ctgatttcca cagttctcgt catcagctct 11160 ctggttgctt tagctaatac accataagca ttttccctac tgatgttcat catctgagcg 11220 tattggttat aagtgaacga taccgtccgt tctttccttg tagggttttc aatcgtgggg 11280 ttgagtagtg ccacacagca taaaattagc ttggtttcat gctccgttaa gtcatagcga 11340 ctaatcgcta gttcatttgc tttgaaaaca actaattcag acatacatct caattggtct 11400 aggtgatttt aatcactata ccaattgaga tgggctagtc aatgataatt actagtcctt 11460 ttcctttgag ttgtgggtat ctgtaaattc tgctagacct ttgctggaaa acttgtaaat 11520 tctgctagac cctctgtaaa ttccgctaga cctttgtgtg ttttttttgt ttatattcaa 11580 gtggttataa tttatagaat aaagaaagaa taaaaaaaga taaaaagaat agatcccagc 11640 cctgtgtata actcactact ttagtcagtt ccgcagtatt acaaaaggat gtcgcaaacg 11700 ctgtttgctc ctctacaaaa cagaccttaa aaccctaaag gcttaagtag caccctcgca 11760 agctcgggca aatcgctgaa tattcctttt gtctccgacc atcaggcacc tgagtcgctg 11820 tctttttcgt gacattcagt tcgctgcgct cacggctctg gcagtgaatg ggggtaaatg 11880 gcactacagg cgccttttat ggattcatgc aaggaaacta cccataatac aagaaaagcc 11940 cgtcacgggc ttctcagggc gttttatggc gggtctgcta tgtggtgcta tctgactttt 12000 tgctgttcag cagttcctgc cctctgattt tccagtctga ccacttcgga ttatcccgtg 12060 acaggtcatt cagactggct aatgcaccca gtaaggcagc ggtatcatca acaggcttac 12120 ccgtcttact gtcggatcga cgctctccct tatgcgactc ctgcat 12166 <210> 87 <211> 410 <212> DNA <213> Artificial sequence <220> <223> Y155H encoding synthetic fragment <400> 87 ctccagtcgt ctgctcttcg agagtcgagc agacaagatg gcctttgcat cgactccgga 60 ggcattgatg gggttttcct cgaacagctg gttgtaggtc tgaacgagct gaatgaacag 120 cttgtccaca tcgctgttgt cgggattgag atcgccctcg atgaggaaat gacctcgaaa 180 cttgatcatg tgtgccagag cgagatggat aagtctgaga tccgccttgt cggtggaatc 240 gacgagtttc tttcgcaggt ggtagatggt aggatacttc tcgtggtaag caacctcgtc 300 cacaatgttg ccaaagatgg gatgacgctc gtgtttcttg tcttcctcga cgaggaagga 360 ttcctccagt cgatgaaaga acgaatcgtc caccttggcc atctcgttgg 410 <210> 88 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Y155H synthetic fragment forward primer <400> 88 ccaacgagat ggccaaggtg 20 <210> 89 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Y155H synthetic fragment reverse primer <400> 89 ccaacgagat ggccaaggtg 20 <210> 90 <211> 11794 <212> DNA <213> Artificial sequence <220> <223> pRF97-Y155H fragment of plasmid <400> 90 caccttggcc atctcgttgg aaaagatctc ctgcaggtag cagattcggt tcttccgtcg 60 ggtgtaacgt cgccgagcag ttcgcttgag tctggtagct tcggcagtct cgccagaatc 120 gaacaacagg gcaccaatga ggtttttctt gatggagtgt cgatcggtgt ttccgaggac 180 cttgaatttc ttggagggca ccttgtactc gtcggtgatg acagcccagc cgacagagtt 240 ggttccaatg tccaggccga tggagtattt cttgtcgaat tcccatatgg taccagctgc 300 agatctcgag ctcggatcct tatcgtcatc gtcgtacaga tcccgaccca tttgctgtcc 360 accagtcatg ctagccatac catgatgatg atgatgatga gaacccccca tggttaattc 420 ctcctgttag cccaaaaaac gggtatggag aaacagtaga gagttgcgat aaaaagcgtc 480 aggtaggatc cgctaatctt atggataaaa atgctatggc atagcaaagt gtgacgccgt 540 gcaaataatc aatgtggact tttctgccgt gattatagac acttttgtta cgcgtttttg 600 tcatggcttt ggtcccgctt tgttacagaa tgcttttaat aagcggggtt accggtttgg 660 ttagcgagaa gagccagtaa aagacgcagt gacggcaatg tctgatgcaa tatggacaat 720 tggtttcttc tctgaatggc gggagtatga aaagtatggc tgaagcgcaa aatgatcccc 780 tgctgccggg atactcgttt aatgcccatc tggtggcggg tttaacgccg attgaggcca 840 acggttatct cgattttttt atcgaccgac cgctgggaat gaaaggttat attctcaatc 900 tcaccattcg cggtcagggg gtggtgaaaa atcagggacg agaatttgtt tgccgaccgg 960 gtgatatttt gctgttcccg ccaggagaga ttcatcacta cggtcgtcat ccggaggctc 1020 gcgaatggta tcaccagtgg gtttactttc gtccgcgcgc ctactggcat gaatggctta 1080 actggccgtc aatatttgcc aatacggggt tctttcgccc ggatgaagcg caccagccgc 1140 atttcagcga cctgtttggg caaatcatta acgccgggca aggggaaggg cgctattcgg 1200 agctgctggc gataaatctg cttgagcaat tgttactgcg gcgcatggaa gcgattaacg 1260 agtcgctcca tccaccgatg gataatcggg tacgcgaggc ttgtcagtac atcagcgatc 1320 acctggcaga cagcaatttt gatatcgcca gcgtcgcaca gcatgtttgc ttgtcgccgt 1380 cgcgtctgtc acatcttttc cgccagcagt tagggattag cgtcttaagc tggcgcgagg 1440 accaacgtat cagccaggcg aagctgcttt tgagcaccac ccggatgcct atcgccaccg 1500 tcggtcgcaa tgttggtttt gacgatcaac tctatttctc gcgggtattt aaaaaatgca 1560 ccggggccag cccgagcgag ttccgtgccg gttgtgaaga aaaagtgaat gatgtagccg 1620 tcaagttgtc ataattggta acgaatcaga caattgacgg cttgacggag tagcataggg 1680 tttgcagaat ccctgcttcg tccatttgac aggcacatta tgcatgccgc ttcgccttcg 1740 cgcgcgaatt gatctgctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 1800 tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 1860 gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta 1920 gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt 1980 gcaggggatc gcggccgcgg accggatcct ctagagcggc cgcgatcctc tagagtcgac 2040 cggtggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 2100 gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 2160 ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 2220 agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 2280 ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 2340 gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 2400 ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 2460 ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt aggtggcact 2520 tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg 2580 tatccgctca ccgcgatcct ttttaaccca tcacatatac ctgccgttca ctattattta 2640 gtgaaatgag atattatgat attttctgaa ttgtgattaa aaaggcaact ttatgcccat 2700 gcaacagaaa ctataaaaaa tacagagaat gaaaagaaac agatagattt tttagttctt 2760 taggcccgta gtctgcaaat ccttttatga ttttctatca aacaaaagag gaaaatagac 2820 cagttgcaat ccaaacgaga gtctaataga atgaggtcga aaagtaaatc gcgcgggttt 2880 gttactgata aagcaggcaa gacctaaaat gtgtaaaggg caaagtgtat actttggcgt 2940 caccccttac atattttagg tcttttttta ttgtgcgtaa ctaacttgcc atcttcaaac 3000 aggagggctg gaagaagcag accgctaaca cagtacataa aaaaggagac atgaacgatg 3060 aacatcaaaa agtttgcaaa acaagcaaca gtattaacct ttactaccgc actgctggca 3120 ggaggcgcaa ctcaagcgtt tgcgaaagaa acgaaccaaa agccatataa ggaaacatac 3180 ggcatttccc atattacacg ccatgatatg ctgcaaatcc ctgaacagca aaaaaatgaa 3240 aaatatcaag ttcctgagtt cgattcgtcc acaattaaaa atatctcttc tgcaaaaggc 3300 ctggacgttt gggacagctg gccattacaa aacgctgacg gcactgtcgc aaactatcac 3360 ggctaccaca tcgtctttgc attagccgga gatcctaaaa atgcggatga cacatcgatt 3420 tacatgttct atcaaaaagt cggcgaaact tctattgaca gctggaaaaa cgctggccgc 3480 gtctttaaag acagcgacaa attcgatgca aatgattcta tcctaaaaga ccaaacacaa 3540 gaatggtcag gttcagccac atttacatct gacggaaaaa tccgtttatt ctacactgat 3600 ttctccggta aacattacgg caaacaaaca ctgacaactg cacaagttaa cgtatcagca 3660 tcagacagct ctttgaacat caacggtgta gaggattata aatcaatctt tgacggtgac 3720 ggaaaaacgt atcaaaatgt acagcagttc atcgatgaag gcaactacag ctcaggcgac 3780 aaccatacgc tgagagatcc tcactacgta gaagataaag gccacaaata cttagtattt 3840 gaagcaaaca ctggaactga agatggctac caaggcgaag aatctttatt taacaaagca 3900 tactatggca aaagcacatc attcttccgt caagaaagtc aaaaacttct gcaaagcgat 3960 aaaaaacgca cggctgagtt agcaaacggc gctctcggta tgattgagct aaacgatgat 4020 tacacactga aaaaagtgat gaaaccgctg attgcatcta acacagtaac agatgaaatt 4080 gaacgcgcga acgtctttaa aatgaacggc aaatggtacc tgttcactga ctcccgcgga 4140 tcaaaaatga cgattgacgg cattacgtct aacgatattt acatgcttgg ttatgtttct 4200 aattctttaa ctggcccata caagccgctg aacaaaactg gccttgtgtt aaaaatggat 4260 cttgatccta acgatgtaac ctttacttac tcacacttcg ctgtacctca agcgaaagga 4320 aacaatgtcg tgattacaag ctatatgaca aacagaggat tctacgcaga caaacaatca 4380 acgtttgcgc caagcttcct gctgaacatc aaaggcaaga aaacatctgt tgtcaaagac 4440 agcatccttg aacaaggaca attaacagtt aacaaataaa aacgcaaaag aaaatgccga 4500 tattgactac cggaagcagt gtgaccgtgt gcttctcaaa tgcctgattc aggctgtcta 4560 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 4620 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 4680 cgatctgttc atggtgaaca gctttaaatg caccaaaaac tcgtaaaagc tctgatgtat 4740 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 4800 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 4860 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 4920 ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 4980 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 5040 cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 5100 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 5160 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 5220 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 5280 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 5340 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 5400 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 5460 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 5520 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 5580 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 5640 atgttcatca tctgaacgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 5700 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 5760 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 5820 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 5880 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 5940 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 6000 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 6060 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 6120 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 6180 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 6240 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 6300 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 6360 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 6420 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 6480 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 6540 tatcatcaac aggcttaccc gtcttactgt cggggatcga cgctctccct tatgcgactc 6600 ctgcaccttt cgtcttcgaa taaatacctg tgacggaaga tcacttcgca gaataaataa 6660 atcctggtgt ccctgttgat accgggaagc cctgggccaa cttttggcga aaatgagacg 6720 ttgatcggca cgtaagaggt tccaactttc accataatga aataagatca ctaccgggcg 6780 tattttttga gttatcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca 6840 ctggatatac caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc 6900 agtcagttgc tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa 6960 agaccgtaaa gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc 7020 tgatgaatgc tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg 7080 atagtgttca cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct 7140 ggagtgaata ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt 7200 gttacggtga aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct 7260 cagccaatcc ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact 7320 tcttcgcccc cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc 7380 cgctggcgat tcaggttcat catgccgttt gtgatggctt ccatgtcggc agaatgctta 7440 atgaattaca acagtactgc gatgagtggc agggcggggc gtaatttttt taaggcagtt 7500 attggtgccc ttaaacgcct ggttgctacg cctgaataag tgataataag cggatgaatg 7560 gcagaaattc gaaagcaaat tcgacccggt cgtcggttca gggcagggtc gttaaatagc 7620 cgcttatgtc tattgctggt ctcggtaccc tgcacccaac tgatcttcag catcttttac 7680 tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 7740 aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 7800 ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 7860 aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 7920 gcctggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 7980 tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 8040 taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 8100 cctactctcg catggggaga ccccacacta ccatcggcgc tacggcgttt cacttctgag 8160 ttcggcatgg ggtcaggtgg gaccaccgcg ctactgccgc caggcaaatt ctgttttatc 8220 agaccgcttc tgcgttctga tttaatctgt atcaggctga aaatcttctc tcatccgcca 8280 aaacagccaa gcttagcggc cgcttagacc tttcgctttt tcttgggatc ggctctggag 8340 tcgccaccaa gctgagacag gtcgattcgg gtctcgtaca ggccagtgat ggactggtga 8400 atcagggtgg catcgagaac ctccttggtg gatgtgtacc gctttcggtc gatagtggta 8460 tcgaagtact tgaaagctgc aggagcaccc aggttggtaa gagtaaacag gtgaatgatg 8520 ttctccgcct gttctcgaat gggtttgtcc cgatgcttgt tgtaggcaga gagcaccttg 8580 tccaagttgg catcagccag gatgactcgc ttcgaaaact cggaaatctg ctcgataatc 8640 tcgtcgaggt aatgtttgtg ctgctcaacg aagagttgct tctgttcgtt gtcctcggga 8700 gaacccttga gcttctcgta gtgagaagcc agatagagaa agttgacgta cttcgaaggc 8760 aaggcaagct cgtttccctt ctgcagctcg ccagcggagg cgagcatacg ctttcgaccg 8820 ttctccagtt cgaacagaga gtacttgggc agcttgataa tgaggtcttt cttgacctcc 8880 ttgtaaccct tggcttccaa gaagtcgatg ggattcttct cgaagctcga tcgctccatg 8940 atggtaattc cgagcagctc cttgacggac ttgagctttt tggacttgcc cttctcgacc 9000 ttcgcaacga caagcacgga ataggcgacg gtaggagaat cgaagccacc gtatttcttg 9060 ggatcccagt ctttctttcg agcgatgagc ttgtcggagt ttcgcttggg cagaatcgac 9120 tccttggaga atccgccagt ctgaacctcg gttttcttga cgatgttgac ctgaggcatc 9180 gacagaacct ttcgcacggt tgcaaagtct cgacccttgt cccacacgat ctctccagtt 9240 tcgccgttgg tctcgataag tggtctcttt cgaatctctc cgttggccaa ggtgatctcg 9300 gtcttgaaaa agttcatgat gttggagtaa aagaagtact tggcagtagc cttgccaatc 9360 tcctgttcgg acttggcaat catctttcga acgtcgtaga ccttgtaatc gccgtaaacg 9420 aactcgcttt cgagcttggg gtatttcttg atgagcgcag tgccaacgac ggcgttgagg 9480 taagcatcgt gggcatggtg gtaattgttg atctctcgca ccttgtagaa ctgaaagtcc 9540 tttcggaaat cggagaccag tttggacttg agagtaatca ccttgacctc tcggatgagc 9600 ttgtcgttct cgtcgtactt ggtgttcatc cgagaatcga gaatctgtgc gacgtgcttt 9660 gtgatctgtc tggtctcgac gagttgacgc ttgatgaagc cagccttgtc gagctcggac 9720 agaccgcctc gctcggcctt ggtaagattg tcgaactttc gctgggtaat gagcttggcg 9780 ttgagcagct gtcgccagta gttcttcatc tttttgacca cctcttcgct gggaacgttg 9840 tccgacttgc ctctgttctt gtcggatcgt gtaaggacct tgttgtcgat agaatcgtcc 9900 ttgagaaagg attgagggac aatgtggtcc acatcgtagt cgctgagacg attgatgtcc 9960 agttcctgat ccacgtacat gtctcgacca ttctgcagat agtagagata cagcttctcg 10020 ttctgcagtt gagtgttctc gacgggatgc tccttgagaa tctgggatcc cagctccttg 10080 atgccttcct cgattcgctt catccgctct cgcgagtttt tctgaccctt ttgagttgtc 10140 tggttctctc tggccatctc gatcacaatg ttctcgggct tgtgacgtcc catgaccttc 10200 accagctcgt cgacaacctt gacagtctgg agaatgcctt tcttgatggc tggcgaacca 10260 gccaggttgg caatatgttc gtgcaagctg tcgccctgac cggacacttg tgccttctgg 10320 atgtcctcct tgaaggtaag agaatcgtcg tgaatgagct gcatgaagtt tcggttggca 10380 aagccatcgg acttgagaaa gtccagaatg gtctttccgg actgcttgtc tctgatgccg 10440 ttgatgagct ttcgcgaaag tcttccccag ccggtgtatc tacgtcgctt gagttgtttc 10500 atgaccttgt cgtcgaacag gtgagcgtat gtcttgagtc gttcctcgat catctcccga 10560 tcttcgaaca gggtaagagt gagcacgatg tcctccagaa tgtcctcgtt ttcctcgttg 10620 tcgagaaaat ccttgtcctt gataatcttg agcagatcgt gataggtgcc caaagaggcg 10680 ttgaatcggt cctcaactcc ggaaatctcg acgctgtcga aacactcgat tttcttgaag 10740 tagtcctcct tgagctgctt aacagtgacc tttcggttgg tcttgaacag gagatcgaca 10800 atggctttct tctgttcgcc agacaagaag gcaggctttc gcattccctc ggtaacgtac 10860 ttgactttgg tgagttcgtt gtagactgta aagtactcgt agagcagcga atgcttggga 10920 agaaccttct cgttgggcag attcttgtcg aagttggtca ttcgctcgat gaaggactgt 10980 gcagaggcac ccttgtccac gacttcctcg aagttccagg gagtgatggt ttcctcggac 11040 tttcgagtca tccaagcaaa tcgagagttt cctctggcaa gaggaccaac atagtagggg 11100 attcgaaagg taagaatctt ctcgatcttc tctcggttgt ccttgagaaa ggggtagaag 11160 tcttcctgac gtcgaagaat ggcgtgcagc tcaccgaggt ggatctgatg aggaatgctg 11220 ccgttgtcga aggttcgttg cttccgaagc agatcctctc gattgagctt gacaagcagt 11280 tcctcggttc cgtccatctt ctcgagaatt ggcttgatga acttgtagaa ctcttcctga 11340 gaggctccgc cgtcgatgta tccagcgtag ccgttcttcg actgatcgaa aaagatctcc 11400 ttgtacttct cgggcagttg ctgtcggaca agagccttga gcagtgtgag atcctgatgg 11460 tgctcgtcgt atcgcttgat catggaggca gaaaggggag cctttgtgat ctcggtgttg 11520 actcgcagaa tgtcagacaa gagaatagca tccgaaaggt tcttggcagc gagaaacagg 11580 tcggcgtact gatcgccaat ctgtgcaagc aggttgtcga ggtcatcgtc gtaggtgtcc 11640 ttggacagct ggagcttggc gtcctccgcc agatcgaagt tggacttgaa gttgggtgtg 11700 agaccaagag aaagggcaat gaggttgcca aacagtccgt tctttttctc gccaggaagt 11760 tgggcaatga ggttctccag tcgtctgctc ttcg 11794 <210> 91 <211> 20 <212> DNA <213> Artificial sequence <220> <223> pRF97-Y155H fragment forward primer <400> 91 caccttggcc atctcgttgg 20 <210> 92 <211> 20 <212> DNA <213> Artificial sequence <220> <223> pRF97-Y155H fragment reverse primer <400> 92 cgaagagcag acgactggag 20 <210> 93 <211> 12164 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF861 <400> 93 cctttcgtct tcgaataaat acctgtgacg gaagatcact tcgcagaata aataaatcct 60 ggtgtccctg ttgataccgg gaagccctgg gccaactttt ggcgaaaatg agacgttgat 120 cggcacgtaa gaggttccaa ctttcaccat aatgaaataa gatcactacc gggcgtattt 180 tttgagttat cgagattttc aggagctaag gaagctaaaa tggagaaaaa aatcactgga 240 tataccaccg ttgatatatc ccaatggcat cgtaaagaac attttgaggc atttcagtca 300 gttgctcaat gtacctataa ccagaccgtt cagctggata ttacggcctt tttaaagacc 360 gtaaagaaaa ataagcacaa gttttatccg gcctttattc acattcttgc ccgcctgatg 420 aatgctcatc cggaattccg tatggcaatg aaagacggtg agctggtgat atgggatagt 480 gttcaccctt gttacaccgt tttccatgag caaactgaaa cgttttcatc gctctggagt 540 gaataccacg acgatttccg gcagtttcta cacatatatt cgcaagatgt ggcgtgttac 600 ggtgaaaacc tggcctattt ccctaaaggg tttattgaga atatgttttt cgtctcagcc 660 aatccctggg tgagtttcac cagttttgat ttaaacgtgg ccaatatgga caacttcttc 720 gcccccgttt tcaccatggg caaatattat acgcaaggcg acaaggtgct gatgccgctg 780 gcgattcagg ttcatcatgc cgtttgtgat ggcttccatg tcggcagaat gcttaatgaa 840 ttacaacagt actgcgatga gtggcagggc ggggcgtaat ttttttaagg cagttattgg 900 tgcccttaaa cgcctggttg ctacgcctga ataagtgata ataagcggat gaatggcaga 960 aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020 atgtctattg ctggtctcgg taccctgcac ccaactgatc ttcagcatct tttactttca 1080 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 1140 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 1200 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaaaga 1260 gtttgtagaa acgcaaaaag gccatccgtc aggatggcct tctgcttaat ttgatgcctg 1320 gcagtttatg gcgggcgtcc tgcccgccac cctccgggcc gttgcttcgc aacgttcaaa 1380 tccgctcccg gcggatttgt cctactcagg agagcgttca ccgacaaaca acagataaaa 1440 cgaaaggccc agtctttcga ctgagccttt cgttttattt gatgcctggc agttccctac 1500 tctcgcatgg ggagacccca cactaccatc ggcgctacgg cgtttcactt ctgagttcgg 1560 catggggtca ggtgggacca ccgcgctact gccgccaggc aaattctgtt ttatcagacc 1620 gcttctgcgt tctgatttaa tctgtatcag gctgaaaatc ttctctcatc cgccaaaaca 1680 gccaagctta gcggccgctt agacctttcg ctttttcttg ggatcggctc tggagtcgcc 1740 accaagctga gacaggtcga ttcgggtctc gtacaggcca gtgatggact ggtgaatcag 1800 ggtggcatcg agaacctcct tggtggatgt gtaccgcttt cggtcgatag tggtatcgaa 1860 gtacttgaaa gctgcaggag cacccaggtt ggtaagagta aacaggtgaa tgatgttctc 1920 cgcctgttct cgaatgggtt tgtcccgatg cttgttgtag gcagagagca ccttgtccaa 1980 gttggcatca gccaggatga ctcgcttcga aaactcggaa atctgctcga taatctcgtc 2040 gaggtaatgt ttgtgctgct caacgaagag ttgcttctgt tcgttgtcct cgggagaacc 2100 cttgagcttc tcgtagtgag aagccagata gagaaagttg acgtacttcg aaggcaaggc 2160 aagctcgttt cccttctgca gctcgccagc ggaggcgagc atacgctttc gaccgttctc 2220 cagttcgaac agagagtact tgggcagctt gataatgagg tctttcttga cctccttgta 2280 acccttggct tccaagaagt cgatgggatt cttctcgaag ctcgatcgct ccatgatggt 2340 aattccgagc agctccttga cggacttgag ctttttggac ttgcccttct cgaccttcgc 2400 aacgacaagc acggaatagg cgacggtagg agaatcgaag ccaccgtatt tcttgggatc 2460 ccagtctttc tttcgagcga tgagcttgtc ggagtttcgc ttgggcagaa tcgactcctt 2520 ggagaatccg ccagtctgaa cctcggtttt cttgacgatg ttgacctgag gcatcgacag 2580 aacctttcgc acggttgcaa agtctcgacc cttgtcccac acgatctctc cagtttcgcc 2640 gttggtctcg ataagtggtc tctttcgaat ctctccgttg gccaaggtga tctcggtctt 2700 gaaaaagttc atgatgttgg agtaaaagaa gtacttggca gtagccttgc caatctcctg 2760 ttcggacttg gcaatcatct ttcgaacgtc gtagaccttg taatcgccgt aaacgaactc 2820 gctttcgagc ttggggtatt tcttgatgag cgcagtgcca acgacggcgt tgaggtaagc 2880 atcgtgggca tggtggtaat tgttgatctc tcgcaccttg tagaactgaa agtcctttcg 2940 gaaatcggag accagtttgg acttgagagt aatcaccttg acctctcgga tgagcttgtc 3000 gttctcgtcg tacttggtgt tcatccgaga atcgagaatc tgtgcgacgt gctttgtgat 3060 ctgtctggtc tcgacgagtt gacgcttgat gaagccagcc ttgtcgagct cggacagacc 3120 gcctcgctcg gccttggtaa gattgtcgaa ctttcgctgg gtaatgagct tggcgttgag 3180 cagctgtcgc cagtagttct tcatcttttt gaccacctct tcgctgggaa cgttgtccga 3240 cttgcctctg ttcttgtcgg atcgtgtaag gaccttgttg tcgatagaat cgtccttgag 3300 aaaggattga gggacaatgt ggtccacatc gtagtcgctg agacgattga tgtccagttc 3360 ctgatccacg tacatgtctc gaccattctg cagatagtag agatacagct tctcgttctg 3420 cagttgagtg ttctcgacgg gatgctcctt gagaatctgg gatcccagct ccttgatgcc 3480 ttcctcgatt cgcttcatcc gctctcgcga gtttttctga cccttttgag ttgtctggtt 3540 ctctctggcc atctcgatca caatgttctc gggcttgtga cgtcccatga ccttcaccag 3600 ctcgtcgaca accttgacag tctggagaat gcctttcttg atggctggcg aaccagccag 3660 gttggcaata tgttcgtgca agctgtcgcc ctgaccggac acttgtgcct tctggatgtc 3720 ctccttgaag gtaagagaat cgtcgtgaat gagctgcatg aagtttcggt tggcaaagcc 3780 atcggacttg agaaagtcca gaatggtctt tccggactgc ttgtctctga tgccgttgat 3840 gagctttcgc gaaagtcttc cccagccggt gtatctacgt cgcttgagtt gtttcatgac 3900 cttgtcgtcg aacaggtgag cgtatgtctt gagtcgttcc tcgatcatct cccgatcttc 3960 gaacagggta agagtgagca cgatgtcctc cagaatgtcc tcgttttcct cgttgtcgag 4020 aaaatccttg tccttgataa tcttgagcag atcgtgatag gtgcccaaag aggcgttgaa 4080 tcggtcctca actccggaaa tctcgacgct gtcgaaacac tcgattttct tgaagtagtc 4140 ctccttgagc tgcttaacag tgacctttcg gttggtcttg aacaggagat cgacaatggc 4200 tttcttctgt tcgccagaca agaaggcagg ctttcgcatt ccctcggtaa cgtacttgac 4260 tttggtgagt tcgttgtaga ctgtaaagta ctcgtagagc agcgaatgct tgggaagaac 4320 cttctcgttg ggcagattct tgtcgaagtt ggtcattcgc tcgatgaagg actgtgcaga 4380 ggcacccttg tccacgactt cctcgaagtt ccagggagtg atggtttcct cggactttcg 4440 agtcatccaa gcaaatcgag agtttcctct ggcaagagga ccaacatagt aggggattcg 4500 aaaggtaaga atcttctcga tcttctctcg gttgtccttg agaaaggggt agaagtcttc 4560 ctgacgtcga agaatggcgt gcagctcacc gaggtggatc tgatgaggaa tgctgccgtt 4620 gtcgaaggtt cgttgcttcc gaagcagatc ctctcgattg agcttgacaa gcagttcctc 4680 ggttccgtcc atcttctcga gaattggctt gatgaacttg tagaactctt cctgagaggc 4740 tccgccgtcg atgtatccag cgtagccgtt cttcgactga tcgaaaaaga tctccttgta 4800 cttctcgggc agttgctgtc ggacaagagc cttgagcagt gtgagatcct gatggtgctc 4860 gtcgtatcgc ttgatcatgg aggcagaaag gggagccttt gtgatctcgg tgttgactcg 4920 cagaatgtca gacaagagaa tagcatccga aaggttcttg gcagcgagaa acaggtcggc 4980 gtactgatcg ccaatctgtg caagcaggtt gtcgaggtca tcgtcgtagg tgtccttgga 5040 cagctggagc ttggcgtcct ccgccagatc gaagttggac ttgaagttgg gtgtgagacc 5100 aagagaaagg gcaatgaggt tgccaaacag tccgttcttt ttctcgccag gaagttgggc 5160 aatgaggttc tccagtcgtc tgctcttcga gagtcgagca gacaagatgg cctttgcatc 5220 gactccggag gcattgatgg ggttttcctc gaacagctgg ttgtaggtct gaacgagctg 5280 aatgaacagc ttgtccacat cgctgttgtc gggattgaga tcgccctcga tgaggaaatg 5340 acctcgaaac ttgatcatgt gtgccagagc gagatggata agtctgagat ccgccttgtc 5400 ggtggaatcg acgagtttct ttcgcaggtg gtagatggta ggatacttct cgtggtaagc 5460 aacctcgtcc acaatgttgc caaagatggg atgacgctcg tgtttcttgt cttcctcgac 5520 gaggaaggat tcctccagtc gatgaaagaa cgaatcgtcc accttggcca tctcgttgga 5580 aaagatctcc tgcaggtagc agattcggtt cttccgtcgg gtgtaacgtc gccgagcagt 5640 tcgcttgagt ctggtagctt cggcagtctc gccagaatcg aacaacaggg caccaatgag 5700 gtttttcttg atggagtgtc gatcggtgtt tccgaggacc ttgaatttct tggagggcac 5760 cttgtactcg tcggtgatga cagcccagcc gacagagttg gttccaatgt ccaggccgat 5820 ggagtatttc ttgtcgaatt cccatatggt accagctgca gatctcgagc tcggatcctt 5880 atcgtcatcg tcgtacagat cccgacccat ttgctgtcca ccagtcatgc tagccatacc 5940 atgatgatga tgatgatgag aaccccccat ggttaattcc tcctgttagc ccaaaaaacg 6000 ggtatggaga aacagtagag agttgcgata aaaagcgtca ggtaggatcc gctaatctta 6060 tggataaaaa tgctatggca tagcaaagtg tgacgccgtg caaataatca atgtggactt 6120 ttctgccgtg attatagaca cttttgttac gcgtttttgt catggctttg gtcccgcttt 6180 gttacagaat gcttttaata agcggggtta ccggtttggt tagcgagaag agccagtaaa 6240 agacgcagtg acggcaatgt ctgatgcaat atggacaatt ggtttcttct ctgaatggcg 6300 ggagtatgaa aagtatggct gaagcgcaaa atgatcccct gctgccggga tactcgttta 6360 atgcccatct ggtggcgggt ttaacgccga ttgaggccaa cggttatctc gattttttta 6420 tcgaccgacc gctgggaatg aaaggttata ttctcaatct caccattcgc ggtcaggggg 6480 tggtgaaaaa tcagggacga gaatttgttt gccgaccggg tgatattttg ctgttcccgc 6540 caggagagat tcatcactac ggtcgtcatc cggaggctcg cgaatggtat caccagtggg 6600 tttactttcg tccgcgcgcc tactggcatg aatggcttaa ctggccgtca atatttgcca 6660 atacggggtt ctttcgcccg gatgaagcgc accagccgca tttcagcgac ctgtttgggc 6720 aaatcattaa cgccgggcaa ggggaagggc gctattcgga gctgctggcg ataaatctgc 6780 ttgagcaatt gttactgcgg cgcatggaag cgattaacga gtcgctccat ccaccgatgg 6840 ataatcgggt acgcgaggct tgtcagtaca tcagcgatca cctggcagac agcaattttg 6900 atatcgccag cgtcgcacag catgtttgct tgtcgccgtc gcgtctgtca catcttttcc 6960 gccagcagtt agggattagc gtcttaagct ggcgcgagga ccaacgtatc agccaggcga 7020 agctgctttt gagcaccacc cggatgccta tcgccaccgt cggtcgcaat gttggttttg 7080 acgatcaact ctatttctcg cgggtattta aaaaatgcac cggggccagc ccgagcgagt 7140 tccgtgccgg ttgtgaagaa aaagtgaatg atgtagccgt caagttgtca taattggtaa 7200 cgaatcagac aattgacggc ttgacggagt agcatagggt ttgcagaatc cctgcttcgt 7260 ccatttgaca ggcacattat gcatgccgct tcgccttcgc gcgcgaattg atctgctgcc 7320 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 7380 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 7440 ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 7500 gcttaactat gcggcatcag agcagattgt actgagagtg caggggatcg cggccgcgga 7560 ccggatcctc tagagcggcc gcgatcctct agagtcgacc ggtggcgaat gggacgcgcc 7620 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 7680 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 7740 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 7800 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 7860 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 7920 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 7980 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 8040 ttttaacaaa atattaacgc ttacaattta ggtggcactt ttcggggaaa tgtgcgcgga 8100 acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcac cgcgatcctt 8160 tttaacccat cacatatacc tgccgttcac tattatttag tgaaatgaga tattatgata 8220 ttttctgaat tgtgattaaa aaggcaactt tatgcccatg caacagaaac tataaaaaat 8280 acagagaatg aaaagaaaca gatagatttt ttagttcttt aggcccgtag tctgcaaatc 8340 cttttatgat tttctatcaa acaaaagagg aaaatagacc agttgcaatc caaacgagag 8400 tctaatagaa tgaggtcgaa aagtaaatcg cgcgggtttg ttactgataa agcaggcaag 8460 acctaaaatg tgtaaagggc aaagtgtata ctttggcgtc accccttaca tattttaggt 8520 ctttttttat tgtgcgtaac taacttgcca tcttcaaaca ggagggctgg aagaagcaga 8580 ccgctaacac agtacataaa aaaggagaca tgaacgatga acatcaaaaa gtttgcaaaa 8640 caagcaacag tattaacctt tactaccgca ctgctggcag gaggcgcaac tcaagcgttt 8700 gcgaaagaaa cgaaccaaaa gccatataag gaaacatacg gcatttccca tattacacgc 8760 catgatatgc tgcaaatccc tgaacagcaa aaaaatgaaa aatatcaagt tcctgagttc 8820 gattcgtcca caattaaaaa tatctcttct gcaaaaggcc tggacgtttg ggacagctgg 8880 ccattacaaa acgctgacgg cactgtcgca aactatcacg gctaccacat cgtctttgca 8940 ttagccggag atcctaaaaa tgcggatgac acatcgattt acatgttcta tcaaaaagtc 9000 ggcgaaactt ctattgacag ctggaaaaac gctggccgcg tctttaaaga cagcgacaaa 9060 ttcgatgcaa atgattctat cctaaaagac caaacacaag aatggtcagg ttcagccaca 9120 tttacatctg acggaaaaat ccgtttattc tacactgatt tctccggtaa acattacggc 9180 aaacaaacac tgacaactgc acaagttaac gtatcagcat cagacagctc tttgaacatc 9240 aacggtgtag aggattataa atcaatcttt gacggtgacg gaaaaacgta tcaaaatgta 9300 cagcagttca tcgatgaagg caactacagc tcaggcgaca accatacgct gagagatcct 9360 cactacgtag aagataaagg ccacaaatac ttagtatttg aagcaaacac tggaactgaa 9420 gatggctacc aaggcgaaga atctttattt aacaaagcat actatggcaa aagcacatca 9480 ttcttccgtc aagaaagtca aaaacttctg caaagcgata aaaaacgcac ggctgagtta 9540 gcaaacggcg ctctcggtat gattgagcta aacgatgatt acacactgaa aaaagtgatg 9600 aaaccgctga ttgcatctaa cacagtaaca gatgaaattg aacgcgcgaa cgtctttaaa 9660 atgaacggca aatggtacct gttcactgac tcccgcggat caaaaatgac gattgacggc 9720 attacgtcta acgatattta catgcttggt tatgtttcta attctttaac tggcccatac 9780 aagccgctga acaaaactgg ccttgtgtta aaaatggatc ttgatcctaa cgatgtaacc 9840 tttacttact cacacttcgc tgtacctcaa gcgaaaggaa acaatgtcgt gattacaagc 9900 tatatgacaa acagaggatt ctacgcagac aaacaatcaa cgtttgcgcc aagcttcctg 9960 ctgaacatca aaggcaagaa aacatctgtt gtcaaagaca gcatccttga acaaggacaa 10020 ttaacagtta acaaataaaa acgcaaaaga aaatgccgat attgactacc ggaagcagtg 10080 tgaccgtgtg cttctcaaat gcctgattca ggctgtctat gtgtgactgt tgagctgtaa 10140 caagttgtct caggtgttca atttcatgtt ctagttgctt tgttttactg gtttcacctg 10200 ttctattagg tgttacatgc tgttcatctg ttacattgtc gatctgttca tggtgaacag 10260 ctttaaatgc accaaaaact cgtaaaagct ctgatgtatc tatctttttt acaccgtttt 10320 catctgtgca tatggacagt tttccctttg atatgtaacg gtgaacagtt gttctacttt 10380 tgtttgttag tcttgatgct tcactgatag atacaagagc cataagaacc tcagatcctt 10440 ccgtatttag ccagtatgtt ctctagtgtg gttcgttgtt tttgcgtgag ccatgagaac 10500 gaaccattga gatcatactt actttgcatg tcactcaaaa attttgcctc aaaactggtg 10560 agctgaattt ttgcagttaa agcatcgtgt agtgtttttc ttagtccgtt atgtaggtag 10620 gaatctgatg taatggttgt tggtattttg tcaccattca tttttatctg gttgttctca 10680 agttcggtta cgagatccat ttgtctatct agttcaactt ggaaaatcaa cgtatcagtc 10740 gggcggcctc gcttatcaac caccaatttc atattgctgt aagtgtttaa atctttactt 10800 attggtttca aaacccattg gttaagcctt ttaaactcat ggtagttatt ttcaagcatt 10860 aacatgaact taaattcatc aaggctaatc tctatatttg ccttgtgagt tttcttttgt 10920 gttagttctt ttaataacca ctcataaatc ctcatagagt atttgttttc aaaagactta 10980 acatgttcca gattatattt tatgaatttt tttaactgga aaagataagg caatatctct 11040 tcactaaaaa ctaattctaa tttttcgctt gagaacttgg catagtttgt ccactggaaa 11100 atctcaaagc ctttaaccaa aggattcctg atttccacag ttctcgtcat cagctctctg 11160 gttgctttag ctaatacacc ataagcattt tccctactga tgttcatcat ctgaacgtat 11220 tggttataag tgaacgatac cgtccgttct ttccttgtag ggttttcaat cgtggggttg 11280 agtagtgcca cacagcataa aattagcttg gtttcatgct ccgttaagtc atagcgacta 11340 atcgctagtt catttgcttt gaaaacaact aattcagaca tacatctcaa ttggtctagg 11400 tgattttaat cactatacca attgagatgg gctagtcaat gataattact agtccttttc 11460 ctttgagttg tgggtatctg taaattctgc tagacctttg ctggaaaact tgtaaattct 11520 gctagaccct ctgtaaattc cgctagacct ttgtgtgttt tttttgttta tattcaagtg 11580 gttataattt atagaataaa gaaagaataa aaaaagataa aaagaataga tcccagccct 11640 gtgtataact cactacttta gtcagttccg cagtattaca aaaggatgtc gcaaacgctg 11700 tttgctcctc tacaaaacag accttaaaac cctaaaggct taagtagcac cctcgcaagc 11760 tcgggcaaat cgctgaatat tccttttgtc tccgaccatc aggcacctga gtcgctgtct 11820 ttttcgtgac attcagttcg ctgcgctcac ggctctggca gtgaatgggg gtaaatggca 11880 ctacaggcgc cttttatgga ttcatgcaag gaaactaccc ataatacaag aaaagcccgt 11940 cacgggcttc tcagggcgtt ttatggcggg tctgctatgt ggtgctatct gactttttgc 12000 tgttcagcag ttcctgccct ctgattttcc agtctgacca cttcggatta tcccgtgaca 12060 ggtcattcag actggctaat gcacccagta aggcagcggt atcatcaaca ggcttacccg 12120 tcttactgtc ggggatcgac gctctccctt atgcgactcc tgca 12164 <210> 94 <211> 918 <212> DNA <213> E. coli <400> 94 atgaacttca gacgcctgaa atacttcgta aaaattgtag atattggtag cctgacccag 60 gctgctgaag tattgcatat cgcacaacca gcgctcagcc agcaggttgc cacactggaa 120 ggtgagttaa atcaacaact tttgatccgt acaaagcggg gcgttacacc aacagacgcc 180 ggaaaaattc tctataccca tgcgcgggcc attttacgtc agtgtgaaca ggcccaactg 240 gcggtgcata acgttggtca ggcattatcg gggcaagtct cgattggctt tgcaccagga 300 accgctgcgt catccatcac catgccctta ttacaggcgg ttcgcgctga atttccggag 360 atcgttatct atcttcatga aaatagtggt gcagtgctta acgaaaaatt gataaatcac 420 caactcgata tggcggtgat ttatgagcat tcccctgtgg ctggtgtatc cagtcaggct 480 ttgctgaaag aagatctttt tctggtagga actcaagatt gcccggggca aagcgttgat 540 gtgaatgcta ttgcgcaaat gaacctcttt ctccccagtg attacagtgc tattagactt 600 cgtgttgatg aggctttttc cctacggcga ctcacggcaa aagttattgg tgaaattgag 660 tctattgcca cgcttaccgc agcgattgcc agcggcatgg gcgttgcagt attacccgaa 720 tcggccgcgc gttcgttatg tggcgcagta aatgggtgga tgtcacgcat taccactcct 780 tccatgagtc tctctttgtc attaaattta cccgccagag cgaacttatc gccacaggca 840 caggcagtga aagagttgtt aatgtcagtg attagttctc cagtgatgga aaaaaggcag 900 tggcaattgg tgagctaa 918 <210> 95 <211> 20 <212> DNA <213> E. coli <400> 95 tatgcaatac ttcagcagcc 20 <210> 96 <211> 23 <212> DNA <213> E. coli <400> 96 tatgcaatac ttcagcagcc tgg 23 <210> 97 <211> 20 <212> DNA <213> E. coli <400> 97 acaaccagcg ctcagccagc 20 <210> 98 <211> 23 <212> DNA <213> E. coli <400> 98 acaaccagcg ctcagccagc agg 23 <210> 99 <211> 56 <212> DNA <213> N25 phage <400> 99 aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattca 56 <210> 100 <211> 247 <212> DNA <213> Artificial sequence <220> <223> synthesized nac target site 1 gRNA expression cassette <400> 100 aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcatatg 60 caatacttca gcagccgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 120 atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 180 ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 240 tgagaat 247 <210> 101 <211> 247 <212> DNA <213> Artificial sequence <220> <223> synthesized nac target site 2 gRNA expression cassette <400> 101 aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcaacaa 60 ccagcgctca gccagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 120 atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 180 ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 240 tgagaat 247 <210> 102 <211> 500 <212> DNA <213> E. coli <400> 102 gaagttcatg ttgcctccgg tttttaagaa tcggcccaag tgccgccatt acttacaacc 60 agattgcaag atgcttgcca gttttatttt ggtgttgatg tacaagctaa ccaactgtca 120 aataagagat tatgatagat tcgtcatttg ctcctttaat cagctgtcgc gttcccctgc 180 cctataaaag gagggtatgc accacgatgg ttcattaccc aataagattg aaagctcacc 240 actttgttga aattgacagc aaacaaacaa aaaaatgcat ttcacccttt gacatcacca 300 tgcactgcca ttaatatgcg ccccgttcac acgattcctc tgtagttcag tcggtagaac 360 ggcggactgt taatccgtat gtcactggtt cgagtccagt cagaggagcc aaattcaaaa 420 aagcctgctt tctagcaggc tttttgcttt ctaattacca acgctcttaa aacatctgtc 480 ttgaaccaga actaatttgc 500 <210> 103 <211> 500 <212> DNA <213> E. coli <400> 103 cgtcccctgg attagctcga gccgaacctc cgggaaaagt tcgcgaaaag ctttaatgac 60 ctctggcaag ctataacgtg cctgagtatg cgtcgttgca atagtgagaa cgccagacgt 120 atcgttggta aacaggtctg caagccgacg aacattactg gcttcattca gaatacgttc 180 tgcaatgacc agtaatgctt tgcccggttc agtcatgccc agcagtcgct tacctcgtcg 240 aacaaatatt tcgatgccaa gttcatcctc cagttcccga atatgacggc tgacgcctga 300 ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg taatcctgac gtgcagcctc 360 gcggattatc tttagttgtt ggaaattcac ggtaaactcc gggcagttca gatttcccgt 420 tattgttaaa gtctaatgcc cggcataaca aataataaaa acccgcatct tattccatcc 480 cgatataaca cttagctcac 500 <210> 104 <211> 1000 <212> DNA <213> Artificial sequence <220> <223> synthesized nac deletion editing template <400> 104 cgtcccctgg attagctcga gccgaacctc cgggaaaagt tcgcgaaaag ctttaatgac 60 ctctggcaag ctataacgtg cctgagtatg cgtcgttgca atagtgagaa cgccagacgt 120 atcgttggta aacaggtctg caagccgacg aacattactg gcttcattca gaatacgttc 180 tgcaatgacc agtaatgctt tgcccggttc agtcatgccc agcagtcgct tacctcgtcg 240 aacaaatatt tcgatgccaa gttcatcctc cagttcccga atatgacggc tgacgcctga 300 ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg taatcctgac gtgcagcctc 360 gcggattatc tttagttgtt ggaaattcac ggtaaactcc gggcagttca gatttcccgt 420 tattgttaaa gtctaatgcc cggcataaca aataataaaa acccgcatct tattccatcc 480 cgatataaca cttagctcac gaagttcatg ttgcctccgg tttttaagaa tcggcccaag 540 tgccgccatt acttacaacc agattgcaag atgcttgcca gttttatttt ggtgttgatg 600 tacaagctaa ccaactgtca aataagagat tatgatagat tcgtcatttg ctcctttaat 660 cagctgtcgc gttcccctgc cctataaaag gagggtatgc accacgatgg ttcattaccc 720 aataagattg aaagctcacc actttgttga aattgacagc aaacaaacaa aaaaatgcat 780 ttcacccttt gacatcacca tgcactgcca ttaatatgcg ccccgttcac acgattcctc 840 tgtagttcag tcggtagaac ggcggactgt taatccgtat gtcactggtt cgagtccagt 900 cagaggagcc aaattcaaaa aagcctgctt tctagcaggc tttttgcttt ctaattacca 960 acgctcttaa aacatctgtc ttgaaccaga actaatttgc 1000 <210> 105 <211> 20 <212> DNA <213> Artificial sequence <220> <223> 5' pRF97 or pRF861 identity fragment <400> 105 cgaatcagac aattgacggc 20 <210> 106 <211> 21 <212> DNA <213> Artificial sequence <220> <223> 3' pRF97 or pRF861 identity fragment <400> 106 gcttccggta gtcaataaac c 21 <210> 107 <211> 1288 <212> DNA <213> artificial sequence <220> <223> nacETsite1 <400> 107 cgaatcagac aattgacggc cgtcccctgg attagctcga gccgaacctc cgggaaaagt 60 tcgcgaaaag ctttaatgac ctctggcaag ctataacgtg cctgagtatg cgtcgttgca 120 atagtgagaa cgccagacgt atcgttggta aacaggtctg caagccgacg aacattactg 180 gcttcattca gaatacgttc tgcaatgacc agtaatgctt tgcccggttc agtcatgccc 240 agcagtcgct tacctcgtcg aacaaatatt tcgatgccaa gttcatcctc cagttcccga 300 atatgacggc tgacgcctga ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg 360 taatcctgac gtgcagcctc gcggattatc tttagttgtt ggaaattcac ggtaaactcc 420 gggcagttca gatttcccgt tattgttaaa gtctaatgcc cggcataaca aataataaaa 480 acccgcatct tattccatcc cgatataaca cttagctcac gaagttcatg ttgcctccgg 540 tttttaagaa tcggcccaag tgccgccatt acttacaacc agattgcaag atgcttgcca 600 gttttatttt ggtgttgatg tacaagctaa ccaactgtca aataagagat tatgatagat 660 tcgtcatttg ctcctttaat cagctgtcgc gttcccctgc cctataaaag gagggtatgc 720 accacgatgg ttcattaccc aataagattg aaagctcacc actttgttga aattgacagc 780 aaacaaacaa aaaaatgcat ttcacccttt gacatcacca tgcactgcca ttaatatgcg 840 ccccgttcac acgattcctc tgtagttcag tcggtagaac ggcggactgt taatccgtat 900 gtcactggtt cgagtccagt cagaggagcc aaattcaaaa aagcctgctt tctagcaggc 960 tttttgcttt ctaattacca acgctcttaa aacatctgtc ttgaaccaga actaatttgc 1020 aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcatatg 1080 caatacttca gcagccgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1140 atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 1200 ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 1260 tgagaatggt ttattgacta ccggaagc 1288 <210> 108 <211> 1288 <212> DNA <213> artificial sequence <220> <223> nacETsite2 <400> 108 cgaatcagac aattgacggc cgtcccctgg attagctcga gccgaacctc cgggaaaagt 60 tcgcgaaaag ctttaatgac ctctggcaag ctataacgtg cctgagtatg cgtcgttgca 120 atagtgagaa cgccagacgt atcgttggta aacaggtctg caagccgacg aacattactg 180 gcttcattca gaatacgttc tgcaatgacc agtaatgctt tgcccggttc agtcatgccc 240 agcagtcgct tacctcgtcg aacaaatatt tcgatgccaa gttcatcctc cagttcccga 300 atatgacggc tgacgcctga ctgtgaggta aaaagcatat tcgcaacctc tgtcaggttg 360 taatcctgac gtgcagcctc gcggattatc tttagttgtt ggaaattcac ggtaaactcc 420 gggcagttca gatttcccgt tattgttaaa gtctaatgcc cggcataaca aataataaaa 480 acccgcatct tattccatcc cgatataaca cttagctcac gaagttcatg ttgcctccgg 540 tttttaagaa tcggcccaag tgccgccatt acttacaacc agattgcaag atgcttgcca 600 gttttatttt ggtgttgatg tacaagctaa ccaactgtca aataagagat tatgatagat 660 tcgtcatttg ctcctttaat cagctgtcgc gttcccctgc cctataaaag gagggtatgc 720 accacgatgg ttcattaccc aataagattg aaagctcacc actttgttga aattgacagc 780 aaacaaacaa aaaaatgcat ttcacccttt gacatcacca tgcactgcca ttaatatgcg 840 ccccgttcac acgattcctc tgtagttcag tcggtagaac ggcggactgt taatccgtat 900 gtcactggtt cgagtccagt cagaggagcc aaattcaaaa aagcctgctt tctagcaggc 960 tttttgcttt ctaattacca acgctcttaa aacatctgtc ttgaaccaga actaatttgc 1020 aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcaacaa 1080 ccagcgctca gccagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1140 atcaacttga aaaagtggca ccgagtcggt gcgactcctg ttgatagatc cagtaatgac 1200 ctcagaactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttattgg 1260 tgagaatggt ttattgacta ccggaagc 1288 <210> 109 <211> 9322 <212> DNA <213> Artificial sequence <220> <223> pRF97-cassette <400> 109 ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctc aggctgtcta 60 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 120 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 180 cgatctgttc atggtgaaca gctttaaatg caccaaaaac tcgtaaaagc tctgatgtat 240 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatctaac 300 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 360 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 420 ttttgcgtga gccatgagaa cgaaccattg agatcatgct tactttgcat gtcactcaaa 480 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 540 cttagtccgt tacgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 600 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 660 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 720 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 780 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 840 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 900 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 960 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 1020 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 1080 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 1140 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 1200 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 1260 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 1320 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 1380 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 1440 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 1500 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 1560 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 1620 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 1680 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 1740 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 1800 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 1860 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 1920 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 1980 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 2040 tatcatcaac aggcttaccc gtcttactgt cggatcgacg ctctccctta tgcgactcct 2100 gcatcccttt cgtcttcgaa taaatacctg tgacggaaga tcacttcgca gaataaataa 2160 atcctggtgt ccctgttgat accgggaagc cctgggccaa cttttggcga aaatgagacg 2220 ttgatcggca cgtaagaggt tccaactttc accataatga aataagatca ctaccgggcg 2280 tattttttga gttatcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca 2340 ctggatatac caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc 2400 agtcagttgc tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa 2460 agaccgtaaa gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc 2520 tgatgaatgc tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg 2580 atagtgttca cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct 2640 ggagtgaata ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt 2700 gttacggtga aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct 2760 cagccaatcc ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact 2820 tcttcgcccc cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc 2880 cgctggcgat tcaggttcat catgccgttt gtgatggctt ccatgtcggc agaatgctta 2940 atgaattaca acagtactgc gatgagtggc agggcggggc gtaatttttt taaggcagtt 3000 attggtgccc ttaaacgcct ggtgctacgc ctgaataagt gataataagc ggatgaatgg 3060 cagaaattcg aaagcaaatt cgacccggtc gtcggttcag ggcagggtcg ttaaatagcc 3120 gcttatgtct attgctggtt tatcggtacc ccccaactga tcttcagcat cttttacttt 3180 caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 3240 ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 3300 tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaaa 3360 gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta atttgatgcc 3420 tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc gcaacgttca 3480 aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa caacagataa 3540 aacgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 3600 actctcgcat ggggagaccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 3660 ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaattctg ttttatcaga 3720 ccgcttctgc gttctgattt aatctgtatc aggctgaaaa tcttctctca tccgccaaaa 3780 cagccaagct tagcggccgc ttagaccttt cgctttttct tgggatcggc tctggagtcg 3840 ccaccaagct gagacaggtc gattcgggtc tcgtacaggc cagtgatgga ctggtgaatc 3900 agggtggcat cgagaacctc cttggtggat gtgtaccgct ttcggtcgat agtggtatcg 3960 aagtacttga aagctgcagg agcacccagg ttggtaagag taaacaggtg aatgatgttc 4020 tccgcctgtt ctcgaatggg tttgtcccga tgcttgttgt aggcagagag caccttgtcc 4080 aagttggcat cagccaggat gactcgcttc gaaaactcgg aaatctgctc gataatctcg 4140 tcgaggtaat gtttgtgctg ctcaacgaag agttgcttct gttcgttgtc ctcgggagaa 4200 cccttgagct tctcgtagtg agaagccaga tagagaaagt tgacgtactt cgaaggcaag 4260 gcaagctcgt ttcccttctg cagctcgcca gcggaggcga gcatacgctt tcgaccgttc 4320 tccagttcga acagagagta cttgggcagc ttgataatga ggtctttctt gacctccttg 4380 taacccttgg cttccaagaa gtcgatggga ttcttctcga agctcgatcg ctccatgatg 4440 gtaattccga gcagctcctt gacggacttg agctttttgg acttgccctt ctcgaccttc 4500 gcaacgacaa gcacggaata ggcgacggta ggagaatcga agccaccgta tttcttggga 4560 tcccagtctt tctttcgagc gatgagcttg tcggagtttc gcttgggcag aatcgactcc 4620 ttggagaatc cgccagtctg aacctcggtt ttcttgacga tgttgacctg aggcatcgac 4680 agaacctttc gcacggttgc aaagtctcga cccttgtccc acacgatctc tccagtttcg 4740 ccgttggtct cgataagtgg tctctttcga atctctccgt tggccaaggt gatctcggtc 4800 ttgaaaaagt tcatgatgtt ggagtaaaag aagtacttgg cagtagcctt gccaatctcc 4860 tgttcggact tggcaatcat ctttcgaacg tcgtagacct tgtaatcgcc gtaaacgaac 4920 tcgctttcga gcttggggta tttcttgatg agcgcagtgc caacgacggc gttgaggtaa 4980 gcatcgtggg catggtggta attgttgatc tctcgcacct tgtagaactg aaagtccttt 5040 cggaaatcgg agaccagttt ggacttgaga gtaatcacct tgacctctcg gatgagcttg 5100 tcgttctcgt cgtacttggt gttcatccga gaatcgagaa tctgtgcgac gtgctttgtg 5160 atctgtctgg tctcgacgag ttgacgcttg atgaagccag ccttgtcgag ctcggacaga 5220 ccgcctcgct cggccttggt aagattgtcg aactttcgct gggtaatgag cttggcgttg 5280 agcagctgtc gccagtagtt cttcatcttt ttgaccacct cttcgctggg aacgttgtcc 5340 gacttgcctc tgttcttgtc ggatcgtgta aggaccttgt tgtcgataga atcgtccttg 5400 agaaaggatt gagggacaat gtggtccaca tcgtagtcgc tgagacgatt gatgtccagt 5460 tcctgatcca cgtacatgtc tcgaccattc tgcagatagt agagatacag cttctcgttc 5520 tgcagttgag tgttctcgac gggatgctcc ttgagaatct gggatcccag ctccttgatg 5580 ccttcctcga ttcgcttcat ccgctctcgc gagtttttct gacccttttg agttgtctgg 5640 ttctctctgg ccatctcgat cacaatgttc tcgggcttgt gacgtcccat gaccttcacc 5700 agctcgtcga caaccttgac agtctggaga atgcctttct tgatggctgg cgaaccagcc 5760 aggttggcaa tatgttcgtg caagctgtcg ccctgaccgg acacttgtgc cttctggatg 5820 tcctccttga aggtaagaga atcgtcgtga atgagctgca tgaagtttcg gttggcaaag 5880 ccatcggact tgagaaagtc cagaatggtc tttccggact gcttgtctct gatgccgttg 5940 atgagctttc gcgaaagtct tccccagccg gtgtatctac gtcgcttgag ttgtttcatg 6000 accttgtcgt cgaacaggtg agcgtatgtc ttgagtcgtt cctcgatcat ctcccgatct 6060 tcgaacaggg taagagtgag cacgatgtcc tccagaatgt cctcgttttc ctcgttgtcg 6120 agaaaatcct tgtccttgat aatcttgagc agatcgtgat aggtgcccaa agaggcgttg 6180 aatcggtcct caactccgga aatctcgacg ctgtcgaaac actcgatttt cttgaagtag 6240 tcctccttga gctgcttaac agtgaccttt cggttggtct tgaacaggag atcgacaatg 6300 gctttcttct gttcgccaga caagaaggca ggctttcgca ttccctcggt aacgtacttg 6360 actttggtga gttcgttgta gactgtaaag tactcgtaga gcagcgaatg cttgggaaga 6420 accttctcgt tgggcagatt cttgtcgaag ttggtcattc gctcgatgaa ggactgtgca 6480 gaggcaccct tgtccacgac ttcctcgaag ttccagggag tgatggtttc ctcggacttt 6540 cgagtcatcc aagcaaatcg agagtttcct ctggcaagag gaccaacata gtaggggatt 6600 cgaaaggtaa gaatcttctc gatcttctct cggttgtcct tgagaaaggg gtagaagtct 6660 tcctgacgtc gaagaatggc gtgcagctca ccgaggtgga tctgatgagg aatgctgccg 6720 ttgtcgaagg ttcgttgctt ccgaagcaga tcctctcgat tgagcttgac aagcagttcc 6780 tcggttccgt ccatcttctc gagaattggc ttgatgaact tgtagaactc ttcctgagag 6840 gctccgccgt cgatgtatcc agcgtagccg ttcttcgact gatcgaaaaa gatctccttg 6900 tacttctcgg gcagttgctg tcggacaaga gccttgagca gtgtgagatc ctgatggtgc 6960 tcgtcgtatc gcttgatcat ggaggcagaa aggggagcct ttgtgatctc ggtgttgact 7020 cgcagaatgt cagacaagag aatagcatcc gaaaggttct tggcagcgag aaacaggtcg 7080 gcgtactgat cgccaatctg tgcaagcagg ttgtcgaggt catcgtcgta ggtgtccttg 7140 gacagctgga gcttggcgtc ctccgccaga tcgaagttgg acttgaagtt gggtgtgaga 7200 ccaagagaaa gggcaatgag gttgccaaac agtccgttct ttttctcgcc aggaagttgg 7260 gcaatgaggt tctccagtcg tctgctcttc gagagtcgag cagacaagat ggcctttgca 7320 tcgactccgg aggcattgat ggggttttcc tcgaacagct ggttgtaggt ctgaacgagc 7380 tgaatgaaca gcttgtccac atcgctgttg tcgggattga gatcgccctc gatgaggaaa 7440 tgacctcgaa acttgatcat gtgtgccaga gcgaggtaga taagtctgag atccgccttg 7500 tcggtggaat cgacgagttt ctttcgcagg tggtagatgg taggatactt ctcgtggtaa 7560 gcaacctcgt ccacaatgtt gccaaagatg ggatgacgct cgtgtttctt gtcttcctcg 7620 acgaggaagg attcctccag tcgatgaaag aacgaatcgt ccaccttggc catctcgttg 7680 gaaaagatct cctgcaggta gcagattcgg ttcttccgtc gggtgtaacg tcgccgagca 7740 gttcgcttga gtctggtagc ttcggcagtc tcgccagaat cgaacaacag ggcaccaatg 7800 aggtttttct tgatggagtg tcgatcggtg tttccgagga ccttgaattt cttggagggc 7860 accttgtact cgtcggtgat gacagcccag ccgacagagt tggttccaat gtccaggccg 7920 atggagtatt tcttgtcgaa ttcccatatg gtaccagctg cagatctcga gctcggatcc 7980 ttatcgtcat cgtcgtacag atcccgaccc atttgctgtc caccagtcat gctagccata 8040 ccatgatgat gatgatgatg agaacccccc atggttaatt cctcctgtta gcccaaaaaa 8100 cgggtatgga gaaacagtag agagttgcga taaaaagcgt caggtaggat ccgctaatct 8160 tatggataaa aatgctatgg catagcaaag tgtgacgccg tgcaaataat caatgtggac 8220 ttttctgccg tgattataga cacttttgtt acgcgttttt gtcatggctt tggtcccgct 8280 ttgttacaga atgcttttaa taagcggggt taccggtttg gttagcgaga agagccagta 8340 aaagacgcag tgacggcaat gtctgatgca atatggacaa ttggtttctt ctctgaatgg 8400 cgggagtatg aaaagtatgg ctgaagcgca aaatgatccc ctgctgccgg gatactcgtt 8460 taatgcccat ctggtggcgg gtttaacgcc gattgaggcc aacggttatc tcgatttttt 8520 tatcgaccga ccgctgggaa tgaaaggtta tattctcaat ctcaccattc gcggtcaggg 8580 ggtggtgaaa aatcagggac gagaatttgt ttgccgaccg ggtgatattt tgctgttccc 8640 gccaggagag attcatcact acggtcgtca tccggaggct cgcgaatggt atcaccagtg 8700 ggtttacttt cgtccgcgcg cctactggca tgaatggctt aactggccgt caatatttgc 8760 caatacgggg ttctttcgcc cggatgaagc gcaccagccg catttcagcg acctgtttgg 8820 gcaaatcatt aacgccgggc aaggggaagg gcgctattcg gagctgctgg cgataaatct 8880 gcttgagcaa ttgttactgc ggcgcatgga agcgattaac gagtcgctcc atccaccgat 8940 ggataatcgg gtacgcgagg cttgtcagta catcagcgat cacctggcag acagcaattt 9000 tgatatcgcc agcgtcgcac agcatgtttg cttgtcgccg tcgcgtctgt cacatctttt 9060 ccgccagcag ttagggatta gcgtcttaag ctggcgcgag gaccaacgta tcagccaggc 9120 gaagctgctt ttgagcacca cccggatgcc tatcgccacc gtcggtcgca atgttggttt 9180 tgacgatcaa ctctatttct cgcgggtatt taaaaaatgc accggggcca gcccgagcga 9240 gttccgtgcc ggttgtgaag aaaaagtgaa tgatgtagcc gtcaagttgt cataattggt 9300 aacgaatcag acaattgacg gc 9322 <210> 110 <211> 9322 <212> DNA <213> Artificial sequence <220> <223> pRF861-cassette <400> 110 ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctc aggctgtcta 60 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 120 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 180 cgatctgttc atggtgaaca gctttaaatg caccaaaaac tcgtaaaagc tctgatgtat 240 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatctaac 300 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 360 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 420 ttttgcgtga gccatgagaa cgaaccattg agatcatgct tactttgcat gtcactcaaa 480 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 540 cttagtccgt tacgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 600 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 660 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 720 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 780 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 840 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 900 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 960 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 1020 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 1080 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 1140 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 1200 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 1260 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 1320 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 1380 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 1440 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 1500 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 1560 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 1620 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 1680 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 1740 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 1800 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 1860 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 1920 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 1980 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 2040 tatcatcaac aggcttaccc gtcttactgt cggatcgacg ctctccctta tgcgactcct 2100 gcatcccttt cgtcttcgaa taaatacctg tgacggaaga tcacttcgca gaataaataa 2160 atcctggtgt ccctgttgat accgggaagc cctgggccaa cttttggcga aaatgagacg 2220 ttgatcggca cgtaagaggt tccaactttc accataatga aataagatca ctaccgggcg 2280 tattttttga gttatcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca 2340 ctggatatac caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc 2400 agtcagttgc tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa 2460 agaccgtaaa gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc 2520 tgatgaatgc tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg 2580 atagtgttca cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct 2640 ggagtgaata ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt 2700 gttacggtga aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct 2760 cagccaatcc ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact 2820 tcttcgcccc cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc 2880 cgctggcgat tcaggttcat catgccgttt gtgatggctt ccatgtcggc agaatgctta 2940 atgaattaca acagtactgc gatgagtggc agggcggggc gtaatttttt taaggcagtt 3000 attggtgccc ttaaacgcct ggtgctacgc ctgaataagt gataataagc ggatgaatgg 3060 cagaaattcg aaagcaaatt cgacccggtc gtcggttcag ggcagggtcg ttaaatagcc 3120 gcttatgtct attgctggtt tatcggtacc ccccaactga tcttcagcat cttttacttt 3180 caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 3240 ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 3300 tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaaa 3360 gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta atttgatgcc 3420 tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc gcaacgttca 3480 aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa caacagataa 3540 aacgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 3600 actctcgcat ggggagaccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 3660 ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaattctg ttttatcaga 3720 ccgcttctgc gttctgattt aatctgtatc aggctgaaaa tcttctctca tccgccaaaa 3780 cagccaagct tagcggccgc ttagaccttt cgctttttct tgggatcggc tctggagtcg 3840 ccaccaagct gagacaggtc gattcgggtc tcgtacaggc cagtgatgga ctggtgaatc 3900 agggtggcat cgagaacctc cttggtggat gtgtaccgct ttcggtcgat agtggtatcg 3960 aagtacttga aagctgcagg agcacccagg ttggtaagag taaacaggtg aatgatgttc 4020 tccgcctgtt ctcgaatggg tttgtcccga tgcttgttgt aggcagagag caccttgtcc 4080 aagttggcat cagccaggat gactcgcttc gaaaactcgg aaatctgctc gataatctcg 4140 tcgaggtaat gtttgtgctg ctcaacgaag agttgcttct gttcgttgtc ctcgggagaa 4200 cccttgagct tctcgtagtg agaagccaga tagagaaagt tgacgtactt cgaaggcaag 4260 gcaagctcgt ttcccttctg cagctcgcca gcggaggcga gcatacgctt tcgaccgttc 4320 tccagttcga acagagagta cttgggcagc ttgataatga ggtctttctt gacctccttg 4380 taacccttgg cttccaagaa gtcgatggga ttcttctcga agctcgatcg ctccatgatg 4440 gtaattccga gcagctcctt gacggacttg agctttttgg acttgccctt ctcgaccttc 4500 gcaacgacaa gcacggaata ggcgacggta ggagaatcga agccaccgta tttcttggga 4560 tcccagtctt tctttcgagc gatgagcttg tcggagtttc gcttgggcag aatcgactcc 4620 ttggagaatc cgccagtctg aacctcggtt ttcttgacga tgttgacctg aggcatcgac 4680 agaacctttc gcacggttgc aaagtctcga cccttgtccc acacgatctc tccagtttcg 4740 ccgttggtct cgataagtgg tctctttcga atctctccgt tggccaaggt gatctcggtc 4800 ttgaaaaagt tcatgatgtt ggagtaaaag aagtacttgg cagtagcctt gccaatctcc 4860 tgttcggact tggcaatcat ctttcgaacg tcgtagacct tgtaatcgcc gtaaacgaac 4920 tcgctttcga gcttggggta tttcttgatg agcgcagtgc caacgacggc gttgaggtaa 4980 gcatcgtggg catggtggta attgttgatc tctcgcacct tgtagaactg aaagtccttt 5040 cggaaatcgg agaccagttt ggacttgaga gtaatcacct tgacctctcg gatgagcttg 5100 tcgttctcgt cgtacttggt gttcatccga gaatcgagaa tctgtgcgac gtgctttgtg 5160 atctgtctgg tctcgacgag ttgacgcttg atgaagccag ccttgtcgag ctcggacaga 5220 ccgcctcgct cggccttggt aagattgtcg aactttcgct gggtaatgag cttggcgttg 5280 agcagctgtc gccagtagtt cttcatcttt ttgaccacct cttcgctggg aacgttgtcc 5340 gacttgcctc tgttcttgtc ggatcgtgta aggaccttgt tgtcgataga atcgtccttg 5400 agaaaggatt gagggacaat gtggtccaca tcgtagtcgc tgagacgatt gatgtccagt 5460 tcctgatcca cgtacatgtc tcgaccattc tgcagatagt agagatacag cttctcgttc 5520 tgcagttgag tgttctcgac gggatgctcc ttgagaatct gggatcccag ctccttgatg 5580 ccttcctcga ttcgcttcat ccgctctcgc gagtttttct gacccttttg agttgtctgg 5640 ttctctctgg ccatctcgat cacaatgttc tcgggcttgt gacgtcccat gaccttcacc 5700 agctcgtcga caaccttgac agtctggaga atgcctttct tgatggctgg cgaaccagcc 5760 aggttggcaa tatgttcgtg caagctgtcg ccctgaccgg acacttgtgc cttctggatg 5820 tcctccttga aggtaagaga atcgtcgtga atgagctgca tgaagtttcg gttggcaaag 5880 ccatcggact tgagaaagtc cagaatggtc tttccggact gcttgtctct gatgccgttg 5940 atgagctttc gcgaaagtct tccccagccg gtgtatctac gtcgcttgag ttgtttcatg 6000 accttgtcgt cgaacaggtg agcgtatgtc ttgagtcgtt cctcgatcat ctcccgatct 6060 tcgaacaggg taagagtgag cacgatgtcc tccagaatgt cctcgttttc ctcgttgtcg 6120 agaaaatcct tgtccttgat aatcttgagc agatcgtgat aggtgcccaa agaggcgttg 6180 aatcggtcct caactccgga aatctcgacg ctgtcgaaac actcgatttt cttgaagtag 6240 tcctccttga gctgcttaac agtgaccttt cggttggtct tgaacaggag atcgacaatg 6300 gctttcttct gttcgccaga caagaaggca ggctttcgca ttccctcggt aacgtacttg 6360 actttggtga gttcgttgta gactgtaaag tactcgtaga gcagcgaatg cttgggaaga 6420 accttctcgt tgggcagatt cttgtcgaag ttggtcattc gctcgatgaa ggactgtgca 6480 gaggcaccct tgtccacgac ttcctcgaag ttccagggag tgatggtttc ctcggacttt 6540 cgagtcatcc aagcaaatcg agagtttcct ctggcaagag gaccaacata gtaggggatt 6600 cgaaaggtaa gaatcttctc gatcttctct cggttgtcct tgagaaaggg gtagaagtct 6660 tcctgacgtc gaagaatggc gtgcagctca ccgaggtgga tctgatgagg aatgctgccg 6720 ttgtcgaagg ttcgttgctt ccgaagcaga tcctctcgat tgagcttgac aagcagttcc 6780 tcggttccgt ccatcttctc gagaattggc ttgatgaact tgtagaactc ttcctgagag 6840 gctccgccgt cgatgtatcc agcgtagccg ttcttcgact gatcgaaaaa gatctccttg 6900 tacttctcgg gcagttgctg tcggacaaga gccttgagca gtgtgagatc ctgatggtgc 6960 tcgtcgtatc gcttgatcat ggaggcagaa aggggagcct ttgtgatctc ggtgttgact 7020 cgcagaatgt cagacaagag aatagcatcc gaaaggttct tggcagcgag aaacaggtcg 7080 gcgtactgat cgccaatctg tgcaagcagg ttgtcgaggt catcgtcgta ggtgtccttg 7140 gacagctgga gcttggcgtc ctccgccaga tcgaagttgg acttgaagtt gggtgtgaga 7200 ccaagagaaa gggcaatgag gttgccaaac agtccgttct ttttctcgcc aggaagttgg 7260 gcaatgaggt tctccagtcg tctgctcttc gagagtcgag cagacaagat ggcctttgca 7320 tcgactccgg aggcattgat ggggttttcc tcgaacagct ggttgtaggt ctgaacgagc 7380 tgaatgaaca gcttgtccac atcgctgttg tcgggattga gatcgccctc gatgaggaaa 7440 tgacctcgaa acttgatcat gtgtgccaga gcgagatgga taagtctgag atccgccttg 7500 tcggtggaat cgacgagttt ctttcgcagg tggtagatgg taggatactt ctcgtggtaa 7560 gcaacctcgt ccacaatgtt gccaaagatg ggatgacgct cgtgtttctt gtcttcctcg 7620 acgaggaagg attcctccag tcgatgaaag aacgaatcgt ccaccttggc catctcgttg 7680 gaaaagatct cctgcaggta gcagattcgg ttcttccgtc gggtgtaacg tcgccgagca 7740 gttcgcttga gtctggtagc ttcggcagtc tcgccagaat cgaacaacag ggcaccaatg 7800 aggtttttct tgatggagtg tcgatcggtg tttccgagga ccttgaattt cttggagggc 7860 accttgtact cgtcggtgat gacagcccag ccgacagagt tggttccaat gtccaggccg 7920 atggagtatt tcttgtcgaa ttcccatatg gtaccagctg cagatctcga gctcggatcc 7980 ttatcgtcat cgtcgtacag atcccgaccc atttgctgtc caccagtcat gctagccata 8040 ccatgatgat gatgatgatg agaacccccc atggttaatt cctcctgtta gcccaaaaaa 8100 cgggtatgga gaaacagtag agagttgcga taaaaagcgt caggtaggat ccgctaatct 8160 tatggataaa aatgctatgg catagcaaag tgtgacgccg tgcaaataat caatgtggac 8220 ttttctgccg tgattataga cacttttgtt acgcgttttt gtcatggctt tggtcccgct 8280 ttgttacaga atgcttttaa taagcggggt taccggtttg gttagcgaga agagccagta 8340 aaagacgcag tgacggcaat gtctgatgca atatggacaa ttggtttctt ctctgaatgg 8400 cgggagtatg aaaagtatgg ctgaagcgca aaatgatccc ctgctgccgg gatactcgtt 8460 taatgcccat ctggtggcgg gtttaacgcc gattgaggcc aacggttatc tcgatttttt 8520 tatcgaccga ccgctgggaa tgaaaggtta tattctcaat ctcaccattc gcggtcaggg 8580 ggtggtgaaa aatcagggac gagaatttgt ttgccgaccg ggtgatattt tgctgttccc 8640 gccaggagag attcatcact acggtcgtca tccggaggct cgcgaatggt atcaccagtg 8700 ggtttacttt cgtccgcgcg cctactggca tgaatggctt aactggccgt caatatttgc 8760 caatacgggg ttctttcgcc cggatgaagc gcaccagccg catttcagcg acctgtttgg 8820 gcaaatcatt aacgccgggc aaggggaagg gcgctattcg gagctgctgg cgataaatct 8880 gcttgagcaa ttgttactgc ggcgcatgga agcgattaac gagtcgctcc atccaccgat 8940 ggataatcgg gtacgcgagg cttgtcagta catcagcgat cacctggcag acagcaattt 9000 tgatatcgcc agcgtcgcac agcatgtttg cttgtcgccg tcgcgtctgt cacatctttt 9060 ccgccagcag ttagggatta gcgtcttaag ctggcgcgag gaccaacgta tcagccaggc 9120 gaagctgctt ttgagcacca cccggatgcc tatcgccacc gtcggtcgca atgttggttt 9180 tgacgatcaa ctctatttct cgcgggtatt taaaaaatgc accggggcca gcccgagcga 9240 gttccgtgcc ggttgtgaag aaaaagtgaa tgatgtagcc gtcaagttgt cataattggt 9300 aacgaatcag acaattgacg gc 9322 <210> 111 <211> 21 <212> DNA <213> Artificial sequence <220> <223> primer <400> 111 ggtttattga ctaccggaag c 21 <210> 112 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer <400> 112 gccgtcaatt gtctgattcg 20 <210> 113 <211> 10569 <212> DNA <213> Artificial sequence <220> <223> pRF97-nacETsite1 plasmid <400> 113 ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60 tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120 tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180 ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240 atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300 agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360 cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420 gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480 tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540 tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600 cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660 caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720 cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780 ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840 attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900 gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960 aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020 atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260 ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320 agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380 cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440 aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500 tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560 tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620 ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680 caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740 caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800 tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860 acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920 cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980 tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040 ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100 tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160 gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220 gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280 ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340 ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400 cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460 agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520 agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580 cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640 tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700 aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760 cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820 tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880 cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940 aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000 tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060 gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120 ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180 gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240 tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300 aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360 gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420 gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480 cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540 ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600 cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660 tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720 ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780 cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840 gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900 tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960 acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020 aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080 ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140 ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200 tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260 tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320 tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380 cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440 tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500 aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560 gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620 cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680 ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740 cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800 tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860 cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920 gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980 actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040 gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100 gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160 tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220 ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280 tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340 ctcgaaactt gatcatgtgt gccagagcga ggtagataag tctgagatcc gccttgtcgg 5400 tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460 cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520 ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580 agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640 gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700 ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760 tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820 agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880 cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940 gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000 tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060 gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120 ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180 tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240 acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300 agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360 gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420 gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480 gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540 ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600 tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660 acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720 atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780 gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840 aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900 atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960 cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020 ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080 gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140 cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200 aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260 gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320 agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380 ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440 cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500 atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560 atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620 gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680 ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740 tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800 tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860 gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920 cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980 acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040 ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100 cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160 tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220 gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcatatgca 8280 atacttcagc agccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340 caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400 cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460 agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520 gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580 ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640 attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700 tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760 ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820 aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880 gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940 tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000 tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060 cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120 caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180 tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240 actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300 tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360 tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420 actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480 acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540 ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600 tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660 ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720 catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780 cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840 gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900 cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960 gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020 agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080 attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140 aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200 accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260 ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320 ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380 ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440 tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500 agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560 ctcctgcat 10569 <210> 114 <211> 10569 <212> DNA <213> Artificial sequence <220> <223> pRF97-nacETsite2 plasmid <400> 114 ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60 tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120 tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180 ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240 atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300 agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360 cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420 gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480 tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540 tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600 cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660 caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720 cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780 ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840 attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900 gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960 aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020 atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260 ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320 agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380 cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440 aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500 tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560 tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620 ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680 caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740 caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800 tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860 acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920 cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980 tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040 ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100 tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160 gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220 gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280 ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340 ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400 cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460 agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520 agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580 cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640 tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700 aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760 cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820 tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880 cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940 aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000 tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060 gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120 ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180 gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240 tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300 aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360 gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420 gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480 cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540 ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600 cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660 tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720 ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780 cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840 gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900 tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960 acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020 aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080 ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140 ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200 tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260 tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320 tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380 cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440 tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500 aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560 gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620 cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680 ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740 cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800 tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860 cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920 gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980 actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040 gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100 gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160 tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220 ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280 tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340 ctcgaaactt gatcatgtgt gccagagcga ggtagataag tctgagatcc gccttgtcgg 5400 tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460 cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520 ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580 agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640 gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700 ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760 tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820 agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880 cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940 gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000 tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060 gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120 ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180 tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240 acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300 agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360 gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420 gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480 gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540 ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600 tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660 acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720 atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780 gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840 aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900 atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960 cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020 ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080 gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140 cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200 aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260 gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320 agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380 ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440 cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500 atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560 atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620 gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680 ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740 tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800 tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860 gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920 cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980 acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040 ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100 cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160 tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220 gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcaacaacc 8280 agcgctcagc cagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340 caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400 cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460 agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520 gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580 ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640 attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700 tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760 ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820 aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880 gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940 tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000 tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060 cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120 caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180 tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240 actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300 tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360 tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420 actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480 acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540 ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600 tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660 ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720 catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780 cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840 gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900 cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960 gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020 agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080 attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140 aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200 accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260 ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320 ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380 ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440 tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500 agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560 ctcctgcat 10569 <210> 115 <211> 10569 <212> DNA <213> Artificial sequence <220> <223> pRF861-nacETsite1 plasmid <400> 115 ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60 tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120 tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180 ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240 atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300 agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360 cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420 gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480 tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540 tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600 cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660 caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720 cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780 ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840 attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900 gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960 aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020 atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260 ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320 agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380 cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440 aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500 tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560 tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620 ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680 caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740 caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800 tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860 acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920 cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980 tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040 ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100 tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160 gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220 gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280 ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340 ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400 cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460 agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520 agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580 cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640 tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700 aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760 cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820 tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880 cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940 aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000 tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060 gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120 ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180 gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240 tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300 aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360 gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420 gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480 cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540 ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600 cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660 tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720 ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780 cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840 gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900 tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960 acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020 aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080 ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140 ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200 tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260 tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320 tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380 cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440 tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500 aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560 gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620 cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680 ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740 cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800 tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860 cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920 gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980 actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040 gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100 gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160 tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220 ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280 tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340 ctcgaaactt gatcatgtgt gccagagcga gatggataag tctgagatcc gccttgtcgg 5400 tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460 cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520 ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580 agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640 gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700 ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760 tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820 agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880 cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940 gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000 tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060 gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120 ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180 tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240 acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300 agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360 gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420 gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480 gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540 ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600 tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660 acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720 atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780 gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840 aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900 atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960 cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020 ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080 gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140 cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200 aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260 gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320 agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380 ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440 cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500 atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560 atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620 gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680 ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740 tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800 tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860 gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920 cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980 acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040 ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100 cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160 tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220 gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcatatgca 8280 atacttcagc agccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340 caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400 cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460 agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520 gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580 ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640 attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700 tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760 ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820 aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880 gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940 tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000 tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060 cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120 caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180 tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240 actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300 tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360 tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420 actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480 acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540 ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600 tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660 ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720 catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780 cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840 gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900 cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960 gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020 agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080 attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140 aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200 accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260 ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320 ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380 ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440 tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500 agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560 ctcctgcat 10569 <210> 116 <211> 10569 <212> DNA <213> Artificial sequence <220> <223> pRF861-nacETsite2 plasmid <400> 116 ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 60 tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 120 tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 180 ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 240 atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 300 agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 360 cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 420 gaatgctcat ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag 480 tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 540 tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 600 cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 660 caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 720 cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 780 ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 840 attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 900 gtgcccttaa acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga 960 aattcgaaag caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt 1020 atgtctattg ctggtttatc ggtacccccc aactgatctt cagcatcttt tactttcacc 1080 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 1140 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 1200 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 1260 ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 1320 agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 1380 cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 1440 aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 1500 tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 1560 tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 1620 ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 1680 caagcttagc ggccgcttag acctttcgct ttttcttggg atcggctctg gagtcgccac 1740 caagctgaga caggtcgatt cgggtctcgt acaggccagt gatggactgg tgaatcaggg 1800 tggcatcgag aacctccttg gtggatgtgt accgctttcg gtcgatagtg gtatcgaagt 1860 acttgaaagc tgcaggagca cccaggttgg taagagtaaa caggtgaatg atgttctccg 1920 cctgttctcg aatgggtttg tcccgatgct tgttgtaggc agagagcacc ttgtccaagt 1980 tggcatcagc caggatgact cgcttcgaaa actcggaaat ctgctcgata atctcgtcga 2040 ggtaatgttt gtgctgctca acgaagagtt gcttctgttc gttgtcctcg ggagaaccct 2100 tgagcttctc gtagtgagaa gccagataga gaaagttgac gtacttcgaa ggcaaggcaa 2160 gctcgtttcc cttctgcagc tcgccagcgg aggcgagcat acgctttcga ccgttctcca 2220 gttcgaacag agagtacttg ggcagcttga taatgaggtc tttcttgacc tccttgtaac 2280 ccttggcttc caagaagtcg atgggattct tctcgaagct cgatcgctcc atgatggtaa 2340 ttccgagcag ctccttgacg gacttgagct ttttggactt gcccttctcg accttcgcaa 2400 cgacaagcac ggaataggcg acggtaggag aatcgaagcc accgtatttc ttgggatccc 2460 agtctttctt tcgagcgatg agcttgtcgg agtttcgctt gggcagaatc gactccttgg 2520 agaatccgcc agtctgaacc tcggttttct tgacgatgtt gacctgaggc atcgacagaa 2580 cctttcgcac ggttgcaaag tctcgaccct tgtcccacac gatctctcca gtttcgccgt 2640 tggtctcgat aagtggtctc tttcgaatct ctccgttggc caaggtgatc tcggtcttga 2700 aaaagttcat gatgttggag taaaagaagt acttggcagt agccttgcca atctcctgtt 2760 cggacttggc aatcatcttt cgaacgtcgt agaccttgta atcgccgtaa acgaactcgc 2820 tttcgagctt ggggtatttc ttgatgagcg cagtgccaac gacggcgttg aggtaagcat 2880 cgtgggcatg gtggtaattg ttgatctctc gcaccttgta gaactgaaag tcctttcgga 2940 aatcggagac cagtttggac ttgagagtaa tcaccttgac ctctcggatg agcttgtcgt 3000 tctcgtcgta cttggtgttc atccgagaat cgagaatctg tgcgacgtgc tttgtgatct 3060 gtctggtctc gacgagttga cgcttgatga agccagcctt gtcgagctcg gacagaccgc 3120 ctcgctcggc cttggtaaga ttgtcgaact ttcgctgggt aatgagcttg gcgttgagca 3180 gctgtcgcca gtagttcttc atctttttga ccacctcttc gctgggaacg ttgtccgact 3240 tgcctctgtt cttgtcggat cgtgtaagga ccttgttgtc gatagaatcg tccttgagaa 3300 aggattgagg gacaatgtgg tccacatcgt agtcgctgag acgattgatg tccagttcct 3360 gatccacgta catgtctcga ccattctgca gatagtagag atacagcttc tcgttctgca 3420 gttgagtgtt ctcgacggga tgctccttga gaatctggga tcccagctcc ttgatgcctt 3480 cctcgattcg cttcatccgc tctcgcgagt ttttctgacc cttttgagtt gtctggttct 3540 ctctggccat ctcgatcaca atgttctcgg gcttgtgacg tcccatgacc ttcaccagct 3600 cgtcgacaac cttgacagtc tggagaatgc ctttcttgat ggctggcgaa ccagccaggt 3660 tggcaatatg ttcgtgcaag ctgtcgccct gaccggacac ttgtgccttc tggatgtcct 3720 ccttgaaggt aagagaatcg tcgtgaatga gctgcatgaa gtttcggttg gcaaagccat 3780 cggacttgag aaagtccaga atggtctttc cggactgctt gtctctgatg ccgttgatga 3840 gctttcgcga aagtcttccc cagccggtgt atctacgtcg cttgagttgt ttcatgacct 3900 tgtcgtcgaa caggtgagcg tatgtcttga gtcgttcctc gatcatctcc cgatcttcga 3960 acagggtaag agtgagcacg atgtcctcca gaatgtcctc gttttcctcg ttgtcgagaa 4020 aatccttgtc cttgataatc ttgagcagat cgtgataggt gcccaaagag gcgttgaatc 4080 ggtcctcaac tccggaaatc tcgacgctgt cgaaacactc gattttcttg aagtagtcct 4140 ccttgagctg cttaacagtg acctttcggt tggtcttgaa caggagatcg acaatggctt 4200 tcttctgttc gccagacaag aaggcaggct ttcgcattcc ctcggtaacg tacttgactt 4260 tggtgagttc gttgtagact gtaaagtact cgtagagcag cgaatgcttg ggaagaacct 4320 tctcgttggg cagattcttg tcgaagttgg tcattcgctc gatgaaggac tgtgcagagg 4380 cacccttgtc cacgacttcc tcgaagttcc agggagtgat ggtttcctcg gactttcgag 4440 tcatccaagc aaatcgagag tttcctctgg caagaggacc aacatagtag gggattcgaa 4500 aggtaagaat cttctcgatc ttctctcggt tgtccttgag aaaggggtag aagtcttcct 4560 gacgtcgaag aatggcgtgc agctcaccga ggtggatctg atgaggaatg ctgccgttgt 4620 cgaaggttcg ttgcttccga agcagatcct ctcgattgag cttgacaagc agttcctcgg 4680 ttccgtccat cttctcgaga attggcttga tgaacttgta gaactcttcc tgagaggctc 4740 cgccgtcgat gtatccagcg tagccgttct tcgactgatc gaaaaagatc tccttgtact 4800 tctcgggcag ttgctgtcgg acaagagcct tgagcagtgt gagatcctga tggtgctcgt 4860 cgtatcgctt gatcatggag gcagaaaggg gagcctttgt gatctcggtg ttgactcgca 4920 gaatgtcaga caagagaata gcatccgaaa ggttcttggc agcgagaaac aggtcggcgt 4980 actgatcgcc aatctgtgca agcaggttgt cgaggtcatc gtcgtaggtg tccttggaca 5040 gctggagctt ggcgtcctcc gccagatcga agttggactt gaagttgggt gtgagaccaa 5100 gagaaagggc aatgaggttg ccaaacagtc cgttcttttt ctcgccagga agttgggcaa 5160 tgaggttctc cagtcgtctg ctcttcgaga gtcgagcaga caagatggcc tttgcatcga 5220 ctccggaggc attgatgggg ttttcctcga acagctggtt gtaggtctga acgagctgaa 5280 tgaacagctt gtccacatcg ctgttgtcgg gattgagatc gccctcgatg aggaaatgac 5340 ctcgaaactt gatcatgtgt gccagagcga gatggataag tctgagatcc gccttgtcgg 5400 tggaatcgac gagtttcttt cgcaggtggt agatggtagg atacttctcg tggtaagcaa 5460 cctcgtccac aatgttgcca aagatgggat gacgctcgtg tttcttgtct tcctcgacga 5520 ggaaggattc ctccagtcga tgaaagaacg aatcgtccac cttggccatc tcgttggaaa 5580 agatctcctg caggtagcag attcggttct tccgtcgggt gtaacgtcgc cgagcagttc 5640 gcttgagtct ggtagcttcg gcagtctcgc cagaatcgaa caacagggca ccaatgaggt 5700 ttttcttgat ggagtgtcga tcggtgtttc cgaggacctt gaatttcttg gagggcacct 5760 tgtactcgtc ggtgatgaca gcccagccga cagagttggt tccaatgtcc aggccgatgg 5820 agtatttctt gtcgaattcc catatggtac cagctgcaga tctcgagctc ggatccttat 5880 cgtcatcgtc gtacagatcc cgacccattt gctgtccacc agtcatgcta gccataccat 5940 gatgatgatg atgatgagaa ccccccatgg ttaattcctc ctgttagccc aaaaaacggg 6000 tatggagaaa cagtagagag ttgcgataaa aagcgtcagg taggatccgc taatcttatg 6060 gataaaaatg ctatggcata gcaaagtgtg acgccgtgca aataatcaat gtggactttt 6120 ctgccgtgat tatagacact tttgttacgc gtttttgtca tggctttggt cccgctttgt 6180 tacagaatgc ttttaataag cggggttacc ggtttggtta gcgagaagag ccagtaaaag 6240 acgcagtgac ggcaatgtct gatgcaatat ggacaattgg tttcttctct gaatggcggg 6300 agtatgaaaa gtatggctga agcgcaaaat gatcccctgc tgccgggata ctcgtttaat 6360 gcccatctgg tggcgggttt aacgccgatt gaggccaacg gttatctcga tttttttatc 6420 gaccgaccgc tgggaatgaa aggttatatt ctcaatctca ccattcgcgg tcagggggtg 6480 gtgaaaaatc agggacgaga atttgtttgc cgaccgggtg atattttgct gttcccgcca 6540 ggagagattc atcactacgg tcgtcatccg gaggctcgcg aatggtatca ccagtgggtt 6600 tactttcgtc cgcgcgccta ctggcatgaa tggcttaact ggccgtcaat atttgccaat 6660 acggggttct ttcgcccgga tgaagcgcac cagccgcatt tcagcgacct gtttgggcaa 6720 atcattaacg ccgggcaagg ggaagggcgc tattcggagc tgctggcgat aaatctgctt 6780 gagcaattgt tactgcggcg catggaagcg attaacgagt cgctccatcc accgatggat 6840 aatcgggtac gcgaggcttg tcagtacatc agcgatcacc tggcagacag caattttgat 6900 atcgccagcg tcgcacagca tgtttgcttg tcgccgtcgc gtctgtcaca tcttttccgc 6960 cagcagttag ggattagcgt cttaagctgg cgcgaggacc aacgtatcag ccaggcgaag 7020 ctgcttttga gcaccacccg gatgcctatc gccaccgtcg gtcgcaatgt tggttttgac 7080 gatcaactct atttctcgcg ggtatttaaa aaatgcaccg gggccagccc gagcgagttc 7140 cgtgccggtt gtgaagaaaa agtgaatgat gtagccgtca agttgtcata attggtaacg 7200 aatcagacaa ttgacggccg tcccctggat tagctcgagc cgaacctccg ggaaaagttc 7260 gcgaaaagct ttaatgacct ctggcaagct ataacgtgcc tgagtatgcg tcgttgcaat 7320 agtgagaacg ccagacgtat cgttggtaaa caggtctgca agccgacgaa cattactggc 7380 ttcattcaga atacgttctg caatgaccag taatgctttg cccggttcag tcatgcccag 7440 cagtcgctta cctcgtcgaa caaatatttc gatgccaagt tcatcctcca gttcccgaat 7500 atgacggctg acgcctgact gtgaggtaaa aagcatattc gcaacctctg tcaggttgta 7560 atcctgacgt gcagcctcgc ggattatctt tagttgttgg aaattcacgg taaactccgg 7620 gcagttcaga tttcccgtta ttgttaaagt ctaatgcccg gcataacaaa taataaaaac 7680 ccgcatctta ttccatcccg atataacact tagctcacga agttcatgtt gcctccggtt 7740 tttaagaatc ggcccaagtg ccgccattac ttacaaccag attgcaagat gcttgccagt 7800 tttattttgg tgttgatgta caagctaacc aactgtcaaa taagagatta tgatagattc 7860 gtcatttgct cctttaatca gctgtcgcgt tcccctgccc tataaaagga gggtatgcac 7920 cacgatggtt cattacccaa taagattgaa agctcaccac tttgttgaaa ttgacagcaa 7980 acaaacaaaa aaatgcattt caccctttga catcaccatg cactgccatt aatatgcgcc 8040 ccgttcacac gattcctctg tagttcagtc ggtagaacgg cggactgtta atccgtatgt 8100 cactggttcg agtccagtca gaggagccaa attcaaaaaa gcctgctttc tagcaggctt 8160 tttgctttct aattaccaac gctcttaaaa catctgtctt gaaccagaac taatttgcaa 8220 gaatcataaa aaatttattt gctttcagga aaatttttct gtataataga ttcaacaacc 8280 agcgctcagc cagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 8340 caacttgaaa aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct 8400 cagaactcca tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg 8460 agaatggttt attgactacc ggaagcagtg tgaccgtgtg cttctcaaat gcctcaggct 8520 gtctatgtgt gactgttgag ctgtaacaag ttgtctcagg tgttcaattt catgttctag 8580 ttgctttgtt ttactggttt cacctgttct attaggtgtt acatgctgtt catctgttac 8640 attgtcgatc tgttcatggt gaacagcttt aaatgcacca aaaactcgta aaagctctga 8700 tgtatctatc ttttttacac cgttttcatc tgtgcatatg gacagttttc cctttgatat 8760 ctaacggtga acagttgttc tacttttgtt tgttagtctt gatgcttcac tgatagatac 8820 aagagccata agaacctcag atccttccgt atttagccag tatgttctct agtgtggttc 8880 gttgtttttg cgtgagccat gagaacgaac cattgagatc atgcttactt tgcatgtcac 8940 tcaaaaattt tgcctcaaaa ctggtgagct gaatttttgc agttaaagca tcgtgtagtg 9000 tttttcttag tccgttacgt aggtaggaat ctgatgtaat ggttgttggt attttgtcac 9060 cattcatttt tatctggttg ttctcaagtt cggttacgag atccatttgt ctatctagtt 9120 caacttggaa aatcaacgta tcagtcgggc ggcctcgctt atcaaccacc aatttcatat 9180 tgctgtaagt gtttaaatct ttacttattg gtttcaaaac ccattggtta agccttttaa 9240 actcatggta gttattttca agcattaaca tgaacttaaa ttcatcaagg ctaatctcta 9300 tatttgcctt gtgagttttc ttttgtgtta gttcttttaa taaccactca taaatcctca 9360 tagagtattt gttttcaaaa gacttaacat gttccagatt atattttatg aattttttta 9420 actggaaaag ataaggcaat atctcttcac taaaaactaa ttctaatttt tcgcttgaga 9480 acttggcata gtttgtccac tggaaaatct caaagccttt aaccaaagga ttcctgattt 9540 ccacagttct cgtcatcagc tctctggttg ctttagctaa tacaccataa gcattttccc 9600 tactgatgtt catcatctga gcgtattggt tataagtgaa cgataccgtc cgttctttcc 9660 ttgtagggtt ttcaatcgtg gggttgagta gtgccacaca gcataaaatt agcttggttt 9720 catgctccgt taagtcatag cgactaatcg ctagttcatt tgctttgaaa acaactaatt 9780 cagacataca tctcaattgg tctaggtgat tttaatcact ataccaattg agatgggcta 9840 gtcaatgata attactagtc cttttccttt gagttgtggg tatctgtaaa ttctgctaga 9900 cctttgctgg aaaacttgta aattctgcta gaccctctgt aaattccgct agacctttgt 9960 gtgttttttt tgtttatatt caagtggtta taatttatag aataaagaaa gaataaaaaa 10020 agataaaaag aatagatccc agccctgtgt ataactcact actttagtca gttccgcagt 10080 attacaaaag gatgtcgcaa acgctgtttg ctcctctaca aaacagacct taaaacccta 10140 aaggcttaag tagcaccctc gcaagctcgg gcaaatcgct gaatattcct tttgtctccg 10200 accatcaggc acctgagtcg ctgtcttttt cgtgacattc agttcgctgc gctcacggct 10260 ctggcagtga atgggggtaa atggcactac aggcgccttt tatggattca tgcaaggaaa 10320 ctacccataa tacaagaaaa gcccgtcacg ggcttctcag ggcgttttat ggcgggtctg 10380 ctatgtggtg ctatctgact ttttgctgtt cagcagttcc tgccctctga ttttccagtc 10440 tgaccacttc ggattatccc gtgacaggtc attcagactg gctaatgcac ccagtaaggc 10500 agcggtatca tcaacaggct tacccgtctt actgtcggat cgacgctctc ccttatgcga 10560 ctcctgcat 10569 <210> 117 <211> 1958 <212> DNA <213> E. coli <400> 117 caatgtcgca atttcctgtg gcgtcccctg gattagctcg agccgaacct ccgggaaaag 60 ttcgcgaaaa gctttaatga cctctggcaa gctataacgt gcctgagtat gcgtcgttgc 120 aatagtgaga acgccagacg tatcgttggt aaacaggtct gcaagccgac gaacattact 180 ggcttcattc agaatacgtt ctgcaatgac cagtaatgct ttgcccggtt cagtcatgcc 240 cagcagtcgc ttacctcgtc gaacaaatat ttcgatgcca agttcatcct ccagttcccg 300 aatatgacgg ctgacgcctg actgtgaggt aaaaagcata ttcgcaacct ctgtcaggtt 360 gtaatcctga cgtgcagcct cgcggattat ctttagttgt tggaaattca cggtaaactc 420 cgggcagttc agatttcccg ttattgttaa agtctaatgc ccggcataac aaataataaa 480 aacccgcatc ttattccatc ccgatataac acttagctca ccaattgcca ctgccttttt 540 tccatcactg gagaactaat cactgacatt aacaactctt tcactgcctg tgcctgtggc 600 gataagttcg ctctggcggg taaatttaat gacaaagaga gactcatgga aggagtggta 660 atgcgtgaca tccacccatt tactgcgcca cataacgaac gcgcggccga ttcgggtaat 720 actgcaacgc ccatgccgct ggcaatcgct gcggtaagcg tggcaataga ctcaatttca 780 ccaataactt ttgccgtgag tcgccgtagg gaaaaagcct catcaacacg aagtctaata 840 gcactgtaat cactggggag aaagaggttc atttgcgcaa tagcattcac atcaacgctt 900 tgccccgggc aatcttgagt tcctaccaga aaaagatctt ctttcagcaa agcctgactg 960 gatacaccag ccacagggga atgctcataa atcaccgcca tatcgagttg gtgatttatc 1020 aatttttcgt taagcactgc accactattt tcatgaagat agataacgat ctccggaaat 1080 tcagcgcgaa ccgcctgtaa taagggcatg gtgatggatg acgcagcggt tcctggtgca 1140 aagccaatcg agacttgccc cgataatgcc tgaccaacgt tatgcaccgc cagttgggcc 1200 tgttcacact gacgtaaaat ggcccgcgca tgggtataga gaatttttcc ggcgtctgtt 1260 ggtgtaacgc cccgctttgt acggatcaaa agttgttgat ttaactcacc ttccagtgtg 1320 gcaacctgct ggctgagcgc tggttgtgcg atatgcaata cttcagcagc ctgggtcagg 1380 ctaccaatat ctacaatttt tacgaagtat ttcaggcgtc tgaagttcat gttgcctccg 1440 gtttttaaga atcggcccaa gtgccgccat tacttacaac cagattgcaa gatgcttgcc 1500 agttttattt tggtgttgat gtacaagcta accaactgtc aaataagaga ttatgataga 1560 ttcgtcattt gctcctttaa tcagctgtcg cgttcccctg ccctataaaa ggagggtatg 1620 caccacgatg gttcattacc caataagatt gaaagctcac cactttgttg aaattgacag 1680 caaacaaaca aaaaaatgca tttcaccctt tgacatcacc atgcactgcc attaatatgc 1740 gccccgttca cacgattcct ctgtagttca gtcggtagaa cggcggactg ttaatccgta 1800 tgtcactggt tcgagtccag tcagaggagc caaattcaaa aaagcctgct ttctagcagg 1860 ctttttgctt tctaattacc aacgctctta aaacatctgt cttgaaccag aactaatttg 1920 cacaggcatt cccgatcgac gttgcaacgc agcatttg 1958 <210> 118 <211> 1058 <212> DNA <213> artificial sequence <220> <223> edited nac locus <400> 118 caatgtcgca atttcctgtg gcgtcccctg gattagctcg agccgaacct ccgggaaaag 60 ttcgcgaaaa gctttaatga cctctggcaa gctataacgt gcctgagtat gcgtcgttgc 120 aatagtgaga acgccagacg tatcgttggt aaacaggtct gcaagccgac gaacattact 180 ggcttcattc agaatacgtt ctgcaatgac cagtaatgct ttgcccggtt cagtcatgcc 240 cagcagtcgc ttacctcgtc gaacaaatat ttcgatgcca agttcatcct ccagttcccg 300 aatatgacgg ctgacgcctg actgtgaggt aaaaagcata ttcgcaacct ctgtcaggtt 360 gtaatcctga cgtgcagcct cgcggattat ctttagttgt tggaaattca cggtaaactc 420 cgggcagttc agatttcccg ttattgttaa agtctaatgc ccggcataac aaataataaa 480 aacccgcatc ttattccatc ccgatataac acttagctca cgaagttcat gttgcctccg 540 gtttttaaga atcggcccaa gtgccgccat tacttacaac cagattgcaa gatgcttgcc 600 agttttattt tggtgttgat gtacaagcta accaactgtc aaataagaga ttatgataga 660 ttcgtcattt gctcctttaa tcagctgtcg cgttcccctg ccctataaaa ggagggtatg 720 caccacgatg gttcattacc caataagatt gaaagctcac cactttgttg aaattgacag 780 caaacaaaca aaaaaatgca tttcaccctt tgacatcacc atgcactgcc attaatatgc 840 gccccgttca cacgattcct ctgtagttca gtcggtagaa cggcggactg ttaatccgta 900 tgtcactggt tcgagtccag tcagaggagc caaattcaaa aaagcctgct ttctagcagg 960 ctttttgctt tctaattacc aacgctctta aaacatctgt cttgaaccag aactaatttg 1020 cacaggcatt cccgatcgac gttgcaacgc agcatttg 1058 <210> 119 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer <400> 119 caatgtcgca atttcctgtg 20 <210> 120 <211> 19 <212> DNA <213> Artificial sequence <220> <223> primer <400> 120 caaatgctgc gttgcaacg 19 <210> 121 <211> 4104 <212> DNA <213> Streptococcus pyogenes <400> 121 atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60 ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120 cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180 gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240 tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300 ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360 aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420 aagttggttg atagtacgga caaagcggat ctgcgtttaa tctatcttgc gttagcgcac 480 atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540 gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600 attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660 cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720 ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780 gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840 cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900 ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960 atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020 caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080 ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140 gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200 aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260 gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320 gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380 cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440 gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500 aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560 tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620 agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680 gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740 tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800 ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860 ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920 cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980 cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040 gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100 tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160 cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220 gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280 atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340 atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400 gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460 gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520 attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580 gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640 aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700 actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760 ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820 acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880 aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940 tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000 taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060 atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120 aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180 cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240 gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300 caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360 gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420 tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480 aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540 tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600 tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660 cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720 cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780 cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840 atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900 ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960 ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020 gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080 gatctttcac agctgggcgg agac 4104 <210> 122 <211> 4104 <212> DNA <213> Artificial sequence <220> <223> synthesized Cas9 Y155H DNA <400> 122 atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60 ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120 cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180 gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240 tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300 ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360 aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420 aagttggttg atagtacgga caaagcggat ctgcgtttaa tccatcttgc gttagcgcac 480 atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540 gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600 attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660 cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720 ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780 gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840 cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900 ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960 atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020 caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080 ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140 gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200 aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260 gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320 gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380 cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440 gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500 aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560 tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620 agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680 gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740 tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800 ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860 ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920 cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980 cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040 gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100 tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160 cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220 gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280 atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340 atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400 gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460 gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520 attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580 gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640 aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700 actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760 ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820 acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880 aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940 tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000 taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060 atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120 aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180 cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240 gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300 caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360 gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420 tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480 aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540 tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600 tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660 cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720 cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780 cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840 atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900 ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960 ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020 gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080 gatctttcac agctgggcgg agac 4104 <210> 123 <211> 1368 <212> PRT <213> Artificial sequence <220> <223> synthesized Cas9 Y155N variant <400> 123 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Asn Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 124 <211> 4104 <212> DNA <213> Artificial sequence <220> <223> synthesized Cas9 Y155N <400> 124 atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60 ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120 cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180 gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240 tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300 ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360 aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420 aagttggttg atagtacgga caaagcggat ctgcgtttaa tcaatcttgc gttagcgcac 480 atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540 gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600 attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660 cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720 ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780 gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840 cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900 ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960 atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020 caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080 ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140 gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200 aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260 gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320 gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380 cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440 gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500 aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560 tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620 agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680 gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740 tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800 ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860 ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920 cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980 cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040 gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100 tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160 cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220 gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280 atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340 atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400 gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460 gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520 attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580 gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640 aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700 actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760 ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820 acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880 aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940 tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000 taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060 atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120 aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180 cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240 gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300 caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360 gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420 tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480 aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540 tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600 tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660 cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720 cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780 cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840 atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900 ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960 ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020 gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080 gatctttcac agctgggcgg agac 4104 <210> 125 <211> 1368 <212> PRT <213> Artificial sequence <220> <223> synthesized Cas9 Y155E <400> 125 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Glu Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 126 <211> 4104 <212> DNA <213> Artificial sequence <220> <223> synthesized Cas9 Y155E <400> 126 atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60 ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120 cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180 gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240 tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300 ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360 aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420 aagttggttg atagtacgga caaagcggat ctgcgtttaa tcgagcttgc gttagcgcac 480 atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540 gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600 attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660 cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720 ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780 gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840 cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900 ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960 atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020 caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080 ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140 gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200 aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260 gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320 gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380 cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440 gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500 aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560 tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620 agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680 gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740 tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800 ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860 ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920 cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980 cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040 gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100 tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160 cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220 gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280 atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340 atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400 gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460 gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520 attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580 gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640 aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700 actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760 ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820 acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880 aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940 tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000 taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060 atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120 aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180 cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240 gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300 caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360 gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420 tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480 aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540 tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600 tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660 cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720 cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780 cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840 atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900 ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960 ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020 gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080 gatctttcac agctgggcgg agac 4104 <210> 127 <211> 1368 <212> PRT <213> Artificial sequence <220> <223> synthesized Cas9 Y155F <400> 127 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Phe Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 128 <211> 4104 <212> DNA <213> Artificial sequence <220> <223> synthesized Cas9 Y155F <400> 128 atggataaaa aatacagcat tggtctggat atcggaacca acagcgttgg gtgggcagta 60 ataacagatg aatacaaagt gccgtcaaaa aaatttaagg ttctggggaa tacagatcgc 120 cacagcataa aaaagaatct gattggggca ttgctgtttg attcgggtga gacagctgag 180 gccacgcgtc tgaaacgtac agcaagaaga cgttacacac gtcgtaaaaa tcgtatttgc 240 tacttacagg aaattttttc taacgaaatg gccaaggtag atgatagttt cttccatcgt 300 ctcgaagaat cttttctggt tgaggaagat aaaaaacacg aacgtcaccc tatctttggc 360 aatatcgtgg atgaagtggc ctatcatgaa aaatacccta cgatttatca tcttcgcaag 420 aagttggttg atagtacgga caaagcggat ctgcgtttaa tctttcttgc gttagcgcac 480 atgatcaaat ttcgtggtca tttcttaatt gaaggtgatc tgaatcctga taactctgat 540 gtggacaaat tgtttataca attagtgcaa acctataatc agctgttcga ggaaaacccc 600 attaatgcct ctggagttga tgccaaagcg attttaagcg cgagactttc taagtcccgg 660 cgtctggaga atctgatcgc ccagttacca ggggaaaaga aaaatggtct gtttggtaat 720 ctgattgccc tcagtctggg gcttaccccg aacttcaaat ccaattttga cctggctgag 780 gacgcaaagc tgcagctgag caaagatact tatgatgatg acctcgacaa tctgctcgcc 840 cagattggtg accaatatgc ggatctgttt ctggcagcga agaatctttc ggatgctatc 900 ttgctgtcgg atattctgcg tgttaatacc gaaatcacca aagcgcctct gtctgcaagt 960 atgatcaaga gatacgacga gcaccaccag gacctgactc ttcttaaggc actggtacgc 1020 caacagcttc cggagaaata caaagaaata ttcttcgacc agtccaagaa tggttacgcg 1080 ggctacatcg atggtggtgc atcacaggaa gagttctata aatttattaa accaatcctt 1140 gagaaaatgg atggcacgga agagttactt gttaaactta accgcgaaga cttgcttaga 1200 aagcaacgta cattcgacaa cggctccatc ccacaccaga ttcatttagg tgaacttcac 1260 gccatcttgc gcagacaaga agatttctat cccttcttaa aagacaatcg ggagaaaatc 1320 gagaagatcc tgacgttccg cattccctat tatgtcggtc ccctggcacg tggtaattct 1380 cggtttgcct ggatgacgcg caaaagtgag gaaaccatca ccccttggaa ctttgaagaa 1440 gtcgtggata aaggtgctag cgcgcagtct tttatagaaa gaatgacgaa cttcgataaa 1500 aacttgccca acgaaaaagt cctgcccaag cactctcttt tatatgagta ctttactgtg 1560 tacaacgaac tgactaaagt gaaatacgtt acggaaggta tgcgcaaacc tgcctttctt 1620 agtggcgagc agaaaaaagc aattgtcgat cttctcttta aaacgaatcg caaggtaact 1680 gtaaaacagc tgaaggaaga ttatttcaaa aagatcgaat gctttgattc tgtcgagatc 1740 tcgggtgtcg aagatcgttt caacgcttcc ttagggacct atcatgattt gctgaagata 1800 ataaaagaca aagactttct cgacaatgaa gaaaatgaag atattctgga ggatattgtt 1860 ttgaccttga ccttattcga agatagagag atgatcgagg agcgcttaaa aacctatgcc 1920 cacctgtttg atgacaaagt catgaagcaa ttaaagcgcc gcagatatac ggggtggggc 1980 cgcttgagcc gcaagttgat taacggtatt agagacaagc agagcggaaa aactatcctg 2040 gatttcctca aatctgacgg atttgcgaac cgcaatttta tgcagcttat acatgatgat 2100 tcgcttacat tcaaagagga tattcagaag gctcaggtgt ctgggcaagg tgattcactc 2160 cacgaacata tagcaaattt ggccggctct cctgcgatta agaaggggat cctgcaaaca 2220 gttaaagttg tggatgaact tgtaaaagta atgggccgcc acaagccgga gaatatcgtg 2280 atagaaatgg cgcgcgagaa tcaaacgaca caaaaaggtc aaaagaactc aagagagaga 2340 atgaagcgca ttgaggaggg gataaaggaa cttggatctc aaattctgaa agaacatcca 2400 gttgaaaaca ctcagctgca aaatgaaaaa ttgtacctgt actacctgca gaatggaaga 2460 gacatgtacg tggatcagga attggatatc aatagactct cggactatga cgtagatcac 2520 attgtccctc agagcttcct caaggatgat tctatagata ataaagtact tacgagatcg 2580 gacaaaaatc gcggtaaatc ggataacgtc ccatcggagg aagtcgttaa aaagatgaaa 2640 aactattggc gtcaactgct gaacgccaag ctgatcacac agcgtaagtt tgataatctg 2700 actaaagccg aacgcggtgg tcttagtgaa ctcgataaag caggatttat aaaacggcag 2760 ttagtagaaa cgcgccaaat tacgaaacac gtggctcaga tcctcgattc tagaatgaat 2820 acaaagtacg atgaaaacga taaactgatc cgtgaagtaa aagtcattac cttaaaatct 2880 aaacttgtgt ccgatttccg caaagatttt cagttttaca aggtccggga aatcaataac 2940 tatcaccatg cacatgatgc atatttaaat gcggttgtag gcacggccct tattaagaaa 3000 taccctaaac tcgaaagtga gtttgtttat ggggattata aagtgtatga cgttcgcaaa 3060 atgatcgcga aatcagaaca ggaaatcggt aaggctaccg ctaaatactt tttttattcc 3120 aacattatga atttttttaa gaccgaaata actctcgcga atggtgaaat ccgtaaacgg 3180 cctcttatag aaaccaatgg tgaaacggga gaaatcgttt gggataaagg tcgtgacttt 3240 gccaccgttc gtaaagtcct ctcaatgccg caagttaaca ttgtcaagaa gacggaagtt 3300 caaacagggg gattctccaa agaatctatc ctgccgaagc gtaacagtga taaacttatt 3360 gccagaaaaa aagattggga tccaaaaaaa tacggaggct ttgattcccc taccgtcgcg 3420 tatagtgtgc tggtggttgc taaagtcgag aaagggaaaa gcaagaaatt gaaatcagtt 3480 aaagaactgc tgggtattac aattatggaa agatcgtcct ttgagaaaaa tccgatcgac 3540 tttttagagg ccaaggggta taaggaagtg aaaaaagatc tcatcatcaa attaccgaag 3600 tatagtcttt ttgagctgga aaacggcaga aaaagaatgc tggcctccgc gggcgagtta 3660 cagaagggaa atgagctggc gctgccttcc aaatatgtta attttctgta ccttgccagt 3720 cattatgaga aactgaaggg cagccccgaa gataacgaac agaaacaatt attcgtggaa 3780 cagcataagc actatttaga tgaaattata gagcaaatta gtgaattttc taagcgcgtt 3840 atcctcgcgg atgctaattt agacaaagta ctgtcagctt ataataaaca tcgggataag 3900 ccgattagag aacaggccga aaatatcatt catttgttta ccttaaccaa ccttggagca 3960 ccagctgcct tcaaatattt cgataccaca attgatcgta aacggtatac aagtacaaaa 4020 gaagtcttgg acgcaaccct cattcatcaa tctattactg gattatatga gacacgcatt 4080 gatctttcac agctgggcgg agac 4104 <210> 129 <211> 1368 <212> PRT <213> Artificial sequence <220> <223> synthesized Cas9 F86A F98A variant <400> 129 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Ala Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Ala Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile His Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 130 <211> 498 <212> DNA <213> Artificial sequence <220> <223> synthesized F86A F98A synthetic fragment <400> 130 cacgtcgtaa aaatcgtatt tgctacttac aggaaattgc gtctaacgaa atggccaagg 60 tagatgatag tgcgttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 120 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 180 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 240 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 300 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 360 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 420 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 480 agaaaaatgg tctgtttg 498 <210> 131 <211> 9266 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF801 backbone for F86A-F98A <400> 131 aaagaaaaat ggtctgtttg gtaatctgat tgccctcagt ctggggctta ccccgaactt 60 caaatccaat tttgacctgg ctgaggacgc aaagctgcag ctgagcaaag atacttatga 120 tgatgacctc gacaatctgc tcgcccagat tggtgaccaa tatgcggatc tgtttctggc 180 agcgaagaat ctttcggatg ctatcttgct gtcggatatt ctgcgtgtta ataccgaaat 240 caccaaagcg cctctgtctg caagtatgat caagagatac gacgagcacc accaggacct 300 gactcttctt aaggcactgg tacgccaaca gcttccggag aaatacaaag aaatattctt 360 cgaccagtcc aagaatggtt acgcgggcta catcgatggt ggtgcatcac aggaagagtt 420 ctataaattt attaaaccaa tccttgagaa aatggatggc acggaagagt tacttgttaa 480 acttaaccgc gaagacttgc ttagaaagca acgtacattc gacaacggct ccatcccaca 540 ccagattcat ttaggtgaac ttcacgccat cttgcgcaga caagaagatt tctatccctt 600 cttaaaagac aatcgggaga aaatcgagaa gatcctgacg ttccgcattc cctattatgt 660 cggtcccctg gcacgtggta attctcggtt tgcctggatg acgcgcaaaa gtgaggaaac 720 catcacccct tggaactttg aagaagtcgt ggataaaggt gctagcgcgc agtcttttat 780 agaaagaatg acgaacttcg ataaaaactt gcccaacgaa aaagtcctgc ccaagcactc 840 tcttttatat gagtacttta ctgtgtacaa cgaactgact aaagtgaaat acgttacgga 900 aggtatgcgc aaacctgcct ttcttagtgg cgagcagaaa aaagcaattg tcgatcttct 960 ctttaaaacg aatcgcaagg taactgtaaa acagctgaag gaagattatt tcaaaaagat 1020 cgaatgcttt gattctgtcg agatctcggg tgtcgaagat cgtttcaacg cttccttagg 1080 gacctatcat gatttgctga agataataaa agacaaagac tttctcgaca atgaagaaaa 1140 tgaagatatt ctggaggata ttgttttgac cttgacctta ttcgaagata gagagatgat 1200 cgaggagcgc ttaaaaacct atgcccacct gtttgatgac aaagtcatga agcaattaaa 1260 gcgccgcaga tatacggggt ggggccgctt gagccgcaag ttgattaacg gtattagaga 1320 caagcagagc ggaaaaacta tcctggattt cctcaaatct gacggatttg cgaaccgcaa 1380 ttttatgcag cttatacatg atgattcgct tacattcaaa gaggatattc agaaggctca 1440 ggtgtctggg caaggtgatt cactccacga acatatagca aatttggccg gctctcctgc 1500 gattaagaag gggatcctgc aaacagttaa agttgtggat gaacttgtaa aagtaatggg 1560 ccgccacaag ccggagaata tcgtgataga aatggcgcgc gagaatcaaa cgacacaaaa 1620 aggtcaaaag aactcaagag agagaatgaa gcgcattgag gaggggataa aggaacttgg 1680 atctcaaatt ctgaaagaac atccagttga aaacactcag ctgcaaaatg aaaaattgta 1740 cctgtactac ctgcagaatg gaagagacat gtacgtggat caggaattgg atatcaatag 1800 actctcggac tatgacgtag atcacattgt ccctcagagc ttcctcaagg atgattctat 1860 agataataaa gtacttacga gatcggacaa aaatcgcggt aaatcggata acgtcccatc 1920 ggaggaagtc gttaaaaaga tgaaaaacta ttggcgtcaa ctgctgaacg ccaagctgat 1980 cacacagcgt aagtttgata atctgactaa agccgaacgc ggtggtctta gtgaactcga 2040 taaagcagga tttataaaac ggcagttagt agaaacgcgc caaattacga aacacgtggc 2100 tcagatcctc gattctagaa tgaatacaaa gtacgatgaa aacgataaac tgatccgtga 2160 agtaaaagtc attaccttaa aatctaaact tgtgtccgat ttccgcaaag attttcagtt 2220 ttacaaggtc cgggaaatca ataactatca ccatgcacat gatgcatatt taaatgcggt 2280 tgtaggcacg gcccttatta agaaataccc taaactcgaa agtgagtttg tttatgggga 2340 ttataaagtg tatgacgttc gcaaaatgat cgcgaaatca gaacaggaaa tcggtaaggc 2400 taccgctaaa tacttttttt attccaacat tatgaatttt tttaagaccg aaataactct 2460 cgcgaatggt gaaatccgta aacggcctct tatagaaacc aatggtgaaa cgggagaaat 2520 cgtttgggat aaaggtcgtg actttgccac cgttcgtaaa gtcctctcaa tgccgcaagt 2580 taacattgtc aagaagacgg aagttcaaac agggggattc tccaaagaat ctatcctgcc 2640 gaagcgtaac agtgataaac ttattgccag aaaaaaagat tgggatccaa aaaaatacgg 2700 aggctttgat tcccctaccg tcgcgtatag tgtgctggtg gttgctaaag tcgagaaagg 2760 gaaaagcaag aaattgaaat cagttaaaga actgctgggt attacaatta tggaaagatc 2820 gtcctttgag aaaaatccga tcgacttttt agaggccaag gggtataagg aagtgaaaaa 2880 agatctcatc atcaaattac cgaagtatag tctttttgag ctggaaaacg gcagaaaaag 2940 aatgctggcc tccgcgggcg agttacagaa gggaaatgag ctggcgctgc cttccaaata 3000 tgttaatttt ctgtaccttg ccagtcatta tgagaaactg aagggcagcc ccgaagataa 3060 cgaacagaaa caattattcg tggaacagca taagcactat ttagatgaaa ttatagagca 3120 aattagtgaa ttttctaagc gcgttatcct cgcggatgct aatttagaca aagtactgtc 3180 agcttataat aaacatcggg ataagccgat tagagaacag gccgaaaata tcattcattt 3240 gtttacctta accaaccttg gagcaccagc tgccttcaaa tatttcgata ccacaattga 3300 tcgtaaacgg tatacaagta caaaagaagt cttggacgca accctcattc atcaatctat 3360 tactggatta tatgagacac gcattgatct ttcacagctg ggcggagaca agaagaaaaa 3420 actgaaactg caccatcatc accatcatca tcaccatcat tgataactcg agaaagctta 3480 cataaaaaac cggccttggc cccgccggtt ttttattatt tttcttcctc cgcatgttca 3540 atccgctcca taatcgacgg atggctccct ctgaaaattt taacgagaaa cggcgggttg 3600 acccggctca gtcccgtaac ggccaagtcc tgaaacgtct caatcgccgc ttcccggttt 3660 ccggtcagct caatgccgta acggtcggcg gcgttttcct gataccggga gacggcattc 3720 gtaatcgggt gaagtggtca agacctcact aggcacctta aaaatagcgc accctgaaga 3780 agatttattt gaggtagccc ttgcctacct agcttccaag aaagatatcc taacagcaca 3840 agagcggaaa gatgttttgt tctacatcca gaacaacctc tgctaaaatt cctgaaaaat 3900 tttgcaaaaa gttgttgact ttatctacaa ggtgtggcat aatgtgtgga ctcgacttcg 3960 aatacatcca gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 4020 ttgaaaaagt ggcaccgagt cggtgcgact cctgttgata gatccagtaa tgacctcaga 4080 actccatctg gatttgttca gaacgctcgg ttgccgccgg gcgtttttta ttggtgagaa 4140 tgtcgacctc gagagttacg ctagggataa cagggtaata taggagctcc agtcggctta 4200 aaccagtttt cgctggtgcg aaaaaagagt gtcttgtgac acctaaattc aaaatctatc 4260 ggtcagattt ataccgattt gattttatat attcttgaat aacatacgcc gagttatcac 4320 ataaaagcgg gaaccaatca taaaatttaa acttcattgc ataatccatt aaactcttaa 4380 attctacgat tccttgttca tcaataaact caatcatttc tttaattaat ttatatctat 4440 ctgttgttgt tttctttaat aattcattaa catctacacc gccataaact atcatatctt 4500 ctttttgata tttaaattta ttaggatcgt ccatgtgaag catatatctc acaagacctt 4560 tcacacttcc tgcaatctgc ggaatagtcg cattcaattc ttctgttaat tatttttatc 4620 tgttcataag atttattacc ctcatacatc actagaatat gataatgctc ttttttcatc 4680 ctaccttctg tatcagtatc cctatcatgt aatggagaca ctacaaattg aatgtgtaac 4740 tcttttaaat actctaacca ctcggctttt gctgattctg gatataaaac aaatgtccaa 4800 ttacgtcctc ttgaattttt cttgttttca gtttctttta ttacattttc gctcatgata 4860 taataacggt gctaatacac ttaacaaaat ttagtcatag ataggcagca tgccagtgct 4920 gtctatcttt ttttgtttaa aatgcaccgt attcctcctt tgcatatttt tttattagaa 4980 taccggttgc atctgatttg ctaatattat atttttcttt gattctattt aatatctcat 5040 tttcttctgt tgtaagtctt aaagtaacag caactttttt ctcttctttt ctatctacaa 5100 ctatcactgt acctcccaac atctgttttt ttcactttaa cataaaaaac aaccttttaa 5160 cattaaaaac ccaatattta tttatttgtt tggacaatgg acactggaca cctagggggg 5220 aggtcgtagt acccccctat gttttctccc ctaaataacc ccaaaaatct aagaaaaaaa 5280 gacctcaaaa aggtctttaa ttaacatctc aaatttcgca tttattccaa tttccttttt 5340 gcgtgtgatg cgagctcatc ggctccgtcg atactatgtt atacgccaac tttcaaaaca 5400 actttgaaaa agctgttttc tggtatttaa ggttttagaa tgcaaggaac agtgaattgg 5460 agttcgtctt gttataatta gcttcttggg gtatctttaa atactgtaga aaagaggaag 5520 gaaataataa atggctaaaa tgagaatatc accggaattg aaaaaactga tcgaaaaata 5580 ccgctgcgta aaagatacgg aaggaatgtc tcctgctaag gtatataagc tggtgggaga 5640 aaatgaaaac ctatatttaa aaatgacgga cagccggtat aaagggacca cctatgatgt 5700 ggaacgggaa aaggacatga tgctatggct ggaaggaaag ctgcctgttc caaaggtcct 5760 gcactttgaa cggcatgatg gctggagcaa tctgctcatg agtgaggccg atggcgtcct 5820 ttgctcggaa gagtatgaag atgaacaaag ccctgaaaag attatcgagc tgtatgcgga 5880 gtgcatcagg ctctttcact ccatcgacat atcggattgt ccctatacga atagcttaga 5940 cagccgctta gccgaattgg attacttact gaataacgat ctggccgatg tggattgcga 6000 aaactgggaa gaagacactc catttaaaga tccgcgcgag ctgtatgatt ttttaaagac 6060 ggaaaagccc gaagaggaac ttgtcttttc ccacggcgac ctgggagaca gcaacatctt 6120 tgtgaaagat ggcaaagtaa gtggctttat tgatcttggg agaagcggca gggcggacaa 6180 gtggtatgac attgccttct gcgtccggtc gatcagggag gatatcgggg aagaacagta 6240 tgtcgagcta ttttttgact tactggggat caagcctgat tgggagaaaa taaaatatta 6300 tattttactg gatgaattgt tttagtgact gcagtgagat ctggtaatga ctctctagct 6360 tgaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 6420 gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gctctagcta agcagaaggc 6480 catcctgacg gatggccttt ttgcgtttct acaaactctt gttaactcta gagctgcctg 6540 ccgcgtttcg gtgatgaaga tcttcccgat gattaattaa ttcagaacgc tcggttgccg 6600 ccgggcgttt tttatgaagc ttcgttgctg gcgtttttcc ataggctccg cccccctgac 6660 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 6720 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 6780 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 6840 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 6900 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 6960 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 7020 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 7080 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 7140 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 7200 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 7260 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 7320 acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 7380 acttggtctg acaaatggtt ctttcccctg tcctaaacaa aaaacccgct ttattgaaaa 7440 agcggggctg ttttacagac aggtcaaata aacgtttgaa aatgttcatt tcaaaacgcg 7500 cggaacctcc atcttctccc atccagacta tactgtcggc ttcggaatcg caccgaatcc 7560 tgcccataaa aaggctcgcg ggcttagagc gcttgctcat caccgccggt agggaatttc 7620 accctgcccc gaagattgat cttatttatt tttaatactg atattattat aaattaattg 7680 tgaaaaaatg tacaggtgca aagcttattg cgctgttttg ggacatcctg cacgatattt 7740 cggtaaactc actttttccg catactaaaa accgcacatt cacagttatt tcatttttaa 7800 ttttcgtctt tccgcgtgaa actcattgac actctttatg gaatatggta aattatcaga 7860 tatttatgac gcttatttag gaggaaatct tacacagaag ctgcggaacc tgaaaagaat 7920 tcctttcagg ttccgttttt tttaggaatt ctccctgatc tcaagcatct ggcggggata 7980 aatccgctct cctttcaaat cgttccattc tttgaggcgc tgtacagtta cgcccatttt 8040 ttcggcgata tgatgaagcg tatccccttt ccgcactaca tatgtaccgg tcttcgattc 8100 atcgtcatga aggcggagtg tttggccggc cttgagattt gaatgtttca acccgtttat 8160 tctcatgatc tcctcgatgg atataccgct atccttgctg attctccaga gcgtgtcccc 8220 tttttgaacg gtcaccgcac cgctcattgt cccggcgttt tgataaacgt ggatagaatt 8280 ttgccggaac gcctcctcac gaagcaccgt cagcggattg attgcatatc ttttatcttc 8340 agtccatgaa ccgtgatgca tttcaaaatg caggtgggtt ccggtcgata ttcgaattcc 8400 tccattttct tctgctatca aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa 8460 agcctctgcc ccttgcaaat cggatgcctg tctataaaat tcccgatatt ggttaaacag 8520 cggcgcaatg gcggccgcat ctgatgtctt tgcttggcga atgttcatct tatttcttcc 8580 tccctctcaa taattttttc attctatccc ttttctgtaa agtttatttt tcagaatact 8640 tttatcatca tgctttgaaa aaatatcacg ataatatcca ttgttctcac ggaagcacac 8700 gcaggtcatt tgaacgaatt ttttcgacag gaatttgccg ggactcagga gcatttaacc 8760 taaaaaagca tgacatttca gcataatgaa catttactca tgtctatttt cgttcttttc 8820 tgtatgaaaa tagttatttc gagtctctac ggaaatagcg agagatgata tacctaaata 8880 gagataaaat catctcaaaa aaatgggtct actaaaatat tattccatct attacaataa 8940 attcacagaa tagtctttta agtaagtcta ctctgaattt ttttaaaagg agagggtaac 9000 tagtggcccc aaaaaagaaa cgcaaggtta tggataaaaa atacagcatt ggtctggata 9060 tcggaaccaa cagcgttggg tgggcagtaa taacagatga atacaaagtg ccgtcaaaaa 9120 aatttaaggt tctggggaat acagatcgcc acagcataaa aaagaatctg attggggcat 9180 tgctgtttga ttcgggtgag acagctgagg ccacgcgtct gaaacgtaca gcaagaagac 9240 gttacacacg tcgtaaaaat cgtatt 9266 <210> 132 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer pRF801 backbone forward <400> 132 aaagaaaaat ggtctgtttg 20 <210> 133 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer pRF801 backbone reverse <400> 133 aatacgattt ttacgacgtg 20 <210> 134 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer F86A F98A synthetic forward <400> 134 cacgtcgtaa aaatcgtatt 20 <210> 135 <211> 20 <212> DNA <213> Artificial sequence <220> <223> primer F86A F98A synthetic reverse <400> 135 caaacagacc atttttcttt 20 <210> 136 <211> 9724 <212> DNA <213> Artificial sequence <220> <223> plasmid pRF866 <400> 136 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240 tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720 gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780 ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840 taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900 ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960 aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020 actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080 tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140 tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200 caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260 ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320 gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380 atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440 gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500 aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560 gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620 tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaattgc gtctaacgaa atggccaagg 5580 tagatgatag tgcgttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 137 <211> 5042 <212> DNA <213> Artificial sequence <220> <223> Bacillus F86A-F98A expression cassette <400> 137 attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60 aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120 aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180 cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240 atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300 cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360 taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420 ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480 aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540 aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600 gtaactagtg gccccaaaaa agaaacgcaa ggttatggat aaaaaataca gcattggtct 660 ggatatcgga accaacagcg ttgggtgggc agtaataaca gatgaataca aagtgccgtc 720 aaaaaaattt aaggttctgg ggaatacaga tcgccacagc ataaaaaaga atctgattgg 780 ggcattgctg tttgattcgg gtgagacagc tgaggccacg cgtctgaaac gtacagcaag 840 aagacgttac acacgtcgta aaaatcgtat ttgctactta caggaaattg cgtctaacga 900 aatggccaag gtagatgata gtgcgttcca tcgtctcgaa gaatcttttc tggttgagga 960 agataaaaaa cacgaacgtc accctatctt tggcaatatc gtggatgaag tggcctatca 1020 tgaaaaatac cctacgattt atcatcttcg caagaagttg gttgatagta cggacaaagc 1080 ggatctgcgt ttaatccatc ttgcgttagc gcacatgatc aaatttcgtg gtcatttctt 1140 aattgaaggt gatctgaatc ctgataactc tgatgtggac aaattgttta tacaattagt 1200 gcaaacctat aatcagctgt tcgaggaaaa ccccattaat gcctctggag ttgatgccaa 1260 agcgatttta agcgcgagac tttctaagtc ccggcgtctg gagaatctga tcgcccagtt 1320 accaggggaa aagaaaaatg gtctgtttgg taatctgatt gccctcagtc tggggcttac 1380 cccgaacttc aaatccaatt ttgacctggc tgaggacgca aagctgcagc tgagcaaaga 1440 tacttatgat gatgacctcg acaatctgct cgcccagatt ggtgaccaat atgcggatct 1500 gtttctggca gcgaagaatc tttcggatgc tatcttgctg tcggatattc tgcgtgttaa 1560 taccgaaatc accaaagcgc ctctgtctgc aagtatgatc aagagatacg acgagcacca 1620 ccaggacctg actcttctta aggcactggt acgccaacag cttccggaga aatacaaaga 1680 aatattcttc gaccagtcca agaatggtta cgcgggctac atcgatggtg gtgcatcaca 1740 ggaagagttc tataaattta ttaaaccaat ccttgagaaa atggatggca cggaagagtt 1800 acttgttaaa cttaaccgcg aagacttgct tagaaagcaa cgtacattcg acaacggctc 1860 catcccacac cagattcatt taggtgaact tcacgccatc ttgcgcagac aagaagattt 1920 ctatcccttc ttaaaagaca atcgggagaa aatcgagaag atcctgacgt tccgcattcc 1980 ctattatgtc ggtcccctgg cacgtggtaa ttctcggttt gcctggatga cgcgcaaaag 2040 tgaggaaacc atcacccctt ggaactttga agaagtcgtg gataaaggtg ctagcgcgca 2100 gtcttttata gaaagaatga cgaacttcga taaaaacttg cccaacgaaa aagtcctgcc 2160 caagcactct cttttatatg agtactttac tgtgtacaac gaactgacta aagtgaaata 2220 cgttacggaa ggtatgcgca aacctgcctt tcttagtggc gagcagaaaa aagcaattgt 2280 cgatcttctc tttaaaacga atcgcaaggt aactgtaaaa cagctgaagg aagattattt 2340 caaaaagatc gaatgctttg attctgtcga gatctcgggt gtcgaagatc gtttcaacgc 2400 ttccttaggg acctatcatg atttgctgaa gataataaaa gacaaagact ttctcgacaa 2460 tgaagaaaat gaagatattc tggaggatat tgttttgacc ttgaccttat tcgaagatag 2520 agagatgatc gaggagcgct taaaaaccta tgcccacctg tttgatgaca aagtcatgaa 2580 gcaattaaag cgccgcagat atacggggtg gggccgcttg agccgcaagt tgattaacgg 2640 tattagagac aagcagagcg gaaaaactat cctggatttc ctcaaatctg acggatttgc 2700 gaaccgcaat tttatgcagc ttatacatga tgattcgctt acattcaaag aggatattca 2760 gaaggctcag gtgtctgggc aaggtgattc actccacgaa catatagcaa atttggccgg 2820 ctctcctgcg attaagaagg ggatcctgca aacagttaaa gttgtggatg aacttgtaaa 2880 agtaatgggc cgccacaagc cggagaatat cgtgatagaa atggcgcgcg agaatcaaac 2940 gacacaaaaa ggtcaaaaga actcaagaga gagaatgaag cgcattgagg aggggataaa 3000 ggaacttgga tctcaaattc tgaaagaaca tccagttgaa aacactcagc tgcaaaatga 3060 aaaattgtac ctgtactacc tgcagaatgg aagagacatg tacgtggatc aggaattgga 3120 tatcaataga ctctcggact atgacgtaga tcacattgtc cctcagagct tcctcaagga 3180 tgattctata gataataaag tacttacgag atcggacaaa aatcgcggta aatcggataa 3240 cgtcccatcg gaggaagtcg ttaaaaagat gaaaaactat tggcgtcaac tgctgaacgc 3300 caagctgatc acacagcgta agtttgataa tctgactaaa gccgaacgcg gtggtcttag 3360 tgaactcgat aaagcaggat ttataaaacg gcagttagta gaaacgcgcc aaattacgaa 3420 acacgtggct cagatcctcg attctagaat gaatacaaag tacgatgaaa acgataaact 3480 gatccgtgaa gtaaaagtca ttaccttaaa atctaaactt gtgtccgatt tccgcaaaga 3540 ttttcagttt tacaaggtcc gggaaatcaa taactatcac catgcacatg atgcatattt 3600 aaatgcggtt gtaggcacgg cccttattaa gaaataccct aaactcgaaa gtgagtttgt 3660 ttatggggat tataaagtgt atgacgttcg caaaatgatc gcgaaatcag aacaggaaat 3720 cggtaaggct accgctaaat acttttttta ttccaacatt atgaattttt ttaagaccga 3780 aataactctc gcgaatggtg aaatccgtaa acggcctctt atagaaacca atggtgaaac 3840 gggagaaatc gtttgggata aaggtcgtga ctttgccacc gttcgtaaag tcctctcaat 3900 gccgcaagtt aacattgtca agaagacgga agttcaaaca gggggattct ccaaagaatc 3960 tatcctgccg aagcgtaaca gtgataaact tattgccaga aaaaaagatt gggatccaaa 4020 aaaatacgga ggctttgatt cccctaccgt cgcgtatagt gtgctggtgg ttgctaaagt 4080 cgagaaaggg aaaagcaaga aattgaaatc agttaaagaa ctgctgggta ttacaattat 4140 ggaaagatcg tcctttgaga aaaatccgat cgacttttta gaggccaagg ggtataagga 4200 agtgaaaaaa gatctcatca tcaaattacc gaagtatagt ctttttgagc tggaaaacgg 4260 cagaaaaaga atgctggcct ccgcgggcga gttacagaag ggaaatgagc tggcgctgcc 4320 ttccaaatat gttaattttc tgtaccttgc cagtcattat gagaaactga agggcagccc 4380 cgaagataac gaacagaaac aattattcgt ggaacagcat aagcactatt tagatgaaat 4440 tatagagcaa attagtgaat tttctaagcg cgttatcctc gcggatgcta atttagacaa 4500 agtactgtca gcttataata aacatcggga taagccgatt agagaacagg ccgaaaatat 4560 cattcatttg tttaccttaa ccaaccttgg agcaccagct gccttcaaat atttcgatac 4620 cacaattgat cgtaaacggt atacaagtac aaaagaagtc ttggacgcaa ccctcattca 4680 tcaatctatt actggattat atgagacacg cattgatctt tcacagctgg gcggagacaa 4740 gaagaaaaaa ctgaaactgc accatcatca ccatcatcat caccatcatt gataaacata 4800 aaaaaccggc cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc 4860 gctccataat cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc 4920 ggctcagtcc cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg 4980 tcagctcaat gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa 5040 tc 5042 <210> 138 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 138 aaagaaatat atagagagat actcttatca atgatggtga tgatgatggt gatg 54 <210> 139 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 139 acacgtattt atttgtccaa ttaccatggc cccaaaaaag aaacgcaagg ttatggat 58 <210> 140 <211> 767 <212> DNA <213> Artificial Sequence <220> <223> synthesized RNR2p promoter <400> 140 gccaatctaa agcgttgtct tcctcgttcc tcgcgcacgc gattttgcgt tctgcatagg 60 aagccgaagt cgaacaagaa gcaggcaaag tttagagcac tgcccctccg cactcaaaaa 120 agaaaaaact aggaggaaaa taaaattctc aaccacacaa acacataaac acatacaaat 180 acaaatacaa gcttatttac ttgacatcgc gcgatcttcc actattcagc gccgtccgcc 240 ctctctcgtg ttttttgttt acgcgacaac tatgcgaaat ccggagcaac gggcaaccgt 300 ttggggaaag accacaccca cgcgcgatcg ccatggcaac gaggtcgcac acgccccaca 360 cccagacctc cctgcgagcg ggcatgggta caatgtcccc gttgccacag agaccacttc 420 gtagcacagc gcagagcgta gcgtgttgtt gctgctgaca aaagaaaatt tttcttagca 480 aagcaaagga ggggaagcac gggcagatag caccgtacca tacccttgga aactcgaaat 540 gaacgaagca ggaaatgaga gaatgagagt tttgtaggta tatatagcgg tagtgtttgc 600 gcgttaccat catcttctgg atctatctat tgttcttttc ctcatcactt tccccttttt 660 cgctcttctt cttgtctttt atttctttct tttttttaat tgttccctcg attggctatc 720 taccaaagaa tccaaactta atacacgtat ttatttgtcc aattacc 767 <210> 141 <211> 1346 <212> DNA <213> Artificial Sequence <220> <223> synthesized 2-micron replication origin 1 <400> 141 aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 60 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 120 taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg agagcgctaa 180 tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgagagcgc 240 tattttacca acaaagaatc tatacttctt ttttgttcta caaaaatgca tcccgagagc 300 gctatttttc taacaaagca tcttagatta ctttttttct cctttgtgcg ctctataatg 360 cagtctcttg ataacttttt gcactgtagg tccgttaagg ttagaagaag gctactttgg 420 tgtctatttt ctcttccata aaaaaagcct gactccactt cccgcgttta ctgattacta 480 gcgaagctgc gggtgcattt tttcaagata aaggcatccc cgattatatt ctataccgat 540 gtggattgcg catactttgt gaacagaaag tgatagcgtt gatgattctt cattggtcag 600 aaaattatga acggtttctt ctattttgtc tctatatact acgtatagga aatgtttaca 660 ttttcgtatt gttttcgatt cactctatga atagttctta ctacaatttt tttgtctaaa 720 gagtaatact agagataaac ataaaaaatg tagaggtcga gtttagatgc aagttcaagg 780 agcgaaaggt ggatgggtag gttatatagg gatatagcac agagatatat agcaaagaga 840 tacttttgag caatgtttgt ggaagcggta ttcgcaatat tttagtagct cgttacagtc 900 cggtgcgttt ttggtttttt gaaagtgcgt cttcagagcg cttttggttt tcaaaagcgc 960 tctgaagttc ctatactttc tagagaatag gaacttcgga ataggaactt caaagcgttt 1020 ccgaaaacga gcgcttccga aaatgcaacg cgagctgcgc acatacagct cactgttcac 1080 gtcgcaccta tatctgcgtg ttgcctgtat atatatatac atgagaagaa cggcatagtg 1140 cgtgtttatg cttaaatgcg tacttatatg cgtctattta tgtaggatga aaggtagtct 1200 agtacctcct gtgatattat cccattccat gcggggtatc gtatgcttcc ttcagcacta 1260 ccctttagct gttctatatg ctgccactcc tcaattggat tagtctcatc cttcaatgct 1320 atcatttcct ttgatattgg atcata 1346 <210> 142 <211> 1705 <212> DNA <213> Artificial Sequence <220> <223> KanMX expression cassette <400> 142 ctagggattc ataaccattt tctcaatcga attacacaga acacaccgta caaacctctc 60 tatcataact acttaatagt cacacacgta ctcgtctaaa tacacatcat cgtcctacaa 120 gttcatcaaa gtgttggaca gacaactata ccagcatgga tctcttgtat cggttctttt 180 ctcccgctct ctcgcaataa caatgaacac tgggtcaatc atagcctaca caggtgaaca 240 gagtagcgtt tatacagggt ttatacggtg attcctacgg caaaaatttt tcatttctaa 300 aaaaaaaaag aaaaattttt ctttccaacg ctagaaggaa aagaaaaatc taattaaatt 360 gatttggtga ttttctgaga gttccctttt tcatatatcg aattttgaat ataaaaggag 420 atcgaaaaaa tttttctatt caatctgttt tctggtttta tttgatagtt tttttgtgta 480 ttattattat ggattagtac tggtttatat gggtttttct gtataacttc tttttatttt 540 agtttgttta atcttatttt gagttacatt atagttccct aactgcaaga gaagtaacat 600 taaaactcga gatgggtaag gaaaagactc acgtttcgag gccgcgatta aattccaaca 660 tggatgctga tttatatggg tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga 720 caatctatcg attgtatggg aagcccgatg cgccagagtt gtttctgaaa catggcaaag 780 gtagcgttgc caatgatgtt acagatgaga tggtcagact aaactggctg acggaattta 840 tgcctcttcc gaccatcaag cattttatcc gtactcctga tgatgcatgg ttactcacca 900 ctgcgatccc cggcaaaaca gcattccagg tattagaaga atatcctgat tcaggtgaaa 960 atattgttga tgcgctggca gtgttcctgc gccggttgca ttcgattcct gtttgtaatt 1020 gtccttttaa cagcgatcgc gtatttcgtc tggctcaggc gcaatcacga atgaataacg 1080 gtttggttga tgcgagtgat tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct 1140 ggaaagaaat gcataagctt ttgccattct caccggattc agtcgtcact catggtgatt 1200 tctcacttga taaccttatt tttgacgagg ggaaattaat aggttgtatt gatgttggac 1260 gagtcggaat cgcagaccga taccaggatc ttgccatcct atggaactgc ctcggtgagt 1320 tttctccttc attacagaaa cggctttttc aaaaatatgg tattgataat cctgatatga 1380 ataaattgca gtttcatttg atgctcgatg agtttttcta agtttaactt gatactacta 1440 gatttttctc ttcatttata aaatttttgg ttataattga agctttagaa gtatgaaaaa 1500 atcctttttt ttcattcttt gcaaccaaaa taagaagctt cttttattca ttgaaatgat 1560 gaatataaac ctaacaaaag aaaaagactc gaatatcaaa cattaaaaaa aaataaaaga 1620 ggttatctgt tttcccattt agttggagtt tgcattttct aatagataga actctcaatt 1680 aatgtggatt tagtttctct gttcg 1705 <210> 143 <211> 299 <212> DNA <213> Artificial Sequence <220> <223> synthesized SNR52p promoter <400> 143 ccctcactaa agggaacaaa agctggagct tctttgaaaa gataatgtat gattatgctt 60 tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag gtgattacat 120 gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg ggaaaggtgc 180 gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg ctgtagaagt 240 gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga taaatgatc 299 <210> 144 <211> 11555 <212> DNA <213> Artificial Sequence <220> <223> pSE087 plasmid <400> 144 gatcctctag tttctcggta ctatgcatat gatccaatat caaaggaaat gatagcattg 60 aaggatgaga ctaatccaat tgaggagtgg cagcatatag aacagctaaa gggtagtgct 120 gaaggaagca tacgataccc cgcatggaat gggataatat cacaggaggt actagactac 180 ctttcatcct acataaatag acgcatataa gtacgcattt aagcataaac acgcactatg 240 ccgttcttct catgtatata tatatacagg caacacgcag atataggtgc gacgtgaaca 300 gtgagctgta tgtgcgcagc tcgcgttgca ttttcggaag cgctcgtttt cggaaacgct 360 ttgaagttcc tattccgaag ttcctattct ctagaaagta taggaacttc agagcgcttt 420 tgaaaaccaa aagcgctctg aagacgcact ttcaaaaaac caaaaacgca ccggactgta 480 acgagctact aaaatattgc gaataccgct tccacaaaca ttgctcaaaa gtatctcttt 540 gctatatatc tctgtgctat atccctatat aacctaccca tccacctttc gctccttgaa 600 cttgcatcta aactcgacct ctacattttt tatgtttatc tctagtatta ctctttagac 660 aaaaaaattg tagtaagaac tattcataga gtgaatcgaa aacaatacga aaatgtaaac 720 atttcctata cgtagtatat agagacaaaa tagaagaaac cgttcataat tttctgacca 780 atgaagaatc atcaacgcta tcactttctg ttcacaaagt atgcgcaatc cacatcggta 840 tagaatataa tcggggatgc ctttatcttg aaaaaatgca cccgcagctt cgctagtaat 900 cagtaaacgc gggaagtgga gtcaggcttt ttttatggaa gagaaaatag acaccaaagt 960 agccttcttc taaccttaac ggacctacag tgcaaaaagt tatcaagaga ctgcattata 1020 gagcgcacaa aggagaaaaa aagtaatcta agatgctttg ttagaaaaat agcgctctcg 1080 ggatgcattt ttgtagaaca aaaaagaagt atagattctt tgttggtaaa atagcgctct 1140 cgcgttgcat ttctgttctg taaaaatgca gctcagattc tttgtttgaa aaattagcgc 1200 tctcgcgttg catttttgtt ttacaaaaat gaagcacaga ttcttcgttg gtaaaatagc 1260 gctttcgcgt tgcatttctg ttctgtaaaa atgcagctca gattctttgt ttgaaaaatt 1320 agcgctctcg cgttgcattt ttgttctaca aaatgaagca cagatgcttc gttaacaaag 1380 atatgctatt gaagtgcaag atggaaacgc agaaaatgaa ccggggatgc gacgtgcaag 1440 attacctatg caatagatgc aatagtttcg gcatgccgaa cagagaaact aaatccacat 1500 taattgagag ttctatctat tagaaaatgc aaactccaac taaatgggaa aacagataac 1560 ctcttttatt tttttttaat gtttgatatt cgagtctttt tcttttgtta ggtttatatt 1620 catcatttca atgaataaaa gaagcttctt attttggttg caaagaatga aaaaaaagga 1680 ttttttcata cttctaaagc ttcaattata accaaaaatt ttataaatga agagaaaaat 1740 ctagtagtat caagttaaac ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta 1800 ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa 1860 aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc gattccgact 1920 cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt atcaagtgag 1980 aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagcttatg catttctttc 2040 cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa 2100 ccgttattca ttcgtgattg cgcctgagcc agacgaaata cgcgatcgct gttaaaagga 2160 caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata 2220 ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttgcc ggggatcgca 2280 gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt cggaagaggc 2340 ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt ggcaacgcta 2400 cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa tcgatagatt 2460 gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa atcagcatcc 2520 atgttggaat ttaatcgcgg cctcgaaacg tgagtctttt ccttacccat ctcgagtttt 2580 aatgttactt ctcttgcagt tagggaacta taatgtaact caaaataaga ttaaacaaac 2640 taaaataaaa agaagttata cagaaaaacc catataaacc agtactaatc cataataata 2700 atacacaaaa aaactatcaa ataaaaccag aaaacagatt gaatagaaaa attttttcga 2760 tctcctttta tattcaaaat tcgatatatg aaaaagggaa ctctcagaaa atcaccaaat 2820 caatttaatt agatttttct tttccttcta gcgttggaaa gaaaaatttt tctttttttt 2880 tttagaaatg aaaaattttt gccgtaggaa tcaccgtata aaccctgtat aaacgctact 2940 ctgttcacct gtgtaggcta tgattgaccc agtgttcatt gttattgcga gagagcggga 3000 gaaaagaacc gatacaagag atccatgctg gtatagttgt ctgtccaaca ctttgatgaa 3060 cttgtaggac gatgatgtgt atttagacga gtacgtgtgt gactattaag tagttatgat 3120 agagaggttt gtacggtgtg ttctgtgtaa ttcgattgag aaaatggtta tgaatcccta 3180 gacccgggaa tctctaagta aatgcatgta tactaaactc acaaattaga gcttcaattt 3240 aattatatca gttattaccc gggttacgcc aagcgcgcaa ttaaccctca ctaaagggaa 3300 caaaagctgg agctcccctc actaaaggga acaaaagctg gagcttcttt gaaaagataa 3360 tgtatgatta tgctttcact catatttata cagaaacttg atgttttctt tcgagtatat 3420 acaaggtgat tacatgtacg tttgaagtac aactctagat tttgtagtgc cctcttgggc 3480 tagcgggaaa ggtgcgcatt ttttcacacc ctacaatgtt ctgttcaaaa gattttggtc 3540 aaacgctgta gaagtgaaag ttggtgcgca tgtttcggcg ttcgaaactt ctccgcagtg 3600 aaagataaat gatcggagac ggatacgttc tctatggagg agttttagag ctagaaatag 3660 caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtggtgc 3720 tttttttctg gccgtctcta agggcccggt acccaattcg ccctatagtg agtcgtatta 3780 cgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 3840 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3900 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3960 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 4020 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 4080 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 4140 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 4200 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 4260 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 4320 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 4380 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 4440 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 4500 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 4560 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 4620 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4680 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4740 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4800 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4860 gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4920 cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4980 gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 5040 gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 5100 ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 5160 tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 5220 ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 5280 cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 5340 accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 5400 cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 5460 tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 5520 cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 5580 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 5640 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5700 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5760 aaagtgccac ctgacgtcgg cgcgccattt aaatagatcc ggtccgctcg agctgtaccg 5820 cagatgggac ctcttatgaa agtagacatc cttaagtgat gtaggggtat gtccgagtag 5880 ttcgttcaac tatttttaaa gacacatcgt tccaggttta tattcatata catatgtatg 5940 tattgtatag gtttttttat tttttatttt ttattttttt tttttttttt ttcaattttt 6000 ttaagctttt cttacttttc cgatgccctt tccactttaa tcaatatacg tatgaaattc 6060 agccgaagtt tccgtttgat aatatattag attcaatata aaaaaaagtt tatatgattc 6120 agtgtatata tatatatata aataagaggt gcgaaagccc acataaagag attgaagaga 6180 ctgcgtaaaa agaaatatat agagagatac tcttaactag acctttcttt tcttctttgg 6240 gtcggctctg gagtcgccac ccaattgaga taagtcaatt ctagtttcgt acaaaccagt 6300 aatagattga tggatcaagg tggcgtccaa gacttccttg gtagaggtgt aacgcttacg 6360 gtcaatagtg gtgtcgaagt acttgaaggc agcaggagca cccaaattgg tcaaagtgaa 6420 caagtgaatg atgttttcag cttgttctct gattggcttg tctctgtgct tgttgtaggc 6480 ggacaaaacc ttgtccaagt tagcgtcagc caaaatgact ctcttggaga actcggagat 6540 ttgttcaatg atttcgtcca agtagtgctt gtgttgttcg acgaatagtt gcttttgttc 6600 gttgtcttct ggactaccct tcaacttttc gtagtgagaa gccaagtata ggaagttaac 6660 gtacttgctt ggcaaggcca attcgttacc cttttgcaat tcaccagcgg aagccaacat 6720 tctctttcta ccgttttcca attcgaacaa tgagtacttt ggcaacttta tgatcaagtc 6780 tttcttgact tccttgtaac ccttagcttc taggaagtcg attgggttct tttcgaaaga 6840 acttctttcc atgatggtaa tacctaacaa ttccttgacg ctcttcaatt tcttagactt 6900 acccttttca accttagcga caaccaaaac gctgtaggca acggtaggag agtcgaagcc 6960 accgtatttc tttgggtccc aatctttctt tctagcgatc aacttatcag agtttctctt 7020 tggtaagata gattccttag agaagccacc agtttggact tcggttttct tgacgatgtt 7080 gacttgtggc atagacaaaa cctttctaac ggtagcgaaa tcacgaccct tgtcccaaac 7140 aatttcacct gtttcaccgt ttgtttcgat caatggtctc tttctgattt caccgttagc 7200 caaggtgatt tcggtcttaa agaagttcat aatgttagag taaaagaagt acttagcagt 7260 ggccttaccg atttcttgtt cagacttagc gatcatcttt ctgacatcgt agaccttgta 7320 atcaccgtag acaaattcag attctagctt tgggtatttc ttgattagag cggtacccac 7380 gacagcgttc aagtaagcat cgtgagcatg gtggtaattg ttgatttctc taaccttgta 7440 gaattggaag tcctttctga agtcagaaac caacttggac ttcaaagtga tgaccttgac 7500 ttctctaatc aacttatcat tttcgtcgta cttggtgttc atacgggaat ctaggatttg 7560 ggcaacgtgc ttggtgattt gtctggtttc gaccaattgt ctcttgatga agccagcctt 7620 atccaattcg gacaatccac ctctttcagc cttagttagg ttatcgaact ttctttgagt 7680 gattagctta gcgtttagca attgtctcca gtagttcttc atctttttca cgacctcttc 7740 ggatggaacg ttgtcagact tacctctgtt cttgtcggat ctggtcaaaa ccttgttgtc 7800 aatagaatcg tccttcaaga aagattgtgg gacgatgtgg tcaacgtcgt agtcggataa 7860 tctgttgata tctaattctt ggtcaacgta catatctcta ccgttttgca agtagtacaa 7920 gtataacttt tcgttttgta gttgggtgtt ttcaacgggg tgttccttca agatttgaga 7980 acccaattcc ttgataccct cttcgattct cttcattctt tctctagagt tcttttgacc 8040 cttttgtgta gtttgatttt ctctagccat ttctatgacg atgttttctg gcttgtgtct 8100 acccataacc ttaactagtt cgtctacaac cttgacagtt tgtagaatac ctttctttat 8160 ggctggggaa ccagccaagt tagcgatgtg ttcgtgcaag gaatcacctt gaccagaaac 8220 ttgagccttt tggatatctt ccttgaaggt caaagaatcg tcgtggatca attgcatgaa 8280 gtttctgttg gcgaaaccat cggacttcaa gaaatccaag atggtcttac cagattgctt 8340 gtctctgata ccgttaatca actttcttga caatctaccc caaccagtgt acctacgtct 8400 tttcaattgc ttcataacct tgtcatcaaa caagtgggcg taggtcttca atctctcttc 8460 gatcatttct ctgtcttcga acaaggttaa agttaggaca atgtcttcca aaatgtcttc 8520 gttctcttcg ttatccaaga agtccttgtc cttaatgatc tttagtaagt cgtggtaggt 8580 acccaaagaa gcgttgaatc tatcttcaac accagagatt tcaacagaat cgaaacattc 8640 gattttcttg aagtagtctt cctttagttg cttaacagtg acctttctgt ttgtcttgaa 8700 taacaagtca acgatagctt tcttttgttc gccagacaag aaggctggct ttctcatacc 8760 ttcagtaacg tacttgacct tggtcaattc gttgtaaaca gtgaagtatt cgtataacaa 8820 ggaatgcttt ggcaagacct tttcgtttgg caagtttttg tcgaagttgg tcattctttc 8880 gatgaaagat tgagcggaag cacccttatc tacgacctct tcgaaattcc aaggggtgat 8940 ggtctcttcg gactttctgg tcatccaagc gaatctggag ttacctctag ctagaggacc 9000 gacgtagtat gggattctaa aagttaggat cttttcaatc ttttctctgt tgtccttcaa 9060 gaatgggtag aagtcttctt gccttctcaa gatagcgtgt agttcaccta agtggatttg 9120 gtgtggaatg gaaccgttgt cgaaggttct ttgctttctt aacaagtctt ctctattcaa 9180 cttaactagc aactcttcgg taccgtccat cttttccaag attggcttga tgaacttgta 9240 gaactcttct tgactagctc caccgtcgat gtaaccagcg taaccgttct tagattgatc 9300 aaagaagatt tccttgtact tttcgggcaa ttgttgtcta accaaagcct tcaatagagt 9360 caagtcttga tggtgttcgt cgtatctctt aatcatggaa gcagacaatg gagccttagt 9420 gatttcagtg ttaactctca aaatgtcaga tagcaaaatg gcatcagaca agttcttggc 9480 agccaagaac aagtcagcgt attggtcacc aatttgggct aacaagttat ctaaatcgtc 9540 atcgtaagtg tccttggaca attgcaactt agcatcttca gccaaatcga agttagactt 9600 gaagtttgga gtcaaaccca aagacaaagc aatcaagtta ccgaacaaac cgtttttctt 9660 ttcacctggt aattgggcaa tcaagttttc caaacgtctg gacttggata atctagcgga 9720 caaaatggcc ttagcgtcaa caccagaggc gttgatagga ttctcttcga acaattggtt 9780 gtaagtttga accaattgga tgaacaactt atcgacgtca gagttgtctg ggttcaagtc 9840 accttcgatt aggaagtgac cacggaactt gatcatgtgg gccaaagcca agtagatcaa 9900 tctcaagtca gccttgtcgg tggagtcaac caatttcttt ctcaagtggt agatagttgg 9960 gtacttttcg tggtaagcga cttcgtcaac gatgttaccg aagattgggt gtctttcgtg 10020 ctttttgtcc tcttcgacca agaaagactc ttccaatctg tgaaagaaag aatcgtcaac 10080 cttagccatt tcattagaga agatttcttg caagtaacag attctgttct tacgtctagt 10140 gtaacgtcta cgggctgttc tcttcaatct agtagcttcg gcagtttcac cagagtcgaa 10200 taacaaagca ccgattaggt ttttcttgat ggagtgtcta tcggtgttac ccaagacctt 10260 gaatttctta gatgggacct tgtattcgtc agtaatgaca gcccaaccaa cagagttggt 10320 accgatgtcc aaaccgatag agtatttctt gtccatggta attggacaaa taaatacgtg 10380 tattaagttt ggattctttg gtagatagcc aatcgaggga acaattaaaa aaaagaaaga 10440 aataaaagac aagaagaaga gcgaaaaagg ggaaagtgat gaggaaaaga acaatagata 10500 gatccagaag atgatggtaa cgcgcaaaca ctaccgctat atatacctac aaaactctca 10560 ttctctcatt tcctgcttcg ttcatttcga gtttccaagg gtatggtacg gtgctatctg 10620 cccgtgcttc ccctcctttg ctttgctaag aaaaattttc ttttgtcagc agcaacaaca 10680 cgctacgctc tgcgctgtgc tacgaagtgg tctctgtggc aacggggaca ttgtacccat 10740 gcccgctcgc agggaggtct gggtgtgggg cgtgtgcgac ctcgttgcca tggcgatcgc 10800 gcgtgggtgt ggtctttccc caaacggttg cccgttgctc cggatttcgc atagttgtcg 10860 cgtaaacaaa aaacacgaga gagggcggac ggcgctgaat agtggaagat cgcgcgatgt 10920 caagtaaata agcttgtatt tgtatttgta tgtgtttatg tgtttgtgtg gttgagaatt 10980 ttattttcct cctagttttt tcttttttga gtgcggaggg gcagtgctct aaactttgcc 11040 tgcttcttgt tcgacttcgg cttcctatgc agaacgcaaa atcgcgtgcg cgaggaacga 11100 ggaagacaac gctttagatt ggcgcggccg cccgcaaatt aaagccttcg agcgtcccaa 11160 aaccttctca agcaaggttt tcagtataat gttacatgcg tacacgcgtc tgtacagaaa 11220 aaaaagaaaa atttgaaata taaataacgt tcttaatact aacataacta taaaaaaata 11280 aatagggacc tagacttcag gttgtctaac tccttccttt tcggttagag cggatgtggg 11340 gggagggcgt gaatgtaagc gtgacataac taattacatg attaatctag taacaaggct 11400 aagatatcag cctgaaataa agggtggtga agtaataatt aaatcatccg tataaaccta 11460 tacacatata tgaggaaaaa taatacaaaa gtgttttaaa tacagataca tacatgaaca 11520 tatgcacgta tagcgcccaa atgtcggtaa tggga 11555 <210> 145 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 145 ctccgcagtg aaagataaat gatcgcccaa aatttgttta ctaaaaacac atgtgga 57 <210> 146 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 146 gaattgggta ccgggccctt agagtaaaaa attgtacttg gcggataatg cctttagc 58 <210> 147 <211> 106 <212> DNA <213> Artificial Sequence <220> <223> synthesized targeting sgRNA + T(6) terminator <400> 147 gatacgttct ctatggagga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct tttttt 106 <210> 148 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> synthesized 50 bp upstream homology arm <400> 148 cccaaaattt gtttactaaa aacacatgtg gatatcttga ctgatttttc 50 <210> 149 <211> 106 <212> DNA <213> Artificial Sequence <220> <223> synthesized URA3 targeting sgRNA + T(6) terminator <400> 149 tatcttgact gatttttcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct tttttt 106 <210> 150 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> synthesized 50 bp downstream homology arm <400> 150 gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc 50 <210> 151 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 151 ccgccaagta caatttttta ctctaagggc ccggtaccca attcgcccta tagtgag 57 <210> 152 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 152 catcatcacc atcattgata agagtatctc tctatatatt tctttttacg cagtctc 57 <210> 153 <211> 566 <212> DNA <213> Artificial Sequence <220> <223> synthesized 2-micron replication origin 2 <400> 153 gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 60 caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 120 actgttcttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 180 acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 240 cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 300 gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 360 cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 420 gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 480 tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 540 tcgtcagggg ggcggagcct atggaa 566 <210> 154 <211> 859 <212> DNA <213> Artificial Sequence <220> <223> synthesized ampicillin resistant gene <400> 154 atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 60 gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 120 cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 180 gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 240 cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 300 gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 360 tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 420 ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 480 gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 540 cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 600 tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 660 tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct 720 cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 780 acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 840 tcactgatta agcattggt 859 <210> 155 <211> 400 <212> DNA <213> Artificial Sequence <220> <223> synthesized RNR2 terminator <400> 155 gagtatctct ctatatattt ctttttacgc agtctcttca atctctttat gtgggctttc 60 gcacctctta tttatatata tatatataca ctgaatcata taaacttttt tttatattga 120 atctaatata ttatcaaacg gaaacttcgg ctgaatttca tacgtatatt gattaaagtg 180 gaaagggcat cggaaaagta agaaaagctt aaaaaaattg aaaaaaaaaa aaaaaaaaat 240 aaaaaataaa aaataaaaaa acctatacaa tacatacata tgtatatgaa tataaacctg 300 gaacgatgtg tctttaaaaa tagttgaacg aactactcgg acatacccct acatcactta 360 aggatgtcta ctttcataag aggtcccatc tgcggtacag 400 <210> 156 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 156 ccttgcgttt cttttttggg gccatggtaa ttggacaaat aaatacgtgt attaag 56 <210> 157 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 157 tgtttttagt aaacaaattt tgggcgatca tttatctttc actgcggaga agtttc 56

Claims (34)

  1. 서열 번호 1에 기재된 모 Cas9 폴리펩타이드와 적어도 80%의 아미노산 동일성을 갖고, 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서 적어도 하나의 아미노산 치환을 갖는 Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편으로서, 변이체의 아미노산 위치는 상기 모 Cas9 폴리펩타이드의 아미노산 서열과의 관련성에 의해 넘버링되고, 상기 Cas9 엔도뉴클레아제 변이체는 엔도뉴클레아제 활성을 갖는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
  2. 제1항에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는, Cas9 엔도뉴클레아제 변이체.
  3. 제1항에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는, Cas9 엔도뉴클레아제 변이체.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 변이체는 서열 번호 1의 아미노산 서열과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
  5. 제3항에 있어서, 개선된 특성은 개선된 형질전환 효율이고, 상기 변이체, 또는 이의 활성 단편은 또한 개선된 편집 효율을 갖는, Cas9 엔도뉴클레아제 변이체.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 아미노산 치환을 포함하는, Cas9 엔도뉴클레아제 변이체, 또는 이의 활성 단편.
  7. 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 조성물.
  8. 제7항에 있어서, 상기 조성물은 가이드 폴리뉴클레오타이드/Cas9 엔도뉴클레아제 복합체, 가이드 RNA/Cas9 엔도뉴클레아제 복합체, 및 상기 Cas9 엔도뉴클레아제 변이체를 포함하는 융합 단백질로 이루어진 군으로부터 선택되는, 조성물.
  9. 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드.
  10. 적어도 하나의 가이드 폴리뉴클레오타이드 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 포함하는 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN)로서, 상기 가이드 폴리뉴클레오타이드는 키메라성 비자연 발생 가이드 폴리뉴클레오타이드이고, 상기 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체는 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹(nicking)하거나 풀거나(unwinding) 절단할 수 있는, 가이드 폴리뉴클레오타이드/Cas 엔도뉴클레아제 복합체(PGEN).
  11. 제9항의 폴리뉴클레오타이드를 포함하는 재조합 DNA 작제물.
  12. 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제, 또는 이의 기능적 단편을 포함하는 숙주 세포.
  13. 제9항의 폴리뉴클레오타이드를 포함하는 숙주 세포.
  14. 제13항에 있어서, 세포는 원핵생물 세포 또는 진핵생물 세포인, 숙주 세포.
  15. 제14항에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
  16. 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 제10항의 PGEN을 도입하는 단계 및 상기 표적에서 변형을 갖는 적어도 하나의 세포를 확인하는 단계를 포함하고, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
  17. 세포의 게놈에서 뉴클레오타이드 서열을 편집하는 방법으로서, 상기 방법은 적어도 하나의 제10항의 PGEN 및 폴리뉴클레오타이드 변형 주형을 도입하는 단계를 포함하고, 상기 폴리뉴클레오타이드 변형 주형은 상기 뉴클레오타이드 서열의 적어도 하나의 뉴클레오타이드 변형을 포함하는 방법.
  18. 제17항에 있어서, 편집된 뉴클레오타이드 서열을 포함하는 적어도 하나의 세포를 선택하는 단계를 추가로 포함하는 방법.
  19. 세포의 게놈에서 표적 부위를 변형시키는 방법으로서, 상기 방법은 세포로 적어도 하나의 제10항의 PGEN 및 적어도 하나의 공여 DNA를 도입하는 단계를 포함하고, 상기 공여 DNA는 관심 폴리뉴클레오타이드를 포함하는 방법.
  20. 제19항에 있어서, 상기 관심 폴리뉴클레오타이드가 상기 표적 부위에서 또는 그 근처에서 통합된 적어도 하나의 세포를 확인하는 단계를 추가로 포함하는 방법.
  21. 제16항 내지 제21항 중 어느 한 항에 있어서, 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물 세포로 이루어진 군으로부터 선택되는 방법.
  22. 제16항 내지 제21항 중 어느 한 항에 있어서, PGEN은 예비조립된 폴리뉴클레오타이드-단백질 복합체로서 세포로 도입되는 방법.
  23. 제16항 내지 제21항 중 어느 한 항에 있어서, 가이드 폴리뉴클레오타이드 /Cas 엔도뉴클레아제는 가이드 RNA/Cas 엔도뉴클레아제인 방법.
  24. 제22항에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체는 리보뉴클레오타이드-단백질 복합체로서 세포로 도입되기 전에 시험관내 조립되는 방법.
  25. Cas9 엔도뉴클레아제 변이체의 적어도 하나의 특성을 개선하는 방법으로서, 상기 방법은 모 Cas9 엔도뉴클레아제에서 적어도 하나의 아미노산 변형을 도입하여 상기 Cas9 엔도뉴클레아제 변이체를 생성하는 단계를 포함하고, 상기 적어도 하나의 아미노산 변형은 모 Cas9 엔도뉴클레아제의 RuVC 및 HNH 도메인 밖에 위치하고, 상기 Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 적어도 하나의 특성의 개선을 나타내는 방법.
  26. 제25항에 있어서, 상기 적어도 하나의 아미노산 변형은 86번 위치, 98번 위치, 155번 위치 및 이들의 조합으로 이루어진 군으로부터 선택된 위치에서의 아미노산 치환이고, 변이체의 아미노산 위치는 상기 모 Cas9 엔도뉴클레아제의 아미노산 서열과의 관련성에 의해 넘버링되는 방법.
  27. 제26항에 있어서, 적어도 하나의 아미노산 치환은 (155번 위치에서의) Y155H, Y155N, Y155E, Y155F, (86번 위치에서의) F86A 및 (98번 위치에서의) F98A로 이루어진 군으로부터 선택되는 방법.
  28. 제25항에 있어서, Cas9 엔도뉴클레아제 변이체는 상기 모 Cas9 엔도뉴클레아제와 비교할 때 개선된 형질전환 효율 및 개선된 편집 효율로 이루어진 군으로부터 선택된 적어도 하나의 개선된 특성을 갖는 방법.
  29. 제24항 내지 제27항 중 어느 한 항의 방법에 의해 생산된 Cas9 엔도뉴클레아제 변이체.
  30. 바실러스 숙주 세포의 게놈을 변형시키는 방법으로서,
    변형되는 적어도 하나의 표적 서열을 포함하는 바실러스 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
    적어도 하나의 바실러스 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
  31. 제30항에 있어서, 상기 표적 부위에서의 변형은 (i) 적어도 하나의 뉴클레오타이드의 대체, (ii) 적어도 하나의 뉴클레오타이드의 결실, (iii) 적어도 하나의 뉴클레오타이드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
  32. 제29항에 있어서, 바실러스 숙주 세포는 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 알티투디니스(Bacillus altitudinis), 바실러스 아밀로리쿼파시엔스(Bacillus amyloliquefaciens), B. 아밀로리쿼파시엔스 아종 플란타룸(plantarum), 바실러스 브레비스(Bacillus brevis), 바실러스 서르쿨란스(Bacillus circulans), 바실러스 클라우시(Bacillus clausii), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 피르무스(Bacillus firmus), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 메틸로트로피쿠스(Bacillus methylotrophicus), 바실러스 푸밀루스(Bacillus pumilus), 바실러스 사펜시스(Bacillus safensis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 서브틸리스(Bacillus subtilis) 및 바실러스 투린기엔시스(Bacillus thuringiensis)로 이루어진 바실러스 종의 군으로부터 선택되는 방법.
  33. E. 콜라이 숙주 세포의 게놈을 변형시키는 방법으로서,
    변형되는 적어도 하나의 표적 서열을 포함하는 E. 콜라이 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
    적어도 하나의 E. 콜라이 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
  34. 진균 숙주 세포의 게놈을 변형시키는 방법으로서,
    변형되는 적어도 하나의 표적 서열을 포함하는 진균 숙주 세포에 적어도 하나의 비자연 발생 가이드 RNA 및 적어도 하나의 제1항 내지 제6항 중 어느 한 항의 Cas9 엔도뉴클레아제 변이체를 제공하는 단계이되, 가이드 RNA 및 Cas9 엔도뉴클레아제 변이체는 복합체(PGEN)를 형성할 수 있고, 상기 복합체는 상기 적어도 하나의 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로 이를 닉킹하거나 풀거나 절단할 수 있는 것인 단계; 및
    적어도 하나의 진균 숙주 세포를 확인하는 단계이되, 적어도 하나의 게놈 표적 서열은 변형된 것인 단계를 포함하는, 방법.
KR1020207019496A 2017-12-15 2018-12-11 Cas9 변이체 및 사용 방법 KR20200098578A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762599176P 2017-12-15 2017-12-15
US62/599,176 2017-12-15
PCT/US2018/064955 WO2019118463A1 (en) 2017-12-15 2018-12-11 Cas9 variants and methods of use

Publications (1)

Publication Number Publication Date
KR20200098578A true KR20200098578A (ko) 2020-08-20

Family

ID=65003497

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207019496A KR20200098578A (ko) 2017-12-15 2018-12-11 Cas9 변이체 및 사용 방법

Country Status (10)

Country Link
US (2) US11781125B2 (ko)
EP (1) EP3707253A1 (ko)
JP (2) JP7384801B2 (ko)
KR (1) KR20200098578A (ko)
CN (1) CN111465689A (ko)
AU (1) AU2018386002A1 (ko)
BR (1) BR112020011011A2 (ko)
CA (1) CA3084191A1 (ko)
MX (1) MX2020005726A (ko)
WO (1) WO2019118463A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022526982A (ja) * 2019-04-05 2022-05-27 ダニスコ・ユーエス・インク 線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物
CN110272858B (zh) * 2019-07-18 2020-09-04 江南大学 一种高产l-乳酸的凝结芽孢杆菌及其应用
EP4031560A1 (en) * 2019-08-14 2022-07-27 Danisco US Inc Compositions and methods for increased protein production in bacillus licheniformis
JP2023524334A (ja) 2020-01-15 2023-06-12 ダニスコ・ユーエス・インク バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法
CN112195164B (zh) * 2020-12-07 2021-04-23 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
CN116601293A (zh) * 2020-12-07 2023-08-15 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5316931A (en) 1988-02-26 1994-05-31 Biosource Genetics Corp. Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
TW261517B (ko) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
BR9306802A (pt) 1992-07-27 1998-12-08 Pioneer Hi Bred Int Processo independente de genótipos para produção de planta de soja transgénica e processo de regeneração de plantas de soja a partir de nodos cotiledonais
IL108241A (en) 1992-12-30 2000-08-13 Biosource Genetics Corp Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
EP0892811B1 (de) 1996-03-26 2002-12-18 Razvan T. Radulescu Peptide mit antiproliferativen eigenschaften
AU3495297A (en) 1996-07-08 1998-02-02 Pioneer Hi-Bred International, Inc. Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
EP1309677B2 (en) 2000-08-11 2012-04-11 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
SI1495330T1 (sl) 2002-04-12 2009-06-30 Dowd Brian F O Postopki identificiranja spojin, ki medsebojno vplivajo na transmembranske proteine
US20110059496A1 (en) 2003-06-25 2011-03-10 E. I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast
US7459546B2 (en) 2003-06-25 2008-12-02 E.I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase regulatory sequences for gene expression in oleaginous yeast
WO2005049805A2 (en) 2003-11-14 2005-06-02 E.I. Dupont De Nemours And Company Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast
US7264949B2 (en) 2004-09-15 2007-09-04 E.I. Du Pont De Nemours And Company Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast
US20060094102A1 (en) 2004-11-04 2006-05-04 Zhixiong Xue Ammonium transporter promoter for gene expression in oleaginous yeast
DK2336362T3 (en) 2005-08-26 2019-01-21 Dupont Nutrition Biosci Aps USE OF CRISPR-ASSOCIATED GENES (CAS)
WO2008007989A1 (en) 2006-07-11 2008-01-17 Grabania, Bogdan Head for directing objects, especially for displaying screens
RU2485180C2 (ru) 2007-06-07 2013-06-20 Эгрикалча Энд Эгри-Фуд Кэнэда Способ трансфекции и трансдукции растительных клеток
EA201391373A1 (ru) 2011-03-23 2014-07-30 Пайонир Хай-Бред Интернэшнл, Инк. Способы получения сложного локуса трансгенных признаков
WO2012135773A1 (en) 2011-03-31 2012-10-04 E. I. Du Pont De Nemours And Company Yarrowia diacylglycerol acyltransferase promoter regions for gene expression in yeast
WO2012135777A1 (en) 2011-04-01 2012-10-04 E. I. Du Pont De Nemours And Company Yarrowia esterase/lipase promoter regions for gene expression in yeast
US8735094B2 (en) 2011-04-05 2014-05-27 E I Du Pont De Nemours And Company Yarrowia n-alkane-hydroxylating cytochrome P450 promoter regions for gene expression in yeast
WO2012138612A1 (en) 2011-04-07 2012-10-11 E. I. Du Pont De Nemours And Company Yarrowia peroxisomal 2,4-dienoyl-coa reductase promoter regions for gene expression in yeast
LT3401400T (lt) 2012-05-25 2019-06-10 The Regents Of The University Of California Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP4234696A3 (en) 2012-12-12 2023-09-06 The Broad Institute Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
CA3109801C (en) 2013-08-22 2024-01-09 Andrew Cigan Plant genome modification using guide rna/cas endonuclease systems and methods of use
US10513711B2 (en) * 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
AU2015343307B2 (en) 2014-11-06 2021-05-20 Iff Us Holding, Llc Peptide-mediated delivery of RNA-guided endonuclease into cells
KR20180008572A (ko) 2015-05-15 2018-01-24 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 Cas 엔도뉴클레아제 시스템, pam 서열 및 가이드 rna 요소의 신속한 특성화
WO2017019867A1 (en) 2015-07-28 2017-02-02 Danisco Us Inc Genome editing systems and methods of use
KR20180059535A (ko) 2015-10-20 2018-06-04 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 마커-프리 게놈 변형을 위한 방법 및 조성물
JP7025325B2 (ja) 2015-10-30 2022-02-24 ダニスコ・ユーエス・インク タンパク質発現の増強およびその方法
US20180362975A1 (en) 2015-12-04 2018-12-20 Novartis Ag Compositions and methods for immunooncology
US9946070B2 (en) 2016-03-08 2018-04-17 Sharp Kabushiki Kaisha Automotive head up display
US20190161742A1 (en) * 2016-03-11 2019-05-30 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
JP2020515258A (ja) * 2017-03-31 2020-05-28 アジェノビア コーポレーション 抗ウイルス治療剤

Also Published As

Publication number Publication date
MX2020005726A (es) 2020-08-13
US11781125B2 (en) 2023-10-10
JP2023011727A (ja) 2023-01-24
US20200308561A1 (en) 2020-10-01
US20240018497A1 (en) 2024-01-18
AU2018386002A1 (en) 2020-05-28
CA3084191A1 (en) 2019-06-20
WO2019118463A1 (en) 2019-06-20
JP2021506257A (ja) 2021-02-22
EP3707253A1 (en) 2020-09-16
CN111465689A (zh) 2020-07-28
BR112020011011A2 (pt) 2020-11-17
JP7384801B2 (ja) 2023-11-21

Similar Documents

Publication Publication Date Title
KR102622910B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
KR102424626B1 (ko) 원형 폴리뉴클레오티드 변형 주형과 함께 가이드 RNA/Cas 엔도뉴클레아제 시스템을 이용하여 대장균에서 효율적으로 유전자 편집을 하기 위한 조성물 및 방법
KR102424721B1 (ko) Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달
KR20200098578A (ko) Cas9 변이체 및 사용 방법
CN107002020B (zh) 使用rna引导的内切核酸酶在非常规酵母中基因靶向
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
KR101420991B1 (ko) 테르펜 합성효소 변이체들을 개발하는 방법들
CN102695796B (zh) 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法
KR20180107155A (ko) Cpf1 또는 csm1을 사용하여 게놈을 변형하기 위한 조성물 및 방법
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
DK2324119T3 (en) Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR20140015136A (ko) 3-히드록시프로피온산 및 다른 생성물의 제조 방법
KR20130032897A (ko) 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거
KR20120136349A (ko) 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20140099251A (ko) 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인
KR20130105649A (ko) 피루베이트로부터 아세토락테이트로의 전환을 촉매작용시키는 폴리펩티드를 암호화하는 폴리뉴클레오티드의 통합
CN106661573B (zh) 多核苷酸文库的重组酶介导的整合
CN108779480A (zh) 生产鞘氨醇碱和鞘脂类的方法
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal