KR20190025910A - 조류 숙주 세포에 대한 crispr-cas 시스템 - Google Patents
조류 숙주 세포에 대한 crispr-cas 시스템 Download PDFInfo
- Publication number
- KR20190025910A KR20190025910A KR1020197000858A KR20197000858A KR20190025910A KR 20190025910 A KR20190025910 A KR 20190025910A KR 1020197000858 A KR1020197000858 A KR 1020197000858A KR 20197000858 A KR20197000858 A KR 20197000858A KR 20190025910 A KR20190025910 A KR 20190025910A
- Authority
- KR
- South Korea
- Prior art keywords
- polynucleotide
- host cell
- sequence
- guinea
- target
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/301—Endonuclease
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Plant Substances (AREA)
Abstract
본 발명은 분자 생물학 및 세포 생물학의 분야에 관한 것이다. 보다 구체적으로, 본 발명은 라비린툴로마이세테스(Labyrinthulomycetes) 숙주 세포에 대한 CRISPR-Cas 시스템에 관한 것이다.
Description
관련 출원의 상호 참조
본원은 2016년 7월 13일자로 출원된 미국 가 특허출원 제 62/361,741 호를 우선권 주장하며, 상기 출원의 내용은 전체가 본 명세서에 참고로 인용된다.
기술 분야
본 명세는 분자 생물학 및 세포 생물학의 분야에 관한 것이다. 보다 구체적으로, 본 발명은 조류 라비린툴로마이세테스(Labyrinthulomycetes) 숙주 세포에 대한 CRISPR-Cas 시스템에 관한 것이다.
게놈 기법 및 분석 방법에 있어서 최근의 진보는 다양한 범위의 생물학적 기능 및 질병과 관련된 유전인자를 분류하고 맵핑하는 능력을 현저하게 가속화하였다. 개별적인 유전요소의 선택적인 섭동을 허용함으로써 원인 유전변이의 체계적인 역공학을 가능하게 할 뿐만 아니라 합성 생물학, 생물공학, 및 의학적 응용을 진보시키기 위해서는 정밀 게놈 공학 기술이 필요하다. 게놈-편집 기법, 예를 들어 디자이너 아연 집게, 전사 활성자-형 효과기 뉴클레아제(TALEN), 또는 귀소 메가뉴클레아제를 표적화된 게놈 섭동의 생성에 이용할 수 있지만, 입수 가능하고, 셋업이 용이하며, 규모조정이 가능하고, 게놈내 다중 위치의 표적화가 가능한 신규의 게놈 공학 기술이 여전히 필요하다. 상기 메가뉴클레아제의 공학은 상기 효소의 DNA 인식 및 절단 기능이 단일 도메인 중에 뒤얽혀있기 때문에 대부분의 학술 연구가들에게는 도전이었다. 조작된 아연 집게 배열의 확고한 제작도 또한 배열 중 개별적인 집게 도메인들간의 상황 의존적인 영향을 해명할 필요성으로 인해 많은 실험실들의 경우 어려운 것으로 입증되었다.
따라서 다수의 응용과 함께 숙주 세포내 특정 서열의 표적화를 위한 대안의 확고한 기법에 대한 급박한 필요성이 존재한다. 상기 기술적 문제에 대한 해법은 특허청구범위에서 특성화된 실시태양들에 의해 제공된다.
본원은, 표적-특이적인 서열에 대한 맞춤 단백질의 생성이 필요한 것이 아니라 오히려 특정한 폴리뉴클레오타이드 표적을 인식하도록 안내-폴리뉴클레오타이드에 의해 프로그램화될 수 있는 단일 Cas 효소를 필요로 하는 CRISPR-Cas 시스템을 기본으로 한다; 즉 상기 Cas 효소를 상기 안내-폴리뉴클레오타이드 분자를 사용하여 특정한 폴리뉴클레오타이드 표적에 모집할 수 있다. 상기 CRISPR-Cas 시스템을 게놈 기법 및 분석 방법의 레퍼토리에 첨가하는 것은 분자 생물학 분야에서 기존의 방법들을 현저하게 단순화시킬 수 있다.
본 발명은 안내-폴리뉴클레오타이드 및 Cas 단백질을 포함하는 CRISPR-Cas 시스템의 소스를 포함하는 비-천연 또는 조작된 조성물을 제공하며, 여기에서 상기 안내-폴리뉴클레오타이드는 근본적으로 숙주 세포 중의 표적-폴리뉴클레오타이드의 역 보체인 서열을 포함하고 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킬 수 있다.
본 발명은 또한 숙주 세포를 본 발명에 따른 조성물과 접촉시킴을 포함하는, 세포에서 폴리뉴클레오타이드의 발현을 조절하는 방법에 관한 것이며, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킨다.
본 발명은 또한 본 발명에 따른 조성물을 포함하는 숙주 세포에 관한 것이다.
본 발명은 또한 숙주 세포를 본 발명에 따른 조성물과 접촉시킴을 포함하는, 숙주 세포의 생성 방법에 관한 것이며, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킨다.
본 발명은 또한 관심 화합물에 도움이 되는 조건하에서 본 발명에 따른 숙주 세포를 배양하고 임의로 상기 관심 화합물을 정제 또는 단리시킴을 포함하는, 상기 관심 화합물의 생성 방법에 관한 것이다.
본 명세의 성질, 목적, 및 장점을 더욱 이해하기 위해서, 하기 도면과 함께 하기 상세한 설명을 참조할 것이며, 여기에서 같은 참조번호는 같은 요소를 나타낸다.
도 1은 전형적인 안내-폴리뉴클레오타이드의 예들을 묘사한다. 2개의 안내-폴리뉴클레오타이드는 모두 안내-서열(crRNA) 및 안내-폴리뉴클레오타이드 구조 성분을 포함하는 안내-RNA들이다. 상부 도면에서, 상기 안내-폴리뉴클레오타이드 구조 성분은 서로에 대해 하이브리드화된 2개의 별도의 분자들로 구성되며; 상기 개별적인 성분을 tracr 서열 및 tracr-짝 서열이라 칭할 수 있다. 하부 도면에서, 상기 안내-폴리뉴클레오타이드 구조 성분은 내부 하이브리드화를 갖는 단일 분자로 구성된다. 본 도면은 문헌[Sander and Joung, 2014 and Mali et al., Nat Methods.10(10):957-63, 2013]으로부터 적합화되었다.
도 2는 안내-폴리뉴클레오타이드(gRSR로서 약기되는 안내 RNA 자기-가공 리보자임)가 어떻게 형성되는 지를 묘사한다. 햄머헤드 리보자임 및 HDV 리보자임은 RNA 분자를 절단시켜 최종 및 기능 성숙 안내-폴리뉴클레오타이드(안내-RNA)를 형성시킨다.
도 3은 1% 아가로스 젤상에서 실행된 절단된 플라스미드 및 PCR-증폭된 단편을 도시한다.
도 4는 pYB32 및 pYB33 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 도시한다.
도 5는 T188 및 T189 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, 프로모터 및 부분 Cas9의 존재에 대해 시험되었다.
도 6은 Cas9의 OrfA/Pfa1 유전자좌에의 통합을 입증하는 아가로스 젤상에서 실행된 T188 및 T189 형질전환체의 게놈 DNA로부터 유래된 증폭산물들을 도시한다.
도 7은 1% 아가로스 젤상에서 실행된 게놈 DNA로부터 증폭된 스키조키트리움(Schizochytrium) 지방산 신타제(FAS) 유전자의 일부를 도시한다.
도 8은 벡터 pCL400 중의 FAS 유전자좌내로의 파로모마이신 및 gRNA 카세트의 PCR 클로닝의 결과를 도시한다.
도 9는 하나의 증폭산물로서 첫 번째 3 CS gRNA 표적을 포함하는 전체 영역을 증폭시키기 위해 수행된 PCR 및 gRNA3 CS4 표적을 별도로 증폭시키기 위한 또 다른 PCR의 결과들을 도시한다.
도 10은 T206 형질전환체의 게놈 DNA로부터 gRNA3 CS1 표적을 별도로 증폭시키기 위해 수행된 PCR의 결과를 도시한다.
도 11은 pLC122-Cas9 및 pYB30 플라스미드의 절단의 결과를 도시한다.
도 12는 pYB61 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 도시한다.
도 13은 1% 아가로스 젤상의 pCL122 플라스미드의 절단 결과를 도시한다.
도 14는 1% 아가로스 젤상의 pYB66 클로닝을 위한 gRNA3 CS1 카세트의 증폭산물을 도시한다.
도 15는 1% 아가로스 젤상의 gRNA3 CS1(pYB66 단편)의 절단 결과를 도시한다.
도 16은 pYB66 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 묘사한다.
도 17은 1% 아가로스 젤상의 pYB61 플라스미드의 절단 결과를 도시한다.
도 18은 1% 아가로스 젤상의 pYB73 클로닝을 위한 gRNA CS1 카세트의 증폭산물을 도시한다.
도 19는 pYB73 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 도시한다.
도 20은 T212 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, CarG 유전자의 존재에 대해 시험되었다.
도 21은 T280, T281, T285 및 T286 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, 부분적인 프로모터 및 Cas9 서열의 존재에 대해 시험되었다.
도 22는 T281 및 T286 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, gRNA 카세트의 존재에 대해 시험되었다.
도 23은 T282 및 T287 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, 부분적인 gRNA 카세트의 존재에 대해 시험되었다.
도 24는 T281, T282, T286 및 T287 형질전환체의 게놈 DNA로부터 gRNA3 CS1 표적을 별도로 증폭시키도록 수행된 PCR의 결과를 도시한다.
서열 목록의 설명
서열번호 1은 pCL122-Cas9 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 2는 pYB31 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 3은 pYB32 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 4는 pYB33 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 5는 pCL399 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 6은 pCL400 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 7은 pCL401 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 8은 pCL402 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 9는 pYB36 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 10은 pYB37 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 11은 pYB38 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 12는 pYB39 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 13은 121 Tub seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 14는 pYB32/3 CR1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 15는 CS 프로 Kpn IF F1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 16은 CS 프로 BamH IF R1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 17은 CS 프로 BamH IF F2 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 18은 CS 프로 Nde IF R2 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 19는 O A1-KO F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 20은 pYB32/3 SV40 R1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 21은 O A1-KO R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 22는 pYB32/3 C F1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 23은 5' FAS PmeNde 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 24는 3' FAS PmeHpa 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 25는 pCL402 IF F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 26은 pCL402 IF R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 27은 pYB36 CS1 F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 28은 pYB36 CS1 R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 29는 pYB36 CS3 R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 30은 pYB36 CS4 F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 31은 pYB36 CS4 R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 32는 pYB30 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 33은 pYB61 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 34는 pYB66 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 35는 pYB73 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 36은 pCL310 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 37은 pCL122 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 38은 pYB66 BamBgl F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 39는 pYB66 Nde R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 40은 pYB66 EF1seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 41은 pCL122 OrfC R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 42는 pYB73 gRNA Pst Kpn IF F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 43은 pYB73 gRNA Xho Pst IF R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 44는 pYB73 seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 45는 pYB73 seq R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 46은 pYB13 pYB1 seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 47은 TT pYB73 HDV R 프라이머 뉴클레오타이드 서열을 제시한다.
도 1은 전형적인 안내-폴리뉴클레오타이드의 예들을 묘사한다. 2개의 안내-폴리뉴클레오타이드는 모두 안내-서열(crRNA) 및 안내-폴리뉴클레오타이드 구조 성분을 포함하는 안내-RNA들이다. 상부 도면에서, 상기 안내-폴리뉴클레오타이드 구조 성분은 서로에 대해 하이브리드화된 2개의 별도의 분자들로 구성되며; 상기 개별적인 성분을 tracr 서열 및 tracr-짝 서열이라 칭할 수 있다. 하부 도면에서, 상기 안내-폴리뉴클레오타이드 구조 성분은 내부 하이브리드화를 갖는 단일 분자로 구성된다. 본 도면은 문헌[Sander and Joung, 2014 and Mali et al., Nat Methods.10(10):957-63, 2013]으로부터 적합화되었다.
도 2는 안내-폴리뉴클레오타이드(gRSR로서 약기되는 안내 RNA 자기-가공 리보자임)가 어떻게 형성되는 지를 묘사한다. 햄머헤드 리보자임 및 HDV 리보자임은 RNA 분자를 절단시켜 최종 및 기능 성숙 안내-폴리뉴클레오타이드(안내-RNA)를 형성시킨다.
도 3은 1% 아가로스 젤상에서 실행된 절단된 플라스미드 및 PCR-증폭된 단편을 도시한다.
도 4는 pYB32 및 pYB33 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 도시한다.
도 5는 T188 및 T189 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, 프로모터 및 부분 Cas9의 존재에 대해 시험되었다.
도 6은 Cas9의 OrfA/Pfa1 유전자좌에의 통합을 입증하는 아가로스 젤상에서 실행된 T188 및 T189 형질전환체의 게놈 DNA로부터 유래된 증폭산물들을 도시한다.
도 7은 1% 아가로스 젤상에서 실행된 게놈 DNA로부터 증폭된 스키조키트리움(Schizochytrium) 지방산 신타제(FAS) 유전자의 일부를 도시한다.
도 8은 벡터 pCL400 중의 FAS 유전자좌내로의 파로모마이신 및 gRNA 카세트의 PCR 클로닝의 결과를 도시한다.
도 9는 하나의 증폭산물로서 첫 번째 3 CS gRNA 표적을 포함하는 전체 영역을 증폭시키기 위해 수행된 PCR 및 gRNA3 CS4 표적을 별도로 증폭시키기 위한 또 다른 PCR의 결과들을 도시한다.
도 10은 T206 형질전환체의 게놈 DNA로부터 gRNA3 CS1 표적을 별도로 증폭시키기 위해 수행된 PCR의 결과를 도시한다.
도 11은 pLC122-Cas9 및 pYB30 플라스미드의 절단의 결과를 도시한다.
도 12는 pYB61 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 도시한다.
도 13은 1% 아가로스 젤상의 pCL122 플라스미드의 절단 결과를 도시한다.
도 14는 1% 아가로스 젤상의 pYB66 클로닝을 위한 gRNA3 CS1 카세트의 증폭산물을 도시한다.
도 15는 1% 아가로스 젤상의 gRNA3 CS1(pYB66 단편)의 절단 결과를 도시한다.
도 16은 pYB66 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 묘사한다.
도 17은 1% 아가로스 젤상의 pYB61 플라스미드의 절단 결과를 도시한다.
도 18은 1% 아가로스 젤상의 pYB73 클로닝을 위한 gRNA CS1 카세트의 증폭산물을 도시한다.
도 19는 pYB73 세균 형질전환으로부터 생성되는 형질전환체의 콜로니 PCR의 결과를 도시한다.
도 20은 T212 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, CarG 유전자의 존재에 대해 시험되었다.
도 21은 T280, T281, T285 및 T286 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, 부분적인 프로모터 및 Cas9 서열의 존재에 대해 시험되었다.
도 22는 T281 및 T286 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, gRNA 카세트의 존재에 대해 시험되었다.
도 23은 T282 및 T287 형질전환체의 게놈 DNA로부터 유래된 증폭산물들이 분리된 아가로스 젤을 도시하며, 부분적인 gRNA 카세트의 존재에 대해 시험되었다.
도 24는 T281, T282, T286 및 T287 형질전환체의 게놈 DNA로부터 gRNA3 CS1 표적을 별도로 증폭시키도록 수행된 PCR의 결과를 도시한다.
서열 목록의 설명
서열번호 1은 pCL122-Cas9 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 2는 pYB31 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 3은 pYB32 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 4는 pYB33 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 5는 pCL399 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 6은 pCL400 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 7은 pCL401 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 8은 pCL402 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 9는 pYB36 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 10은 pYB37 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 11은 pYB38 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 12는 pYB39 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 13은 121 Tub seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 14는 pYB32/3 CR1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 15는 CS 프로 Kpn IF F1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 16은 CS 프로 BamH IF R1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 17은 CS 프로 BamH IF F2 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 18은 CS 프로 Nde IF R2 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 19는 O A1-KO F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 20은 pYB32/3 SV40 R1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 21은 O A1-KO R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 22는 pYB32/3 C F1 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 23은 5' FAS PmeNde 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 24는 3' FAS PmeHpa 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 25는 pCL402 IF F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 26은 pCL402 IF R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 27은 pYB36 CS1 F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 28은 pYB36 CS1 R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 29는 pYB36 CS3 R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 30은 pYB36 CS4 F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 31은 pYB36 CS4 R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 32는 pYB30 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 33은 pYB61 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 34는 pYB66 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 35는 pYB73 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 36은 pCL310 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 37은 pCL122 벡터 뉴클레오타이드 서열을 제시한다.
서열번호 38은 pYB66 BamBgl F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 39는 pYB66 Nde R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 40은 pYB66 EF1seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 41은 pCL122 OrfC R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 42는 pYB73 gRNA Pst Kpn IF F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 43은 pYB73 gRNA Xho Pst IF R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 44는 pYB73 seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 45는 pYB73 seq R 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 46은 pYB13 pYB1 seq F 프라이머 뉴클레오타이드 서열을 제시한다.
서열번호 47은 TT pYB73 HDV R 프라이머 뉴클레오타이드 서열을 제시한다.
본 명세를 추가로 기재하기 전에, 특정 실시태양들의 변화를 수행할 수 있고 상기 변화가 여전히 첨부된 특허청구범위의 범위내에 있을 수 있기 때문에, 상기 명세가 하기에 기재되는 명세의 특정 실시태양들로 제한되지 않음을 알아야 한다. 또한, 사용되는 용어는 특정 실시태양들을 기재하기 위한 것이며 제한을 의도하는 것은 아님을 알아야 한다. 대신에, 본 명세의 범위는 첨부되는 특허청구범위에 의해 확립될 것이다.
첫 번째 태양에서, 본 발명은 안내-폴리뉴클레오타이드 및 Cas 단백질을 포함하는 CRISPR-Cas 시스템의 소스를 포함하는 비-천연 또는 조작된 조성물을 제공하며, 여기에서 상기 안내-폴리뉴클레오타이드는 근본적으로 숙주 세포 중의 표적-폴리뉴클레오타이드의 역 보체인 안내-서열을 포함하고, 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킬 수 있으며, 여기에서 상기 안내-서열은 근본적으로 상기 숙주 세포의 게놈 중 5'-(N)yPAM-3' 폴리뉴클레오타이드 서열 표적의 (N)y 부분의 역 보체이고, 여기에서 y는 8 내지 30, 보다 바람직하게는 10 내지 30, 보다 바람직하게는 15 내지 30, 보다 바람직하게 17 내지 27, 보다 바람직하게 17 내지 20, 보다 바람직하게 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27의 정수이며, 여기에서 PAM은 프로토스페이서 인접 모티프이고, 여기에서 상기 숙주 세포는 라비린툴로마이세테스 강, 바람직하게는 트라우스토키트리알레스(Thraustochytriales) 목, 보다 바람직하게는 트라우스토키트리아세아에(Thraustochytriaceae) 과, 보다 바람직하게는 아우란티오키트리움(Aurantiochytrium), 오블롱기키트리움(Oblongichytrium), 스키조키트리움(Schizochytrium), 트라우스토키트리움(Thraustochytrium) 및 울케니아(Ulkenia)로 이루어지는 그룹 중에서 선택된 속의 일원, 훨씬 더 바람직하게는 스키조키트리움 종 ATCC# 20888의 것이며, 여기에서 PAM은 바람직하게는 5′-XGG-3′, 5′-XGGXG-3′, 5′-XXAGAAW-3′, 5′-XXXXGATT-3′, 5′-XXAGAA-3′, 5′-XAAAAC-3′로 이루어지는 그룹 중에서 선택된 서열이고, 여기에서 X는 임의의 뉴클레오타이드 또는 그의 유사체일 수 있으며, 바람직하게 X는 임의의 뉴클레오타이드일 수 있고; W는 A 또는 T이다.
본 명세서에서 상기 조성물, 소스, CRISPR-Cas 시스템, 안내-폴리뉴클레오타이드, Cas 단백질, 표적-폴리뉴클레오타이드, 숙주 세포 및 CRISPR-Cas 복합체는 본 발명에 따른 조성물, 소스, CRISPR-Cas 시스템, 안내-폴리뉴클레오타이드, Cas 단백질, 표적-폴리뉴클레오타이드, 숙주 세포 및 CRISPR-Cas 복합체로서 지칭된다. 완성을 위해서, "하나의"는 본 명세서의 다른 곳에서 "적어도 하나"로서 정의되기 때문에, 본 발명에 따른 하나의 조성물은 적어도 하나, 즉 1, 2, 3 또는 그 이상의 안내-폴리뉴클레오타이드 및/또는 적어도 하나, 즉 1, 2, 3 또는 그 이상의 Cas 단백질의 소스를 포함한다. 상응하게, 본 발명은 편의상 멀티플렉스 CRISPR-Cas 시스템을 제공한다. 상기와 같은 멀티플렉스 CRISPR-Cas 시스템은 편의상 공여체 폴리뉴클레오타이드의 도입, 폴리뉴클레오타이드의 결실 및 숙주 세포의 게놈내로의 폴리뉴클레오타이드 라이브러리 삽입에 사용될 수 있다. 본 명세서에서, 멀티플렉스 CRISPR-Cas 시스템은 하나 이상의 Cas 단백질, 하나 이상의 안내-폴리뉴클레오타이드 및/또는 하나 이상의 공여체 폴리뉴클레오타이드의 사용을 지칭할 수 있다.
"CRISPR 시스템", "CRISPR-Cas 시스템" 및 "CRISPR 효소 시스템"이란 용어들은 본 명세서에서 호환 가능하게 사용되며 본 발명의 모든 실시태양들의 상황에서 표적-폴리뉴클레오타이드와 함께 CRISPR-Cas 복합체를 형성하는데 필요한 요소들의 집합을 지칭하고; 이들 요소는 비제한적으로 Cas 단백질 및 안내-폴리뉴클레오타이드를 포함한다.
"CRISPR-Cas 복합체"란 용어는 본 발명의 모든 실시태양들의 상황에서 표적-폴리뉴클레오타이드에 하이브리드화되고 Cas 단백질과 복합체화된 안내-폴리뉴클레오타이드를 포함하는 복합체를 지칭한다. 가장 간단한 형태로, 돌연변이되지 않은 Cas 단백질, 예를 들어 비제한적으로 스트렙토코커스 피오게네스(Streptococcus pyogenes)의 Cas9 단백질이 사용되는 경우, 상기 CRISPR-Cas 복합체의 형성은 표적-폴리뉴클레오타이드 중의 또는 상기 부근의(예를 들어 상기로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 또는 그 이상의 염기쌍내의) 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두의 절단을 생성시킨다. 전형적으로, 본 발명에 따른(본 명세서에서 하기에 정의된) 표적-폴리뉴클레오타이드는 PAM 서열(본 명세서에서 하기에 정의됨)과 결합되고 상기 PAM 서열은 바람직하게는 상기 표적-폴리뉴클레오타이드의 바로 하류(3')에 있으며; 상기 CRISPR-Cas 복합체의 형성은 전형적으로 상기 PAM 서열의 3 염기쌍 상류(5')에서 하나 또는 2개 모두의 폴리뉴클레오타이드 가닥의 절단을 생성시킨다.
"비-천연 조성물"이란 용어는 본 발명의 모든 실시태양들의 상황에서 본 발명에 사용되는 그의 형태 중에 자연적으로 존재하지 않는 조성물을 지칭한다. 상기 개별적인 요소는 예를 들어 그대로 또는 자연 중의 다른 요소들과 함께 존재할 수 있지만, 상기 비-천연 조성물은 예를 들어 다소 천연 조성물 이외의 적어도 하나의 요소를 포함한다.
"조작된 조성물"이란 용어는 본 발명의 모든 실시태양들의 상황에서 요소 중 적어도 하나가, 생성되는 요소가 자연적으로 존재하지 않도록 하는 방식으로 조작된, 즉 인간에 의해 변형된 조성물을 지칭한다. 적어도 하나의 조작된 요소를 포함함으로써, 조작된 조성물은 자연에 존재하지 않는 것이 된다.
"폴리뉴클레오타이드", "뉴클레오타이드 서열" 및 "핵산"이란 용어는 본 명세서에서 호환 가능하게 사용되며 본 발명의 실시태양들의 상황에서 데옥시리보뉴클레오타이드이든 리보뉴클레오타이드이든, 임의의 길이의 뉴클레오타이드의 중합체성 형태, 또는 이들의 혼합물 또는 유사체를 지칭한다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있으며 공지되거나 공지되지 않은 임의의 기능을 수행할 수 있다. 하기는 폴리뉴클레오타이드의 비제한적인 예들이다: 유전자 또는 유전자 단편의 암호화 또는 비-암호화 영역, 연관 분석으로부터 한정된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은-헤어핀 RNA(shRNA), 미세-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지된 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 탐침, 올리고뉴클레오타이드 및 프라이머. 폴리뉴클레오타이드는 하나 이상의 변형된 뉴클레오타이드, 예를 들어 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체 또는 뉴클레오타이드 균등물을 포함할 수 있다(여기에서 뉴클레오타이드 유사체 또는 균등물은 변형된 염기 및/또는 변형된 주쇄, 및/또는 비-천연 뉴클레오사이드간 결합, 또는 이들 변형의 조합을 갖는 잔기로서 정의된다). 바람직한 뉴클레오타이드 유사체 및 균등물은 "일반적인 정의" 섹션에 기재되어 있다. 경우에 따라, 상기 뉴클레오타이드 구조에 대한 변형을 폴리뉴클레오타이드의 조립 전 또는 후에 도입시킬 수도 있다. 폴리뉴클레오타이드를 중합 후에, 예를 들어 표지화 화합물과의 접합에 의해 추가로 변형시킬 수도 있다.
본 명세서에 사용되는 바와 같이, "폴리뉴클레오타이드"는 통상적인 포스포다이에스터 결합 또는 비-통상적인 결합(예를 들어 아미드 결합, 예를 들어 펩타이드 핵산(PNA) 중에서 발견되는)을 포함할 수 있다. 폴리뉴클레오타이드는 번역되지 않은 5' 및 3' 서열, 암호화 서열을 포함한, 완전길이 cDNA 서열의 뉴클레오타이드 서열뿐만 아니라 상기 핵산 서열의 단편, 에피토프, 도메인 및 변체를 함유할 수 있다. 상기 폴리뉴클레오타이드는 임의의 폴리리보뉴클레오타이드 또는 폴리데옥시리보뉴클레오타이드로 구성될 수 있으며, 이들은 변형되지 않은 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있다. 예를 들어, 폴리뉴클레오타이드는 단일- 또는 이중-가닥 DNA, 단일- 및 이중-가닥 영역의 혼합물인 DNA, 단일- 및 이중-가닥 RNA, 및 단일- 및 이중-가닥 영역의 혼합물인 RNA, 단일 가닥 또는 보다 전형적으로 이중 가닥 또는 단일- 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자로 구성될 수 있다. 또한, 상기 폴리뉴클레오타이드는 RNA 또는 DNA 또는 RNA와 DNA 모두를 포함하는 삼중-가닥 영역으로 구성될 수 있다. 폴리뉴클레오타이드는 리보뉴클레오사이드(아데노신, 구아노신, 유리딘, 또는 시티딘; "RNA 분자") 또는 데옥시리보뉴클레오사이드(데옥시아데노신, 데옥시구아노신, 데옥시티미딘, 또는 데옥시시티딘; "DNA 분자"), 또는 이들의 임의의 포스포에스터 유사체, 예를 들어 포스포로티오에이트 및 티오에스터를 함유할 수 있다. 폴리뉴클레오타이드는 또한 안정성 또는 다른 이유로 변형된 하나 이상의 변형된 염기 또는 DNA 또는 RNA 주쇄를 함유할 수 있다. "변형된" 염기는 예를 들어 트리틸화된 염기 및 통상적이지 않은 염기, 예를 들어 이노신을 포함한다. DNA 및 RNA에 다양한 변형을 수행할 수 있으며; 따라서, "폴리뉴클레오타이드"는 화학적으로, 효소적으로 또는 대사적으로 변형된 형태를 포함한다. 핵산 분자란 용어는 오직 상기 분자의 1차 및 2차 구조만을 지칭하며, 상기를 임의의 특정한 3차 형태로 제한하지 않는다. 따라서, 상기 용어는 특히 선형 또는 환상 DNA 분자(예를 들어 제한 단편), 플라스미드, 및 염색체에서 발견되는 이중 가닥 DNA를 포함한다. 특정한 이중 가닥 DNA 분자 구조의 논의에서, 서열은 본 명세서에서 오직 DNA의 전사되지 않은 가닥(즉 mRNA와 상동성인 서열을 갖는 가닥)을 따라 5'에서 3' 방향의 서열만을 제공하는 통상적인 규약에 따라 기재될 수 있다.
"단리된" 핵산 분자란 용어는 그의 고유 환경으로부터 제거된 핵산 분자, DNA 또는 RNA를 지칭한다. 단리된 핵산 분자의 추가적인 예는 이종 숙주 세포 중에서 유지되는 재조합 폴리뉴클레오타이드 또는 용액 중 정제된(부분적으로 또는 실질적으로) 폴리뉴클레오타이드를 포함하는 핵산 분자를 포함한다. 단리된 RNA 분자는 본 발명의 폴리뉴클레오타이드의 생체내 또는 시험관내 RNA 전사물을 포함한다. 본 발명에 따른 단리된 핵산 분자는 합성적으로 생성된 상기와 같은 분자를 추가로 포함한다. 또한, 핵산 분자 또는 폴리뉴클레오타이드는 조절 요소, 예를 들어 프로모터, 리보솜 결합 부위, 또는 전사 종결자를 포함할 수 있다.
"유전자"는 폴리펩타이드를 암호화하는 뉴클레오타이드의 조립체를 지칭하며 cDNA 및 게놈 DNA 핵산을 포함한다. "유전자"는 또한 개별적인 암호화 분절(엑손) 사이의 개재 서열(인트론)뿐만 아니라 암호화 서열에 선행(5' 비-암호화 서열) 및 후행(3' 비-암호화 서열)하는 조절 서열을 포함하여, 특정 단백질을 발현하는 핵산 단편을 지칭한다. "고유 유전자"는 그 자신의 조절 서열을 갖는, 자연에서 발견되는 바와 같은 유전자를 지칭한다.
일부 실시태양에서, 상기 핵산 분자는 본 명세서에 보고된 폴리뉴클레오타이드 서열에 적어도 약 80%, 85%, 또는 90% 일치하는, 또는 본 명세서에 보고된 폴리뉴클레오타이드 서열에 적어도 약 95%, 96%, 97%, 98%, 99% 또는 100% 일치하는 폴리뉴클레오타이드 서열을 포함한다. 당해 분야에 공지된 바와 같이, "일치성 퍼센트"란 용어는 서열 비교에 의해 측정시, 2개 이상의 아미노산 서열 또는 2개 이상의 폴리뉴클레오타이드 서열간의 관계이다. 당해 분야에서, "일치성"은 또한 서열들의 스트링간의 합치에 의해 측정시, 경우에 따라, 아미노산 또는 폴리뉴클레오타이드 서열간의 서열 관련성 정도를 의미한다.
본 발명의 참조 폴리뉴클레오타이드 서열에 적어도, 예를 들어 95% "일치하는" 폴리뉴클레오타이드 서열을 갖는 핵산 분자의 경우, 상기 핵산 분자의 폴리뉴클레오타이드 서열은 상기 폴리뉴클레오타이드 서열이 상기 참조 폴리뉴클레오타이드 서열의 각 100 뉴클레오타이드당 5개 이하의 뉴클레오타이드 차이를 포함할 수 있음을 제외하고, 상기 참조 서열과 일치함을 의미한다. 즉, 참조 폴리뉴클레오타이드 서열에 적어도 95% 일치하는 폴리뉴클레오타이드 서열을 갖는 핵산 분자를 획득하기 위해서, 상기 참조 서열 중 뉴클레오타이드의 5% 이하가 결실되거나 또 다른 뉴클레오타이드로 치환될 수 있거나, 또는 상기 참조 서열의 전체 뉴클레오타이드의 5% 이하의 뉴클레오타이드의 수가 상기 참조 서열내에 삽입될 수 있다.
실제적인 문제로서, 임의의 특정 폴리뉴클레오타이드 서열 또는 아미노산 서열이 본 발명의 폴리뉴클레오타이드 서열 또는 아미노산 서열에 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 일치하는 지의 여부를 공지된 컴퓨터 프로그램을 사용하여 통상적으로 측정할 수 있다. 의문의 서열(본 발명의 서열)과 주 서열간의 최상의 전체적인 합치를 측정하는 방법을, 서열의 정렬 및 일치성 점수의 계산을 사용하여 결정할 수 있다. 상기 정렬은 참조 알고리즘 및 지니어스 참조 어셈블러(Geneious reference assembler)에 대한 지도와 함께 컴퓨터 프로그램 지니어스(www.geneious.com)를 사용하여 수행되었다.
본 발명에 따른 안내-폴리뉴클레오타이드는 표적-폴리뉴클레오타이드와 하이브리드화할 수 있는 적어도 하나의 안내-서열을 포함하며 상기 표적-폴리뉴클레오타이드에의 상기 CRISPR-Cas 시스템의 서열-특이적 결합을 지시하여 CRISPR-Cas 복합체를 형성시킬 수 있다. 활성 CRISPR-Cas 복합체의 형성을 가능하게 하기 위해서, 상기 안내-폴리뉴클레오타이드는 바람직하게는 또한, 특이적인 2차 구조를 갖고 상기 Cas 단백질의 상기 안내-폴리뉴클레오타이드에의 결합을 허용하는 서열을 포함한다. 상기와 같은 서열은 당해 분야에 tracr RNA, tracr 서열, tracr 스캐폴드 또는 안내-폴리뉴클레오타이드 구조 성분으로서 공지되어 있으며, 이들 용어는 본 명세서에서 호환 가능하게 사용되고; 여기에서 상기 tracr은 전사촉진 CRISPR에 대한 약어이고; 따라서 tracrRNA는 전사촉진 CRISPR RNA를 의미한다. 원 CRISPR-Cas 시스템 중의 tracrRNA는 crRNA(안내-서열)를 Cas 뉴클레아제에 연결하며, 어떠한 crRNA에도 결합할 수 있는 내인성 세균 RNA이다. 안내-폴리뉴클레오타이드 구조 성분은 단일의 폴리뉴클레오타이드 분자로 구성되거나 또는 서로에 대해 하이브리드화된 2개 이상의 분자, 또는 Cas 단백질 또는 유사한 기능의 다른 뉴클레아제와 결합하는 2개 이상의 분자로 구성될 수 있다. 안내-폴리뉴클레오타이드 구조의 상기와 같은 성분을 tracr 서열 및 tracr-짝 서열로서 지칭할 수 있다.
상응하게, 상기 안내-폴리뉴클레오타이드는 바람직하게는 또한 tracr 서열 및/또는 tracr-짝 서열을 포함한다. 상기 안내-폴리뉴클레오타이드는 본 명세서에서 상기에 제시된 폴리뉴클레오타이드의 일반적인 정의에 따른 폴리뉴클레오타이드이며; 바람직한 안내-폴리뉴클레오타이드는 리보뉴클레오타이드를 포함하고, 보다 바람직한 안내-폴리뉴클레오타이드는 RNA(안내-RNA)이다. 안내-폴리뉴클레오타이드 구조의 2가지 예를 도 1에 묘사한다.
본 발명의 상황에서, 서열은 주 서열이 바람직하게는 숙주 세포에서와 같은 생리학적 조건하에서 표적-서열 또는 표적-폴리뉴클레오타이드와 하이브리드화할 수 있는 경우, 근본적으로 상기 표적-서열 또는 표적-폴리뉴클레오타이드의 역보체로서 지칭된다. 안내-서열과 그의 상응하는 표적-서열간의 상보성 정도는 적합한 정렬 알고리즘을 사용하여 최적으로 정렬될 때, 바람직하게는 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 초과 서열 일치성이다. 상기 표적-폴리뉴클레오타이드가 이중가닥 폴리뉴클레오타이드인 경우, 안내-서열과 같은 주 서열은 상기 표적-폴리뉴클레오타이드의 어느 한 가닥, 예를 들어 암호화 가닥 또는 비-암호화 가닥과 하이브리드화할 수 있다.
바람직하게, 본 발명에 따른 안내-서열은 표적 중 독특한 표적-서열을 표적화한다. 바람직하게, 본 발명에 따른 안내-서열은 PAM 서열에 바로 인접한 표적-폴리뉴클레오타이드 중 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20, 보다 바람직하게는 8, 9, 10, 11 또는 12 뉴클레오타이드와 100% 서열 일치성을 갖는다.
본 발명에 따른 안내-서열은 길이가 바람직하게는 8 내지 30, 보다 바람직하게는 10 내지 30, 보다 바람직하게는 15 내지 30, 보다 바람직하게는 17 내지 27, 보다 바람직하게는 17 내지 20, 보다 바람직하게는 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27 뉴클레오타이드이다. CRISPR-Cas 시스템의 표적-서열에의 서열-특이적 결합을 지시하여 CRISPR-Cas 복합체를 형성시키는 안내-서열의 능력을 임의의 적합한 분석에 의해 평가할 수 있다. 예를 들어, 시험하려는 안내-서열을 포함하여, CRISPR-Cas 복합체를 형성하기에 충분한 CRISPR 시스템의 성분들을, 예를 들어 상기 CRISPR-Cas 시스템의 성분들을 암호화하는 벡터에 의한 형질감염, 이어서 예를 들어 표준 서열 분석에 의한, 우선적인 절단 및/또는 상기 표적-서열내 세포 수복 기전에 의해 유도된 생성된 돌연변이의 평가에 의해, 상응하는 표적-서열을 갖는 숙주 세포에 제공할 수 있다. 표적-폴리뉴클레오타이드의 절단을 또한, 상기 표적-폴리뉴클레오타이드, 시험하려는 안내-서열 및 상기 시험 안내-서열과 상이한 대조용 안내-서열을 포함한 CRISPR-Cas 시스템의 성분들을 제공하고, 상기 시험 및 대조용 안내-서열 반응들간에 표적-서열에서의 절단률 또는 결합을 비교함으로써 시험관에서 평가할 수 있다. 다른 분석들이 가능하며, 이는 당해 분야의 숙련가에게 공지되어 있다.
안내-폴리뉴클레오타이드 구조 성분은 활성 CRISPR-Cas 복합체의 형성에 필요한 것으로 여겨진다. 상기 안내-폴리뉴클레오타이드 구조 성분은 반드시 안내-서열에 작동적으로 연결되는 것은 아닌 것으로 여겨지나; 안내-폴리뉴클레오타이드 구조 성분은 안내-폴리뉴클레오타이드내의 안내-서열에 작동적으로 연결될 수도 있다. 본 발명에 따른 안내-폴리뉴클레오타이드 구조 성분[상기는 야생형 안내-폴리뉴클레오타이드 구조 성분의 전부 또는 일부(예를 들어 야생형 tracr-서열의 약 또는 약 20, 26, 32, 45, 48, 54, 63, 67, 85 초과, 또는 그 이상의 뉴클레오타이드)를 포함하거나 또는 상기로 이루어질 수 있다]은, 예를 들어 본 발명에 따른 tracr-서열의 적어도 일부의 본 발명에 따른 tracr-짝 서열의 전부 또는 일부에의 하이브리드화에 의해서 및 바람직하게는 본 발명에 따른 안내-서열에 작동적으로 연결되어 CRISPR-Cas 복합체 부분을 형성한다. 본 발명에 따른 tracr-서열은 바람직하게는 숙주 세포에서와 같은 생리학적 조건하에서 본 발명에 따른 tracr-짝 서열에 하이브리드화하고 CRISPR-Cas 복합체의 형성을 촉진하기에 충분한 상보성을 갖는다. 본 발명에 따른 표적-서열과 같이, 기능성이기에 충분한 상보성이 존재한다면, 완전한 상보성은 필요하지 않은 것으로 여겨진다. 바람직하게, 본 발명에 따른 tracr-서열은 최적으로 정렬될 때 본 발명에 따른 tracr-짝 서열의 길이를 따라 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 서열 일치성을 갖는다. 최적의 정렬은 상기에 논의된 바와 같이 서열 정렬에 대한 임의의 적합한 알고리즘을 사용하여 측정될 수 있다.
일반적으로, 본 발명에 따른 tracr 짝 서열은 본 발명에 따른 tracr 서열과 표적-서열에서 CRISPR-Cas 복합체의 형성을 촉진하기에 충분한 상보성을 갖는 임의의 서열을 포함하며, 여기에서 상기 CRISPR-Cas 복합체는 본 발명에 따른 tracr 서열에 하이브리드화된 본 발명에 따른 tracr 짝 서열을 포함한다. 본 발명에 따른 tracr 서열과 본 발명에 따른 tracr 짝 서열의 상보성 정도는 바람직하게는 2개 서열 중 보다 짧은 서열의 길이를 따라 상기 tracr 짝 서열 및 tracr 서열의 최적의 정렬에 관해 정의된다. 최적의 정렬은 상기에 논의된 바와 같이 서열 정렬에 대한 임의의 적합한 알고리즘을 사용하여 측정될 수 있다.
바람직하게, 본 발명에 따른 tracr 짝 서열 및 본 발명에 따른 tracr 서열에 대해서, 2차 구조는 예를 들어 상기 tracr 서열 또는 tracr 짝 서열 중 어느 하나내에서의 자기-상보성을 고려한다. 바람직하게, 본 발명에 따른 tracr 서열 및 본 발명에 따른 tracr 짝 서열간의 상보성 정도는 상기 2개 서열 중 보다 짧은 서열의 길이를 따라 최적으로 정렬될 때 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 초과의 서열 일치성이다. 바람직하게 본 발명에 따른 tracr 짝 서열은 길이가 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 이상의 뉴클레오타이드이다. 바람직하게 본 발명에 따른 tracr 서열은 길이가 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 이상의 뉴클레오타이드이다. 바람직하게, 본 발명에 따른 tracr 서열 및 본 발명에 따른 tracr 짝 서열, 즉 안내-폴리뉴클레오타이드 구조 성분은, 상기 둘간의 하이브리드화가 2차 구조를 포함하는 하이브리드화 복합체, 예를 들어 헤어핀을 생성시키도록 단일의 전사물내에 포함된다. 상기와 같은 하이브리드화 복합체는 또한 상기 tracr 서열 및 tracr 짝 서열이 단일의 전사물 중에 포함되지 않는 경우에 형성될 수도 있다. 헤어핀 구조의 형성을 위한 본 발명에 따른 tracr 서열 및/또는 본 발명에 따른 tracr 짝 서열 및/또는 본 발명에 따른 안내-폴리뉴클레오타이드 구조 성분에서 바람직한 고리 형성 서열은 길이가 4 뉴클레오타이드이고, 가장 바람직하게는 GAAA 서열을 가지며; 교체 서열일 수도 있는, 보다 길거나 보다 짧은 고리 서열을 사용할 수도 있다. 상기 고리 서열은 바람직하게는 뉴클레오타이드 트리플릿(예를 들어 AAA) 및 추가적인 뉴클레오타이드(예를 들어 C 또는 G)를 포함한다. 고리 형성 서열의 예는 CAAA 및 AAAG를 포함한다. 바람직하게 본 발명에 따른 tracr 서열 및/또는 본 발명에 따른 tracr 짝 서열 또는 그의 하이브리드화 복합체 및/또는 본 발명에 따른 안내-폴리뉴클레오타이드 구조 성분은 적어도 2개 이상의 헤어핀을 포함하거나 또는 상기를 형성할 수 있다. 보다 바람직하게, 본 발명에 따른 tracr 서열 및/또는 본 발명에 따른 tracr 짝 서열 또는 그의 하이브리드화 복합체 및/또는 본 발명에 따른 안내-폴리뉴클레오타이드 구조 성분은 2, 3, 4 또는 5개의 헤어핀을 포함하거나 또는 상기를 형성할 수 있다. 바람직하게, 본 발명에 따른 tracr 서열 및/또는 본 발명에 따른 tracr 짝 서열 또는 그의 하이브리드화 복합체 및/또는 본 발명에 따른 안내-폴리뉴클레오타이드 구조 성분은 5개 이하의 헤어핀을 포함하거나 또는 상기를 형성할 수 있다. 바람직하게, 본 발명에 따른 tracr 서열 및 본 발명에 따른 tracr-짝 서열 또는 본 발명에 따른 tracr 서열 및 본 발명에 따른 tracr 짝 서열의 하이브리드화 복합체 및/또는 본 발명에 따른 안내-폴리뉴클레오타이드 구조 성분의 단일 전사물은 전사 종결 서열을 추가로 포함하며; 바람직하게 상기는 폴리T 서열, 예를 들어 6개의 T 뉴클레오타이드이다. 말한 바와 같이, 안내-폴리뉴클레오타이드 구조 성분은 당해 분야의 숙련가에게 공지되어 있으며; 배경 정보는 문헌[Gaj et al., 2013]에서 찾을 수 있다.
본 발명에 따른 모든 실시태양들의 상황에서, "표적-폴리뉴클레오타이드"란 용어는 본 발명에 따른 안내-서열이 상보성을 갖도록 설계된 본 발명에 따른 표적-서열을 지칭하며, 이때 본 발명에 따른 표적-서열과 본 발명에 따른 안내-서열간의 하이브리드화는 CRISPR-Cas 복합체의 형성을 촉진한다. CRISPR-Cas 복합체의 하이브리드화를 일으키고 상기 복합체의 형성을 촉진하기에 충분한 상보성이 존재하는 한, 완전한 상보성이 반드시 요구되는 것은 아니다. 바람직하게, 본 발명에 따른 안내-서열은 표적 중의 독특한 표적-서열을 표적화한다. 바람직하게, 본 발명에 따른 안내-서열은 PAM 서열에 바로 인접한 표적-폴리뉴클레오타이드 중의 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20, 보다 바람직하게는 8, 9, 10, 11 또는 12 뉴클레오타이드와 100% 서열 일치성을 갖는다. 본 발명에 따른 표적-폴리뉴클레오타이드는 임의의 폴리뉴클레오타이드, 예를 들어 DNA 또는 RNA 폴리뉴클레오타이드를 포함할 수 있으며 단일 또는 이중 가닥일 수 있다. 상기 표적-폴리뉴클레오타이드가 이중가닥 폴리뉴클레오타이드인 경우, 본 발명에 따른 안내-서열은 상기 표적-폴리뉴클레오타이드의 어느 한 가닥, 예를 들어 암호화 가닥 또는 비-암호화 가닥과 하이브리드화할 수 있다.
본 발명에 따른 표적-폴리뉴클레오타이드는 세포의 핵 또는 세포질 중에 위치할 수 있다. 본 발명에 따른 표적-폴리뉴클레오타이드는 숙주 세포의 세포소기관, 예를 들어 미토콘드리아 또는 색소체 중에 위치할 수도 있다. 본 발명에 따른 표적-폴리뉴클레오타이드는 게놈내에 포함되거나, 염색체내에 포함되거나 또는 염색체외에 존재할 수 있으며, 인공 염색체 중에 포함될 수도 있고, 임의의 염색체 개체 또는 염색체-외 개체, 예를 들어 상염색체 복제 개체, 예를 들어 에피솜 플라스미드 또는 벡터 중에 존재할 수도 있다. 본 발명에 따른 표적-폴리뉴클레오타이드는 숙주 세포에 고유이거나 외래일 수 있다.
본 발명에 따른 표적-폴리뉴클레오타이드는 바람직하게는, CRISPR-Cas 복합체에 의해 인식되는 짧은 폴리뉴클레오타이드인 프로토스페이서 인접 모티프(PAM)와 결합된다. 바람직하게, 상기 표적-폴리뉴클레오타이드 및 PAM은 연결되며, 여기에서 상기 PAM은 바람직하게는 상기 표적-폴리뉴클레오타이드의 바로 하류(3')에 있다. 상기 PAM의 정확한 서열 및 길이는 다양할 수 있다, 예를 들어 상이한 Cas 단백질 및 유사한 기능의 뉴클레아제는 상이한 PAM 서열을 필요로 할 수 있다. 본 발명에 따른 바람직한 PAM은 2 내지 8 뉴클레오타이드 길이의 폴리뉴클레오타이드이다. 바람직한 PAM은 5′-XGG-3′, 5′-XGGXG-3′, 5′-XXAGAAW-3′, 5′-XXXXGATT-3′, 5′-XXAGAA-3′, 5′-XAAAAC-3′(여기에서 X는 임의의 뉴클레오타이드 또는 그의 유사체, 바람직하게는 임의의 뉴클레오타이드일 수 있고; W는 A 또는 T이다)로 이루어지는 그룹 중에서 선택된다. 보다 바람직한 PAM은 5'-XGG-3'이다. 상기 PAM은 바람직하게는 Cas 단백질과 합치된다. 가장 널리 사용되는 CAS/CRISPR 시스템은 스트렙토코커스 피오게네스로부터 유래되며 합치하는 PAM 서열 5'-XGG-3'은 표적-서열의 바로 하류(3')에 위치한다. 네이세리아 메닌지티디스(Neisseria meningitidis) Cas 단백질에 바람직한 PAM은 5′-XXXXGATT-3′이고; 스트렙토코커스 써모필루스(Streptococcus thermophilus) Cas 단백질에 바람직한 PAM은 5′-XXAGAA-3′이며; 트레포네마 덴티콜라(Treponema denticola)에 바람직한 PAM은 5′-XAAAAC-3′이다. 바람직한 PAM은 사용된 Cas 단백질과 합치한다. 본 발명에 따른 Cas 단백질을, 야생형 Cas 단백질과 합치하는 고유 PAM보다는 상이한 PAM과 합치하도록 조작할 수 있다. 이와 같이, 본 발명에 따른 CRISPR-Cas 시스템을 맞춤된 특이적 표적화에 사용할 수 있다.
"하이브리드화"란 용어는 하나 이상의 폴리뉴클레오타이드가 반응하여, 뉴클레오타이드 잔기의 염기들간의 수소 결합을 통해 안정화되는 복합체를 형성하는 반응을 지칭한다. 상기 수소 결합은 와트슨 크리크 염기 짝짓기, 후그스테인 결합에 의해, 또는 임의의 다른 서열-특이적인 방식으로 발생할 수 있다. 상기 복합체는 듀플렉스 구조를 형성하는 2개의 가닥, 다중 가닥 복합체를 형성하는 3개 이상의 가닥, 단일의 자기-하이브리드화 가닥, 또는 이들의 임의의 조합을 포함할 수 있다. 하이브리드화 반응은 보다 광범위한 가공 중의 한 단계, 예를 들어 효소에 의한 폴리뉴클레오타이드의 절단을 구성할 수 있다. 바람직한 하이브리드화 조건은 본 발명에 따른 숙주 세포내에서와 같은 생리학적 조건이다.
본 발명의 모든 실시태양들의 상황에서 "소스"란 용어는 안내-폴리뉴클레오타이드 및 Cas 단백질을 포함하는 CRISPR-Cas 시스템의 임의의 소스를 지칭한다. 상기 안내-폴리뉴클레오타이드 및 Cas 단백질은 별도의 소스 중에 존재할 수 있다. 상기와 같은 경우에, 본 발명에 따른 조성물은 안내-폴리뉴클레오타이드의 소스 및 Cas-단백질의 소스를 포함하는 CRISPR-Cas 시스템을 포함한다. 임의의 소스는 상기 안내-폴리뉴클레오타이드 및 Cas 단백질이 CRISPR-Cas 시스템내에서 기능할 수 있는 형태로 그대로 존재할 수 있음을 의미한다. 상기 안내-폴리뉴클레오타이드 및/또는 Cas-단백질은 그의 활성 형태로 제공될 수 있으며 예를 들어 불활성 형태로부터 또는 또 다른 개체로부터 제공될 수 있다. 상기 안내-폴리뉴클레오타이드는 예를 들어 또 다른 폴리뉴클레오타이드상에 존재하거나 또는 실제 안내-폴리뉴클레오타이드를 제공하도록 전사된 폴리뉴클레오타이드에 의해 암호화될 수 있다. 상기 Cas 단백질은 실제 Cas 단백질을 제공하도록 전사되고/되거나 번역된 폴리뉴클레오타이드(예를 들어 DNA 또는 mRNA)에 의해 암호화될 수 있다. 암호화 폴리뉴클레오타이드는 본 명세서에 정의된 바와 같은 핵산 구조물 중에 및/또는 본 명세서에 정의된 바와 같은 벡터 중에 존재할 수 있다. 상기와 같은 핵산 구조물 및 벡터는 본 명세서에서 본 발명에 따른 핵산 구조물 및 본 발명에 따른 벡터로서 지칭된다.
바람직하게, 본 발명에 따른 조성물에서, 상기 Cas 단백질 또는 관련 기능의 뉴클레아제는 폴리뉴클레오타이드에 의해 암화되고/되거나 상기 안내-폴리뉴클레오타이드는 폴리뉴클레오타이드에 의해 암호화되거나 상기 상에 존재한다.
바람직하게, 본 발명에 따른 조성물에서, 상기 Cas 단백질 또는 관련 기능의 뉴클레아제는 폴리뉴클레오타이드에 의해 암호화되고/되거나 상기 안내-폴리뉴클레오타이드는 또 다른 폴리뉴클레오타이드에 의해 암호화되거나 상기 상에 존재하고 상기 폴리뉴클레오타이드 또는 폴리뉴클레오타이드들은 벡터 중에 포함된다.
바람직하게, 본 발명에 따른 조성물에서, 상기 안내-폴리뉴클레오타이드는 실제 안내-폴리뉴클레오타이드를 제공하도록 전사된 폴리뉴클레오타이드에 의해 암호화된다. 상응하게, 하나의 실시태양에서, 본 발명에 따른 조성물에서, 바람직하게 상기 안내-폴리뉴클레오타이드는 상기 안내-폴리뉴클레오타이드를 암호화하는 폴리뉴클레오타이드의 형태로 존재하고 상기 안내-폴리뉴클레오타이드는 숙주 세포에서 상기 폴리뉴클레오타이드의 전사시에 수득된다.
바람직하게, 본 발명에 따른 조성물에서, 상기 Cas 단백질은 폴리뉴클레오타이드에 의해 암호화되고 상기 안내-폴리뉴클레오타이드는 또 다른 폴리뉴클레오타이드에 의해 암호화되거나 상기 상에 존재하고 상기 폴리뉴클레오타이드는 하나의 벡터 중에 포함된다.
바람직하게, 본 발명에 따른 조성물에서, 상기 Cas 단백질은 하나의 벡터 중에 포함된 폴리뉴클레오타이드에 의해 암호화되고 상기 안내-폴리뉴클레오타이드는 또 다른 벡터 중에 포함된 또 다른 폴리뉴클레오타이드에 의해 암호화되거나 상기 상에 존재한다. 바람직하게, 상기 Cas 단백질을 암호화하는 벡터는 저 사본 벡터이고/이거나 상기 Cas 전사물의 발현을 구동하는 프로모터는 저-강도 프로모터이고 상기 안내-폴리뉴클레오타이드를 암호화하는 벡터는 고 사본 벡터이고/이거나 상기 gRNA 전사물의 발현을 구동하는 프로모터는 고-강도 프로모터이다. 이는 상기 Cas 단백질 및 안내-폴리뉴클레오타이드의 차별적인 발현을 허용하며; 상기 Cas 단백질은 예를 들어 상기 안내-폴리뉴클레오타이드보다 낮은 수준으로 발현될 수 있다. 프로모터 강도를 임의의 수단에 의해, 예를 들어 RNA 서열분석에 의해 평가할 수 있다. RNA 서열분석(RNAseq)은 상이한 조건하에서 전사체 전체에 걸친 발현을 측정하기 위한 매우 민감하고 정확한 도구이다. 상기는 RPKM 값(백만개의 맵핑된 판독당 전사물의 킬로염기당 판독)으로서 보고되는 전사물 수준에서의 유전자 발현의 정량적인 근사치를 허용한다. 스키조키트리움으로부터의 전형적인 유전자의 RPKM 값 및 상대적인 프로모터 강도를 표 1에 제공한다.
유전자 | 평균 RPKM 값 |
상대적인
프로모터 강도 |
아르기나제 (EC 3.5.3.1) | 3694.34 | 강함 |
피루베이트 키나제 (EC 2.7.1.40) | 2127.49 | 강함 |
열 충격 단백질 70 | 1857.74 | 강함 |
글리세르알데하이드 3-포스페이트 데하이드로게나제 (EC 1.2.1.12) | 1688.00 | 강함 |
튜불린 알파 쇄 | 696.85 | 중간 |
단백질 번역 연장 인자 1A (EF-1A) | 682.30 | 중간 |
아이소시트레이트 라이아제 (EC 4.1.3.1) | 510.45 | 중간 |
아코니테이트 하이드라타제 2 (EC 4.2.1.3) | 317.74 | 중간 |
말레이트 데하이드로게나제 (EC 1.1.1.37) | 192.47 | 중간 |
액포 ATP 신타제 서브유닛 D (EC 3.6.3.14) | 163.74 | 중간 |
아실-CoA 데하이드로게나제 (EC 1.3.99.3) | 94.43 | 약함 |
아세틸스페르미딘 데아세틸라제 (EC 3.5.1.48) | 90.60 | 약함 |
아세토락테이트 신타제 (EC 2.2.1.6) | 63.21 | 약함 |
말레일아세토아세테이트 아이소머라제 (EC 5.2.1.2) | 39.46 | 약함 |
피토엔 데세튜라제 (EC 1.14.99.-) (카로틴 신타제) | 31.56 | 약함 |
ATP-의존성 RNA 헬리카제 | 28.42 | 약함 |
아세틸-CoA 아세틸트랜스퍼라제 (EC 2.3.1.9) | 26.74 | 약함 |
저-강도(즉 약한) 스키조키트리움 프로모터의 예는 비제한적으로 카로티노이드 신타제의 발현을 구동하는 것들을 포함한다. 중간-강도(즉 중간) 스키조키트리움 프로모터의 예는 비제한적으로 알파-튜불린의 발현을 구동하는 것들을 포함한다. 고-강도(즉 강한) 스키조키트리움 프로모터의 예는 비제한적으로 연장 인자 1(EF-1)의 발현을 구동하는 것들을 포함한다. RPKM 값은 일반적으로 상대적인 프로모터 강도를 가리키는 것으로 간주되지만, 고유 게놈 환경에서의 프로모터는 발현 벡터 환경에서와 정확하게 동일한 강도를 갖지 않을 수도 있음은 당해 분야의 숙련가들에게 공지되어 있다. 따라서, 당해 분야의 숙련가는 표 1에 제공된 상대적인 프로모터 강도가 본 발명의 상황에서 변할 수 있음을 알 것이다.
따라서 본 발명은 상기 안내-폴리뉴클레오타이드 및 Cas 단백질이 그대로 제공되거나, 또는 벡터상에서 암호화되거나 또는 벡터상에 존재할 가능성들을 제공한다. 후자의 경우에, 상기 암호화 폴리뉴클레오타이드는 각각 별도의 벡터상에 있거나 또는 둘 다 단일 벡터상에 있을 수 있다. 상응하게, 하나의 실시태양에서, 본 발명은 본 발명에 따른 조성물을 제공하며, 여기에서 본 발명에 따른 Cas 단백질을 암호화하는 폴리뉴클레오타이드, 안내-폴리뉴클레오타이드 또는 본 발명에 따른 안내-폴리뉴클레오타이드를 암호화하는 폴리뉴클레오타이드는 단일 벡터상에 존재하며, 상기 벡터는 프로모터 및 종결자 요소와 같이 상기 암호화된 생성물을 발현하는데 필요한 임의의 요소를 추가로 포함할 수 있다. 상기와 같은 단일(올인원) 벡터는 CRISPR-Cas 시스템에 필요한 모든 성분이 함께 존재한다는 장점을 가지며; 또한, 임의로 공여체 폴리뉴클레오타이드와 함께, 단일의 형질전환 사건이면 상기 성분들을 숙주 세포내로 도입시키기에 충분하다.
벡터
본 발명의 모든 실시태양들의 상황에서, 벡터는 편의상 재조합 DNA 과정이 가해질 수 있고 본 발명에 따른 폴리뉴클레오타이드의 발현을 매개할 수 있는 임의의 벡터(예를 들어 플라스미드 또는 바이러스)일 수 있다. 상기 벡터의 선택은 전형적으로 상기 벡터와 상기 벡터가 도입되는 숙주 세포와의 적합성에 따라 변할 것이다. 바람직한 벡터는 본 명세서의 실시예들에 사용되는 벡터이다. 벡터는 선형 폴리뉴클레오타이드 또는 선형 또는 폐쇄된 환상 플라스미드일 수 있다. 벡터는 통합 또는 자율 복제 벡터, 즉 염색체 또는 염색체-외 개체로서 존재하고 그의 복제가 염색체 복제에 의존적이거나 독립적인 벡터, 예를 들어 플라스미드, 염색체외 요소, 미니-염색체, 또는 인공 염색체일 수 있다.
바람직하게 벡터는, 숙주 세포내로 도입될 때 게놈내에 통합되고 상기가 통합된 염색체(들)와 함께 복제되는 것일 수 있다. 통합 벡터는 숙주 세포의 염색체 중에서 무작위로 또는 소정의 표적 유전자좌에서 통합될 수 있다. 바람직한 통합 벡터는 DNA 단편을 포함하며, 상기 단편은 상기 벡터의 소정의 유전자좌에의 통합을 표적화하기 위해 숙주 세포의 게놈 중의 상기 소정의 표적 유전자좌 중의 DNA 서열에 상동성이다. 표적화된 통합을 촉진하기 위해서, 벡터를 바람직하게는 상기 세포의 형질전환에 앞서 선형화시킨다. 선형화를 바람직하게는 상기 벡터의 적어도 하나의 단부, 바람직하게는 어느 한 단부가 상기 표적 유전자좌에 상동성인 서열에 의해 측면 인접되도록 수행한다. 상기 표적 유전자좌에 측면 인접한 상동성 서열의 길이는 바람직하게 적어도 30 bp, 바람직하게 적어도 50 bp, 바람직하게 적어도 0.1 kb, 훨씬 바람직하게 적어도 0.2 kb, 보다 바람직하게 적어도 0.5 kb, 훨씬 더 바람직하게 적어도 1 kb, 가장 바람직하게 적어도 2 kb이다. 바람직하게, 상기 숙주 세포의 게놈내로의 표적화된 통합, 즉 소정의 표적 유전자좌 중의 통합의 효율은 상기 숙주 세포의 증대된 상동성 재조합 능력에 의해 증가된다.
상기 벡터 중 상동성 측면 인접 DNA 서열(표적 유전자좌에 상동성이다)은 발현된 유전자좌로부터 유래할 수 있으며, 이는 상기 서열이 숙주 세포에서 발현이 가능한 유전자로부터 유래됨을 의미한다. 측면 인접 DNA 서열을, 배양 배지에 적합한 선택성 인자가 보충될 때 형질전환된 세포가 성장하도록 선택성 마커 유전자와 결합시킬 수 있다. 상기 측면 인접 DNA 서열을 당해 분야의 숙련가에게 공지된 임의의 수단에 의해 설계할 수 있으며; 하나의 바람직한 설계는 포화된 및/또는 다중불포화된 지방산 신타제(PUFA 신타제)를 암호화하는 유전자에의 상동성 재조합을 지시하고, 따라서 이들 신타제의 돌연변이 또는 붕괴는 포화된 및/또는 다중불포화된 지방산에 대한 영양요구성을 생성시킨다. 포화된 및/또는 다중불포화된 지방산에 영양요구성인 세포는 성장을 위한 보충제로서 포화된 및/또는 다중불포화된 지방산을 필요로 한다. 또 다른 바람직한 설계는 우성 선택성 마커 유전자의 형질전환체가 적합한 우성 선택성 인자의 존재하에서 성장할 수 있도록 상기 선택성 마커 유전자의 발현을 가능하게 한다.
본 발명에 따른 폴리뉴클레오타이드의 하나 초과의 사본을 미생물 숙주 세포내에 삽입하여 상기 폴리뉴클레오타이드에 의해 암호화된 생성물의 생산을 매개할 수 있다. 이를, 바람직하게는 상기 폴리뉴클레오타이드의 다중 사본을 상기 숙주 세포의 게놈내에 통합시키거나 또는 상기 폴리뉴클레오타이드의 통합을 고도로 발현된 유전자좌에 작동 가능한 배열로 표적화함으로써 수행할 수 있다. 한편으로, 다중 사본의 통합을, 본 발명에 따른 폴리뉴클레오타이드를 갖는 증폭 가능한 선택성 마커 유전자를 포함시킴으로써 성취할 수 있으며, 따라서 상기 선택성 마커 유전자의 증폭된 사본(및 이에 의해 핵산 서열의 추가적인 사본)을 함유하는 세포를, 적합한 선택성 인자의 존재하에서 상기 세포를 배양함으로써 선택할 수 있다. 본 발명에 따른 폴리뉴클레오타이드의 사본수를 훨씬 더 증가시키기 위해서, WO98/46772에 기재된 바와 같은 유전자 전환의 기법을 사용할 수 있다.
본 발명에 따른 Cas 단백질 및/또는 본 발명에 따른 안내-폴리뉴클레오타이드를 암호화하는 본 발명에 따른 폴리뉴클레오타이드를 숙주 세포의 게놈내에 통합시킬 때, 예를 들어 목적하는 게놈 편집이 발생했을 때, 상기 폴리뉴클레오타이드를 상기 게놈으로부터 절제하는 것이 바람직할 수 있다. 폴리뉴클레오타이드의 절제를 당해 분야의 숙련가에게 공지된 임의의 수단에 의해 수행할 수 있으며; 하나의 바람직한 수단은 영양요구성이 치유된 세포가 상기 영양요구체에 의해 요구된 영양소가 생략된 배양 배지에서 생육에 의해 대신 선택될 수 있도록 영양요구성을 유도한 유전자 돌연변이 또는 붕괴를 복구하는 뉴클레오타이드에 의한 2차 형질전환에 의한다. 또 다른 절제 수단은 본 발명에 따른 CRISPR-Cas 시스템의 사용일 수 있다.
본 발명에 따른 벡터는 숙주 세포내로 도입되는 본 발명에 따른 폴리뉴클레오타이드를 함께 함유하는 단일 벡터 또는 플라스미드 또는 2개 이상의 벡터 또는 플라스미드를 포함하는 벡터 시스템일 수 있다.
본 발명에 따른 벡터는, 형질전환된 세포의 용이한 선택을 허용하는 하나 이상의 선택성 마커를 함유할 수 있다. 하나의 실시태양에서, 본 발명에 따른 조성물에서 하나 이상의 또는 모든 벡터는 선택성 마커를 포함하며, 바람직하게 각각의 벡터는 별개의 선택성 마커를 포함한다. 선택성 마커는 생성물이 살생물제 또는 바이러스 내성, 중금속에 대한 내성, 영양요구체에 대한 원영양요구성 등을 제공하는 유전자이다. 상기 선택성 마커는 발현 카세트로서 상기 벡터상에서 세포내에 도입되거나 또는 별도의 벡터상에 도입될 수 있다.
라비린툴로마이세트 세포에 사용하기 위한 선택성 마커는 비제한적으로 nptII(네오마이신 포스포트랜스퍼라제 II, 파로모마이신 내성을 부여한다), ALS(아세토락테이트 신타제, 설포메투론메틸 내성을 부여한다), bsd(블라스티시딘-S-데아미나제, 블라스티시딘 내성을 부여한다), 및 Sh ble(플레오마이신 결합, 제오신 내성을 부여한다)를 포함하는 그룹 중에서 선택될 수 있다.
한편으로, 특이성 선택 마커, 예를 들어 앞서 논의된 균주로서 포화되거나 다중불포화된 지방산 신타제 유전자의 불활성화 돌연변이를 갖는 상응하는 돌연변이 숙주 세포를 요구하는 영양요구성 마커를 사용할 수 있다. 바람직한 실시태양에서, 상기 선택 마커는 선택 마커 유전자가 없는 폴리펩타이드를 생성시킬 수 있는 형질전환된 숙주 세포를 수득하기 위해서 발현 구조물의 도입 후에 형질전환된 숙주 세포로부터 결실된다.
본 발명에 따른 벡터를 구성하기 위해서 상술한 요소들을 결찰시키는데 사용되는 과정은 당해 분야의 숙련가에게 주지되어 있다(예를 들어 문헌[Sambrook & Russell, Molecular Cloning: A Laboratory Manual, 3rd Ed., CSHL Press, Cold Spring Harbor, NY, 2001]; 및 문헌[Ausubel et al., Current Protocols in Molecular Biology, Wiley InterScience, NY, 1995]을 참조하시오).
본 발명의 모든 실시태양들의 상황에서 Cas 단백질은 본 발명의 목적에 적합한 임의의 Cas 단백질을 지칭한다. Cas 단백질은 효소 활성을 포함하거나 효소 활성을 포함하지 않을 수도 있다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(또한 Csn1 및 Csx12로서 공지됨), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 이들 Cas 단백질은 당해 분야의 숙련가에게 공지되어 있으며; 예를 들어 스트렙토코커스 피오게네스 Cas9 단백질의 아미노산 서열은 스위스프롯(SwissProt) 데이터베이스에서 수납번호 Q99ZW2하에 발견될 수 있다. 바람직하게, 본 발명에 따른 변형되지 않은 Cas 단백질, 예를 들어 Cas9는 DNA 절단 활성을 갖는다. 바람직하게, 상응하는 Cas 단백질은 Cas9이며, 스트렙토코커스 피오게네스 또는 스트렙토코커스 뉴모니아에로부터의 Cas9일 수 있다. 바람직하게, 본 발명에 따른 Cas 단백질은 표적-폴리뉴클레오타이드의 위치에서, 예를 들어 상기 표적-폴리뉴클레오타이드내 및/또는 상기 표적-폴리뉴클레오타이드의 역보체내에서 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두의 절단을 지시한다. 상기 표적-폴리뉴클레오타이드의 위치는 본 명세서에서 표적-폴리뉴클레오타이드의 첫 번째 또는 최종 뉴클레오타이드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, 또는 그 이상의 뉴클레오타이드 이내; 보다 바람직하게는 표적-폴리뉴클레오타이드의 첫 번째 또는 최종 뉴클레오타이드로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, 또는 그 이상의 뉴클레오타이드 이내; 훨씬 더 바람직하게는 표적-폴리뉴클레오타이드의 첫 번째 또는 최종 뉴클레오타이드로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50 뉴클레오타이드 이내로서 한정된다. 상응하게, 본 발명에 따른 Cas 단백질은 바람직하게는 표적-폴리뉴클레오타이드의 첫 번째 또는 최종 뉴클레오타이드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, 또는 그 이상의 뉴클레오타이드 이내; 보다 바람직하게는 표적-폴리뉴클레오타이드의 첫 번째 또는 최종 뉴클레오타이드로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, 또는 그 이상의 뉴클레오타이드 이내; 훨씬 더 바람직하게는 표적-폴리뉴클레오타이드의 첫 번째 또는 최종 뉴클레오타이드로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50 뉴클레오타이드 이내에서 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두의 절단을 지시한다. 전형적으로, 본 발명에 따른 표적-폴리뉴클레오타이드는 PAM 서열(본 명세서의 다른 어딘가에서 정의됨)과 결합되며 상기 PAM 서열은 바람직하게는 표적-서열의 바로 하류(3')에 있고; 상기 CRISPR-Cas 복합체의 형성은 전형적으로 상기 PAM 서열의 3 염기쌍 상류(5')에서 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두의 절단을 생성시킨다.
바람직하게, 본 발명에 따른 조성물 중의 Cas 단백질은 상기 표적-폴리뉴클레오타이드의 위치에서 2개의 폴리뉴클레오타이드 가닥 모두의 절단을 지시하는 활성을 갖는다. Cas 뉴클레아제 활성은 전형적으로 2개의 분리된 촉매 도메인, 즉 RuvC 및 HNH에 의해 수행된다. 각각의 도메인은 하나의 폴리뉴클레오타이드 가닥을 절단하고 각각의 도메인은 단일 점 돌연변이에 의해 불활성화될 수 있다.
따라서 본 발명에 따른 Cas 단백질은 편의상, 돌연변이된 Cas 단백질이 변경된 뉴클레아제 활성을 갖고 표적-폴리뉴클레오타이드의 하나 또는 2개의 가닥 모두를 절단하는 능력이 결여되도록 상응하는 야생형 Cas 단백질에 대해 돌연변이될 수 있다. 예를 들어, 스트렙토코커스 피오게네스로부터의 Cas9의 RuvC I 촉매 도메인에서 아스파테이트에서 알라닌으로의 치환(D10A)은 Cas9를 2개의 가닥을 모두 절단하는 뉴클레아제에서 니카제(상기는 본 명세서에서 표적-폴리뉴클레오타이드의 단일 가닥을 절단하는 Cas 단백질로서 정의된다)로 전환시킨다. Cas9를 니카제로 만드는 돌연변이의 다른 예는 비제한적으로 H840A, N854A, 및 N863A를 포함한다. 본 발명의 상황에서, 니카제 활성을 갖는 Cas 단백질을 상동성 재조합을 통한 게놈 편집, 바람직하게는 문헌[Ran et al., 2013]에 따른 이중 닉킹(nicking) 기법에 사용할 수 있다. 상응하게, 본 발명에 따른 바람직한 Cas 단백질은 상기 단백질이 상응하는 야생형 Cas 단백질에 비해 변경된 뉴클레아제 활성을 갖도록, 바람직하게는 상기 표적-서열의 위치에서 단일의 폴리뉴클레오타이드 가닥의 절단을 지시하는 활성을 갖는 적어도 하나의 돌연변이를 포함한다. 상기와 같은 소위 니카제 돌연변이체를 편의상 듀플렉스 셋업에, 즉 RuvC 돌연변이된 Cas 단백질 니카제 돌연변이체 및 NHN이 돌연변이된 Cas 단백질 니카제 돌연변이체를 포함하는 본 발명에 따른 조성물에 사용할 수 있으며, 따라서 상기 하나의 Cas 단백질 돌연변이체는 상기 폴리뉴클레오타이드 표적의 하나의 가닥을 닉킹하고 다른 Cas 단백질 돌연변이체는 상기 폴리뉴클레오타이드 표적의 다른 가닥을 닉킹한다. 상기 사용되는 2개의 안내-폴리뉴클레오타이드에 따라, 2개의 상이한 CRISPR-Cas 복합체는 상기 폴리뉴클레오타이드 표적 중에 2개의 단일-가닥 닉을 유효하게 생성시킬 것이며; 이들 닉은 5, 10, 20, 30 이상 떨어진 다수의 뉴클레오타이드들일 수 있다. 상기와 같은 이중 닉킹 방법은 비-상동성 말단 부착(NEJH)의 특이성을 크게 증대시킨다. 이중 닉킹에 대한 배경 정보를 예를 들어 문헌[Ran et al., 2013]에서 찾을 수 있다.
본 발명에 따른 Cas 단백질은 Cas9의 2개 이상의 돌연변이된 촉매 도메인, 예를 들어 RuvC I, RuvC II 및/또는 RuvC III를 포함하여 모든 DNA 절단 활성이 실질적으로 없는 돌연변이된 Cas9를 생성시킬 수 있다 일부 실시태양에서, D10A 돌연변이를 H840A, N854A, 또는 N863A 돌연변이 중 하나 이상과 병용하여 모든 DNA 절단 활성이 실질적으로 없는 Cas9 효소를 생성시킨다. 바람직하게, Cas 단백질은 상기 돌연변이된 효소의 DNA 절단 활성이 돌연변이되지 않은 형태에 대해서 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 미만, 또는 그 이하일 때 모든 DNA 절단 활성이 실질적으로 없는 것으로 간주된다. 실질적으로 모든 효소 활성이 없는 Cas 단백질을, 상기 CRISPR-Cas 복합체가 상기 표적-폴리뉴클레오타이드로부터의 전사를 방해할 것이기 때문에, 편의상 유전자 침묵 또는 발현의 하향 조절에 사용할 수 있다. 다른 돌연변이들이 유용할 수 있으며; 상기 Cas9 또는 다른 Cas 단백질이 스트렙토코커스 피오게네스 이외의 종으로부터의 것인 경우, 상응하는 아미노산에서 돌연변이를 수행하여 유사한 효과를 성취할 수 있고; 당해 분야의 숙련가는 이들 상응하는 아미노산을 어떻게 식별하는 지를 안다.
본 발명에 따른 Cas 단백질은 융합 단백질일 수 있으며 적어도 하나의 이종 기능성 도메인을 포함하고, 상기와 같은 도메인은 바람직하게는 문헌[Aggarwal, A. K.; Wah, D. A.; Hirsch, J. A.; Dorner, L. F.; Schildkraut, I. (1997). "Structure of the multimodular endonuclease FokI bound to DNA". Nature 388 (6637): 97-100]에 기재된 바와 같은 FokI 활성을 포함하는 도메인이다. 상기 효소 FokI은 플라보박테리움 오케아노코이테스(Flavobacterium okeanokoites)에서 자연적으로 발견되며 N-말단 DNA-결합 도메인 및 C-말단의 비-특이성 DNA 절단 도메인으로 이루어지는 세균성 IIS형 제한 엔도뉴클레아제이다(Durai et al., 2005). 상기 FokI 단백질이 5′-GGATG-3′:3′-CATCC-5′ 인식 부위에서 그의 DNA-결합 도메인을 통해 이중 가닥 DNA에 결합할 때, 상기 DNA 절단 도메인은 활성화되어 추가의 서열 특이성 없이 상기 인식 부위의 하류에서 첫 번째 가닥 9 뉴클레오타이드 및 상기 부위의 가장 가까운 뉴클레오타이드의 상류에서 두 번째 가닥 13 뉴클레오타이드를 절단한다(Wah et al., 1998). Cas9-FokI 융합은 특히 문헌[Guilinger et al., 2014]; 및 문헌[Tsai et al., 2014]에서 기재되었다.
본 발명에 따른 Cas 융합 단백질은 상기 Cas 단백질 외에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 도메인을 포함할 수 있다. Cas 단백질에 융합될 수 있는 단백질 도메인의 예는 비제한적으로 에피토프 태그, 리포터 유전자 서열, 및 하기의 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다: 메틸라제 활성, 데미틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 역사적인 변형 활성, RNA 절단 활성 및 핵산 결합 활성. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그, 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는 비제한적으로 글루타치온-S-트랜스퍼라제(GST), 양고추냉이 퍼옥시다제(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시페라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 시안 형광 단백질(CFP), 황색 형광 단백질(YFP), 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함한다. Cas 단백질을, DNA 분자에 결합하거나 다른 세포 분자에 결합하는 단백질 또는 단백질의 단편을 암호화하는 유전자 서열, 예를 들어 비제한적으로 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합물, GAL4 DNA 결합 도메인 융합물, 및 헤르페스 단순 바이러스(HSV) BP 16 단백질 융합물에 융합시킬 수 있다. CRISPR 효소를 포함하는 융합 단백질의 부분을 형성할 수 있는 추가적인 도메인은 US20110059502에 기재되어 있다. 태그된 Cas 단백질을 사용하여 표적-폴리뉴클레오타이드의 위치를 확인할 수 있다. 본 발명에 따른 바람직한 Cas 융합 단백질은 본 명세서에서 상기에 정의한 바와 같은 FokI 도메인을 포함한다.
본 발명에 따른 바람직한 Cas 단백질은 핵 국소화 서열, 바람직하게는 이종 핵 국소화 서열을 포함한다. 상기와 같은 핵 국소화 서열을 또한 핵 국소화 신호라 칭한다. 바람직하게, 상기와 같은 핵 국소화 신호는 상기 CRISPR-Cas 복합체에, 숙주 세포의 핵 중에서 검출 가능한 양으로 상기 CRISPR-Cas 복합체의 축적을 구동하기에 충분한 강도를 부여한다. 이론에 얽매이고자 하는 것은 아니지만, 핵 국소화 서열이 숙주 세포에서 CRISPR-Cas 활성에 필요하지 않지만 상기와 같은 서열을 포함하는 것은, 특히 상기 핵내로의 표적 핵산 분자에 대한 상기 시스템의 활성을 증대시키는 것으로 여겨진다. 상기와 같은 핵 국소화 서열은 바람직하게는 Cas 단백질 중에 존재하지만, 상기 CRISPR-Cas 시스템의 핵에의 표적화를 촉진하도록 다른 어딘가에 또한 존재할 수도 있다. 바람직한 핵 국소화 서열은 SV40 핵 국소화 서열이다.
본 발명에 따른 조성물 및 임의의 다른 실시태양에서, Cas 단백질 암호화 폴리뉴클레오타이드를 바람직하게는 상기를 발현시키고자 하는 숙주 세포에 코돈 최적화시킨다, 보다 바람직하게 상기 Cas 단백질 암호화 폴리뉴클레오타이드를 코돈 쌍 최적화시킨다. 일반적으로, 코돈 최적화는 관심 숙주 세포에서의 증대된 발현을 위해, 고유 아미노산 서열을 유지시키면서 숙주 세포의 유전자에 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 상기 고유 서열 중 적어도 하나의 코돈(예를 들어 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 초과, 또는 그 이상의 코돈)을 교체시킴으로써 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종들이 특정 아미노산의 몇몇 코돈에 대해 특정한 편향을 나타낸다. 코돈 편향(유기체들간의 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역 효율과 상관있으며, 이는 차례로 다른 것들 중에서도 특히 번역되는 코돈의 성질 및 특정한 전달 RNA(tRNA) 분자의 입수성에 따라 변하는 것으로 여겨진다. 하나의 세포 중의 선택된 tRNA의 우세성은 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈의 반영이다. 상응하게, 유전자를 코돈 최적화에 기반하여 주어진 유기체에서의 최적의 유전자 발현에 맞출 수 있다. 코돈 사용 표를, 예를 들어 "코돈 사용 데이터베이스"에서 쉽게 입수할 수 있으며 상기 표를 다양한 방식으로 적합화시킬 수 있다. 예를 들어 문헌[Nakamura, Y., et al., 2000]을 참조하시오. 특정한 숙주 세포에서 발현을 위해 특정한 서열을 코돈 최적화하기 위한 컴퓨터 알고리즘을 또한 입수할 수 있으며, 예를 들어 진 포지(Gene Forge)(앱타젠(Aptagen); 미국 펜실바니아주 저커버스 소재)를 또한 입수할 수 있다. 바람직하게 Cas 단백질을 암호화하는 서열 중 하나 이상의 코돈(예를 들어 1, 2, 3, 4, 5, 10, 15, 20, 25, 50, 또는 그 이상, 또는 모든 코돈)은 특정 아미노산에 대해 가장 빈번히 사용되는 코돈에 상응한다. 코돈 최적화에 바람직한 방법은 WO2006/077258 및 WO2008/000632에 기재되어 있다. WO2008/000632는 코돈-쌍 최적화를 다룬다. 코돈-쌍 최적화는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열의 개선된 발현 및/또는 상기 암호화된 폴리펩타이드의 개선된 생성을 획득하기 위해, 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 그의 코돈-사용, 특히 사용되는 코돈-쌍에 대해 변형시킨 방법이다. 코돈 쌍은 암호화 서열 중 2개의 후속적인 트리플릿(코돈)의 세트로서 정의된다. 본 발명에 따른 조성물에서 소스 중 Cas 단백질의 양은 변할 수 있으며 최적의 성능을 위해 최적화시킬 수 있다. 높은 수준의 Cas 단백질은, 안내-폴리뉴클레오타이드가 존재하지 않는다 하더라도, 숙주 세포에 대해 독성일 수 있기 때문에(예를 들어 문헌[Ryan et al., 2014] 및 문헌[Jacobs et al., 2014]을 참조하시오) 상기 숙주 세포에서 Cas 단백질의 너무 높은 수준은 피하는 것이 편할 수 있다. 당해 분야의 숙련가는 예를 들어 Cas 단백질의 발현을 위해 보다 약한 프로모터, 억제성 프로모터 또는 유도성 프로모터를 선택함으로써 발현 수준을 어떻게 조절하는 지를 안다. 단백질의 발현에 적합한 프로모터의 예는 본 명세서의 다른 어딘가에 묘사되어 있다.
본 발명에 따른 안내-폴리뉴클레오타이드가 폴리뉴클레오타이드에 의해 암호화되는 본 발명에 따른 조성물에서, 상기 안내-폴리뉴클레오타이드의 발현을 암호화 폴리뉴클레오타이드에 작동적으로 연결된 프로모터에 의해 촉진할 수 있다. 상기와 같은 프로모터는 당해 분야의 숙련가에게 공지된 임의의 적합한 프로모터일 수 있다. 다수 유형의 프로모터를 사용할 수 있다. 편의상 RNA 폴리머라제 III 프로모터 또는 RNA 폴리머라제 II 프로모터를 사용할 수 있다. RNA 폴리머라제 III 및 그의 프로모터에 대한 배경 정보를 예를 들어 문헌[Marck et al., 2006]에서 찾을 수 있다. 상응하게, 편의상 RNA 폴리머라제 II 프로모터를 사용할 수 있으며, 상기는 당해 분야의 숙련가에게 공지되어 있고 예를 들어 문헌[Kornberg, 1999]에 리뷰되어 있다. 그러나, RNA II 폴리머라제로부터의 전사물은 종종 복잡한 전사 종결자를 가지며 전사물은 폴리아데닐화되고; 이는, 기능성 CRISPR-Cas 시스템을 생성시키기 위해 필요한 2차 구조를 성취하기 위해서 5' 및 3' 단부를 모두 정확하게 한정할 필요가 있기 때문에 상기 안내-폴리뉴클레오타이드의 요건을 방해할 수도 있다. 그러나 상기 결점은 회피될 수 있다. RNA 폴리머라제 II 프로모터가 사용되는 경우, 상기 안내-폴리뉴클레오타이드를 암호화하는 폴리뉴클레오타이드는 또한 자기-가공 리보자임을 암호화할 수 있고 RNA 폴리머라제 II 프로모터에 작동적으로 연결될 수 있으며; 이와 같이 상기 폴리뉴클레오타이드는 상기 안내-폴리뉴클레오타이드 및 자기-가공 리보자임을 포함하는 프리-안내-폴리뉴클레오타이드를 암호화하며, 여기에서 상기 안내-폴리뉴클레오타이드는 전사시 상기 프리-안내-폴리뉴클레오타이드 전사물로부터 자기-가공 리보자임에 의해 방출된다. RNA 폴리머라제 II 프로모터에 작동적으로 연결된 본 발명에 따른 프리-안내-폴리뉴클레오타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 바람직한 구조물은 본 명세서에서 실시예 1 내지 4에 묘사된 것들이다. 상기와 같은 구조물에 대한 배경 정보를 예를 들어 문헌[Gao et al., 2014]에서 찾을 수 있다.
바람직하게, 본 발명에 따른 조성물에서, 상기 안내-폴리뉴클레오타이드는 폴리뉴클레오타이드에 의해 암호화된다.
바람직하게, 상기 안내-폴리뉴클레오타이드가 폴리뉴클레오타이드에 의해 암호화되는 본 발명에 따른 조성물에서, 상기 폴리뉴클레오타이드는 RNA 폴리머라제 II 프로모터에 작동적으로 연결되며 상기 안내-폴리뉴클레오타이드 및 자기-가공 리보자임을 포함하는 프리-안내-폴리뉴클레오타이드를 암호화하고, 여기에서 상기 안내-폴리뉴클레오타이드는 전사시 상기 프리-안내-폴리뉴클레오타이드 전사물로부터 자기-가공 리보자임에 의해 방출된다. RNA 폴리머라제 II 프로모터에 작동적으로 연결된 본 발명에 따른 프리-안내-폴리뉴클레오타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 바람직한 구조물은 본 명세서에서 실시예 1 내지 4에 묘사된 것들이다. 편의상, 다수의 프리-안내-폴리뉴클레오타이드 및 다수의 자기-가공 리보자임을 하나 이상의 RNA 폴리머라제 II 프로모터에 작동적으로 연결된 단일 폴리뉴클레오타이드에 의해 암호화할 수 있다.
본 발명의 첫 번째 태양에 따른 조성물을 편의상 숙주 세포에서 폴리뉴클레오타이드의 발현을 조절하는데 사용할 수 있다. 상응하게, 두 번재 태양에서, 본 발명은 숙주 세포에서 폴리뉴클레오타이드의 발현을 조절하는 방법을 제공하며, 상기 방법은 숙주 세포를 본 발명의 첫 번째 태양에 따른 조성물과 접촉시킴을 포함하고, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킨다.
본 발명의 상황에서 "발현"이란 용어는 본 명세서에서 폴리뉴클레오타이드가 폴리뉴클레오타이드 주형으로부터 전사되는 과정(예를 들어 DNA 주형 폴리뉴클레오타이드가 mRNA 폴리뉴클레오타이드 전사물 또는 다른 RNA 전사물로 전사된다) 및/또는 mRNA 전사물이 후속적으로 펩타이드, 폴리펩타이드, 또는 단백질로 번역되는 과정으로서 정의된다. 전사물 및 암호화된 폴리펩타이드를 집합적으로 "유전자 산물"로서 지칭할 수 있다. 상기 폴리뉴클레오타이드 전사물이 게놈 주형 DNA로부터 유래되는 경우, 발현은 숙주 세포에서 상기 mRNA 전사물의 이어맞추기를 포함할 수 있다. "조절 발현"이란 용어는 본 명세서에서 동일한 조건을 사용하여 분석시 발현이 조절되지 않은 모 숙주 세포에 비해 증가되거나 감소된 발현을 지칭한다. 감소된 발현은 mRNA와 같은 전사물의 감소된 양 및/또는 폴리펩타이드와 같은 번역 산물의 감소된 양일 수 있다. 증가된 발현은 mRNA와 같은 전사물의 증대된 양 및/또는 폴리펩타이드와 같은 번역 산물의 증대된 양일 수 있음이 된다.
바람직하게, 상기 CRISPR-Cas 복합체는 상기 표적-폴리뉴클레오타이드의 위치에서 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두를 절단하여 유전자 산물의 조절된 발현을 생성시킨다. 상기 CRISPR-Cas 복합체는 또한 변경된 뉴클레아제 활성을 가질 수 있으며 표적-폴리뉴클레오타이드의 하나 또는 2개의 가닥을 모두 절단하는 능력이 실질적으로 없다; 상기와 같은 경우에 발현은 표적-폴리뉴클레오타이드에 대한 상기 복합체의 결합에 의해 조절된다. 실질적으로 모든 효소 활성이 없는 Cas 단백질을 편의상 유전자 침묵화 또는 발현의 하향조절에 사용할 수 있는데, 그 이유는 상기 CRISPR-Cas 복합체가 상기 표적-폴리뉴클레오타이드로부터의 전사를 방해할 것이기 때문이다. 한편으로, Cas 단백질을 관심 유전자의 프로그램화 가능한 전사 활성화 또는 침묵화를 위한 전사 인자로 변형시킬 수 있다(문헌[Larson, et al., 2013]).
본 발명의 첫 번째 태양에 따른 조성물을 편의상 폴리뉴클레오타이드의 결실에 사용할 수 있다. 하나의 실시태양에서, 본 발명의 첫 번째 태양에 따른 조성물이 적어도 하나 또는 2개의 안내-폴리뉴클레오타이드의 소스를 포함하고/하거나 적어도 하나의 Cas 단백질의 소스를 포함하는 경우, 상기 표적-폴리뉴클레오타이드의 하나의 위치 또는 상이한 위치에서 하나 또는 2개의 폴리뉴클레오타이드 가닥을 모두 절단하여 상기 표적-폴리뉴클레오타이드로부터 폴리뉴클레오타이드 단편의 결실을 생성시키는, 적어도 하나의 CRISPR-Cas 복합체 또는 2개의 상이한 CRISPR-Cas 복합체가 형성된다. 바람직하게, 적어도 하나 또는 2개의 안내-폴리뉴클레오타이드 및/또는 적어도 하나의 Cas 단백질의 소스를 포함하는 본 발명에 따른 상기와 같은 조성물은, 상기 안내-폴리뉴클레오타이드(들)에 의해 표적화된 적어도 하나 또는 2개의 표적-폴리뉴클레오타이드에 적어도 부분적으로 상보성인, 본 명세서에서 하기에 정의하는 바와 같은 외인성 폴리뉴클레오타이드를 추가로 포함한다. 결실되는 상기와 같은 폴리뉴클레오타이드 단편 또는 결실된 단편은 길이가 수 뉴클레오타이드 내지 수천 뉴클레오타이드일 수 있으며, 전체 유전자가 결실되거나 또는 유전자들의 클러스터가 결실될 수 있다. 상응하게, 본 발명은 숙주 세포에서 폴리뉴클레오타이드의 발현을 조절하는 방법을 제공하며, 여기에서 폴리뉴클레오타이드 단편은 표적-폴리뉴클레오타이드로부터 결실된다.
하나의 실시태양에서, 발현 조절 방법은 상기 표적-폴리뉴클레오타이드 중 적어도 하나의 위치에서 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두의 절단에 이어서 외인성 폴리뉴클레오타이드와의 상동성 재조합에 의한 상기 표적-폴리뉴클레오타이드의 변형을 포함한다. 상기와 같은 경우에, 본 발명의 첫 번째 태양에 따른 조성물은 바람직하게는 상기와 같은 외인성 폴리뉴클레오타이드를 추가로 포함한다. 상기와 같은 변형은 상기 표적-폴리뉴클레오타이드 중의 적어도 하나의 뉴클레오타이드의 삽입, 결실 또는 치환을 생성시킬 수 있으며, 여기에서 상기 삽입 또는 치환 뉴클레오타이드는 상기 외인성 폴리뉴클레오타이드로부터 기원할 수 있다. 변형은 또한 상기 외인성 폴리뉴클레오타이드가 문헌[Dong et al.] 및 [Beetham et al.]에 기재된 바와 같은 비-통합 존재인 경우 이루어질 수 있으며; 이 경우에 상기 표적-폴리뉴클레오타이드는 변형되지만 상기 외인성 폴리뉴클레오타이드의 뉴클레오타이드는 상기 표적-폴리뉴클레오타이드내로 도입된다. 결과적으로, 상기 생성 숙주는 본 발명에 따른 Cas-단백질을 단백질로서 숙주 세포에 도입시키는 경우 비-재조합 숙주 세포이다. 상기 외인성 폴리뉴클레오타이드는 임의의 관심 폴리뉴클레오타이드, 예를 들어 본 명세서에서 하기에 정의하는 바와 같은 관심 화합물을 암호화하는 폴리뉴클레오타이드, 또는 상기와 같은 폴리뉴클레오타이드의 일부 또는 그의 변체일 수 있다. 상기와 같은 외인성 폴리뉴클레오타이드는 본 명세서에서 본 발명에 따른 외인성 폴리뉴클레오타이드로서 지칭되며 단일 가닥 또는 이중 가닥일 수 있다.
다양한 용도가 본 발명에 따른 조성물 및 방법에 대해서 당해 분야의 숙련가에 의해 고려될 수 있다. 게놈 중 폴리뉴클레오타이드(또는 유전자)를 본 발명에 따른 조성물 및 방법을 사용하여 변형시키거나, 편집하거나 또는 붕괴시킬 수 있다. 예를 들어 상기 표적-폴리뉴클레오타이드의 2개 가닥 모두를 절단하는 완전 활성 Cas 단백질을 사용하는 경우 및 외인성 폴리뉴클레오타이드가 적합한 복구 주형으로서 존재하지 않는 경우, 이중가닥 절단이 비-상동성 말단 부착 복구(NHEJ)에 의해 복구된다. NHEJ 동안 하나 또는 다수의 뉴클레오타이드의 삽입 및/또는 결실(일부의 경우에 치환으로서 이해될 수 있다)이 발생할 수 있으며, 이들은 상기 복구 부위에 무작위로 삽입되거나 결실되고; 이는 NHEJ의 특징이다. 상기와 같은 삽입 및/또는 결실은 암호화 서열의 판독 프레임에 영향을 미칠 수 있으며, 이는 (조기)정지 코돈의 발생 또는 이어맞추기 부위의 변경의 경우에 유전자 산물 또는 심지어 절두된 단백질 중의 아미노산 변화를 생성시킬 수 있다.
외인성 폴리뉴클레오타이드가 복구 주형으로서 존재하는 경우, 게놈 중 폴리뉴클레오타이드(또는 유전자)를 상동성 말단 부착 복구(HEJ)(또한 상동성-지시된 복구(HDR)로서 공지되어 있다)를 사용하는 본 발명에 따른 조성물 및 방법을 사용하여 변형시키거나, 편집하거나 붕괴시킬 수 있다. 예를 들어 상기 표적-폴리뉴클레오타이드에 일치하는 서열을 갖는 외인성 폴리뉴클레오타이드(즉 상기 이중 가닥 절단의 상류(5') 및 하류(3'))가 본 발명에 따른 CRISPR-Cas 시스템과 함께 존재하는 경우, HDR은 상기 표적-폴리뉴클레오타이드 중의 이중 가닥 절단에 상기 외인성 폴리뉴클레오타이드의 상응하는 뉴클레오타이드를 도입시킬 것이다(또는 실제로 재생성시킬 것이다). 바람직하게, 본 발명에 따른 외인성 폴리뉴클레오타이드는 상기 표적 서열 자체에 이어서 기능성 PAM 서열을 함유하지 않아 상기 외인성 폴리뉴클레오타이드 자체 또는 변형된 표적-폴리뉴클레오타이드가 상기 CRISPR-Cas 시스템에 의해 (재)절단될 위험을 피한다.
본 발명의 실시태양에서, 본 발명에 따른 CRISPR-Cas 시스템이 외인성 폴리뉴클레오타이드(공여체 폴리뉴클레오타이드, 공여체 DNA, 복구 주형)를 포함하는 경우, 본 발명에 따른 CRISPR-Cas 시스템은 바람직하게는 하나 이상의 별도의 폴리뉴클레오타이드 또는 벡터에 의해 암호화되거나 또는 상기 상에 존재하는 2개 이상의 안내-폴리뉴클레오타이드를 포함하며, 2개 이상의 외인성 폴리뉴클레오타이드는 상기 CRISPR-Cas 시스템과 함께 제공되어 2개 이상의 CRISPR-Cas 복합체의 형성을 가능하게 한다. 본 발명에 따른 방법에서, 본 발명에 따른 상기와 같은 CRISPR-Cas 시스템을 편의상 2개 이상의 표적-폴리뉴클레오타이드에서의 발현을 조절하는데 사용할 수 있다, 즉 다수의 표적 부위를 표적화하는 방법에 사용할 수 있다. 본 발명에 따른 상기와 같은 CRISPR-Cas 시스템은 하나 이상의 표적-폴리뉴클레오타이드에서 우연히 1, 2 또는 그 이상의 CRISPR-Cas 복합체를 형성시킬 것이다. 상기와 같은 방법을 사용하여 숙주 세포의 게놈 중에, 임의로 하나 이상의 외인성 폴리뉴클레오타이드와 함께 하나 이상의 삽입, 결실, 치환을 생성시키거나, 또는 상기 형성된 CRISPR-Cas 복합체를 통해 유전자의 발현을 조절할 수 있다.
숙주 세포
본 발명의 상기 태양에 따른 방법에서, 바람직한 숙주 세포는 본 명세서의 다른 어딘가에서 정의된 바와 같은 관심 화합물을 암호화하는 폴리뉴클레오타이드를 포함한다.
본 발명의 상기 태양에 따른 방법에서, 상기 숙주 세포는 재조합 숙주 세포이거나 또는 비-재조합 숙주 세포일 수 있다.
일부 실시태양에서, 상기 숙주 세포는 라비린툴로마이세트, 바람직하게는 트라우스토키트리알레스 목의 일원, 바람직하게는 트라우스토키트리아세아에 과의 일원, 보다 바람직하게는 아우란티오키트리움, 오블롱기키트리움, 스키조키트리움, 트라우스토키트리움 및 울케니아로 이루어지는 그룹 중에서 선택되는 속의 일원, 훨씬 더 바람직하게는 스키조키트리움 종 ATCC# 20888이다.
본 발명의 상기 태양에 따른 숙주 세포 중의 폴리뉴클레오타이드의 발현 조절 방법은, 바람직하게는 본 발명의 첫 번째 태양에 따른 조성물의 성분들을 포함하는 변형된 숙주 세포를 생성시킨다. 상응하게, 세 번째 태양에서, 본 발명은 본 발명의 첫 번째 태양에 따른 조성물을 포함하는 숙주 세포를 제공한다. 상기와 같은 숙주 세포는 본 명세서에 정의된 바와 같은 임의의 숙주 세포일 수 있으며 본 명세서에서 달리 어딘가에 정의된 바와 같은 관심 화합물을 암호화하는 폴리뉴클레오타이드를 추가로 포함할 수 있다.
네 번째 태양에서, 본 발명은 숙주 세포의 생성 방법을 제공하며, 상기 방법은 숙주 세포를 본 발명의 첫 번째 태양에 따른 조성물과 접촉시킴을 포함하고, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킨다. 하나의 실시태양에서, 본 발명의 첫 번째 태양에 따른 조성물과의 접촉을 2 단계로 수행할 수 있으며, 여기에서 상기 숙주 세포를 본 발명에 따른 Cas 단백질의 소스와 1차 접촉시키고 후속으로 상기 숙주 세포를 본 발명에 따른 안내-폴리뉴클레오타이드의 소스 및 임의로 본 발명에 따른 외인성 폴리뉴클레오타이드와 접촉시킨다. 본 발명의 상기 실시태양에서 숙주 세포는 본 명세서에서 정의된 바와 같은 임의의 유형의 숙주 세포일 수 있으며 본 명세서의 다른 어딘가에 정의된 바와 같은 관심 화합물을 암호화하는 폴리뉴클레오타이드를 포함할 수 있다. 본 발명에 따른 숙주 세포의 바람직한 생성 방법은 자손 숙주 세포를 생성시키는 단계를 포함하며, 여기에서 상기 자손 숙주 세포 중에 본 발명에 따른 CRISPR-Cas 시스템의 성분은 더 이상 존재하지 않는다.
본 발명의 첫 번째 태양에 따른 조성물은 본 명세서에 정의된 바와 같은 임의의 상기와 같은 조성물일 수 있다. 숙주 세포를 본 발명에 따른 조성물과 접촉시키는 것을 당해 분야의 숙련가에게 공지된 임의의 수단에 의해 수행할 수 있다. 본 발명에 따른 숙주 세포를 간단히 본 발명에 따른 조성물을 포함하는 용액으로 가져올 수 있다. 본 발명에 따른 조성물을 숙주 세포로 전달하는 특정한 수단을 사용할 수 있다. 당해 분야의 숙련가는 상기와 같은 방법들을 알고 있으며(예를 들어 상기 문헌[Sambrook & Russell]; 문헌[Ausubel]을 참조하시오), 여기에는 비제한적으로 일렉트로포레이션 방법, 입자 충격 또는 미립자가속장치 충격, 원형질체 방법 및 아그로박테리움(Agrobacterium) 매개된 형질전환(AMT)이 포함된다. 라비린툴로마이세테스를 당해 분야에 공지된 임의의 방법을 사용하여 형질전환시킬 수 있다. 트라우스토키트리드의 유전자 형질전환을 위한 일반적인 기법이 미국특허 제 7,001,772 호 및 미국특허 제 8,637,651 호 및 문헌[Cheng et al. (2012)](이들은 모두 내용 전체가 본 명세서에 참고로 인용된다)에 상세히 기재되어 있다.
바람직하게, 상기 CRISPR-Cas 복합체는 상기 표적-폴리뉴클레오타이드의 위치에서 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두를 절단하여 상기 유전자 산물의 조절된 발현을 생성시킨다. 상기 CRISPR-Cas 복합체는 또한 변경된 뉴클레아제 활성을 가질 수 있으며 표적-폴리뉴클레오타이드의 하나 또는 2개의 가닥 모두를 절단하는 능력이 없을 수 있고; 상기와 같은 경우에, 발현은 상기 복합체의 상기 표적-폴리뉴클레오타이드에의 결합에 의해 조절된다.
하나의 실시태양에서, 본 발명의 첫 번째 태양에 따른 조성물이 적어도 하나 또는 2개의 안내-폴리뉴클레오타이드의 소스 및/또는 적어도 하나의 Cas 단백질의 소스를 포함하는 경우, 상기 표적-폴리뉴클레오타이드의 하나의 위치 또는 상이한 위치에서 하나 또는 2개의 폴리뉴클레오타이드 가닥을 모두 절단하여, 상기 표적-폴리뉴클레오타이드로부터 폴리뉴클레오타이드 단편의 결실을 생성시키는 적어도 하나의 CRISPR-Cas 복합체 또는 2개의 상이한 CRISPR-Cas 복합체가 형성된다. 바람직하게, 적어도 하나 또는 2개의 안내-폴리뉴클레오타이드 및/또는 적어도 하나의 Cas 단백질의 소스를 포함하는 본 발명에 따른 상기와 같은 조성물은 상기 안내-폴리뉴클레오타이드(들)에 의해 표적화된 상기 적어도 하나 또는 2개의 표적-폴리뉴클레오타이드에 적어도 부분적으로 상보성인, 본 명세서에서 하기에 정의하는 바와 같은 외인성 폴리뉴클레오타이드를 추가로 포함한다. 결실되는 상기와 같은 폴리뉴클레오타이드 단편 또는 결실된 단편은 길이가 수 뉴클레오타이드 내지 수천 뉴클레오타이드일 수 있으며, 전체 유전자가 결실되거나 또는 유전자들의 클러스터가 결실될 수 있다. 상응하게, 본 발명은 숙주 세포에서 폴리뉴클레오타이드의 발현을 조절하는 방법을 제공하며, 여기에서 폴리뉴클레오타이드 단편은 표적-폴리뉴클레오타이드로부터 결실된다.
하나의 실시태양에서, 폴리뉴클레오타이드 단편이 표적-폴리뉴클레오타이드로부터 결실되는, 숙주 세포 중의 폴리뉴클레오타이드의 발현 조절 방법은 숙주 세포를 본 명세서에 기재된 바와 같은 조성물과 접촉시킴을 포함하며, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킨다. 바람직하게, 폴리뉴클레오타이드 단편이 표적-폴리뉴클레오타이드로부터 결실되는, 숙주 세포 중의 폴리뉴클레오타이드의 발현 조절 방법은 숙주 세포를 본 명세서에 기재된 바와 같은 조성물과 접촉시킴을 포함하며, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킨다. 또 다른 바람직한 실시태양에서, 폴리뉴클레오타이드 단편이 표적-폴리뉴클레오타이드로부터 결실되는, 숙주 세포 중의 폴리뉴클레오타이드의 발현 조절 방법은 숙주 세포를 본 명세서에 기재된 바와 같은 조성물과 접촉시킴을 포함하며, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시키고, 여기에서 본 명세서에 기재된 바와 같은 조성물은 외인성 또는 공여체 폴리뉴클레오타이드를 포함하지 않는다. 숙주 세포에서 폴리뉴클레오타이드의 발현 조절 방법의 또 다른 실시태양에서, 상기 조성물은 자율적으로 복제하는 벡터 중에 포함된다.
따라서, 본 발명은 하나의 실시태양에서 세포 중의 폴리뉴클레오타이드의 발현을 조절하는 방법에 관한 것으로, 여기에서 폴리뉴클레오타이드 단편이 표적-폴리뉴클레오타이드로부터 결실되며, 상기 방법은 숙주 세포를 본 명세서에 기재된 바와 같은 조성물과 접촉시킴을 포함하지만, 바람직하게는 본 명세서에 정의된 바와 같은 공여체 폴리뉴클레오타이드는 포함하지 않으며, 여기에서 상기 안내-폴리뉴클레오타이드는 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킨다.
바람직한 실시태양에서, 상기 Cas 단백질은 상기 표적-서열의 위치에서 2개의 폴리뉴클레오타이드 가닥 모두의 절단을 지시하는 활성을 가지며, 여기에서 상기 절단은, 상기 Cas 단백질에 의해 절단시 서로 재결합하여 2개의 상동성 영역들 사이에 포함된 폴리뉴클레오타이드의 결실을 생성시키는 상기 영역들 사이에 포함된 게놈의 영역 중에서 발생한다. 바람직하게, 상기 2개의 상동성 영역간의 상동성 정도는 상동성 재조합을 허용하는 정도이다. 바람직하게, 상기 2개의 상동성 영역은 상기 상동성 영역의 전체 길이에 걸쳐 적어도 60%, 70%, 80%, 90%, 99% 또는 100% 서열 일치성을 갖는다. 놀랍게도, 상동성 영역의 길이는 라비린툴로마이세테스에서조차 매우 짧을 수 있으며, 여기에서 상동성 재조합을 허용하기 위해서 대개는 적어도 1 또는 수 kbp의 길이가 필요한 것으로 밝혀졌다. 따라서, 바람직한 실시태양에서, 상기 상동성 영역의 길이는 바람직하게는 1 kb 이하, 0.5 kb 이하, 100 bp 이하, 50 bp 이하, 40 bp 이하, 30 bp 이하, 20 bp 이하, 10 bp 이하이다.
바람직하게 상기 2개의 상동성 영역간의 거리는 10 kb 이하, 9 이하, 8 kb 이하, 7 kb 이하, 6 kb 이하, 5 kb 이하, 4 kb 이하, 3 kb 이하, 2 kb 이하, 1 kb 이하, 0.5 kb 이하, 100bp 이하, 50bp 이하, 40bp 이하, 30 bp 이하, 20 bp 이하, 10 bp 이하이다.
하나의 태양에서, 본 발명은 하나 이상의 PAM 부위를 표적화하고 공여체 DNA의 사용 없이 폴리뉴클레오타이드의 결실을 생성시키는 방법을 설계하기 위해서 상기 PAM 부위의 이웃 중 약 7 내지 20 bp의 상동성 영역 사이에 포함된 게놈 중에서 PAM 부위를 식별할 수 있는 소프트웨어 알고리즘에 관한 것이다.
상기 방법을 설계된 방식으로 폴리뉴클레오타이드 서열의 효율적인 제거에 사용할 수 있다. 예를 들어, Cas9 발현 카세트를 상기 게놈 DNA에 도입시킬 때 및 상기 CRISPR/CAS9 시스템에 의해 매개되는 수회 라운드의 변형 후에, 상기 CAS9 발현 카세트를 상기 Cas9 발현 카세트 중의 한 부위를 표적화하는 gRNA의 도입에 의해 상기 게놈으로부터 제거할 수 있으며, 여기에서 상기 Cas9 발현 카세트는 상기 정의된 바와 같은 2개의 상동성 영역 사이에, 바람직하게 100-bp 길이로, 보다 바람직하게 20-bp, 15-bp 길이로 또는 더 짧게 포함되며, 상기 Cas9 개방 판독 프레임 또는 상기 발현 카세트의 큰 부분을 절단시킨다.
상기 방법을 또한 유전자의 일시적인 불활성화에 사용할 수 있다. 예를 들어, 각각 5'-단부 및 3'-단부에 2개의 상동성 영역을 포함하는 카로티노이드 신타제 또는 포화된 지방산 신타제 또는 다중불포화된 지방산 신타제 유전자의 ORF에 폴리뉴클레오타이드 서열을 삽입함으로써 상기 유전자(예를 들어 카로티노에드 신타제 또는 포화된 지방산 신타제 또는 다중불포화된 지방산 신타제)를 비-기능성으로 만들 수 있으며, 여기에서 바람직하게 상기 상동성 영역은 100-bp, 보다 바람직하게 20-bp, 15-bp 길이이거나 또는 더 짧다. 상기 언급한 신타제 유전자를 상술한 바와 같이 공여체 DNA 없이 CRISPR-Cas9 시스템을 사용하여 다시 기능성으로 만들 수 있다.
하나의 실시태양에서, 상기 발현 조절 방법은 상기 표적-폴리뉴클레오타이드의 적어도 하나의 위치에서 하나 또는 2개의 폴리뉴클레오타이드 가닥 모두의 절단에 이어서 외인성 폴리뉴클레오타이드와의 상동성 재조합에 의한 상기 표적-폴리뉴클레오타이드의 변형을 포함한다. 상기와 같은 경우에, 본 발명의 첫 번째 태양에 따른 조성물은 바람직하게는 상기와 같은 외인성 폴리뉴클레오타이드를 추가로 포함한다. 상기와 같은 변형은 상기 표적-폴리뉴클레오타이드 중의 적어도 하나의 뉴클레오타이드의 삽입, 결실 또는 치환을 생성시킬 수 있으며, 여기에서 상기 삽입 또는 치환 뉴클레오타이드는 상기 외인성 폴리뉴클레오타이드로부터 기원할 수도 또는 기원하지 않을 수도 있다. 하나의 실시태양에서, 상기 외인성 폴리뉴클레오타이드는 상기 표적-폴리뉴클레오타이드와의 상동성 영역을 포함한다. 바람직하게, 이들 상동성 영역간의 상동성 정도는 상동성 재조합을 허용하는 정도이다. 바람직하게 상기 상동성 영역은 상기 상동성 영역의 전체 길이에 걸쳐 적어도 60%, 70%, 80%, 90%, 99% 또는 100% 서열 일치성을 갖는다. 상기 외인성 폴리뉴클레오타이드가 비-통합 개체인 경우 변형을 또한 수행할 수 있으며; 이 경우에 상기 표적-폴리뉴클레오타이드는 변형되지만 상기 외인성 폴리뉴클레오타이드의 뉴클레오타이드는 상기 표적-폴리뉴클레오타이드내로 도입되지 않는다. 결과적으로, 상기 생성되는 숙주는 본 발명에 따른 Cas-단백질을 단백질로서 상기 숙주 세포에 도입시킬 때 비-재조합 숙주이다. 따라서, 본 발명의 상기 태양에 따른 방법에서, 상기 숙주 세포는 재조합 숙주 세포이거나 또는 비-재조합 숙주 세포일 수 있다. 상기 외인성 폴리뉴클레오타이드는 임의의 관심 폴리뉴클레오타이드, 예를 들어 본 명세서에서 정의된 바와 같은 관심 화합물을 암호화하는 폴리뉴클레오타이드, 또는 상기와 같은 폴리뉴클레오타이드의 일부 또는 그의 변체일 수 있다.
또 다른 태양에서, 본 발명은 관심 화합물의 제조 방법을 제공하며, 상기 방법은 상기 관심 화합물에 도움이 되는 조건하에서 본 발명의 세 번째 또는 네 번째 태양에 따른 숙주 세포 또는 본 발명의 두 번째 태양에 따른 방법에 의해 수득된 숙주 세포, 또는 본 발명의 네 번째 태양에 따른 방법에 의해 수득될 수 있는 숙주 세포를 배양하고 임의로 상기 관심 화합물을 정제 또는 단리시킴을 포함한다.
본 발명의 모든 실시태양의 상황에서 관심 화합물은 임의의 생물학적 화합물일 수 있다. 상기 생물학적 화합물은 바이오매스 또는 생물중합체 또는 대사길항물질일 수 있다. 상기 생물학적 화합물은 단일 폴리뉴클레오타이드 또는 생합성 또는 대사 경로를 구성하는 일련의 폴리뉴클레오타이드에 의해 암호화되거나 또는 단일 폴리뉴클레오타이드의 생성물 또는 일련의 폴리뉴클레오타이드의 생성물의 직접적인 결과일 수 있으며, 상기 폴리뉴클레오타이드는 유전자일 수 있고, 상기 일련의 폴리뉴클레오타이드는 유전자 클러스터일 수 있다. 본 발명의 모든 실시태양에서, 상기 생물학적 관심 화합물을 암호화하는 단일 폴리뉴클레오타이드 또는 일련의 폴리뉴클레오타이드 또는 상기 생물학적 관심 화합물과 관련된 생합성 또는 대사 경로는 본 발명에 따른 조성물 및 방법에 바람직한 표적이다. 상기 생물학적 화합물은 상기 숙주 세포에 고유하거나 또는 상기 숙주 세포에 이종일 수 있다.
"이종 생물학적 화합물"이란 용어는 본 명세서에서 상기 세포에 고유하지 않은 생물학적 화합물; 또는 구조적 변형이 이루어져 상기 고유의 생물학적 화합물을 변경시킨 고유의 생물학적 화합물로서 정의된다.
"생물중합체"란 용어는 본 명세서에서 동일하거나, 유사하거나 또는 다른 서브유닛(단량체)의 쇄로서 정의된다. 상기 생물중합체는 임의의 생물중합체일 수 있다. 상기 생물중합체는 예를 들어 비제한적으로 핵산, 폴리아민, 폴리올, 폴리펩타이드(또는 폴리아미드), 또는 폴리사카라이드일 수 있다.
상기 생물중합체는 폴리펩타이드일 수 있다. 상기 폴리펩타이드는 관심 생물학적 활성을 갖는 임의의 폴리펩타이드일 수 있다. 상기 "폴리펩타이드"란 용어는 본 명세서에서 특정 길이의 암호화된 생성물을 지칭함을 의미하지 않으며, 따라서 펩타이드, 올리고펩타이드, 및 단백질을 포함한다. 폴리펩타이드란 용어는 임의의 길이의 아미노산의 중합체를 지칭한다. 상기 중합체는 선형이거나 분지될 수 있으며, 상기는 변형된 아미노산을 포함할 수 있고, 상기는 비-아미노산에 의해 중단될 수 있다. 상기 용어는 또한 변형된 아미노산 중합체를 포함한다; 예를 들어 다이설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 임의의 다른 조작, 예를 들어 표지화 성분과의 접합. 본 명세서에 사용되는 바와 같이, "아미노산"이란 용어는 천연 및/또는 비천연 또는 합성 아미노산, 예를 들어 글리신 및 D 또는 L 광학 이성질체 모두, 및 아미노산 유사체 및 펩티도유사물질을 포함한다. 폴리펩타이드는 천연 대립유전자 및 상기-언급한 폴리펩타이드의 조작된 변형 및 하이브리드 폴리펩타이드를 추가로 포함한다. 상기 폴리펩타이드는 상기 숙주 세포에 고유하거나 또는 이종일 수 있다. 상기 폴리펩타이드는 콜라겐 또는 젤라틴이거나, 또는 그의 변체 또는 하이브리드일 수 있다. 상기 폴리펩타이드는 항체 또는 그의 부분, 항원, 응고인자, 효소, 호르몬 또는 호르몬 변체, 수용체 또는 그의 부분, 조절 단백질, 구조 단백질, 리포터, 또는 수송 단배질, 분비 과정에 관련된 단백질, 폴딩 과정에 관련된 단백질, 셰프론, 펩타이드 아미노산 수송체, 글리코실화 인자, 전사 인자, 합성 펩타이드 또는 올리고펩타이드, 세포내 단백질일 수 있다. 상기 세포내 단백질은 효소, 예를 들어 프로테아제, 세라미다제, 에폭사이드 하이드롤라제, 아미노펩티다제, 아실라제, 알돌라제, 하이드록실라제, 아미노펩티다제, 리파제일 수 있다. 상기 폴리펩타이드는 또한 세포외로 분비된 효소일 수 있다. 상기와 같은 효소는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 라이아제, 아이소머라제, 리가제, 카탈라제, 셀룰라제, 키티나제, 큐티나제, 데옥시리보뉴클레아제, 덱스트라나제, 에스테라제의 그룹에 속할 수 있다. 상기 효소는 카보하이드라제, 예를 들어 셀룰라제, 예를 들어 엔도글루카나제, β-글루카나제, 셀로바이오하이드롤라제 또는 β-글루코시다제, 헤미셀룰라제 또는 펙틴분해 효소, 예를 들어 자일라나제, 자일로시다제, 만나나제, 갈락타나제, 갈락토시다제, 펙틴 메틸 에스테라제, 펙틴 라이아제, 펙테이트 라이아제, 엔도 폴리갈락튜로나제, 엑소폴리갈락튜로나제 람노갈락튜로나제, 아라바나제, 아라비노퓨라노시다제, 아라비녹실란 하이드롤라제, 갈락튜로나제, 라이아제, 또는 전분분해 효소; 하이드롤라제, 아이소머라제, 또는 리가제, 포스파타제, 예를 들어 피타제, 에스테라제, 예를 들어 리파제, 단백질분해 효소, 옥시도리덕타제, 예를 들어 옥시다제, 트랜스퍼라제, 또는 아이소머라제일 수 있다. 상기 효소는 피타제일 수 있다. 상기 효소는 아미노펩티다제, 아스파라기나제, 아밀라제, 말토제닉 아밀라제, 카보하이드라제, 카복시펩티다제, 엔도-프로테아제, 메탈로-프로테아제, 세린-프로테아제 카탈라제, 키티나제, 큐티나제, 사이클로덱스트린 글리코실트랜스퍼라제, 데옥시리보뉴클레아제, 에스테라제, 알파-갈락토시다제, 베타-갈락토시다제, 글루코아밀라제, 알파-글루코시다제, 베타-글루코시다제, 할로페록시다제, 단백질 데아미나제, 인베르타제, 라카제, 리파제, 만노시다제, 뮤타나제, 옥시다제, 펙틴분해 효소, 페록시다제, 포스포리파제, 갈락토리파제, 클로로필라제, 폴리페놀옥시다제, 리보뉴클레아제, 트랜스글루타미나제, 또는 글루코스 옥시다제, 헥소스 옥시다제, 모노옥시게나제일 수 있다.
본 발명에 따라, 관심 화합물은 WO2010/102982에 기재된 바와 같은 개선된 분비 특징을 갖는 폴리펩타이드 또는 효소일 수 있다. 본 발명에 따라, 관심 화합물은 또 다른 폴리펩타이드가 상기 폴리펩타이드 또는 그의 단편의 N-말단 또는 C-말단에 융합된, 융합된 또는 하이브리드 폴리펩타이드일 수 있다. 융합된 폴리펩타이드는 하나 이상의 폴리펩타이드를 암호화하는 핵산 서열(또는 그의 일부)을 또 다른 폴리펩타이드를 암호화하는 핵산 서열(또는 그의 일부)에 융합시킴으로써 생성된다.
융합 폴리펩타이드의 생성 기법은 당해 분야에 공지되어 있으며, 상기 폴리펩타이드를 암호화하는 암호화 서열들을 이들이 인프레임이고 상기 융합된 폴리펩타이드의 발현이 동일한 프로모터(들) 및 종결자의 조절하에 있도록 결찰시킴을 포함한다. 상기 하이브리드 폴리펩타이드는 적어도 2개의 상이한 폴리펩타이드로부터 수득된 부분적인 또는 완전한 폴리펩타이드 서열의 조합을 포함할 수 있으며, 여기에서 하나 이상은 상기 숙주 세포에 대해 이종일 수 있다. 융합 폴리펩타이드 및 신호 서열 융합의 예는 예를 들어 WO2010/121933에 기재된 바와 같다.
상기 생물중합체는 폴리사카라이드일 수 있다. 상기 폴리사카라이드는 임의의 폴리사카라이드, 예를 들어 비제한적으로 뮤코폴리사카라이드(예를 들어 헤파린 및 히아루론산) 및 질소-함유 폴리사카라이드(예를 들어 키틴)일 수 있다. 바람직한 옵션에서, 상기 폴리사카라이드는 히아루론산이다.
상기 관심 화합물을 암호화하거나 본 발명에 따른 상기 관심 화합물의 생성에 관련된 화합물을 암호화하는 폴리뉴클레오타이드는 1차 또는 2차 대사산물, 예를 들어 유기산, 카로티노이드, (베타-락탐) 항생제 및 비타민의 합성에 관련된 효소를 암호화할 수 있다. 상기와 같은 대사산물은 본 발명에 따른 생물학적 화합물로서 간주될 수 있다.
"대사산물"이란 용어는 1차 및 2차 대사산물 모두를 포함하며; 상기 대사산물은 임의의 대사산물일 수 있다. 바람직한 대사산물은 불포화된 지방 및 지질(비제한적으로 지방산 도코사헥사엔산, 도코사펜타엔산, 에루크산, 파울린산, 바크센산(시스 또는 트랜스), 에이코사펜타엔산, 에이코사테트라엔산(n-3), 아라키돈산(n-6), 옥사데카펜타엔산, 스테아리돈산, 리놀렌산(n6 또는 n3), 리놀레산, 올레산, 팔미톨레산, 옥타코사옥타엔산, 및 이들 중에 포함된 지질을 포함한다), 포화된 지방 및 지질(비제한적으로 지방산: 카프로산, 카프릴산, 카프르산, 라우르산, 미리스트산, 팔미트산, 스테아르산, 아라키드산, 베헨산, 및 이들 중에 포함된 지질을 포함한다), 황산화된 지질, 소포로지질, 락톤, 세라미드, 인지질, 지방 알콜, 지방산 에스터, 지방산 에테르, 지방산 알데하이드, 스테롤, 카로티노이드, 옥시리핀, 레솔빈, 류코트리엔, 프로스타글란딘, 유기산(비제한적으로 아세트산, 부티르산, 시트르산, 글루콘산, 아디프산, 푸마르산, 이타콘산, 말산, 메발론산 및 숙신산을 포함한다), 당 알콜 및 당산이다.
대사산물은 예를 들어 생합성 또는 대사 경로 중의 하나 이상의 유전자에 의해 암호화될 수 있다. 1차 대사산물은 세포의 1차 또는 일반적인 대사의 산물이며, 이는 에너지 대사, 성장 및 구조에 관한 것이다. 2차 대사산물은 2차 대사의 산물이다(예를 들어 문헌[R. B. Herbert, The Biosynthesis of Secondary Metabolites, Chapman and Hall, New York, 1981]을 참조하시오).
1차 대사산물은 비제한적으로 아미노산, 지방산, 뉴클레오사이드, 뉴클레오타이드, 당, 트리글리세라이드, 또는 비타민일 수 있다.
2차 대사산물은 비제한적으로 알칼로이드, 쿠마린, 플라보노이드, 폴리케타이드, 퀴닌, 스테로이드, 펩타이드 또는 터펜일 수 있다. 상기 2차 대사산물은 항생제, 섭식저해물질, 유인물질, 살균제, 살진균제, 호르몬, 살충제, 또는 살서제일 수 있다.
상기 생물학적 화합물은 또한 선택성 마커의 생성물일 수 있다. 선택성 마커는 생성물이 살생물제 또는 바이러스 내성, 중금속 내성, 영양요구체에 대한 원영양요구 등을 제공하는 관심 폴리뉴클레오타이드의 생성물이다. 선택성 마커는 비제한적으로 nptII(네오마이신 포스포트랜스퍼라제 II), ALS(아세토락테이트 신타제), bsd(블라스티시딘-S-데아미나제), 및 Sh ble(플레오마이신 결합)뿐만 아니라 이들의 균등물을 포함한다.
본 발명에 따라, 관심 화합물은 바람직하게는 관심 화합물 목록에 기재된 바와 같은 폴리펩타이드이다.
본 발명의 또 다른 실시태양에 따라, 관심 화합물은 바람직하게는 대사산물이다.
본 발명에 따른 숙주 세포는 이미 상기 관심 화합물을 생성할 수 있다. 상기 숙주 세포에는 또한 폴리펩타이드를 암호화하는 동종 또는 이종 핵산 구조물이 제공될 수 있으며, 여기에서 상기 폴리펩타이드는 상기 관심 화합물 또는 상기 관심 화합물의 생성에 관련된 폴리펩타이드일 수 있다. 당해 분야의 숙련가는 상기 관심 화합물을 생성할 수 있도록 조류 숙주 세포를 어떻게 변형시키는 지를 알고 있다.
일반적인 정의
본 명세서 및 첨부된 특허청구범위 전체를 통해서, "포함하다", "함유하다" 및 "갖는"이란 단어 및 "포함하다", "포함하는", "함유하다" 및 "함유하는"과 같은 변형들은 포괄적으로 해석되어야 한다. 즉, 이들 단어는 문맥상 허용되는 경우 구체적으로 명시되지 않은 다른 요소들 또는 정수들의 가능한 포함을 전달하고자 한다.
"하나의"란 용어는 본 명세서에서 상기 관사의 문법적 목적어 중 하나 또는 하나 초과(즉 하나 또는 적어도 하나)를 지칭한다. 예로서, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미할 수 있다.
"약" 또는 "대략적으로"란 단어는 수치와 함께 사용될 때(예를 들어 약 10) 바람직하게는 상기 값이 상기 주어진 값(10)의 1% 초과 또는 미만의 값일 수 있음을 의미한다.
달리 정의되지 않는 한, 본 명세서에 사용된 모든 과학기술 용어들은 본 명세가 속하는 분야의 통상적인 숙련가에게 통상적으로 이해되는 바와 동일한 의미를 갖는다.
바람직한 뉴클레오타이드 유사체 또는 균등물은 변형된 주쇄를 포함한다. 상기와 같은 주쇄의 예는 모폴리노 주쇄, 카바메이트 주쇄, 실록산 주쇄, 설파이드, 설폭사이드 및 설폰 주쇄, 포름아세틸 및 티오포름아세틸 주쇄, 메틸렌포름아세틸 주쇄, 리보아세틸 주쇄, 알켄 함유 주쇄, 설파메이트, 설포네이트 및 설폰아미드 주쇄, 메틸렌이미노 및 메틸렌하이드라지노 주쇄, 및 아미드 주쇄에 의해 제공된다. 주쇄 중의 잔기간의 결합은 인 원자를 포함하지 않는 것, 예를 들어 단쇄 알킬 또는 사이클로알킬 뉴클레오사이드간 결합, 혼합된 이종원자 및 알킬 또는 사이클로알킬 뉴클레오사이드간 결합, 또는 하나 이상의 단쇄 이종원자 또는 헤테로사이클릭 뉴클레오사이드간 결합에 의해 형성되는 것이 더욱 바람직하다.
바람직한 뉴클레오타이드 유사체 또는 균등물은 변형된 폴리아미드 주쇄(문헌[Nielsen, et al. (1991) Science 254, 1497-1500]를 갖는 펩타이드 핵산(PNA)을 포함한다. PNA-계 분자는 염기쌍 인식에 관하여 DNA 분자의 진정한 유사물질이다. 상기 PNA의 주쇄는 펩타이드 결합에 의해 연결된 N-(2-아미노에틸)-글리신 단위로 구성되며, 여기에서 상기 핵염기는 메틸렌 카보닐 결합에 의해 주쇄에 연결된다. 또 다른 주쇄는 1-탄소 연장된 피롤리딘 PNA 단량체를 포함한다(문헌[Govindaraju and Kumar (2005) Chem. Commun, 495-497]). PNA 분자의 주쇄는 하전된 포스페이트기를 함유하지 않으므로, PNA-RNA 하이브리드가 각각 RNA-RNA 또는 RNA-DNA 하이브리드보다 대개는 더 안정하다(문헌[Egholm et al. (1993) Nature 365, 566-568]).
더욱 바람직한 주쇄는 모폴리노 뉴클레오타이드 유사체 또는 균등물을 포함하며, 여기에서 리보스 또는 데옥시리보스 당이 6-원 모폴리노 고리에 의해 교체된다. 가장 바람직한 뉴클레오타이드 유사체 또는 균등물은 포스포로다이아미데이트 모폴리노 올리고머(PMO)를 포함하며, 여기에서 상기 리보스 또는 데옥시리보스 당은 6-원 모폴리노 고리에 의해 교체되고, 인접한 모폴리노 고리들간의 음이온성 포스포다이에스터 결합은 비-이온성 포스포로다이아미데이트 결합에 의해 교체된다.
추가의 바람직한 뉴클레오타이드 유사체 또는 균등물은 상기 포스포다이에스터 결합 중의 비-가교 산소 중 적어도 하나의 치환을 포함한다. 상기 변형은 염기-짝짓기를 약간 탈안정화시키지만 뉴클레아제 분해에 상당한 내성을 가한다. 바람직한 뉴클레오타이드 유사체 또는 균등물은 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로다이티오에이트, 포스포트라이에스터, 아미노알킬포스포트라이에스터, H-포스포네이트, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트 및 키랄 포스포네이트를 포함한 메틸 및 다른 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포아미데이트 및 아미노알킬포스포아미데이트를 포함한 포스포아미데이트, 티오노포스포아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트라이에스터, 셀레노포스페이트 또는 보라노포스페이트를 포함한다.
더욱 바람직한 뉴클레오타이드 유사체 또는 균등물은 2', 3' 및/또는 5' 위치에서 일- 또는 이치환된 하나 이상의 당 부분, 예를 들어 -OH; -F; 하나 이상의 헤테로원자에 의해 중단될 수 있는, 치환되거나 비치환된, 선형 또는 분지된 저급(C1-C10) 알킬, 알케닐, 알키닐, 알크아릴, 알릴, 아릴, 또는 아르알킬; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; O-, S-, 또는 N-알릴; O-알킬-O-알킬, -메톡시, -아미노프로폭시; 아미노옥시, 메톡시에톡시; -다이메틸아미노옥시에톡시; 및 -다이메틸아미노에톡시에톡시를 포함한다. 상기 당 부분은 피라노스 또는 그의 유도체, 또는 데옥시피라노스 또는 그의 유도체, 바람직하게는 리보스 또는 그의 유도체, 또는 데옥시리보스 또는 그의 유도체일 수 있다. 상기와 같은 바람직한 유도체화된 당 부분은 잠김 핵산(LNA)(여기에서 2'-탄소 원자는 당 고리의 3' 또는 4' 탄소 원저에 결합되어 바이사이클릭 당 부분을 형성한다)을 포함한다. 바람직한 LNA는 2'-O,4'-C-에틸렌-가교된 핵산을 포함한다(문헌[Morita et al. 2001. Nucleic Acid Res Supplement No. 1: 241-242]). 이들 치환은 상기 뉴클레오타이드 유사체 또는 균등물을 RNase H 및 뉴클레아제 내성으로 만들고 표적에 대한 친화성을 증가시킨다.
본 발명의 상황에서 아미노산- 또는 핵산-서열의 "서열 일치성" 또는 "일치성"은 본 명세서에서 서열들간의 비교에 의해 측정된 바와 같은, 2개 이상의 아미노산(펩타이드, 폴리펩타이드, 또는 단백질) 서열 또는 2개 이상의 핵산(뉴클레오타이드, 올리고뉴클레오타이드, 폴리뉴클레오타이드) 서열간의 관계로서 정의된다. 당해 분야에서, "일치성"은 또한 경우에 따라, 서열들의 스트링간의 합치에 의해 측정된 바와 같은, 아미노산 또는 뉴클레오타이드 서열들간의 서열 관련성 정도를 의미한다. 본 발명 내에서, 특정 서열과의 서열 일치성은 바람직하게는 상기 특정 폴리펩타이드 또는 폴리뉴클레오타이드 서열의 전체 길이에 걸친 서열 일치성을 의미한다.
2개의 아미노산 서열간의 "유사성"은 하나의 펩타이드 또는 폴리펩타이드의 아미노산 서열 및 그의 보존된 아미노산 치환체를 제2 펩타이드 또는 폴리펩타이드의 서열에 비교함으로써 측정된다. 바람직한 실시태양에서, 일치성 또는 유사성은 본 명세서에서 확인된 바와 같은 전체 서열(서열번호)에 걸쳐 산정된다. "일치성" 및 "유사성"은 공지된 방법, 예를 들어 비제한적으로 문헌[Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988]; 문헌[Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993]; 문헌[Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994]; 문헌[Sequence Analysis in Molecular Biology, von Heine, G., Academic Press, 1987]; 및 문헌[Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991]; 및 문헌[Carillo, H., and Lipman, D., SIAM J. Applied Math., 48:1073 (1988)]에 기재된 것들에 의해 쉽게 산정될 수 있다.
일치성을 측정하기에 바람직한 방법은 시험된 서열들간의 최대의 합치를 제공하도록 설계된다. 일치성 및 유사성을 측정하기 위한 방법은 공개적으로 입수할 수 있는 컴퓨터 프로그램에 체계적으로 정리되어 있다. 2개 서열간의 일치성 및 유사성을 측정하기에 바람직한 컴퓨터 프로그램 방법은 예를 들어 GCG 프로그램 패키지(문헌[Devereux, J., et al., Nucleic Acids Research 12 (1): 387 (1984)]), BestFit, BLASTP, BLASTN, 및 FASTA(문헌[Altschul, S. F. et al., J. Mol. Biol. 215:403-410 (1990)])를 포함한다. 상기 BLAST X 프로그램은 NCBI 및 다른 소스로부터 공개적으로 입수할 수 있다(문헌[BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894]; 문헌[Altschul, S., et al., J. Mol. Biol. 215:403-410 (1990)]). 주지된 스미스 워터맨(Smith Waterman) 알고리즘을 또한 일치성 측정에 사용할 수 있다.
폴리펩타이드 서열 비교에 바람직한 매개변수는 하기와 같다: 알고리즘: 니들맨 앤드 분취(Needleman and Wunsch)(문헌[J. Mol. Biol. 48:443-453 (1970)]); 비교 행렬: BLOSSUM62(문헌[Hentikoff and Hentikoff, Proc. Natl. Acad. Sci. USA. 89:10915-10919 (1992)]); 끊김 벌점: 12; 및 끊김 길이 벌점: 4. 이들 매개변수에 유용한 프로그램을 미국 위스콘신주 매디슨에 위치한 제네틱스 컴퓨터 그룹(Genetics Computer Group)으로부터 "Ogap" 프로그램으로서 공개적으로 입수할 수 있다. 상기 언급한 매개변수는 아미노산 비교를 위한 디폴트 매개변수(단부 끊김에 대한 벌점 없음과 함께)이다.
핵산 비교에 바람직한 매개변수는 하기와 같다: 알고리즘: 니들맨 앤드 분취(문헌[J. Mol. Biol. 48:443-453 (1970)]); 비교 행렬: 합치 = +10, 오합치 = 0; 끊김 벌점: 50; 끊김 길이 벌점: 3. 미국 위스콘신주 매디슨에 위치한 제네틱스 컴퓨터 그룹으로부터 끊김 프로그램으로서 입수할 수 있다. 핵산 비교용 디폴트 매개변수는 상기에 제공되어 있다.
임의로, 아미노산 유사성 정도의 측정에서, 숙련가는 또한 상기 숙련가에게 명백한 바와 같이, 소위 "보존적" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기들의 호환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 그룹은 글리신, 알라닌, 발린, 류신 및 아이소류신이고; 지방족-하이드록실 측쇄를 갖는 아미노산의 그룹은 세린 및 쓰레오닌이며; 아미드-함유 측쇄를 갖는 아미노산의 그룹은 아스파라진 및 글루타민이고; 방향족 측쇄를 갖는 아미노산의 그룹은 페닐알라닌, 타이로신 및 트립토판이며; 염기성 측쇄를 갖는 아미노산의 그룹은 리신, 아르기닌 및 히스티딘이고; 황-함유 측쇄를 갖는 아미노산의 그룹은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환기는 발린-류신-아이소류신, 페닐알라닌-타이로신, 리신-아르기닌, 알라닌-발린, 및 아스파라진-글루타민이다. 본 명세서에 개시된 아미노산 서열의 치환적 변체는 상기 개시된 서열 중 적어도 하나의 잔기가 제거되었고 상이한 잔기가 대신에 삽입된 것들이다. 바람직하게, 상기 아미노산 변화는 보존적이다. 각각의 천연 아미노산에 대한 바람직한 보존적 치환은 하기와 같다: Ala에서 ser로; Arg에서 lys로; Asn에서 gln 또는 his로; Asp에서 glu로; Cys에서 ser 또는 ala로; Gln에서 asn로; Glu에서 asp로; Gly에서 pro로; His에서 asn 또는 gln로; Ile에서 leu 또는 val로; Leu에서 ile 또는 val로; Lys에서 arg로; gln 또는 glu로; Met에서 leu 또는 ile로; Phe에서 met, leu 또는 tyr로; Ser에서 thr로; Thr에서 ser로; Trp에서 tyr로; Tyr에서 trp 또는 phe로; 및 Val에서 ile 또는 leu로.
본 발명에 따른 폴리뉴클레오타이드를 뉴클레오타이드 서열에 의해 나타낸다. 본 발명에 따른 폴리펩타이드를 아미노산 서열에 의해 나타낸다. 본 발명에 따른 핵산 구조물은 천연 유전자로부터 단리되거나 또는 달리 자연에는 존재하지 않는 방식으로 결합되거나 병치된 폴리뉴클레오타이드의 분절을 함유하도록 변형된 폴리뉴클레오타이드로서 정의된다. 임의로, 본 발명에 따른 핵산 구조물 중에 존재하는 폴리뉴클레오타이드는 하나 이상의 조절 서열에 작동적으로 연결되며, 상기 서열은 숙주 세포 또는 무세포 시스템에서 암호화된 생성물의 생성 또는 발현을 지시한다.
본 명세서에 제공된 바와 같은 서열 정보는 잘못 식별된 염기의 포함을 요하는 것으로 좁게 이해되어서는 안 된다. 숙련가는 상기와 같은 잘못 식별된 염기를 식별할 수 있으며 상기와 같은 오류를 어떻게 보정하는 지를 알고 있다.
본 발명의 모든 실시태양, 즉 본 발명에 따른 조성물, 발현의 조절 방법, 본 발명에 따른 조성물을 포함하는 숙주 세포, 본 발명에 따른 숙주 세포의 생성 방법, 본 발명에 따른 숙주 세포, 및 본 발명에 따른 관심 화합물의 생성 방법은 바람직하게는 무세포 시험관내 시스템이 아닌 숙주 세포를 참조한다; 즉, 본 발명에 따른 CRISPR-Cas 시스템은 바람직하게는 무세포 시험관내 시스템이 아닌 숙주 세포 시스템이다.
본 발명의 모든 실시태양, 예를 들어 본 발명에 따른 조성물, 발현의 조절 방법, 본 발명에 따른 조성물을 포함하는 숙주 세포, 본 발명에 따른 숙주 세포의 생성 방법, 본 발명에 따른 숙주 세포, 및 본 발명에 따른 관심 화합물의 생성 방법에서, 상기 숙주 세포는 반수체, 이배체 또는 배수체 숙주 세포일 수 있다.
본 발명에 따른 숙주 세포는 라비린툴로마이세테스 숙주 세포, 바람직하게는 트라우스토키트리알레스 목, 보다 바람직하게는 트라우스토키트리아세아에 과, 보다 바람직하게는 아우란티오키트리움, 오블롱기키트리움, 스키조키트리움, 트라우스토키트리움 및 울케니아로 이루어지는 그룹 중에서 선택되는 속의 일원, 훨씬 더 바람직하게는 스키조키트리움 종 ATCC# 20888이다.
바람직하게는 게놈 중 변형은 본 명세서에서 하나 이상의 변형으로서 이해된다. 바람직하게는 본 발명에 따른 숙주 세포의 게놈 중 변형은
a) 모 숙주 세포에 재조합 유전자 조작 기법을 가하고/가하거나
b) 모 숙주 세포에 (고전적인) 돌연변이유발을 가하고/가하거나;
c) 모 숙주 세포에 억제 화합물 또는 조성물을 가함
으로써 수행될 수 있다.
숙주 세포의 게놈의 변형은 본 명세서에서 상기 숙주 세포의 게놈 중 폴리뉴클레오타이드 서열의 변화를 생성시키는 임의의 사건으로서 정의된다.
바람직하게, 본 발명에 따른 숙주 세포는 바람직하게는, 동일한 조건하에서 분석시, 변형되지 않은 모 숙주 세포와 비교하는 경우 본 명세서에서 정의된 바와 같은 불필요한 화합물을 생성시키지 않거나 감소시키는 그의 게놈 중의 변형을 갖는다.
변형을 당해 분야의 숙련가에게 공지된 임의의 수단에 의해, 예를 들어 고전적인 균주 개선, 무작위 돌연변이유발에 이은 선택에 의해 도입시킬 수 있다. 변형을 또한 부위-지향된 돌연변이유발에 의해 도입시킬 수 있다.
변형을 폴리뉴클레오타이드 서열 중 하나 이상의 뉴클레오타이드의 도입(삽입), 치환(교체), 또는 제거(결실)에 의해 수행할 수 있다. 폴리펩타이드와 같은 불필요한 화합물을 암호화하는 폴리뉴클레오타이드의 전체 또는 부분 결실을 성취할 수 있다. 불필요한 화합물은 본 명세서에서 달리 어딘가에 나열된 임의의 불필요한 화합물일 수 있으며; 상기는 또한 대사산물과 같은 불필요한 화합물의 생물학적 합성 경로에서 단백질 및/또는 효소일 수 있다. 한편으로, 상기 불필요한 화합물을 암호화하는 폴리뉴클레오타이드를, 상기 불필요한 화합물을 암호화하지 않거나 또는 상기 불필요한 화합물의 부분적으로 또는 완전히 불활성인 형태를 암호화하는 폴리뉴클레오타이드 서열로 부분적으로 또는 완전히 교체할 수 있다. 또 다른 대안에서, 하나 이상의 뉴클레오타이드를 상기 불필요한 화합물을 암호화하는 폴리뉴클레오타이드내에 삽입시켜 상기 폴리뉴클레오타이드의 붕괴 및 결과적으로 상기 붕괴된 폴리뉴클레오타이드에 의해 암호화된 상기 불필요한 화합물의 부분적인 또는 완전한 불활성화를 생성시킬 수 있다.
하나의 실시태양에서, 본 발명에 따른 돌연변이 미생물 숙주 세포는
a) 불필요한 화합물을 암호화하는 폴리뉴클레오타이드의 완전한 또는 부분적인 결실,
b) 불필요한 화합물을 암호화하지 않거나 또는 상기 불필요한 화합물의 부분적으로 또는 완전히 불활성인 형태를 암호화하는 폴리뉴클레오타이드 서열에 의한, 상기 불필요한 화합물을 암호화하는 폴리뉴클레오타이드의 완전한 또는 부분적인 교체,
c) 불필요한 화합물을 암호화하는 폴리뉴클레오타이드 서열 중 하나 이상의 뉴클레오타이드의 삽입에 의한 상기 폴리뉴클레오타이드의 붕괴 및 결과적인 상기 붕괴된 폴리뉴클레오타이드에 의한 상기 불필요한 화합물의 부분적인 또는 완전한 불활성화
중에서 선택된 그의 게놈 중의 변형을 포함한다.
상기 변형은 예를 들어 상기 불필요한 화합물의 전사 또는 번역에 필요한 암호화 서열 또는 조절 요소 중에 있을 수 있다. 예를 들어, 뉴클레오타이드를 정지 코돈의 도입, 개시 코돈의 제거 또는 암호화 서열의 개방 판독 프레임의 변화 또는 프레임-이동을 생성시키기 위해 삽입하거나 제거할 수 있다. 상기 암호화 서열 또는 그의 조절 요소의 변형을 부위-지향된 또는 무작위 돌연변이유발, DNA 셔플링 방법, DNA 조립 방법, 유전자 합성(예를 들어 문헌[Young and Dong (2004), Nucleic Acids Research 32(7) electronic access at nar.oupjournals.org/cgi/reprint/32/7/e59 or Gupta et al. (1968), Proc. Natl. Acad. Sci USA, 60: 1338-1344]; 문헌[Scarpulla et al. (1982), Anal. Biochem. 121: 356-365; Stemmer et al. (1995), Gene 164: 49-53]을 참조하시오), 또는 당해 분야에 공지된 방법에 따른 PCR 생성된 돌연변이유발에 의해 수행할 수 있다. 무작위 돌연변이유발 과정의 예는 당해 분야에 주지되어 있다, 예를 들어 화학적(예를 들어 NTG) 돌연변이유발 또는 물리적(예를 들어 UV) 돌연변이유발. 부위-지향된 돌연변이유발 과정의 예는 퀵체인지(QuickChange)(상표) 부위-지향된 돌연변이유발 키트(스트라타진 클로닝 시스템(Stratagene Cloning Systems), 미국 캘리포니아주 라졸라 소재), 디 얼터드 사이츠('The Altered Sites)(등록상표) II 시험관내 돌연변이유발 시스템스(프로메가 코포레이션(Promega Corporation)) 또는 문헌[Ho et al., "Site-directed mutagenesis by overlap extension using the polymerase chain reaction", Gene, 1989 Apr 15, 77(1):51-9]에 기재된 바와 같은 PCR을 사용하거나 또는 문헌[Molecular Biology: Current Innovations and Future Trends., Eds. A.M. Griffin and H.G. Griffin. ISBN 1-898486-01-8; 1995 Horizon Scientific Press, PO Box 1, Wymondham, Norfolk, U.K.]에 기재된 바와 같은 PCR을 사용하는 오버랩 연장에 의한 것이다.
바람직한 변형 방법은 재조합 유전자 조작 기법, 예를 들어 부분 또는 완전한 유전자 교체 또는 부분 또는 완전한 유전자 결실을 기반으로 한다.
예를 들어, 폴리뉴클레오타이드, 핵산 구조물 또는 발현 카세트의 교체의 경우에, 적합한 DNA 서열을 교체하려는 표적 유전자좌에 도입시킬 수 있다. 적합한 DNA 서열은 바람직하게는 클로닝 벡터상에 존재한다. 바람직한 통합적인 클로닝 벡터는 DNA 단편을 포함하며, 상기 단편은 폴리뉴클레오타이드에 상동성이고/이거나, 소정의 유전자좌에의 클로닝 벡터의 통합을 표적화하기 위해 교체시키고자 하는 유전자좌에 측면 인접한 폴리뉴클레오타이드에 상동성을 갖는다. 표적화된 통합을 촉진하기 위해서, 상기 클로닝 벡터를 바람직하게는 세포의 형질전환에 앞서 선형화시킨다. 바람직하게, 선형화를 상기 클로닝 벡터의 적어도 하나, 바람직하게는 어느 한 단부가, 교체시키려는 DNA 서열(또는 측면에 인접한 서열)에 상동성인 서열에 측면 인접하도록 수행한다. 상기 과정을 상동성 재조합이라 칭하며 상기 기법을 또한 (부분적인) 유전자 결실을 성취하기 위해 사용할 수 있다.
예를 들어, 내인성 폴리뉴클레오타이드에 상응하는 폴리뉴클레오타이드를 결함성 폴리뉴클레오타이드, 즉 (완전히 기능성인) 폴리펩타이드를 생성시키지 못하는 폴리뉴클레오타이드에 의해 교체시킬 수 있다. 상동성 재조합에 의해, 상기 결함성 폴리뉴클레오타이드는 상기 내인성 폴리뉴클레오타이드를 대체한다. 상기 결함성 폴리뉴클레오타이드는 또한 마커를 암호화하는 것이 바람직할 수 있으며, 상기 마커는 핵산 서열이 변형된 형질전환체의 선택에 사용될 수 있다.
불필요한 화합물을 생성시키지 않거나 상기 화합물의 생성을 감소시키는 변형을, 상이한 방법에 의해, 예를 들어 상기와 같은 불필요한 화합물에 대한 항체 또는 화학적 억제제 또는 단백질 억제제 또는 물리적 억제제에 의해 획득할 수 있다(문헌[Tour O. et al., "Genetically targeted chromophore-assisted light inactivation", (2003) Nat. Biotech]). 한편으로, 또는 상기 언급한 기법과 함께, 불필요한 화합물의 감소된 생성 또는 생성되지 않음을 또한 예를 들어 UV 또는 화학적 돌연변이유발(문헌[Lian et al., "Increase of docosahexaenoic acid production by Schizochytrium sp. through mutagenesis and enzyme assay" (2010) Appl Biochem Biotechnol 162(4):935-941])에 의해 또는 본 명세서에 기재된 바와 같은 불필요한 폴리펩타이드의 효소 활성을 억제하는 억제제의 사용(예를 들어 β-글루코시다제의 억제제로서 기능하는 노지리마이신(문헌[Ren et al., "Effect of biotin and cerulenin addition on DHA production by Schizochytrium sp." (2012-01) Chinese J Bioprocess Engineering])에 의해 획득할 수 있다.
본 발명의 하나의 실시태양에서, 본 발명에 따른 숙주 세포의 게놈 중 변형은 불필요한 화합물을 암호화하는 폴리뉴클레오타이드의 적어도 하나의 위치에서의 변형이다.
화합물, 예를 들어 불필요한 화합물, 예를 들어 불필요한 폴리펩타이드 및/또는 효소의 생성에서 세포의 결함은 본 명세서에서, 바람직하게는 게놈 중에서, 동일한 조건하에서 분석시 상기 세포가 변형되지 않은 모 숙주 세포에 비해, a) 상기 불필요한 화합물을 덜 생성시키거나 상기 불필요한 화합물을 실질적으로 생성시키지 않고/않거나 b) 감소된 활성 또는 감소된 비활성을 갖는 상기 불필요한 화합물, 또는 활성을 갖지 않거나 비활성을 갖지 않는 불필요한 화합물, 및 상기 가능성들 중 하나 이상의 조합을 생성시키는 표현형 특징을 생성시키도록 변형된 돌연변이 미생물 숙주 세포로서 정의된다.
바람직하게, 본 발명에 따른 변형된 숙주 세포는, 변형되지 않았고 동일한 조건하에서 측정된 모 숙주 세포에 비해 1% 미만의 상기 불필요한 화합물, 적어도 5% 미만의 상기 불필요한 화합물, 적어도 10% 미만의 상기 불필요한 화합물, 적어도 20% 미만의 상기 불필요한 화합물, 적어도 30% 미만의 상기 불필요한 화합물, 적어도 40% 미만의 상기 불필요한 화합물, 적어도 50% 미만의 상기 불필요한 화합물, 적어도 60% 미만의 상기 불필요한 화합물, 적어도 70% 미만의 상기 불필요한 화합물, 적어도 80% 미만의 상기 불필요한 화합물, 적어도 90% 미만의 상기 불필요한 화합물, 적어도 91% 미만의 상기 불필요한 화합물, 적어도 92% 미만의 상기 불필요한 화합물, 적어도 93% 미만의 상기 불필요한 화합물, 적어도 94% 미만의 상기 불필요한 화합물, 적어도 95% 미만의 상기 불필요한 화합물, 적어도 96% 미만의 상기 불필요한 화합물, 적어도 97% 미만의 상기 불필요한 화합물, 적어도 98% 미만의 상기 불필요한 화합물, 적어도 99% 미만의 상기 불필요한 화합물, 적어도 99.9% 미만의 상기 불필요한 화합물, 또는 가장 바람직하게는 100% 미만의 상기 불필요한 화합물을 생성시킨다.
본 명세서에 제공된 바와 같은 서열 정보는 잘못 식별된 염기의 포함을 요하는 것으로 좁게 이해되어서는 안 된다. 숙련가는 상기와 같은 잘못 식별된 염기를 식별할 수 있으며 상기와 같은 오류를 어떻게 보정하는 지를 알고 있다.
본 명세서에 제시된 각각의 참고문헌의 개시는 내용 전체가 본 명세서에 참고로 인용된다.
본 발명을 하기의 실시예들에 의해 추가로 예시한다:
실시예
실시예 1
형질전환을 위한 Cas9 벡터의 설계 및 형성
스트렙토코커스 피오게네스 MGAS5005 Cas9 서열을 스키조키트리움에서 발현을 위해 코돈-최적화하였다. 사용된 기본 Cas9 펩타이드 서열은 기재된 HA-태그 또는 GFP 융합 없이, 문헌[Jinek et al., 2013]에 사용된 바와 근본적으로 동일하였다(하기를 참조하시오). 상기 Cas9를 합성한 후에(DNA2.0, 미국 캘리포니아주 뉴워크 소재), 상기를 파로모마이신 선택 카세트를 함유하는 pCL122 벡터내로 클로닝하여 pCL122-Cas9(서열번호 )로 표기되는 벡터를 생성시켰다. OrfA/Pfa1 측면을 합성하고 pCL121(제오신 선택 카세트를 가졌다)내에 클로닝하고(젠스크립트(Genscript) USA, 미국 뉴저지주 피스카타웨이 소재) 최종 벡터를 pYB31(서열번호 2)로 표기하였다; 예를 들어 미국특허 제 8,940,884 호를 참조하시오. 상기 Cas9 유전자를, BamHI 및 NdeI 제한 부위 및 효소(뉴잉글랜드 바이오랩스(New England Biolabs), 미국 매사추세츠주 입스위치 소재)(도 3) 및 래피드 DNA 라이게이션(Rapid DNA Ligation) 키트(롯슈(Roche), 스위스 리치-로트크로이츠 소재)를 사용하여 절단 및 결찰을 통해 pCL122-Cas9 벡터로부터 pYB31 벡터내로 서브클로닝하였다. NEB10β 화학적 수용성 세포를 형질전환시키고(뉴잉글랜드 바이오랩스) 생성 콜로니를, 프라이머 121 Tub seq F(서열번호 13) 및 pYB32/3C R1(서열번호 14)(표 2) 및 5% DMSO(v:v)와 함께 선택된 콜로니, GoTaq 그린 마스터 믹스(프로메가(Promega), 미국 일리노이주 시카고 소재)를 사용하여 콜로니 PCR에 의해 선별하였으며 하기의 순환 조건을 상기 반응에 적용하였다: 95 ℃ 5분, (95 ℃ 30초, 59 ℃ 30초, 72 ℃ 1분) x 35주기, 72 ℃ 5분(도 4). 플라스미드를 PCR에 의해 양성 콜로니로부터 단리하고, 서열분석하고, 하나의 생성 벡터를 pYB32(서열번호 3)로 표기하였다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5′→ 3′ |
121 Tub seq F | 13 | GGATCTCATGCTGGAGTTCTTC |
pYB32/3C R1 | 14 | GTACTTCTCGTGGTAGGCAACC |
앞서 언급한 바와 같이, 다른 연구들은 Cas9 발현의 수준이 형질전환체 생육성 및 뉴클레아제 활성의 최적화에 중요함을 지적하였다. 상기 pYB32 플라스미드에서, 상기 Cas9 유전자는 중간 강도 프로모터인 알파 튜불린 프로모터의 조절하에 있다. 카로틴 신타제(CS) 유전자로부터의 약한 프로모터를 또한 시험하고자 선택하였으며 인퓨전(InFusion) PCR 클로닝(클론테크/타카라 바이오 USA 인코포레이티드(Clontech/Takara Bio USA Inc.), 미국 캘리포니아주 마운틴뷰 소재)을 통해 pYB31내로 클로닝하였다. pYB31 플라스미드를 인퓨전 클로닝을 위한 준비에서 KpnI 및 NdeI 효소(뉴잉글랜드 바이오랩스)로 절단하였다. CS 프로모터를, 5% DMSO(v:v), KOD 핫스타트 마스터 믹스(HotStart Master Mix)(EMD 밀리포어(Millipore), 미국 매사추세츠주 빌레리카 소재) 및 주형으로서 사용된, CS 프로모터를 갖는 플라스미드 pTH043과 함께, CS 프로 KpnI IF F1(서열번호 15) 및 CS 프로 BamHI IF R1 프라이머(서열번호 16)(표 3)로 증폭시켰다. 반응 순환 조건은 하기와 같았다: 95 ℃ 2분, (95 ℃ 20초, 66 ℃ 10초, 70 ℃ 20초) x 35주기, 70 ℃ 2분. Cas9를, 5% DMSO(v:v), KOD 핫스타트 마스터 믹스, 및 주형으로서 사용된 pCL122-Cas9와 함께, CS 프로 BamHI IF F2(서열번호 17) 및 CS 프로 NdeI IF R2(서열번호 18) 프라이머(표 3)로 증폭시켰다. 반응 순환 조건은 하기와 같았다: 95 ℃ 2분, (95 ℃ 20초, 65 ℃ 10초, 70 ℃ 1분 45초) x 35주기, 70 ℃ 2분.
프라이머 명칭 | 서열 번호 | 프라이머 서열, 5′→ 3′ |
CS pro Kpn IF F1 | 15 | GTCTGAATTCCCGGGGTACCGAGCGGGCGATTCCACCGTC |
CS pro BamH IF R1 | 16 | GTACTTCTTATCCATGGATCCCTCGGTCTCCGAGCGAGCGAG |
CS pro BamH IF F2 | 17 | TCGCTCGCTCGGAGACCGAGGGATCCATGGATAAGAAGTAC |
CS pro Nde IF R2 | 18 | GATTCACTAGTTTAGATCATATGTTAGACCTTGCGCTTCTTCTTAGGGTCC |
PCR 산물을 1% 아가로스 젤(론자(Lonza), 스위스 바젤 소재)상에서 실행시키고, 예상된 크기의 밴드를 절제하고 QIAquick 젤 추출 키트(퀴아겐(Qiagen), 독일 힐덴 소재)를 사용하여 젤 정제하였다(도 3). 인퓨전 클로닝에 대한 제조사의 프로토콜에 따라, 상기 Cas9 PCR 단편, CS 프로모터 PCR 단편 및 선형화된 pYB31 단편을 결찰하고, NEB10β 화학적 수용성 세포를 형질전환시키고, 생성 콜로니를 상술한 바와 같은 콜로니 PCR에 의해 선별하였다(도 4)(72 ℃에서 1분 30초 연장 시간으로). 서열 확인 후에, 상기 CS 프로모터에 작동적으로 연결된 Cas9를 함유하는 생성 벡터들 중 하나를 pYB33(서열번호 4)으로 표기하였다.
pYB32 및 pYB33의 클로닝을 절단, 결찰 및 인퓨전 PCR 클로닝의 조합을 통해 수행하였다. 도 3에 도시된 바와 같이, 단편들이 모두 생성되었으며 컬럼 정제후 예상된 크기의 밴드를 가졌다. 절단된 플라스미드 및 PCR 증폭된 단편을 1% 아가로스 젤상에서 실행시켰다. 모든 레인에서 하기와 같이 예상된 크기의 단편들이 관찰되었다: pYB31-BamHI+NdeI=838 bp + 6555 bp, pYB31-KpnI+NdeI=1289bp + 6104bp, Cas9-BamHI+NdeI=4157bp + 5773bp, CS PCR 단편=1046 bp, Cas9 PCR 단편=4189 bp. 상기 젤 및 모든 후속 젤들에 사용된 분자량 마커는 DNA 콴티-래더(Quanti-Ladder)(오리진(Origene), 미국 메릴랜드주 록빌 소재)였으며, 단편 크기를 도 3의 우측 패널에 나타낸다.
pYB32 및 pYB33 세균 형질전환으로부터 생성되는 콜로니를 콜로니 PCR에 의해 분석하였으며, 예상된 크기의 증폭산물을 갖는 콜로니들을 도 4에 굵은 글씨로 표시한다. 이들 콜로니는 pYB32-2, -4, -9, -14, -15, -24, -25, -28, 및 pYB33-16 및 pYB33D-1, -14이다. pYB32-2 및 pYB33-16이 정확한 서열을 갖는 것으로 확인된 것들 중에 있었으며 이들을 후속 연구에 사용하였다. pYB32 및 pYB33의 클로닝으로부터의 콜로니 PCR 결과들에 대해서, 예상된 증폭산물 크기는 하기와 같다: pYB32=1028 bp, pYB33=1584bp.
실시예 2
Cas9 형질전환체의 형질전환 및 선택
스키조키트리움 종의 야생형 균주, ATCC 20888을 하기에 기재하는 바와 같은 입자 충격 방법 및 유전자총 장비(바이오래드(Bio-Rad), 미국 노쓰캐롤라이나주 롤리 소재)를 사용하여 pYB32 및 pYB33에 의한 형질전환에 사용하였다. 간단히, 20888을 27 ℃에서 250 ㎖ 편평-바닥 삼각 플라스크 중의 25 ㎖의 M50-20 배지(예를 들어 미국특허 제 8,003,772 호를 참조하시오)에서, 200 rpm에서 밤새 진탕시키면서 증식시켰다. 상기에 이어서, 상기 배양물을 250 ㎖ 진탕형 플라스크 중의 50 ㎖의 M2B 배지(예를 들어 미국특허 제 8,003,772 호를 참조하시오)에 1/100 희석하고 동일한 조건하에서 밤새 증식시켰다. 상기 스키조키트리움 배양물이 초기 로그기(0.6-2 OD 단위/㎖)에 있었을 때, 배양물을 3,220 x g에서 10분간 원심분리에 의해 수확하였다. 상등액을 경사분리하고, 펠릿을 M2B에 20 OD 단위/㎖의 최종 농도로 재현탁시키고 100 ㎕의 생성 세포 현탁액을 비-선택성 M2B 아가 플레이트(대략적으로 4 ㎝ 직경)의 대략 1/3상에 환상 움직임으로 도말하였다. 플라스미드 pYB32 및 pYB33을 25 ℃에서 밤새 SwaI로 절단하고 QIAquick PCR 정제 키트(퀴아겐, 독일 힐덴 소재)를 사용하여 정제하였다. 이어서 5 ㎍의 각각의 정제된 플라스미드를 50 ㎕의 2.5 M CaCl2, 20 ㎕의 0.1 M 스페르미딘 및 50 ㎕의 제조된 M10 텅스텐 비드(제조사의 프로토콜에 따라, 바이오 래드)와 혼합하고, 1분간 와동시키고, 이어서 실온에서 10분간 배양하여 상기 비드를 침전되게 하였다. DNA-코팅된 비드를 250 ㎕의 100% 에탄올로 1회 세척하고, 이어서 비드를 60 ㎕의 100% 에탄올에 재현탁시켰다. 각각의 제조된 거대담체(거대담체 조립 제조에 대한 제조사의 프로토콜에 따라)는 거대담체 디스크의 중심에 스폿팅된 에탄올 중의 코팅된 비드 10 ㎕를 가졌으며 에탄올은 건조되었다. 파열판 홀더는 70% 아이소프로판올 중에서 짧은 멸균 후 내부에 놓은 1,100 psi-지정된 파열판을 가졌으며, 조립된 거대담체를 꼭대기 선반 위치의 유전자총 플랫폼에 설치하고 스키조키트리움의 세포 패치가 있는 M2B 아가 플레이트를 상기 꼭대기로부터 세 번째 선반상에 세포쪽을 위로 하여 놓았다. 진공이 상기 유전자총 챔버내부에서 약 27 psi에 도달했으면, 파열판이 파손될 때까지 헬륨을 발사하고, 헬륨 흐름을 차단시키고, 상기 챔버를 대기로 배기시키고, 충격판을 상기 챔버로부터 제거하였다. 상기 충격 과정을 모든 샘플 및 대조용에 대해 반복하였으며, pYB32로 충격된 스키조키트리움 종 20888을 T188로 표기하고, pYB33으로 충격된 스키조키트리움 배양물은 T189로 표기하였다. 충격판을 27 ℃에서 4시간 동안 배양하고, 그 후에 세포를 상기 플레이트로부터 약 1 ㎖의 M2B로 세척하고 0.4% 무작위-메틸화된 β-사이클로덱스트린(CTD 홀딩스 인코포레이티드(Holdings, Inc.), 미국 플로리다주 하이스프링스 소재) 중의 0.5 mM DHA(누첵 프렙(Nu-Chek Prep), 미국 미네소타주 워터빌 소재) 및 50 ㎍/㎖ 제오신(써모피셔 사이언티픽(ThermoFisher Scientific), 미국 매사추세츠주 월썸 소재)을 함유하는 4개의 M2B 아가 플레이트들간에 균등하게 분배하였다. 세포를 3 ㎜ 멸균 유리 비드로 도말하고, 비드를 제거하고 플레이트를 싸고 27 ℃에서 약 7 내지 10일 동안 배양하였다. 콜로니의 크기가 2 내지 4 밀리미터에 도달했을 때, 각각의 콜로니를 DHA(상술한 바와 같이 무작위로 메틸화된 β-사이클로덱스트린과 복합체화되었다)와 함께 또는 상기 없이 100 ㎍/㎖ 제오신을 함유하는 M2B 아가 플레이트상에 반복해서 덧대어 OrfA/Pfa1 유전자의 붕괴에 의해 유도된 영양요구변이를 선택하였다.
DHA에 대해 영양요구성인 것으로 확인된 콜로니를 고르고, 250 ㎖ 편평 바닥 삼각 플라스크 중의 40% β-사이클로덱스트린 및 50 mM DHA 용액 500 ㎕가 보충된 50 ㎖의 M50-20내에 접종하고, 27 ℃ 진탕기에서 200 rpm에서 48시간 동안 두었다. 48시간 배양후에, 2 ㎖의 배양물을 5,000xg에서 10분간 원심분리에 의해 수집하고, 상등액을 경사분리하고, 펠릿을 변형된 페놀-클로로포름 추출에 따른 게놈 DNA 단리에 사용하였다. 게놈 DNA를 추출하고 GoTaq 그린 마스터믹스(프로메가, 미국 노쓰캐롤라이나주 더럼 소재)와 함께 PCR 주형으로서 사용하고 pYB32 및 pYB33에 대한 콜로니 PCR 선별에 대해 기재된 바와 같은 프라이머, GoTaq 그린 마스터 믹스 및 순환 조건을 사용하여 제오신 카세트 및 Cas9 유전자의 존재를 확인하였다(도 5). 상기 T188 및 T189 형질전환체 중의 OrfA/Pfa1 유전자의 붕괴를 PCR에 의해 확인하였다. 구체적으로, 5' 측면인접 영역을, O A1-KO F(서열번호 19) 및 pYB32/3 SV40 R1(서열번호 20) 프라이머(표 4), GoTaq 그린 마스터믹스, 5% DMSO(v:v) 및 주형으로서 T188/T189 gDNA와 함께 PCR에 의해 탐문하였으며, 순환 조건은 하기와 같았다: 95 ℃ 2분, (95 ℃ 30초, 60 ℃ 30초, 72 ℃ 2분 15초) x 35주기, 72 ℃ 5분. 더욱 또한, 3' 측면인접 영역을, O A1-KO R(서열번호 21) 및 pYB32/2 CF1(서열번호 22) 프라이머(표 4), GoTaq 그린 마스터믹스, 5% DMSO(v:v) 및 주형으로서 T188/T189 gDNA와 함께 PCR에 의해 탐문하였으며, 순환 조건은 하기와 같았다: 95 ℃ 2분, (95 ℃ 30초, 59 ℃ 30초, 72 ℃ 2분) x 35주기, 72 ℃ 5분(도 6).
프라이머 명칭 | 서열번호 | 프라이머 서열, 5′→ 3′ |
O A1-KO F | 19 | CCAAGTTCGCCAAGGCTTC |
pYB32/3 SV40 R1 | 20 | GTGGAATCGAAATCTCGTAGCAC |
O A1-KO R | 21 | GCTGTTGCAACTTTGCTCCAC |
pYB32/3C F1 | 22 | GTTAAGAAGACCGAGGTCCAGAC |
Cas9 유전자 통합 및 OrfA/Pfa1에서의 붕괴에 대한 PCR에 의한 양성 배양물을, 무작위로 메틸화된 β-사이클로덱스트린 및 DHA가 보충된 25 ㎖의 M50-20에 접종하고, 앞서 기재된 바와 같이 24시간 동안 증식시켰다. 상기 배양물의 OD600을 측정하고, 각 배양물의 2 OD 단위를, 250 ㎖ 진탕형 삼각 플라스크 중의 무작위로 메틸화된 β-사이클로덱스트린 및 DHA가 보충된 50 ㎖의 SPFM, pH 6.75에 접종하고 27 ℃ 진탕기에서 200 rpm으로 48시간 동안 증식시킨 후에 5% 글리세롤(v:v)을 저온보존을 위해 가하였다. 2개의 클론, 각각 형질전환 그룹으로부터 하나씩을 추가의 연구 - T188-1-20 및 T189-1-20을 위해 선택하였다.
야생형 스키조키트리움 종 20888을 충격에 의해 pYB32 및 pYB33으로 형질전환시켜, 다중불포화된 지방산(PUFA) 신타제의 OrfA/PFA1 유전자좌에서 Cas9의 삽입에 기인하여 20888 중에 DHA 영양요구변이를 생성시켰다. 콜로니들을 카운트하고 DHA가 있거나 없는 선택성 플레이트상에서 반복하여 덧대었다. DHA에 대해 영양요구성인 콜로니를 상기 2개의 형질전환 그룹 모두로부터 무작위로 골라 추가의 특성화를 위해 사용하였다.
하기 표 5에 나타낸 바와 같이, pYB33 플라스미드에 의한 형질전환 효율이 pYB32 플라스미드의 경우보다 더 낮았으며, 발견된 영양요구성 콜로니들의 분획에 대해 유사한 성향이 관찰되었다.
형질전환 | 5 ㎍ DNA당 총 콜로니 | 영양요구성 콜로니 | 녹아웃% |
T188: pYB32―Tub pro-Cas9 | 160 | 80 | 50% |
T189: pYB33―CS pro-Cas9 | 96 | 37 | 38.5% |
T188 및 T189 형질전환체를 Cas9에 결합된 프로모터의 존재 및 상기 Cas9 유전자의 상류 영역에 대해 탐문하였다. T188 클론에 대해서, 예상된 증폭산물 크기는 1028 bp이고, T189는 1584 bp였다. 도 5에 도시된 바와 같이, 클론 T189-1-30을 제외한 모두가 상기 예상된 증폭산물 크기를 생성시켰으며 이들을 추가의 시험에 사용하였다.
상기 OrfA/Pfa1 유전자좌 중 Cas9의 통합을 PCR에 의해 확인하였으며, 5' 및 3' 측면인접 영역을 모두 야생형-특이성 외부 프라이머 및 Cas9-특이성 내부 프라이머의 조합으로 증폭시켰고, 따라서 증폭산물은 오직 통합이 발생한 경우에만 성취될 수 있었다(도 6). 상기 Cas9 통합 부위의 5' 측면에 대한 예상 증폭산물 크기는 2229 bp였고, 3' 측면의 경우 1973 bp였다. 상기 시험된 균주들은 모두 OrfA/Pfa1 유전자좌에서 Cas9의 통합에 대해 양성이었다.
실시예 3
gRNA 벡터의 설계 및 형성
상기 안내 RNA(gRNA) 카세트는 모두 스키조키트리움으로부터 유래된 연장 인자 1α(EF-1α) 프로모터에 의해 발현되도록 설계되었다. 각각의 경우에, 상기 gRNA 서열은 2개의 리보자임 서열, 헴머헤드 및 HDV가 측면에 인접해 있다(문헌[Gao Y and Zhao Y "Self-processing of ribozyme-flanked RNAs into guide RNAs in vitro and in vivo for CRISPR-mediated genome editing" J Integr Plant Biol. 56(4):343-349 (2014)]). "NGG" 프로토스페이서-인접 모티프를 함유하는 4개의 표적 서열이 카로틴 신타제 유전자내에서 확인되었으며 각각의 바로 상류 20 bp가 표적 서열로서 선택되었다. 상기 두 리보자임 모두, 표적 서열 및 안내 RNA를 포함하는 하나의 카세트를 합성하고 BglII 및 NdeI 부위(DNA2.0)를 사용하여 pCL122 벡터내에 클로닝하여 pCL401-추가적인 클로닝을 위한 전구체 플라스미드(서열번호 7)로 표기된 벡터를 생성시켰다. 최종 gRNA 카세트 벡터를 제조하기 위해서, 플라스미드 pSP73(프로메가)을 NdeI 및 HPaI로 절단하고 생성되는 보다 큰 단편을 젤 정제하였다. 스키조키트리움 지방산 신타제 단편(FAS)의 단편을, 5' FAS PmeNde(서열번호 23) 및 3' FAS PmeHpa(서열번호 24) 프라이머(표 6), KOD 핫 스타트 마스터믹스, 및 5% DMSO와 함께 스키조키트리움 종 20888 게놈 DNA로부터 PCR에 의해, 하기의 순환 조건을 사용하여 증폭시켰다: 95 ℃ 2분, (95 ℃ 20초, 62 ℃ 10초, 70 ℃ 51초) x 40주기, 70 ℃ 5분(도 7). 상기 생성 단편을 HpaI 및 NdeI 제한 효소로 절단하고 정제하였다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5′→ 3′ |
5′ FAS PmeNde | 23 | TAGCATATGTTTAAACTCGCGGCGTCTTTCGC |
3′ FAS PmeHpa | 24 | AGTTAACGTTTAAACAGAGGAGGTGGCTGGC |
적합한 정제 및 절단된 pSP73 및 FAS 단편을 래피드 DNA 라이게이션 키트(롯슈)를 사용하여 결찰시키고 NEB10β 세포(뉴잉글랜드 바이오랩스)내로 형질전환시켜 벡터 pCL399(서열번호 5)를 생성시켰다. 이어서 상기 pCL399 벡터를 NdeI 엔도뉴클레아제 단독으로 절단하고, 단부를 녹두 뉴클레아제(뉴잉글랜드 바이오랩스)로 절두하고, 상기 벡터를 래피드 DNA 결찰 키트로 재결찰시켜 NdeI 부위를 제거하였다. 상기 생성 벡터를 pCL400(서열번호 6)으로 표기하였다. 파로모마이신 발현 카세트 및 gRNA 카세트를 인퓨전 PCR 클로닝에 의해, XhoI로 미리절단시킨 pCL400내로 삽입되는 주형으로서 pCL401(서열번호 7)을 사용하여 증폭시켜 벡터 pCL402(서열번호 8)를 생성시켰다. 간단히, pCL402 IF F(서열번호 25) 및 PCL402 IF R(서열번호 26) 프라이머(표 7), 5% DMSO(v:v), KOD 핫 스타트 마스터믹스, pCL401 플라스미드 주형을 사용하고 하기 순환 조건을 사용하여 pCL401로부터 목적하는 단편을 증폭시켰다: 95 ℃ 2분, (95 ℃ 20초, 60 ℃ 10초, 70 ℃ 1분 25초) x 35주기, 70 ℃ 5분(도 8). 상기 생성 벡터를 pCL402로 표기하였다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5′→ 3′ |
pCL402 IF F | 25 | GAGGCGCTGACCGCCGGCCAAGCTTCCAATTTTAGGCC |
pCL402 IF R | 26 | GCAGGTGCCGAGTTTCTCGAGAAGAATCTGAACTCACGTC |
4개의 게놈 카로틴 신타제 표적 서열을 BglII 및 NdeI 측면 인접 부위와 함께 합성하였다(유로핀스(Eurofins), 미국 노쓰캐롤라이나주 미베인 소재). 상기 단편을 gRNA3 CS1, CS2, CS3 및 CS4로 표기하였다. 4개의 단편 전부 및 벡터 pCL0402를 BglII및 NdeI로 절단하였다. 모든 적합한 단편을 젤 또는 컬럼 정제하고 이어서 래피드 DNA 라이게이션 키트(롯슈)를 사용하여 함께 결찰하고 생성되는 벡터들을 pYB36(gRNA3 CS1; 서열번호 9), pYB37(gRNA3 CS2; 서열번호 10), pYB38(gRNA3 CS3; 서열번호 11), 및 pYB39(gRNA3 CS4; 서열번호 12)로 표기하였다.
스키조키트리움으로부터 유전자 편집 성분을 제거하기 위해서, Cas9 및 안내 RNA 카세트를 모두 ("녹아웃") 유전자를 붕괴시키도록 설계하고 이에 의해 영양요구변이를 유도하였다. 상기 Cas9 선택에 의한 영양요구변이는 DHA에 대한 것인 반면, gRNA 삽입에 대해 유도된 영양요구변이는 지방산 신타제 유전자좌(FAS)의 붕괴로 인해 팔미트산에 대한 것이었다. 상기 FAS 유전자의 부분을 스키조키트리움 종 20888 게놈 DNA로부터 증폭시키고 이어서 1% 아가로스 젤상에서 실행시켰다(도 8). 상기 증폭산물의 예상 크기는 2530 bp였다. 2개의 샘플을 제조하고 이들을 젤상에 로딩하였으며, 예상된 크기의 밴드는 상기 PCR의 주요 산물이었으나 다른 보다 작은 크기의 밴드들이 존재하였고, 이는 PCR 조건이 덜 이상적이었을 수도 있고 차후에 최적화시킬 필요가 있을 수도 있음을 암시한다. 2.5 kbp 밴드를 절단하고, 젤 정제하고 벡터 pCL399의 클로닝에 사용하였다.
PCR을 벡터 pCL400 중의 FAS 유전자좌내로의 파로모마이신 및 gRNA 카세트의 클로닝을 위해 셋업하였다. 상기 증폭산물의 예상 크기는 3376 bp였으며, 상기는 상기 젤상에 나타난 주요 밴드였다(도 8). 이어서 상기 단편을 pCL400내로 클로닝시켜 pCL402를 생성시켰다.
실시예 4
gRNA 구조물의 형질전환 및 선택
T188-1-20 및 T189-1-20 균주(둘 다 PCR에 의해 상이한 프로모터, 각각 알파 튜불린 및 Cs의 조절하에서 Cas9 발현 카세트를 함유하는 것으로 확인되었으며 PUFA 신타제의 OrfA/PFA1 유전자좌에 삽입되었다)를 0.5 mM DNA와 함께 0.4% 무작위 메틸화된 β-사이클로덱스트린이 보충된 25 ㎖의 M50-20을 함유하는 편평바닥 삼각 플라스크에 접종하고 27 ℃, 200 rpm에서 밤새 증식시켰다. 상기 두 균주 모두 상술한 바와 같이 β-사이클로덱스트린 및 DHA가 보충된 50 ㎖의 M2B를 함유하는 진탕형 플라스크에 1/50 희석시키고 27 ℃에서 밤새 증식시켰다. T188 및 T189 배양물을 상술한 바와 같이 다음날 수확하고 충격을 위한 준비를 상술한 바와 같이 수행하였다. pYB36-39 플라스미드를 PmeI에 의한 충격에 앞서 절단하고 컬럼 정제하고, 4개의 절단된 플라스미드를 모두 사용하여 상기 2개의 균주를 형질전환시켜 T202-209로 표기된 형질전환을 생성시켰다(각각 pYB36-39를 갖는 T188, pYB36-39를 갖는 T189). 생성되는 형질전환체를 충격으로부터 회수 후 4시간째에 0.5 mM DHA, 0.5 mM C16:0(팔미트산, 시그마 알드리치(Sigma-Aldrich), 미국 미주리주 세인트 루이스 소재) 및 50 ㎍/㎖ 파로모마이신과 함께 0.4%의 β-사이클로덱스트린을 함유하는 M2B 플레이트상에 도말하였다. 플레이트를 싸고 27 ℃에서 7 내지 10일간 배양하였다. 일단 직경이 2 내지 4 ㎜가 되었으면, 콜로니를 0.5 mM 팔미트산의 존재 또는 부재하에 M2B+0.4% β-사이클로덱스트린+0.5 mM DHA+0.5 ㎍/㎖ 파로모마이신상에 반복해서 덧대어 FAS 유전자좌에 gRNA 카세트 삽입의 결과로서 생성된 팔미트산에 대한 영양요구변이를 확인하였다. 상기 DHA 및 팔미트산 모두에 대해 영양요구성인 것으로 확인된 8개 형질전환 각각으로부터 10개의 콜로니를 골라, 0.4% β-사이클로덱스트린, 0.5 mM DHA 및 0.5 mM 팔미트산이 보충된 25 ㎖의 M50-20을 함유하는 편평바닥 삼각 플라스크에 접종하고, 배양물을 27 ℃, 200 rpm에서 48시간 동안 증식시켰으며, 이때에 2 ㎖의 각 배양물을 게놈 DNA 제조를 위해 수집하였다. 게놈 DNA를 페놀:클로로포름으로 추출한 후에, PCR을 수행하여 gRNA 카세트가 표적화된 영역들을 함유하는 카로틴 신타제 유전자좌를 증폭시켰다. T202, 203, 204, 207, 208로부터 선택된 형질전환체로부터의 gDNA를 하기의 순환 조건을 사용하여 pYB36 CS1 F(서열번호 27) 및 pYB36 CS3 R(서열번호 29) 프라이머(표 8), 5% DMSO(v:v), KOD 핫 스타트 마스터믹스, 주형으로서 각각의 gDNA를 사용하여 PCR에 의해 증폭시켰다: 95 ℃ 2분, (95 ℃ 20초, 61 ℃ 10초, 70 ℃ 21초) x 35주기, 70 ℃ 5분(도 9). T206으로부터 gDNA를 하기의 순환 조건을 사용하여 pYB36 CS1 F 및 pYB36 CS1 R(서열번호 28) 프라이머(표 8), 5% DMSO(v:v), KOD 핫 스타트 마스터믹스로 증폭시켰다: 95 ℃ 2분, (95 ℃ 20초, 61 ℃ 10초, 70 ℃ 11초) x 35주기, 70 ℃ 5분(도 10). T205 및 T209로부터 gDNA를 하기의 순환 조건을 사용하여 pYB36 CS4 F(서열번호 30) 및 pYB36 CS4 R(서열번호 31) 프라이머(표 8), 5% DMSO(v:v), KOD 핫 스타트 마스터믹스로 증폭시켰다: 95 ℃ 2분, (95 ℃ 20초, 61 ℃ 10초, 70 ℃ 21초) x 35주기, 70 ℃ 5분(도 9).
프라이머 명칭 | 서열번호 | 프라이머 서열, 5′→ 3′ |
pYB36 CS1 F | 27 | GAGTCGAAGGAGACGTTGTCG |
pYB36 CS1 R | 28 | GTCATTGCGAATGATGCGATATG |
pYB36 CS3 R | 29 | GGTCATCATGGAATACAACGCAG |
pYB36 CS4 F | 30 | CGAGCTCATTTGTGCTACACTCTATG |
pYB36 CS4 R | 31 | CACAAGATTTGCAGGATTGATGC |
생성되는 PCR 증폭산물을 컬럼 정제하고, pJet1.2 벡터(써모피셔, 미국 매사추세츠주 월썸 소재)내에 클로닝하고, 생성되는 세균 형질전환체에서 플라스미드를 소량 추출하고, 삽입물을 상기 키트에 제공된 프라이머로 서열분석하였다. 서열을 지니어스(Geneious) 소프트웨어를 사용하여 정렬시켰다.
gRNA를 암호화하는 벡터에 의한 2개의 Cas9 배경(T188 및 T189)의 형질전환이 성공적으로 수행되었으며 하기 표 9에 나타낸 바와 같은 다수의 이중 영양요구성 균주(T202-209로 표기됨)를 생성시켰다. 선택 균주를 나중에 유전자 수준으로 분석하여 카로티노이드 신타제 유전자좌의 임의의 돌연변이를 검출하였으며, 이는 비-상동성 말단 부착(NHEJ) 사건을 가리킨다.
형질전환 |
총 콜로니
(3ug DNA 당) |
16:0 영양요구체의 수 | KO 퍼센트 |
T202 (T188+gRNA1) | 103 | 17/32 | 53% |
T203 (T188+gRNA2) | 93 | 15/32 | 46% |
T204 (T188+gRNA3) | 65 | 15/32 | 46% |
T205 (T188+gRNA4) | 50 | 15/32 | 46% |
T206 (T189+gRNA1) | 53 | 12/32 | 37% |
T207 (T189+gRNA2) | 28 | 8/20 | 40% |
T208 (T189+gRNA3) | 38 | 9/29 | 31% |
T209 (T189+gRNA4) | 28 | 9/22 | 41% |
gDNA를 영양요구성인 것으로 나타난(DNA 및 팔미트산 모두가 보충될 것을 요한다) gRNA + Cas9 형질전환체로부터 단리한 후에, 하나의 PCR을 사용하여 하나의 증폭산물로서 첫 번째 3 CS gRNA 표적을 포함하는 전체 영역을 증폭시키고 또 다른 PCR을 사용하여 별도로 gRNA3 CS4 표적을 증폭시켰다(도 9). gRNA3 CS1-3 형질전환체 DNA로부터의 증폭산물에 대한 예상 크기는 1040 bp였으며, gRNA 3 CS4 형질전환체로부터의 경우는 715 bp였다. gRNA CS1-3 표적에 대한 증폭산물의 경우에, 상기 T188 계통으로부터 온 샘플은 정확한 크기의 단일 밴드를 가졌다. 그러나 T189로부터 온 샘플(T189 모 균주 자체로부터의 gDNA 포함)은 가장 현저한 약 1 kbp 밴드 및 두 번째로 가장 현저한 약 1.5 kbp 밴드와 함께 다수의 밴드를 가졌다. 상기 1.5 kbp 밴드는 비-특이적인 증폭의 산물인 것으로 판단되었다. 비특이적인 밴드의 존재를 감소시키고자 상기 PCR의 최적화를 수행하지는 않았으며, 약 1 kbp 밴드를 상기 형질전환체 모두에 대해 상기 젤로부터 절단하고 pJet1.2 클로닝에 사용하였다. CS4 증폭산물은 모두 정확한 크기의 단일 밴드였다. 상기 생성되는, Cas9/gRNA 형질전환체 각각으로부터의 증폭산물을 갖는 다수의 pJet 형질전환체 콜로니를 서열분석을 위해 보내어 Cas9/gRNA가 CS 서열에 임의의 영향을 미치는 지의 여부를 측정하였다.
추가로, 클론의 T206 계통상에서 분석을 수행하였다. 도 9에 기재된 바와 같이, T206 형질전환체는 gDNA 추출되었으며 PCR용 주형으로서 사용되어 오직 gRNA3 CS1 표적 서열만을 증폭시켰고 예상되는 증폭산물 크기는 689 bp였다. 상기 크기의 밴드가 상기 젤상에서 관찰되었으며, 이는 다른 것들 가운데에서 주 밴드였고, 보다 큰 분자량을 갖는 것이었으며, 선행 도면상에서 관찰된 것들과 유사하였다. 예상된 약 700 bp 크기의 젤 단편을 절단하고 정제하고 상기 단편의 pJet1.2 클로닝 및 서열분석에 사용하여 Cas9-gDNA가 CS 유전자 중의 임의의 서열 변화를 유도하였는지를 측정하였다(도 10).
Cas9 및 gRNA 암호화 벡터 모두로 형질전환된 클론들로부터의 CS 유전자좌의 증폭산물을 함유하는 다수의 pJet 벡터를 서열분석할 때, 여러 종류의 변화가 발생함이 관찰되었다(표 10). 선행 연구는 CAS9가 DNA를 절단하고 PAM 서열 상류의 3 염기쌍 위치에서 이중 가닥 절단을 생성시킴을 입증하였다(문헌[Jinek et al. "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity" Science 337(6096):816-821, 2012]). 상기 이중 가닥 절단 부위에서 다양한 길이의 삽입 및/또는 결실 돌연변이를 생성시킬 수도 있는 부정확한 비-상동성 말단 부착(NHEJ)-매개된 복구로부터 돌연변이가 발생할 수도 있음이 공지되어 있다(문헌[Sander and Joung, "CRISPR-Cas systems for editing, regulating and targeting genomes" Nat Biotechnol. 32(4):347-355, 2014]). 관찰된 변화는 모두 예상된 바와 같이 PAM에 비해 -3번 위치에서 발생한다(이 경우 AGG). Cas9+gRNA 형질전환체에서 검출된 스키조키트리움 종 20888의 카로티노이드 신타제의 예시적인 돌연변이를 표 10에 나타내며, 이때 결실은 대시로 도시하고 삽입은 밑줄로 도시되었다.
야생형 뉴클레오타이드 위치 # | 15 | 16 | 17 | 18 | 19 | 20 | PAM/NGG |
야생형 | A | C | G | C | G | C | AGG |
CS1 표적 변체 #1 | A | C | G | C | - | - | AGG |
CS1 표적 변체 #2 | A | C | - | C | G | C | AGG |
CS1 표적 변체 #3 | A | C | G | C C | G | C | AGG |
CS1 표적 변체 #4 | A | C | G | T C | G | C | AGG |
본 명세서에 인용된 모든 참고문헌은 각각의 참고문헌이 구체적이고 개별적으로 참고로 인용됨을 가리키는 바와 같이 본 명세서에 참고로 인용된다. 임의의 참고문헌의 인용은 출원일 이전의 그의 명세에 대한 것이며 본 명세가 종래 발명 때문에 상기와 같은 참고문헌에 선행할 자격을 갖지 않음을 인정하는 것으로서 이해해서는 안 된다.
각각의 상술한 요소들, 또는 2개 이상의 요소가 함께 상술한 유형과 상이한 다른 유형의 방법에서 유용한 용도를 또한 발견할 수 있음을 알 것이다. 추가의 분석 없이, 상기는 본 명세의 요지를 충분히 밝혀서, 다른 이들이 현재의 지식을 적용함으로써, 종래 기술의 관점으로부터, 첨부된 특허청구범위에 제시된 본 명세의 일반적이거나 특정한 태양의 필수적인 특징을 공정하게 구성하는 특징들을 생략하지 않고서 상기 명세를 다양한 용도들에 쉽게 적합화시킬 수 있다. 상기 실시태양들은 단지 예로서 제공되며; 본 명세의 범위는 오직 하기 특허청구범위에 의해서만 제한되게 된다.
실시예 5
표적화되지 않은 Cas9 벡터(pYB61)의 설계 및 형성
앞서, Cas9 플라스미드를 PUFA 신타제 유전자(OrfA 서브유닛; pYB32 및 pYB33을 참조하시오)에서 표적화된 통합을 위해 설계하였다. 이러한 방식으로 설계된 Cas9 카세트의 통합은 상기 OrfA 유전자의 녹아웃 및 DHA 영양요구변이를 생성시켰다. 영양요구변이의 유도는 OrfA 유전자좌에서의 후속적인 통합을 위한 형질전환체의 보다 용이한 선별을 가능하게 하나, CRISPR-매개된 카로틴 신타제 녹아웃의 분화를 보다 어렵게 한다. 임의의 염색체 유전자좌에 표적화하지 않으면서 Cas9에 대한 발현 카세트를 갖는 플라스미드를 형성시켜 이소성, 무작위 통합의 영향을 시험하였다. 플라스미드 pCL122-Cas9(서열번호 1)를 BamHI-HF(NEB) 및 NdeI(NEB)로 절단시켜 2개의 단편, 크기 4140 bp 및 5780 bp를 생성시켰다. 상기 4140 bp 단편을 1% 아가로스 젤상에서 분리시키고, 절제하고, QIAquick 젤 추출 키트(퀴아겐)를 사용하여 정제시켰다(도 11). 플라스미드 pYB30(서열번호 32)은 GFP 및 제오신 내성의 발현을 구동하는 알파-튜불린 프로모터의 부분적인 단편을 함유한다. 상기 플라스미드를 BamHI-HF(NEB) 및 NdeI(NEB)로 절단시켜, 2개의 단편 838 bp 및 4724 bp를 생성시켰다. 상기 4724 bp 단편을 1% 아가로스 젤상에서 분리시키고, 절제하고, QIAquick 젤 추출 키트(퀴아겐)를 사용하여 정제시켰다(도 11). 상기 2개의 관심 단편을 래피드 DNA 라이게이션 키트(롯슈)를 사용하여 결찰시켰다. 이어서 NEB10β 화학적 수용성 세포(NEB)를 상기 결찰 반응의 일부로 형질전환시켰다. 생성되는 콜로니를 2x GoTaq 그린 마스터 믹스(프로메가), 프라이머 121 Tub seq F 및 pYB32/3C R1 및 5% 최종 DMSO와 함께 PCR에 의한 선별을 위해 주형으로서 사용하였다. 하기의 순환 조건을 적용하였다: 95 ℃ 5분, [95 ℃ 30초, 59 ℃ 30초, 72 ℃ 1분] 35주기 동안, 및 72 ℃ 5분(앞서 기재됨)(도 12). 플라스미드를 PCR에 의해 양성 형질전환체로서 확인된 콜로니로부터 추출하고, 서열분석하고, 생성 벡터를 pYB61(서열번호 33)로 표기하였다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5'→3' |
121 Tub seq F | 13 | GGATCTCATGCTGGAGTTCTTC |
pYB32/3C R1 | 14 | GTACTTCTCGTGGTAGGCAACC |
실시예 6
표적화되지 않은 gRNA 벡터(pYB66)의 설계 및 형성
앞서, gRNA 플라스미드를 지방산 신타제(FAS) 유전자 유전자좌에 대해 표적화하여, 팔미트산에 대한 영양요구성 요건을 생성시켰다. 상기 영양요구변이는 CRISPR-매개된 카로틴 신타제 불활성화로부터 생성되는 표현형을 가렸다. 카로티노이드 생합성에 관련된 유전자좌에서의 CRISPR-매개된 표현형 변화를 보다 잘 식별하기 위해서, 표적화되지 않은 gRNA 벡터를 제조하였다. 플라스미드 pCL122(서열번호 37)를 BamHI-HF(NEB) 및 NdeI(NEB)로 절단하여 GFP를 암호화하는 판독 프레임을 제거하여, 838 bp 및 5773 bp 크기의 2개의 단편을 생성시켰다. 상기 5773 bp 단편을 1% 아가로스 젤상에서 분리시키고, 절제하고, QIAquick 젤 추출 키트(퀴아겐)를 사용하여 정제하였다(도 13). gRNA3 CS1을 암호화하는 카세트를 2x KOD 핫 스타트 마스터 믹스(EMD 밀리포어), 프라이머 pYB66 BamBgl F 및 pYB66 Nde R, 및 5% 최종 DMSO와 함께 주형으로서 플라스미드 pYB36(서열번호 9)을 사용하여 PCR에 의해 증폭시켰다. 하기의 순환 조건을 적용하였다: 95 ℃ 2분, [95 ℃ 20초, 59 ℃ 10초, 70 ℃ 5초] 35주기 동안, 및 72 ℃ 2분(앞서 기재됨)(도 14). 상기 생성되는 PCR 단편을 QIAquick PCR 정제 키트(퀴아겐)를 사용하여 컬럼 정제하고 BamHI-HF(NEB) 및 NdeI(NEB)로 절단하였다. 절단에 이어서, 상기 생성되는 DNA 단편을 다시 QIAquick PCR 정제 키트를 사용하여 정제하였다(도 15). 상기 절단된 pCL122 및 gRNA 단편을 래피드 DNA 라이게이션 키트(롯슈)를 사용하여 결찰시켰다. 이어서 NEB10β 화학적 수용성 세포를 상기 결찰 반응의 일부로 형질전환시키고 생성되는 콜로니를 2x GoTaq 그린 마스터 믹스(프로메가), 프라이머 pYB66 EF1seq F 및 pCL122 OrfC R 및 5% 최종 부피의 DMSO를 사용하여, 하기의 순환 조건으로 콜로니 PCR에 의해 선별하였다: 95 ℃ 10분, [95 ℃ 30초, 60 ℃ 30초, 72 ℃ 45초] 35주기 동안, 및 72 ℃ 5분(도 16). 플라스미드를 PCR에 의해 양성 콜로니로부터 추출하고, 서열분석하고, 생성 벡터를 pYB66(서열번호 34)으로 표기하였다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5'→ 3' |
pYB66 BamBgl F | 38 | CAAGGGATCCAGATCTTCCGCACTGATGAGTC |
pYB66 Nde R | 39 | AACTCATATGGTCCCATTCGCCA |
pYB66 EF1seq F | 40 | GAGAGGATAGTATCTTGCGTGCTTG |
pCL122 OrfC R | 41 | GCAAGGTTGGAACATTACGATCAAG |
실시예 7
Cas9 및 gRNA 벡터(pYB73)의 설계 및 형성
단일의 우성 선택성 마커를 갖는 동일한 벡터상에 Cas9 및 gRNA 카세트를 모두 함유하는 벡터를 생성시켜 게놈 편집에 대한 상기와 같은 배열의 효율을 시험하였다. 플라스미드 pYB61을 PstI(NEB)로 절단하고 QIAquick PCR 정제 키트(퀴아겐)에 의해 정제하였다(도 17). 상기 gRNA 발현 카세트를 하기와 함께 PCR을 사용하여 pYB36으로부터 증폭시켰다: 2x KOD 핫 스타트 마스터 믹스(노바겐(Novagen)), 프라이머 pYB73 gRNA Pst Kpn IF F 및 pYB73 gRNA Xho Pst IF R, 및 5% 최종 DMSO. 순환 조건은 하기와 같이 사용되었다: 95 ℃ 2분, [95 ℃ 20초, 58 ℃ 10초, 70 ℃ 38초] 35주기 동안, 및 70 ℃ 2분(도 18). 상기 생성되는 PCR 단편을 QIAquick PCR 클린업 키트(퀴아겐)를 사용하여 컬럼 정제하였다. 정제된, 절단된 pYB61 단편을 제조사의 프로토콜에 따라 인퓨전 키트(클론테크)를 사용하여 상기 정제된, 절단된 gRNA PCR 단편에 결찰시켰다. NEB10β 화학적 수용성 세포를 상기 인퓨전 반응의 일부로 형질전환시키고 생성되는 세균 콜로니를 2x GoTaq 그린 마스터 믹스(프로메가), 프라이머 pYB73 seq F 및 pYB73 seq R 및 5% 최종 DMSO와 함께 PCR에 의해 선별하였다. 하기의 순환 조건을 적용하였다: 95 ℃ 10분, [95 ℃ 30초, 60 ℃ 30초, 72 ℃ 2분] 35주기 동안, 및 72 ℃ 5분(도 19). 플라스미드를 PCR에 의해 양성 콜로니로부터 추출하고, 서열분석하고, 생성 벡터를 pYB73(서열번호 35)으로 표기하였다. 플라스미드 pYB73은 임의의 특정한 유전자에 대한 표적화를 위해 설계되지 않는다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5'→ 3' |
pYB73 gRNA Pst Kpn IF F | 42 | CATACATGGTCGACCTGCAGGGTACCTCTTATCTGCCTCGC |
pYB73 gRNA Xho Pst IF R | 43 | ATTAATGCAGGTTCCTGCAGCTCGAGAAGAATCTGAACTCACGTC |
pYB73 seq F | 44 | CACCCCAACTTGTTTATTGCAG |
pYB73 seq R | 45 | GAGCGAGGAAGCGGAAGAG |
실시예 8
CarG 균주에 대한 설계, 형성 및 형질전환
CRIPSR-매개된 카로틴 신타제 유전자 불활성화를 갖는 형질전환체(백색 콜로니 표현형)와, CRIPSR-매개된 카로틴 신타제 유전자 불활성화를 갖지 않는 형질전환체(황색-오렌지색 콜로니 표현형)간의 구별을 개선하기 위해서, 뮤코르 시르시넬로이데스(Mucor circinelloides)로부터의 CarG 유전자(제라닐제라닐 피로포스페이트 신타제)를 스키조키트리움에서의 발현에 대해 코돈-최적화하였다. 상기 CarG 유전자(상기는 생성된 카로티노이드의 총량을 증가시키고 형질전환체를 더 오렌지색으로 만들 것이다)를 DNA2.0에 의해 합성하고, 블라스티시딘 선택 카세트를 함유하는 스키조키트리움 발현 벡터내로 클로닝하였다. 상기 생성 벡터를 pCL310(서열번호 36)이라 명명하였다.
스키조키트리움 종 ATCC 20888의 야생형 균주를 입자 충격 방법(바이오 래드)을 통해 pCL310에 대한 형질전환에 사용하였다. ATCC 20888을 200 rpm에서 밤새 진탕시키면서 +27 ℃에서 250 ㎖ 편평바닥 삼각 플라스크 중의 25 ㎖의 M50-20 배지에서 증식시켰다. 이어서, 상기 20888 배양물을 250 ㎖ 진탕형 플라스크 중의 50 ㎖의 M2B 배지에 1/100 희석하고 앞서 사용된 조건하에서 밤새 증식시켰다. 상기 20888 배양물이 초기 로그기(0.6-2 OD 단위/㎖)에 있었을 때, 배양물을 3,220 x g에서 10분간 원심분리에 의해 수확하였다. 상등액을 경사분리하고, 펠릿을 M2B에 20 OD 단위/㎖의 최종 농도로 재현탁시켰다. 100 ㎕의 생성 세포 현탁액을 비-선택성 M2B 아가 플레이트(대략적으로 2 in 직경)의 대략 1/3상에 도말하였다. 5 ㎍의 플라스미드 DNA 및 5 ㎍의 pCL310을 50 ㎕의 2.5 M CaCl2, 20 ㎕의 0.1 M 스페르미딘 및 50 ㎕의 제조된 M10 텅스텐 비드(제조사의 프로토콜에 따라)와 혼합하고, 1분간 와동시키고, 이어서 실온에서 10분간 배양하여 상기 비드를 침전되게 하였다. DNA-코팅된 비드를 250 ㎕의 100% 에탄올로 1회 세척하고, 이어서 비드를 60 ㎕의 100% 에탄올에 재현탁시켰다. 각각의 제조된 거대담체(거대담체 조립 제조에 대한 제조사의 프로토콜에 따라)는, 후드로부터 최소의 진동을 유도하고 따라서 에탄올이 건조되게 하는 조건하에서 중심에 스폿팅된 에탄올 중의 코팅된 비드 10 ㎕를 가졌다. 파열판 홀더는 70% 아이소프로판올 중에서 짧은 멸균 후 1,100 psi 파열판을 가졌다. 조립된 거대담체 플랫폼을 꼭대기 선반 위치에 놓고 20888 세포 패치가 있는 M2B 아가 플레이트를 상기 꼭대기로부터 세 번째 선반상에 세포쪽을 위로 하여 놓았다. 진공이 상기 유전자총 챔버내부에서 약 27 인치의 수은에 도달했으면, 파열판이 파손될 때까지 헬륨을 발사하였다. 이어서 헬륨 흐름을 차단시키고, 상기 챔버를 대기로 배기시켰다. 이어서 충격판을 상기 챔버로부터 제거하였다. 상기 충격 과정을 모든 샘플 및 대조용에 대해 반복하였다. pCL310으로 충격된 20888 균주를 T212로 표기하였다. 충격판을 +27 ℃ 배양기에서 4시간 동안 배양하고, 그 후에 세포를 상기 플레이트로부터 약 1 ㎖의 M2B로 세척하고 100 ㎍/㎖ 블라스티시딘(써모피셔)을 함유하는 4개의 M2B 아가 플레이트들간에 균등하게 분배하였다. 세포를 3 ㎜ 멸균 유리 비드로 도말하였다. 비드 제거 후에, 플레이트를 싸고 +27 ℃에서 5 내지 8일 동안 배양하였다. 콜로니의 크기가 2 내지 4 밀리미터에 도달했을 때, 이들을 100 ㎍/㎖ 블라스티시딘을 함유하는 M2B 아가 플레이트상에 덧대었다. 블라스티시딘에 대해 내성인 것으로 확인된 콜로니를 고르고, 250 ㎖ 편평 바닥 삼각 플라스크 중의 50 ㎖의 M50-20내에 접종하고, +27 ℃ 및 200 rpm에서 48시간 동안 진탕기에 넣었다. 48시간 배양후에, 2 밀리리터의 배양물을 4,000xg에서 10분간 원심분리에 의해 수집하고, 상등액을 경사분리하고, 펠릿을 변형된 페놀-클로로포름 추출에 따른 게놈 DNA 단리에 사용하였다. 게놈 DNA를 추출하고 GoTaq 그린 마스터믹스(프로메가)와 함께 PCR 주형으로서 사용하고 프라이머 pYB13 YB1 seq F 및 pCL122 OrfC R 및 DMSO를 5% 최종 농도로 사용하여 Cas9 카세트의 존재를 확인하였다. 하기의 순환 조건을 적용하였다: 95 ℃ 2분, [95 ℃ 30초, 63 ℃ 30초, 72 ℃ 1분 45초] 35주기 동안, 및 72 ℃ 5분(도 20). PCR에 의해 측정시 pCL130 형질전환 DNA의 존재에 대해 양성이고 야생형 대조용에 비해 더 짙은 오렌지색을 나타내는 다수의 형질전환체를 UV-Vis 방법에 의해 총 카로티노이드에 대해 분석하였다. 상기 분석 중에서 2개의 균주, T212-3-1 및 T212-3-2가 보다 높은 총 카로티노이드를 갖는 것으로 확인되었다. T212-3-2는 게놈 편집 요소에 대한 후속 연구를 위해 선택된다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5'→ 3' |
pYB13 pYB1 seq F | 46 | GAGAGGATAGTATCTTGCGTGCTTGG |
pCL122 OrfC R | 41 | GCAAGGTTGGAACATTACGATCAAG |
실시예 9
pYB61, pYB66 및 pYB73에 의한 T212 및 20888의 형질전환
스키조키트리움에서 편집 효율에 대한 표적화되지 않은 벡터의 영향을 시험하기 위해서 다수의 형질전환을 상술한 입자 충격 방법을 사용하여 수행하였다. 상기 형질전환을 하기와 같이 셋업하였다: T280-T212-3-2 균주를 pYB61로 형질전환시키고, T285-ATCC 20888 야생형 균주를 pYB61로 형질전환시켰다. 상기 두 형질전환을 모두 수행하여 gRNA 시험 연구를 위해 Cas9를 사전-발현하는 수용 균주를 생성시켰다. 후속의 형질전환을 하기와 같이 셋업하였다: T281-T212-3-2 균주를 pYB61 및 pYB66으로 동시-형질전환시키고, T286-ATCC 20888 야생형 균주를 pYB61 및 pYB66으로 동시-형질전환시켰다. T281 및 T286 형질전환을 수행하여, 게놈 중 임의의 특정 유전자좌에 대한 표적화를 위해 설계되지 않은 플라스미드에 의한 편집 효율을 평가하였다. pYB73으로 형질전환된 T282-T212-3-2 균주, 및 pYB73으로 형질전환된 T287-ATCC 20888 야생형 균주를, 게놈 편집을 위해 상기 두 요소를 모두 갖는 단일 플라스미드에 의한 편집 효율을 평가하기 위해 완성시켰다. T280, T282, T285, T287 형질전환을 제오신(써모피셔) 50 ㎍/㎖가 보충된 M2B 플레이트상에서 선택하였다. T281 및 T286 형질전환을 제오신 50 ㎍/㎖ 및 파로모마이신(시그마) 100 ㎍/㎖이 보충된 M2B 플레이트상에서 선택하였다. 이들 형질전환 모두로부터 생성된 콜로니를 100 ㎍/㎖의 제오신 단독 또는 100 ㎍/㎖ 제오신과 100 ㎍/㎖ 파로모마이신을 함께 함유하는 선택성 M2B 플레이트상에 덧대었다. 상기 패치 플레이트상에서 확고하게 증식하고 적용 가능한 경우 백색 콜로니 표현형을 나타낸 패치들을 추가의 분석을 위해 선택하였다. 상기 균주들을 상기 패치 플레이트로부터 떼어내어 250 ㎖ 삼각 편평바닥 플라스크 중의 25 ㎖의 M50-20 배지에 접종하였다. 플라스크를 대략 24시간 동안 +27 ℃, 200 rpm에서 배양하였다. 2 ㎖의 각 접종물의 분액을 취하여 미세원심분리 튜브에 넣고, 7,500 x g에서 10분간 회전시켰다. 상등액을 경사분리시키고 펠릿을 변형된 페놀-클로로포름 추출 방법을 사용하여 게놈 DNA의 제조에 사용하였다. 생성되는 gDNA에, 상기 선택 카세트 및 관심 유전자의 존재에 대해서 PCR에 의한 분석을 가하였다. T280, T281, T285, T286에 대해서, 상기 선택 카세트의 종결자와 상기 Cas9 유전자의 시작간의 접합부를 하기를 사용하여 증폭시켰다: 2X GoTaq 그린 마스터 믹스, 프라이머 121 Tub seq F 및 pYB32/3 CR1, 5% 최종 농도로 DMSO, 및 gDNA. 하기의 조건들을 적용하였다: 95 ℃ 2분, [95 ℃ 30초, 58 ℃ 30초, 72 ℃ 1분 2초] 35주기 동안, 및 72 ℃ 5분(도 21). T281 및 T286에 대해서, 상기 gRNA 카세트의 존재를 하기와 같이 전체 gRNA 카세트의 PCR 증폭에 의해 평가하였다: 2X GoTaq 그린 마스터 믹스, 프라이머 pYB66 EF1 seq F 및 pCL122 OrfC R, 5% 최종 농도로 DMSO, 및 gDNA. 하기의 순환 조건들을 적용하였다: 95 ℃ 2분, [95 ℃ 30초, 60 ℃ 30초, 72 ℃ 47초] 35주기 동안, 및 72 ℃ 5분(도 22). T282 및 T287에 대해서, 상기 gRNA 카세트의 존재를 하기와 같이 PCR 증폭에 의해 평가하였다: 2X GoTaq 그린 마스터 믹스, 프라이머 pYB66 EF1 seq F 및 TT pYB73 HDV R, 5% 최종 농도로 DMSO, 및 gDNA. 하기의 순환 조건들을 적용하였다: 95 ℃ 2분, [95 ℃ 30초, 60.9 ℃ 30초, 72 ℃ 16초] 35주기 동안, 및 72 ℃ 5분(도 23). PCR 증폭산물을 서열분석하고 상기 유전자 편집 실험으로부터 생성된 삽입-결실의 유형을 관찰하기 위해서 Cas9 및 gRNA에 대해 PCR에 의해 양성으로 시험된 T281, T282, T286 및 T287 형질전환체에 PCR을 가하여, gRNA가 변화에 영향을 미친 CS 유전자의 부분들을 증폭시켰다. 상기 CS 유전자의 관련 부분을 증폭시키기 위한 PCR을 하기에 의해 준비하였다: 2X KOD 핫 스타 마스터 믹스, 프라이머 pYB36 CS1 F 및 pYB36 CS1 R, 5% 최종 농도로 DMSO, 및 gDNA. 하기의 순환 조건들을 적용하였다: 95 ℃ 2분, [95 ℃ 20초, 61 ℃ 10초, 70 ℃ 11초] 35주기 동안, 및 70 ℃ 5분(도 24). PCR 단편을 QIAquick PCR 정제 키트(퀴아겐)를 사용하여 컬럼 정제하고 pYB36 CS1 F 및 pYB36 CS1 R로 서열을 확인하였다.
프라이머 명칭 | 서열번호 | 프라이머 서열, 5'→ 3' |
pYB66 EF1 seq F | 40 | GAGAGGATAGTATCTTGCGTGCTTG |
pCL122 OrfC R | 41 | GCAAGGTTGGAACATTACGATCAAG |
TT pYB73 HDV R | 47 | GAAGCATGTTGCCCAGCC |
pYB36 CS1 F | 27 | GAGTCGAAGGAGACGTTGTCG |
pYB36 CS1 R | 28 | GTCATTGCGAATGATGCGATATG |
SEQUENCE LISTING
<110> DSM IP Assets B.V.
<120> A CRISPR-CAS SYSTEM FOR AN ALGAL HOST CELL
<130> 32176-WO-PCT
<140> PCT/US2017/041949
<141> 2017-07-13
<150> US 62/361,741
<151> 2016-07-13
<160> 47
<170> PatentIn version 3.5
<210> 1
<211> 9920
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL122-Cas9 vector
<220>
<221> misc_feature
<222> (1)..(1064)
<223> EF-1 alpha promoter
<220>
<221> misc_feature
<222> (1070)..(5209)
<223> Cas9
<220>
<221> misc_feature
<222> (5229)..(5868)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (7153)..(8013)
<223> AmpR_gene
<220>
<221> misc_feature
<222> (8403)..(8851)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (8852)..(9646)
<223> paromomycin_resistance_gene
<220>
<221> misc_feature
<222> (9647)..(9920)
<223> SV40_terminator
<400> 1
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tggataagaa 1080
gtactcgatc ggcctcgaca ttggcaccaa cagcgtcggc tgggccgtca ttactgatga 1140
gtacaaggtc ccgtcgaaga agtttaaggt cctcggcaac actgaccgcc actccatcaa 1200
gaagaacctc atcggtgccc tcctttttga ctccggcgag accgctgagg ccactcgcct 1260
caagcgcact gcccgccgcc gttacacccg ccgcaagaac cgcatctgct acctccagga 1320
gattttctcg aacgaaatgg ccaaggtcga tgactccttt ttccaccgtc tcgaagaatc 1380
gttcctcgtc gaggaggaca agaagcacga gcgccacccc atcttcggta acattgtcga 1440
tgaggttgcc taccacgaga agtacccgac catctaccac ctccgcaaga agctcgtcga 1500
ctccaccgac aaggccgatc tccgccttat ctacctcgcc ctcgcccaca tgatcaagtt 1560
ccgcggccac tttcttatcg agggtgatct caaccctgat aactctgacg tcgacaagct 1620
tttcatccag ctcgtccaga cttacaacca gctcttcgag gagaacccca tcaacgcttc 1680
cggcgtcgac gcgaaggcca ttctcagcgc ccgcctcagc aagtcccgcc gcctcgaaaa 1740
cctcattgcc cagcttcccg gcgagaagaa gaacggcctc ttcggcaacc tcattgccct 1800
cagccttggc ctcaccccta acttcaagtc gaactttgac ctcgccgagg acgccaagct 1860
ccagctttcc aaggacactt acgacgacga tctcgacaac ctcctcgctc agattggcga 1920
ccagtacgct gacctcttcc tcgccgccaa gaaccttagc gatgccatcc tcctctccga 1980
catccttcgt gttaacacgg aaatcacgaa ggctccgctc tccgcctcca tgatcaagcg 2040
ttacgacgag caccatcagg acctcaccct cctcaaggcc ctcgtccgcc agcagctccc 2100
cgagaagtac aaggagatct tcttcgacca gagcaagaac ggctacgccg gctacattga 2160
cggcggcgcg tcgcaggagg agttttacaa gtttatcaag cccattcttg agaagatgga 2220
cggcaccgag gagctcctcg tcaagctcaa ccgtgaggac cttctccgca agcagcgcac 2280
gttcgacaac ggctctattc cccatcagat ccacctcggt gagcttcacg cgattcttcg 2340
ccgccaggaa gacttttacc cgttcctcaa ggacaaccgc gagaagattg agaagatcct 2400
cacctttcgc attccctact acgtcggccc cctcgcccgc ggcaactcgc gctttgcttg 2460
gatgacccgc aagtccgagg agaccatcac cccgtggaac ttcgaagagg tcgtcgacaa 2520
gggcgcctcc gcgcagtctt tcatcgagcg catgactaac tttgacaaga acctcccgaa 2580
cgagaaggtc ctccccaagc acagcctcct ttacgaatac tttacggtgt acaacgagct 2640
cacgaaggtc aagtacgtca ctgagggcat gcgcaagccg gcgttccttt cgggcgagca 2700
gaagaaggct atcgtcgacc tccttttcaa gaccaaccgc aaggttaccg tcaagcagct 2760
caaggaggac tacttcaaga agatcgagtg ctttgactcg gtcgagattt cgggcgtgga 2820
ggaccgtttc aacgcctccc tcggcactta ccacgacctt ctcaagatca tcaaggacaa 2880
ggactttctc gacaacgagg agaacgagga cattctcgag gacatcgtcc tcacgctcac 2940
cctctttgag gaccgtgaga tgatcgagga gcgcctcaag acctacgccc atctctttga 3000
cgacaaggtc atgaagcagc tcaagcgccg ccgctacacc ggctggggcc gcctttcccg 3060
caagctcatc aacggcatcc gcgacaagca gtctggcaag accatccttg actttcttaa 3120
gtctgatggt ttcgccaacc gcaacttcat gcagctcatc cacgacgaca gcctcacttt 3180
caaggaggac attcagaagg cccaggtctc cggccagggt gactctctcc acgaacacat 3240
cgccaacctt gctggcagcc cggctattaa gaagggcatc ctccagaccg tcaaggtcgt 3300
cgacgagctc gtcaaggtta tgggccgcca caagcccgag aacatcgtca ttgagatggc 3360
tcgcgaaaac cagaccaccc agaagggtca gaagaactcc cgcgagcgca tgaagcgtat 3420
cgaggagggc atcaaggagc tcggcagcca gatcctcaag gagcacccgg tcgagaacac 3480
ccagctccag aacgaaaagc tctacctcta ctacctccag aacggccgtg acatgtacgt 3540
tgaccaggag ctcgacatta accgcctctc cgattacgac gtcgaccata ttgtccccca 3600
gagctttctc aaggacgaca gcatcgacaa caaggtcctc acccgctcgg acaagaaccg 3660
cggcaagtcc gacaacgtcc cttccgagga ggtcgtgaag aagatgaaga actactggcg 3720
ccagcttctc aacgctaagc ttattactca gcgcaagttc gataacctca ccaaggccga 3780
acgcggcggc ctctccgagc tcgacaaggc cggttttatc aagcgccagc tcgttgagac 3840
tcgccagatc accaagcacg tggcgcagat cctcgactcg cgcatgaaca cgaagtacga 3900
cgagaacgac aagctcatcc gcgaggtcaa ggtcatcacc cttaagtcga agctcgtgtc 3960
cgactttcgc aaggacttcc agttctacaa ggtccgtgaa attaacaact accaccacgc 4020
tcacgacgct tacctcaacg cggtcgtggg taccgcgctc atcaagaagt acccgaagct 4080
cgagtcggag tttgtctacg gcgactacaa ggtctacgac gtgcgcaaga tgatcgccaa 4140
gtccgagcag gagatcggca aggccacggc caagtacttt ttctactcca acattatgaa 4200
cttctttaag actgagatca cccttgccaa cggcgagatc cgcaagcgcc cccttatcga 4260
gaccaacggc gagaccggcg aaattgtgtg ggataagggt cgcgactttg ccaccgtccg 4320
caaggtcctc agcatgcccc aggtcaacat tgttaagaag accgaggtcc agacgggcgg 4380
ctttagcaag gagtctatcc tccccaagcg taacagcgac aagctcatcg cccgcaagaa 4440
ggactgggac cctaagaagt acggcggctt cgattcgcct acggtcgcct acagcgtcct 4500
cgtcgtcgcc aaggtcgaga agggcaagtc caagaagctc aagtccgtca aggagctcct 4560
cggcatcacg atcatggagc gctccagctt tgagaagaac cccattgact tcctcgaggc 4620
taagggttac aaggaggtca agaaggacct tatcatcaag ctccccaagt actccctctt 4680
tgagctcgaa aacggccgca agcgtatgct cgctagcgct ggcgaactcc agaagggcaa 4740
cgagctcgcc ctccccagca agtacgtcaa ctttctctac ctcgcctccc actacgagaa 4800
gctcaagggt agcccggagg ataacgagca gaagcagctt tttgtggagc agcacaagca 4860
ctaccttgac gagatcattg aacagatctc cgagttctcc aagcgtgtta ttcttgctga 4920
cgccaacctc gataaggtgc tctccgcgta caacaagcac cgcgacaagc ctatccgcga 4980
gcaggccgag aacatcatcc acctctttac cctcaccaac ctcggcgccc cggccgcctt 5040
taagtacttt gatacgacta tcgaccgcaa gcgctacact tcgactaagg aggtcctcga 5100
cgctaccctc attcaccagt ccattaccgg cctctacgag acccgcattg acctttcgca 5160
gctcggtggc gactcgcgtg cggaccctaa gaagaagcgc aaggtctaac atatgagtta 5220
tgagatccga aagtgaacct tgtcctaacc cgacagcgaa tggcgggagg gggcgggcta 5280
aaagatcgta ttacatagta tttttcccct actctttgtg tttgtctttt tttttttttt 5340
gaacgcattc aagccacttg tctgggttta cttgtttgtt tgcttgcttg cttgcttgct 5400
tgcctgcttc ttggtcagac ggcccaaaaa agggaaaaaa ttcattcatg gcacagataa 5460
gaaaaagaaa aagtttgtcg accaccgtca tcagaaagca agagaagaga aacactcgcg 5520
ctcacattct cgctcgcgta agaatcttag ccacgcatac gaagtaattt gtccatctgg 5580
cgaatcttta catgagcgtt ttcaagctgg agcgtgagat catacctttc ttgatcgtaa 5640
tgttccaacc ttgcataggc ctcgttgcga tccgctagca atgcgtcgta ctcccgttgc 5700
aactgcgcca tcgcctcatt gtgacgtgag ttcagattct tctcgagacc ttcgagcgct 5760
gctaatttcg cctgacgctc cttcttttgt gcttccatga cacgccgctt caccgtgcgt 5820
tccacttctt cctcagacat gcccttggct gcctcgacct gctcggtaaa acgggcccca 5880
gcacgtgcta cgagatttcg attccaccgc cgccttctat gaaaggttgg gcttcggaat 5940
cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc tggagttctt 6000
cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 6060
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 6120
caatgtatct tatcatacat ggtcgacctg caggaacctg cattaatgaa tcggccaacg 6180
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 6240
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 6300
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 6360
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 6420
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 6480
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 6540
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 6600
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 6660
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 6720
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 6780
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 6840
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 6900
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 6960
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7020
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 7080
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 7140
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 7200
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 7260
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 7320
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 7380
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 7440
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 7500
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 7560
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 7620
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 7680
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 7740
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 7800
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 7860
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 7920
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 7980
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 8040
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 8100
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 8160
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg 8220
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg 8280
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 8340
gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccaagc 8400
ttccaatttt aggcccccca ctgaccgagg tctgtcgata atccactttt ccattgattt 8460
tccaggtttc gttaactcat gccactgagc aaaacttcgg tctttcctaa caaaagctct 8520
cctcacaaag catggcgcgg caacggacgt gtcctcatac tccactgcca cacaaggtcg 8580
ataaactaag ctcctcacaa atagaggaga attccactga caactgaaaa caatgtatga 8640
gagacgatca ccactggagc ggcgcggcgg ttgggcgcgg aggtcggcag caaaaacaag 8700
cgactcgccg agcaaacccg aatcagcctt cagacggtcg tgcctaacaa cacgccgttc 8760
taccccgcct tcttcgcgcc ccttcgcgtc caagcatcct tcaagtttat ctctctagtt 8820
caacttcaag aagaacaaca ccaccaacac catgattgaa caagatggat tgcacgcagg 8880
ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg 8940
ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa 9000
gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct 9060
ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga 9120
ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc 9180
cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac 9240
ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc 9300
cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact 9360
gttcgccagg ctcaaggcgc gcatgcccga cggcgatgat ctcgtcgtga cccatggcga 9420
tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg 9480
ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga 9540
agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga 9600
ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgacacg tgctacgaga 9660
tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc 9720
cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc accccaactt 9780
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 9840
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca 9900
tgtctgaatt cccggggtac 9920
<210> 2
<211> 7393
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB31 vector
<220>
<221> misc_feature
<222> (2)..(450)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (457)..(549)
<223> Sec1_signal_for_eGFP
<220>
<221> misc_feature
<222> (550)..(1266)
<223> eGFP
<220>
<221> misc_feature
<222> (1294)..(2293)
<223> OrfA_terminator
<220>
<221> misc_feature
<222> (4971)..(5970)
<223> OrfA_UP_homology
<220>
<221> misc_feature
<222> (5974)..(6289)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (6296)..(6744)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (6745)..(7119)
<223> Sh_ble_gene
<220>
<221> misc_feature
<222> (7120)..(7393)
<223> SV40_terminator
<400> 2
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatga agttcgcgac ctcggtcgca 480
attttgcttg tggccaacat agccaccgcc ctcgcgcaga gcgatggctg cacccccacc 540
gaccagacga tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc 600
gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat 660
gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc 720
tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac 780
cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc 840
accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc 900
gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc 960
ctgggacaca agctggagta caactacaac agccacaacg tctatatcat ggccgacaag 1020
cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga cggcagcgtg 1080
cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc 1140
gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat 1200
cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg 1260
tacaagcacc accatcacca ccactaacat atgatctaaa ctagtgaatc gcgacaagtt 1320
gtctttttgt tactctacgt actgctcttt ctaattttac gacgtatgct tctgctcttg 1380
acgacgacaa ccatggcaat aaaagtaagg caagaagtga gtgcgtgctc gctcacaagg 1440
tctaggccga aacgaggcgc cttaggattg gttgtctccg tcgtaagtca tgacggagcg 1500
taggacaccg acggcctgcc gcgcaaatat acgaaccgct gcacaattct tttcgttgag 1560
aacaacctcg aacggcctgc cttgctgagc tgccgacacg gtggaaggaa gcatagcggc 1620
caatcgaggg gatgctatta attaggcttg gcgctgctgc cgccgtgcct gaagatgtgc 1680
gcaagcgtgg caacaccgtc caccttgcca ttaaagtcat gcactccaaa tacctcgaac 1740
agagcctctc gcatgtttgg ccaagcacct tcgagagagt ctggactctc actccttcct 1800
caccgttgtc gccattctca gcgagctcat gcaatcacca ggacggagag acggccagct 1860
gcttttctgc tttccattgt tattagagaa acgcttctcg ctctcatcgt cttagtagac 1920
attccgatgg cttcgttcgc caatttgtca cctaagtaag ctagagtgtt aagtctaaat 1980
gcctttgacc cgcgtacggc gtcacgtaga tgcctgtcct tgccagcaaa cgctagttcg 2040
cggtgtgcgt aatttggccc gcattatgct ggctctcaaa atcaaccgcc accactcgcg 2100
gctgcacgat gattttcgtg cactcatgac atgagaaatg tgatactcaa actagtatag 2160
acctcctact cctactgctg cttttctcgt cagagctgtc tccggaaaag ttgacaagtt 2220
gttggccttc ttcttctctg ctagtaagta gatcatcatg gatgagacga tgatgataat 2280
gatgatgatg ataatttaaa tctcgagacc ttcgagcgct gctaatttcg cctgacgctc 2340
cttcttttgt gcttccatga cacgccgctt caccgtgcgt tccacttctt cctcagacat 2400
gcccttggct gcctcgacct gctcggtaaa acgggcccca gcacgtgcta cgagatttcg 2460
attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 2520
ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 2580
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 2640
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatacat 2700
ggtcgacctg caggaacctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 2760
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 2820
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 2880
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 2940
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 3000
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 3060
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 3120
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 3180
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 3240
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 3300
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 3360
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 3420
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 3480
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 3540
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 3600
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 3660
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 3720
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 3780
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 3840
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 3900
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 3960
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 4020
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 4080
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 4140
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 4200
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 4260
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 4320
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 4380
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 4440
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 4500
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 4560
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 4620
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 4680
catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct 4740
ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa 4800
acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga 4860
gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact 4920
atgcggcatc agagcagatt gtactgagag tgcaccaagc ttatttaaat ctttatcggt 4980
gtggcgcgcc ttgacggccg cctcggattc acttcgcagg gcacttctga cgcgctcaag 5040
cgtgcccagc gtggtgccat ctttggcctc tgcaagacca tcggcctcga gtggtccgag 5100
tctgacgtct tttcccgcgg cgtggacatt gctcagggca tgcaccccga ggatgccgcc 5160
gtggcgattg tgcgcgagat ggcgtgcgct gacattcgca ttcgcgaggt cggcattggc 5220
gcaaaccagc agcgctgcac gatccgtgcc gccaagctcg agaccggcaa cccgcagcgc 5280
cagatcgcca aggacgacgt gctgctcgtt tctggcggcg ctcgcggcat cacgcctctt 5340
tgcatccggg agatcacgcg ccagatcgcg ggcggcaagt acattctgct tggccgcagc 5400
aaggtctctg cgagcgaacc ggcatggtgc gctggcatca ctgacgagaa ggctgtgcaa 5460
aaggctgcta cccaggagct caagcgcgcc tttagcgctg gcgagggccc caagcccacg 5520
ccccgcgctg tcactaagct tgtgggctct gttcttggcg ctcgcgaggt gcgcagctct 5580
attgctgcga ttgaagcgct cggcggcaag gccatctact cgtcgtgcga cgtgaactct 5640
gccgccgacg tggccaaggc cgtgcgcgat gccgagtccc agctcggtgc ccgcgtctcg 5700
ggcatcgttc atgcctcggg cgtgctccgc gaccgtctca tcgagaagaa gctccccgac 5760
gagttcgacg ccgtctttgg caccaaggtc accggtctcg agaacctcct cgccgccgtc 5820
gaccgcgcca acctcaagca catggtcctc ttcagctcgc tcgccggctt ccacggcaac 5880
gtcggccagt ctgactacgc catggccaac gaggccctta acaagatggg cctcgagctc 5940
gccaaggacg tctcggtcaa gtcgatctgc taagaaagtg aaccttgtcc taacccgaca 6000
gcgaatggcg ggagggggcg ggctaaaaga tcgtattaca tagtattttc ccctactctt 6060
tgtgtttgtc tttttttttt ttgaacgcat tcaagccact tgtcttggtt tacttgtttg 6120
tttgcttgct tgcttgcttg cttgcctgct tcttggtcag acggacccaa aaaagggaaa 6180
aaattcattc atggcacaga taagaaaaag aaaaagtttg tcgaccaccg tcatcagaaa 6240
gcaagagaag agaaacactc gcgctcacat tctcgctcgc gtaagaatca agcttccaat 6300
tttaggcccc ccactgaccg aggtctgtcg ataatccact tttccattga ttttccaggt 6360
ttcgttaact catgccactg agcaaaactt cggtctttcc taacaaaagc tctcctcaca 6420
aagcatggcg cggcaacgga cgtgtcctca tactccactg ccacacaagg tcgataaact 6480
aagctcctca caaatagagg agaattccac tgacaactga aaacaatgta tgagagacga 6540
tcaccactgg agcggcgcgg cggttgggcg cggaggtcgg cagcaaaaac aagcgactcg 6600
ccgagcaaac ccgaatcagc cttcagacgg tcgtgcctaa caacacgccg ttctaccccg 6660
ccttcttcgc gccccttcgc gtccaagcat ccttcaagtt tatctctcta gttcaacttc 6720
aagaagaaca acaccaccaa caccatggcc aagttgacca gtgccgttcc ggtgctcacc 6780
gcgcgcgacg tcgccggagc ggtcgagttc tggaccgacc ggctcgggtt ctcccgggac 6840
ttcgtggagg acgacttcgc cggtgtggtc cgggacgacg tgaccctgtt catcagcgcg 6900
gtccaggacc aggtggtgcc ggacaacacc ctggcctggg tgtgggtgcg cggcctggac 6960
gagctgtacg ccgagtggtc ggaggtcgtg tccacgaact tccgggacgc ctccgggccg 7020
gccatgaccg agatcggcga gcagccgtgg gggcgggagt tcgccctgcg cgacccggcc 7080
ggcaactgcg tgcacttcgt ggccgaggag caggactgac acgtgctacg agatttcgat 7140
tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg 7200
atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt 7260
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 7320
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctga 7380
attcccgggg tac 7393
<210> 3
<211> 10702
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB32 vector
<220>
<221> misc_feature
<222> (2)..(450)
<223> alpha tubulin promoter
<220>
<221> misc_feature
<222> (457)..(4596)
<223> Cas9
<220>
<221> misc_feature
<222> (4603)..(5602)
<223> OrfA terminator
<220>
<221> misc_feature
<222> (8280)..(9279)
<223> OrfA UP homology
<220>
<221> misc_feature
<222> (9283)..(9598)
<223> OrfC terminator
<220>
<221> misc_feature
<222> (9605)..(10053)
<223> alpha tubulin promoter
<220>
<221> misc_feature
<222> (10054)..(10428)
<223> Sh ble gene
<220>
<221> misc_feature
<222> (10429)..(10702)
<223> SV40_terminator
<400> 3
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatgg ataagaagta ctcgatcggc 480
ctcgacattg gcaccaacag cgtcggctgg gccgtcatta ctgatgagta caaggtcccg 540
tcgaagaagt ttaaggtcct cggcaacact gaccgccact ccatcaagaa gaacctcatc 600
ggtgccctcc tttttgactc cggcgagacc gctgaggcca ctcgcctcaa gcgcactgcc 660
cgccgccgtt acacccgccg caagaaccgc atctgctacc tccaggagat tttctcgaac 720
gaaatggcca aggtcgatga ctcctttttc caccgtctcg aagaatcgtt cctcgtcgag 780
gaggacaaga agcacgagcg ccaccccatc ttcggtaaca ttgtcgatga ggttgcctac 840
cacgagaagt acccgaccat ctaccacctc cgcaagaagc tcgtcgactc caccgacaag 900
gccgatctcc gccttatcta cctcgccctc gcccacatga tcaagttccg cggccacttt 960
cttatcgagg gtgatctcaa ccctgataac tctgacgtcg acaagctttt catccagctc 1020
gtccagactt acaaccagct cttcgaggag aaccccatca acgcttccgg cgtcgacgcg 1080
aaggccattc tcagcgcccg cctcagcaag tcccgccgcc tcgaaaacct cattgcccag 1140
cttcccggcg agaagaagaa cggcctcttc ggcaacctca ttgccctcag ccttggcctc 1200
acccctaact tcaagtcgaa ctttgacctc gccgaggacg ccaagctcca gctttccaag 1260
gacacttacg acgacgatct cgacaacctc ctcgctcaga ttggcgacca gtacgctgac 1320
ctcttcctcg ccgccaagaa ccttagcgat gccatcctcc tctccgacat ccttcgtgtt 1380
aacacggaaa tcacgaaggc tccgctctcc gcctccatga tcaagcgtta cgacgagcac 1440
catcaggacc tcaccctcct caaggccctc gtccgccagc agctccccga gaagtacaag 1500
gagatcttct tcgaccagag caagaacggc tacgccggct acattgacgg cggcgcgtcg 1560
caggaggagt tttacaagtt tatcaagccc attcttgaga agatggacgg caccgaggag 1620
ctcctcgtca agctcaaccg tgaggacctt ctccgcaagc agcgcacgtt cgacaacggc 1680
tctattcccc atcagatcca cctcggtgag cttcacgcga ttcttcgccg ccaggaagac 1740
ttttacccgt tcctcaagga caaccgcgag aagattgaga agatcctcac ctttcgcatt 1800
ccctactacg tcggccccct cgcccgcggc aactcgcgct ttgcttggat gacccgcaag 1860
tccgaggaga ccatcacccc gtggaacttc gaagaggtcg tcgacaaggg cgcctccgcg 1920
cagtctttca tcgagcgcat gactaacttt gacaagaacc tcccgaacga gaaggtcctc 1980
cccaagcaca gcctccttta cgaatacttt acggtgtaca acgagctcac gaaggtcaag 2040
tacgtcactg agggcatgcg caagccggcg ttcctttcgg gcgagcagaa gaaggctatc 2100
gtcgacctcc ttttcaagac caaccgcaag gttaccgtca agcagctcaa ggaggactac 2160
ttcaagaaga tcgagtgctt tgactcggtc gagatttcgg gcgtggagga ccgtttcaac 2220
gcctccctcg gcacttacca cgaccttctc aagatcatca aggacaagga ctttctcgac 2280
aacgaggaga acgaggacat tctcgaggac atcgtcctca cgctcaccct ctttgaggac 2340
cgtgagatga tcgaggagcg cctcaagacc tacgcccatc tctttgacga caaggtcatg 2400
aagcagctca agcgccgccg ctacaccggc tggggccgcc tttcccgcaa gctcatcaac 2460
ggcatccgcg acaagcagtc tggcaagacc atccttgact ttcttaagtc tgatggtttc 2520
gccaaccgca acttcatgca gctcatccac gacgacagcc tcactttcaa ggaggacatt 2580
cagaaggccc aggtctccgg ccagggtgac tctctccacg aacacatcgc caaccttgct 2640
ggcagcccgg ctattaagaa gggcatcctc cagaccgtca aggtcgtcga cgagctcgtc 2700
aaggttatgg gccgccacaa gcccgagaac atcgtcattg agatggctcg cgaaaaccag 2760
accacccaga agggtcagaa gaactcccgc gagcgcatga agcgtatcga ggagggcatc 2820
aaggagctcg gcagccagat cctcaaggag cacccggtcg agaacaccca gctccagaac 2880
gaaaagctct acctctacta cctccagaac ggccgtgaca tgtacgttga ccaggagctc 2940
gacattaacc gcctctccga ttacgacgtc gaccatattg tcccccagag ctttctcaag 3000
gacgacagca tcgacaacaa ggtcctcacc cgctcggaca agaaccgcgg caagtccgac 3060
aacgtccctt ccgaggaggt cgtgaagaag atgaagaact actggcgcca gcttctcaac 3120
gctaagctta ttactcagcg caagttcgat aacctcacca aggccgaacg cggcggcctc 3180
tccgagctcg acaaggccgg ttttatcaag cgccagctcg ttgagactcg ccagatcacc 3240
aagcacgtgg cgcagatcct cgactcgcgc atgaacacga agtacgacga gaacgacaag 3300
ctcatccgcg aggtcaaggt catcaccctt aagtcgaagc tcgtgtccga ctttcgcaag 3360
gacttccagt tctacaaggt ccgtgaaatt aacaactacc accacgctca cgacgcttac 3420
ctcaacgcgg tcgtgggtac cgcgctcatc aagaagtacc cgaagctcga gtcggagttt 3480
gtctacggcg actacaaggt ctacgacgtg cgcaagatga tcgccaagtc cgagcaggag 3540
atcggcaagg ccacggccaa gtactttttc tactccaaca ttatgaactt ctttaagact 3600
gagatcaccc ttgccaacgg cgagatccgc aagcgccccc ttatcgagac caacggcgag 3660
accggcgaaa ttgtgtggga taagggtcgc gactttgcca ccgtccgcaa ggtcctcagc 3720
atgccccagg tcaacattgt taagaagacc gaggtccaga cgggcggctt tagcaaggag 3780
tctatcctcc ccaagcgtaa cagcgacaag ctcatcgccc gcaagaagga ctgggaccct 3840
aagaagtacg gcggcttcga ttcgcctacg gtcgcctaca gcgtcctcgt cgtcgccaag 3900
gtcgagaagg gcaagtccaa gaagctcaag tccgtcaagg agctcctcgg catcacgatc 3960
atggagcgct ccagctttga gaagaacccc attgacttcc tcgaggctaa gggttacaag 4020
gaggtcaaga aggaccttat catcaagctc cccaagtact ccctctttga gctcgaaaac 4080
ggccgcaagc gtatgctcgc tagcgctggc gaactccaga agggcaacga gctcgccctc 4140
cccagcaagt acgtcaactt tctctacctc gcctcccact acgagaagct caagggtagc 4200
ccggaggata acgagcagaa gcagcttttt gtggagcagc acaagcacta ccttgacgag 4260
atcattgaac agatctccga gttctccaag cgtgttattc ttgctgacgc caacctcgat 4320
aaggtgctct ccgcgtacaa caagcaccgc gacaagccta tccgcgagca ggccgagaac 4380
atcatccacc tctttaccct caccaacctc ggcgccccgg ccgcctttaa gtactttgat 4440
acgactatcg accgcaagcg ctacacttcg actaaggagg tcctcgacgc taccctcatt 4500
caccagtcca ttaccggcct ctacgagacc cgcattgacc tttcgcagct cggtggcgac 4560
tcgcgtgcgg accctaagaa gaagcgcaag gtctaacata tgatctaaac tagtgaatcg 4620
cgacaagttg tctttttgtt actctacgta ctgctctttc taattttacg acgtatgctt 4680
ctgctcttga cgacgacaac catggcaata aaagtaaggc aagaagtgag tgcgtgctcg 4740
ctcacaaggt ctaggccgaa acgaggcgcc ttaggattgg ttgtctccgt cgtaagtcat 4800
gacggagcgt aggacaccga cggcctgccg cgcaaatata cgaaccgctg cacaattctt 4860
ttcgttgaga acaacctcga acggcctgcc ttgctgagct gccgacacgg tggaaggaag 4920
catagcggcc aatcgagggg atgctattaa ttaggcttgg cgctgctgcc gccgtgcctg 4980
aagatgtgcg caagcgtggc aacaccgtcc accttgccat taaagtcatg cactccaaat 5040
acctcgaaca gagcctctcg catgtttggc caagcacctt cgagagagtc tggactctca 5100
ctccttcctc accgttgtcg ccattctcag cgagctcatg caatcaccag gacggagaga 5160
cggccagctg cttttctgct ttccattgtt attagagaaa cgcttctcgc tctcatcgtc 5220
ttagtagaca ttccgatggc ttcgttcgcc aatttgtcac ctaagtaagc tagagtgtta 5280
agtctaaatg cctttgaccc gcgtacggcg tcacgtagat gcctgtcctt gccagcaaac 5340
gctagttcgc ggtgtgcgta atttggcccg cattatgctg gctctcaaaa tcaaccgcca 5400
ccactcgcgg ctgcacgatg attttcgtgc actcatgaca tgagaaatgt gatactcaaa 5460
ctagtataga cctcctactc ctactgctgc ttttctcgtc agagctgtct ccggaaaagt 5520
tgacaagttg ttggccttct tcttctctgc tagtaagtag atcatcatgg atgagacgat 5580
gatgataatg atgatgatga taatttaaat ctcgagacct tcgagcgctg ctaatttcgc 5640
ctgacgctcc ttcttttgtg cttccatgac acgccgcttc accgtgcgtt ccacttcttc 5700
ctcagacatg cccttggctg cctcgacctg ctcggtaaaa cgggccccag cacgtgctac 5760
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 5820
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 5880
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 5940
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 6000
atcatacatg gtcgacctgc aggaacctgc attaatgaat cggccaacgc gcggggagag 6060
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 6120
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6180
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6240
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6300
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6360
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 6420
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 6480
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 6540
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 6600
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 6660
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 6720
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6780
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6840
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6900
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6960
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 7020
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 7080
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 7140
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 7200
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 7260
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 7320
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 7380
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 7440
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 7500
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 7560
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 7620
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 7680
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 7740
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 7800
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 7860
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 7920
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 7980
ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga 8040
cattaaccta taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg 8100
acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg 8160
atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct 8220
ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccaagct tatttaaatc 8280
tttatcggtg tggcgcgcct tgacggccgc ctcggattca cttcgcaggg cacttctgac 8340
gcgctcaagc gtgcccagcg tggtgccatc tttggcctct gcaagaccat cggcctcgag 8400
tggtccgagt ctgacgtctt ttcccgcggc gtggacattg ctcagggcat gcaccccgag 8460
gatgccgccg tggcgattgt gcgcgagatg gcgtgcgctg acattcgcat tcgcgaggtc 8520
ggcattggcg caaaccagca gcgctgcacg atccgtgccg ccaagctcga gaccggcaac 8580
ccgcagcgcc agatcgccaa ggacgacgtg ctgctcgttt ctggcggcgc tcgcggcatc 8640
acgcctcttt gcatccggga gatcacgcgc cagatcgcgg gcggcaagta cattctgctt 8700
ggccgcagca aggtctctgc gagcgaaccg gcatggtgcg ctggcatcac tgacgagaag 8760
gctgtgcaaa aggctgctac ccaggagctc aagcgcgcct ttagcgctgg cgagggcccc 8820
aagcccacgc cccgcgctgt cactaagctt gtgggctctg ttcttggcgc tcgcgaggtg 8880
cgcagctcta ttgctgcgat tgaagcgctc ggcggcaagg ccatctactc gtcgtgcgac 8940
gtgaactctg ccgccgacgt ggccaaggcc gtgcgcgatg ccgagtccca gctcggtgcc 9000
cgcgtctcgg gcatcgttca tgcctcgggc gtgctccgcg accgtctcat cgagaagaag 9060
ctccccgacg agttcgacgc cgtctttggc accaaggtca ccggtctcga gaacctcctc 9120
gccgccgtcg accgcgccaa cctcaagcac atggtcctct tcagctcgct cgccggcttc 9180
cacggcaacg tcggccagtc tgactacgcc atggccaacg aggcccttaa caagatgggc 9240
ctcgagctcg ccaaggacgt ctcggtcaag tcgatctgct aagaaagtga accttgtcct 9300
aacccgacag cgaatggcgg gagggggcgg gctaaaagat cgtattacat agtattttcc 9360
cctactcttt gtgtttgtct tttttttttt tgaacgcatt caagccactt gtcttggttt 9420
acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt cttggtcaga cggacccaaa 9480
aaagggaaaa aattcattca tggcacagat aagaaaaaga aaaagtttgt cgaccaccgt 9540
catcagaaag caagagaaga gaaacactcg cgctcacatt ctcgctcgcg taagaatcaa 9600
gcttccaatt ttaggccccc cactgaccga ggtctgtcga taatccactt ttccattgat 9660
tttccaggtt tcgttaactc atgccactga gcaaaacttc ggtctttcct aacaaaagct 9720
ctcctcacaa agcatggcgc ggcaacggac gtgtcctcat actccactgc cacacaaggt 9780
cgataaacta agctcctcac aaatagagga gaattccact gacaactgaa aacaatgtat 9840
gagagacgat caccactgga gcggcgcggc ggttgggcgc ggaggtcggc agcaaaaaca 9900
agcgactcgc cgagcaaacc cgaatcagcc ttcagacggt cgtgcctaac aacacgccgt 9960
tctaccccgc cttcttcgcg ccccttcgcg tccaagcatc cttcaagttt atctctctag 10020
ttcaacttca agaagaacaa caccaccaac accatggcca agttgaccag tgccgttccg 10080
gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct ggaccgaccg gctcgggttc 10140
tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc 10200
atcagcgcgg tccaggacca ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc 10260
ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc 10320
tccgggccgg ccatgaccga gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc 10380
gacccggccg gcaactgcgt gcacttcgtg gccgaggagc aggactgaca cgtgctacga 10440
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 10500
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 10560
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 10620
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 10680
catgtctgaa ttcccggggt ac 10702
<210> 4
<211> 11332
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB33 vector
<220>
<221> misc_feature
<222> (2)..(1006)
<223> CS_promoter
<220>
<221> misc_feature
<222> (1013)..(5152)
<223> Cas9
<220>
<221> misc_feature
<222> (5159)..(6158)
<223> OrfA_terminator
<220>
<221> misc_feature
<222> (8836)..(9835)
<223> OrfA_UP_homology
<220>
<221> misc_feature
<222> (9839)..(10154)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (10161)..(10609)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (10610)..(10984)
<223> Sh_ble_gene
<220>
<221> misc_feature
<222> (10985)..(11258)
<223> SV40_terminator
<400> 4
cgagcgggcg attccaccgt caactggtct tcgcctgtgc cttccagcgc agtgcgcctt 60
gccccgctcg gtcttattat tcttggcgct ctcgtcaatg tgatcatgat ctagtcgaac 120
gtgcaatcta gccaatgaaa aaagagtcca gttctatctg aatttttcac tttctaaatc 180
tcgcatcgac aatctacttt tcaaatctcg caacaaagct gatcttgttt ctccctcacc 240
cagttctatc tgaatttttc cttttctgaa gctcgcgtta acaatctact tttcgaatct 300
gtcaacaaag ctgatcttgt ttctcccccc tatccccttc cctcccccct tctttgggat 360
cttgttgtgc gtgtcgcccc ttcaacttct ttgttcgacg atgacctcca cctagcctgt 420
gaagctcatc gtctccgagt atttctggcc tgctccaatt cctctcttcc attctccatc 480
gcatacatgc atgttctttg gtctcactcc gagccatgct tcttcggtca ctacttcatc 540
tatttgacta ggcctctgtt cgagcgacga accctccgtg ttcgcgggtg ttcattctct 600
gcaaagtggt ccgtaaccgt gactaccgga cacctcgcgt acactacatt cgggacggac 660
gcggccgagc gcgacgtctc tgggcccggc ctgccgcccc cggggccgcg gcttcctcgc 720
gccgccagcc gcgtccaagt cgccagcgcg aggtcgcgcg agtcgaagga gacgttgtcg 780
atctcgaccc tcgccatgcg cgtgacgggt gaccgcctca ccggatcccg ccctccgcgc 840
gctgccttca ttccttcatt ccttcattcc ttcactcaat cctgcatcat ccatcgcccg 900
cccgcccgct cgcacgcacc agaggcgcgc attgcgggcc agggcgccgc ctgcagaccg 960
ccatcgcgcc cgccttctgc cgcgcctcgc tcgctcggag accgagggat ccatggataa 1020
gaagtactcg atcggcctcg acattggcac caacagcgtc ggctgggccg tcattactga 1080
tgagtacaag gtcccgtcga agaagtttaa ggtcctcggc aacactgacc gccactccat 1140
caagaagaac ctcatcggtg ccctcctttt tgactccggc gagaccgctg aggccactcg 1200
cctcaagcgc actgcccgcc gccgttacac ccgccgcaag aaccgcatct gctacctcca 1260
ggagattttc tcgaacgaaa tggccaaggt cgatgactcc tttttccacc gtctcgaaga 1320
atcgttcctc gtcgaggagg acaagaagca cgagcgccac cccatcttcg gtaacattgt 1380
cgatgaggtt gcctaccacg agaagtaccc gaccatctac cacctccgca agaagctcgt 1440
cgactccacc gacaaggccg atctccgcct tatctacctc gccctcgccc acatgatcaa 1500
gttccgcggc cactttctta tcgagggtga tctcaaccct gataactctg acgtcgacaa 1560
gcttttcatc cagctcgtcc agacttacaa ccagctcttc gaggagaacc ccatcaacgc 1620
ttccggcgtc gacgcgaagg ccattctcag cgcccgcctc agcaagtccc gccgcctcga 1680
aaacctcatt gcccagcttc ccggcgagaa gaagaacggc ctcttcggca acctcattgc 1740
cctcagcctt ggcctcaccc ctaacttcaa gtcgaacttt gacctcgccg aggacgccaa 1800
gctccagctt tccaaggaca cttacgacga cgatctcgac aacctcctcg ctcagattgg 1860
cgaccagtac gctgacctct tcctcgccgc caagaacctt agcgatgcca tcctcctctc 1920
cgacatcctt cgtgttaaca cggaaatcac gaaggctccg ctctccgcct ccatgatcaa 1980
gcgttacgac gagcaccatc aggacctcac cctcctcaag gccctcgtcc gccagcagct 2040
ccccgagaag tacaaggaga tcttcttcga ccagagcaag aacggctacg ccggctacat 2100
tgacggcggc gcgtcgcagg aggagtttta caagtttatc aagcccattc ttgagaagat 2160
ggacggcacc gaggagctcc tcgtcaagct caaccgtgag gaccttctcc gcaagcagcg 2220
cacgttcgac aacggctcta ttccccatca gatccacctc ggtgagcttc acgcgattct 2280
tcgccgccag gaagactttt acccgttcct caaggacaac cgcgagaaga ttgagaagat 2340
cctcaccttt cgcattccct actacgtcgg ccccctcgcc cgcggcaact cgcgctttgc 2400
ttggatgacc cgcaagtccg aggagaccat caccccgtgg aacttcgaag aggtcgtcga 2460
caagggcgcc tccgcgcagt ctttcatcga gcgcatgact aactttgaca agaacctccc 2520
gaacgagaag gtcctcccca agcacagcct cctttacgaa tactttacgg tgtacaacga 2580
gctcacgaag gtcaagtacg tcactgaggg catgcgcaag ccggcgttcc tttcgggcga 2640
gcagaagaag gctatcgtcg acctcctttt caagaccaac cgcaaggtta ccgtcaagca 2700
gctcaaggag gactacttca agaagatcga gtgctttgac tcggtcgaga tttcgggcgt 2760
ggaggaccgt ttcaacgcct ccctcggcac ttaccacgac cttctcaaga tcatcaagga 2820
caaggacttt ctcgacaacg aggagaacga ggacattctc gaggacatcg tcctcacgct 2880
caccctcttt gaggaccgtg agatgatcga ggagcgcctc aagacctacg cccatctctt 2940
tgacgacaag gtcatgaagc agctcaagcg ccgccgctac accggctggg gccgcctttc 3000
ccgcaagctc atcaacggca tccgcgacaa gcagtctggc aagaccatcc ttgactttct 3060
taagtctgat ggtttcgcca accgcaactt catgcagctc atccacgacg acagcctcac 3120
tttcaaggag gacattcaga aggcccaggt ctccggccag ggtgactctc tccacgaaca 3180
catcgccaac cttgctggca gcccggctat taagaagggc atcctccaga ccgtcaaggt 3240
cgtcgacgag ctcgtcaagg ttatgggccg ccacaagccc gagaacatcg tcattgagat 3300
ggctcgcgaa aaccagacca cccagaaggg tcagaagaac tcccgcgagc gcatgaagcg 3360
tatcgaggag ggcatcaagg agctcggcag ccagatcctc aaggagcacc cggtcgagaa 3420
cacccagctc cagaacgaaa agctctacct ctactacctc cagaacggcc gtgacatgta 3480
cgttgaccag gagctcgaca ttaaccgcct ctccgattac gacgtcgacc atattgtccc 3540
ccagagcttt ctcaaggacg acagcatcga caacaaggtc ctcacccgct cggacaagaa 3600
ccgcggcaag tccgacaacg tcccttccga ggaggtcgtg aagaagatga agaactactg 3660
gcgccagctt ctcaacgcta agcttattac tcagcgcaag ttcgataacc tcaccaaggc 3720
cgaacgcggc ggcctctccg agctcgacaa ggccggtttt atcaagcgcc agctcgttga 3780
gactcgccag atcaccaagc acgtggcgca gatcctcgac tcgcgcatga acacgaagta 3840
cgacgagaac gacaagctca tccgcgaggt caaggtcatc acccttaagt cgaagctcgt 3900
gtccgacttt cgcaaggact tccagttcta caaggtccgt gaaattaaca actaccacca 3960
cgctcacgac gcttacctca acgcggtcgt gggtaccgcg ctcatcaaga agtacccgaa 4020
gctcgagtcg gagtttgtct acggcgacta caaggtctac gacgtgcgca agatgatcgc 4080
caagtccgag caggagatcg gcaaggccac ggccaagtac tttttctact ccaacattat 4140
gaacttcttt aagactgaga tcacccttgc caacggcgag atccgcaagc gcccccttat 4200
cgagaccaac ggcgagaccg gcgaaattgt gtgggataag ggtcgcgact ttgccaccgt 4260
ccgcaaggtc ctcagcatgc cccaggtcaa cattgttaag aagaccgagg tccagacggg 4320
cggctttagc aaggagtcta tcctccccaa gcgtaacagc gacaagctca tcgcccgcaa 4380
gaaggactgg gaccctaaga agtacggcgg cttcgattcg cctacggtcg cctacagcgt 4440
cctcgtcgtc gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaggagct 4500
cctcggcatc acgatcatgg agcgctccag ctttgagaag aaccccattg acttcctcga 4560
ggctaagggt tacaaggagg tcaagaagga ccttatcatc aagctcccca agtactccct 4620
ctttgagctc gaaaacggcc gcaagcgtat gctcgctagc gctggcgaac tccagaaggg 4680
caacgagctc gccctcccca gcaagtacgt caactttctc tacctcgcct cccactacga 4740
gaagctcaag ggtagcccgg aggataacga gcagaagcag ctttttgtgg agcagcacaa 4800
gcactacctt gacgagatca ttgaacagat ctccgagttc tccaagcgtg ttattcttgc 4860
tgacgccaac ctcgataagg tgctctccgc gtacaacaag caccgcgaca agcctatccg 4920
cgagcaggcc gagaacatca tccacctctt taccctcacc aacctcggcg ccccggccgc 4980
ctttaagtac tttgatacga ctatcgaccg caagcgctac acttcgacta aggaggtcct 5040
cgacgctacc ctcattcacc agtccattac cggcctctac gagacccgca ttgacctttc 5100
gcagctcggt ggcgactcgc gtgcggaccc taagaagaag cgcaaggtct aacatatgat 5160
ctaaactagt gaatcgcgac aagttgtctt tttgttactc tacgtactgc tctttctaat 5220
tttacgacgt atgcttctgc tcttgacgac gacaaccatg gcaataaaag taaggcaaga 5280
agtgagtgcg tgctcgctca caaggtctag gccgaaacga ggcgccttag gattggttgt 5340
ctccgtcgta agtcatgacg gagcgtagga caccgacggc ctgccgcgca aatatacgaa 5400
ccgctgcaca attcttttcg ttgagaacaa cctcgaacgg cctgccttgc tgagctgccg 5460
acacggtgga aggaagcata gcggccaatc gaggggatgc tattaattag gcttggcgct 5520
gctgccgccg tgcctgaaga tgtgcgcaag cgtggcaaca ccgtccacct tgccattaaa 5580
gtcatgcact ccaaatacct cgaacagagc ctctcgcatg tttggccaag caccttcgag 5640
agagtctgga ctctcactcc ttcctcaccg ttgtcgccat tctcagcgag ctcatgcaat 5700
caccaggacg gagagacggc cagctgcttt tctgctttcc attgttatta gagaaacgct 5760
tctcgctctc atcgtcttag tagacattcc gatggcttcg ttcgccaatt tgtcacctaa 5820
gtaagctaga gtgttaagtc taaatgcctt tgacccgcgt acggcgtcac gtagatgcct 5880
gtccttgcca gcaaacgcta gttcgcggtg tgcgtaattt ggcccgcatt atgctggctc 5940
tcaaaatcaa ccgccaccac tcgcggctgc acgatgattt tcgtgcactc atgacatgag 6000
aaatgtgata ctcaaactag tatagacctc ctactcctac tgctgctttt ctcgtcagag 6060
ctgtctccgg aaaagttgac aagttgttgg ccttcttctt ctctgctagt aagtagatca 6120
tcatggatga gacgatgatg ataatgatga tgatgataat ttaaatctcg agaccttcga 6180
gcgctgctaa tttcgcctga cgctccttct tttgtgcttc catgacacgc cgcttcaccg 6240
tgcgttccac ttcttcctca gacatgccct tggctgcctc gacctgctcg gtaaaacggg 6300
ccccagcacg tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 6360
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 6420
ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 6480
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 6540
ctcatcaatg tatcttatca tacatggtcg acctgcagga acctgcatta atgaatcggc 6600
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 6660
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 6720
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 6780
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 6840
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 6900
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 6960
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 7020
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 7080
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 7140
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 7200
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 7260
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 7320
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 7380
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 7440
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 7500
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 7560
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 7620
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 7680
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 7740
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 7800
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 7860
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 7920
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 7980
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 8040
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 8100
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 8160
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 8220
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 8280
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 8340
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 8400
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 8460
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 8520
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 8580
accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 8640
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 8700
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 8760
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 8820
caagcttatt taaatcttta tcggtgtggc gcgccttgac ggccgcctcg gattcacttc 8880
gcagggcact tctgacgcgc tcaagcgtgc ccagcgtggt gccatctttg gcctctgcaa 8940
gaccatcggc ctcgagtggt ccgagtctga cgtcttttcc cgcggcgtgg acattgctca 9000
gggcatgcac cccgaggatg ccgccgtggc gattgtgcgc gagatggcgt gcgctgacat 9060
tcgcattcgc gaggtcggca ttggcgcaaa ccagcagcgc tgcacgatcc gtgccgccaa 9120
gctcgagacc ggcaacccgc agcgccagat cgccaaggac gacgtgctgc tcgtttctgg 9180
cggcgctcgc ggcatcacgc ctctttgcat ccgggagatc acgcgccaga tcgcgggcgg 9240
caagtacatt ctgcttggcc gcagcaaggt ctctgcgagc gaaccggcat ggtgcgctgg 9300
catcactgac gagaaggctg tgcaaaaggc tgctacccag gagctcaagc gcgcctttag 9360
cgctggcgag ggccccaagc ccacgccccg cgctgtcact aagcttgtgg gctctgttct 9420
tggcgctcgc gaggtgcgca gctctattgc tgcgattgaa gcgctcggcg gcaaggccat 9480
ctactcgtcg tgcgacgtga actctgccgc cgacgtggcc aaggccgtgc gcgatgccga 9540
gtcccagctc ggtgcccgcg tctcgggcat cgttcatgcc tcgggcgtgc tccgcgaccg 9600
tctcatcgag aagaagctcc ccgacgagtt cgacgccgtc tttggcacca aggtcaccgg 9660
tctcgagaac ctcctcgccg ccgtcgaccg cgccaacctc aagcacatgg tcctcttcag 9720
ctcgctcgcc ggcttccacg gcaacgtcgg ccagtctgac tacgccatgg ccaacgaggc 9780
ccttaacaag atgggcctcg agctcgccaa ggacgtctcg gtcaagtcga tctgctaaga 9840
aagtgaacct tgtcctaacc cgacagcgaa tggcgggagg gggcgggcta aaagatcgta 9900
ttacatagta ttttccccta ctctttgtgt ttgtcttttt tttttttgaa cgcattcaag 9960
ccacttgtct tggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 10020
gtcagacgga cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 10080
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 10140
ctcgcgtaag aatcaagctt ccaattttag gccccccact gaccgaggtc tgtcgataat 10200
ccacttttcc attgattttc caggtttcgt taactcatgc cactgagcaa aacttcggtc 10260
tttcctaaca aaagctctcc tcacaaagca tggcgcggca acggacgtgt cctcatactc 10320
cactgccaca caaggtcgat aaactaagct cctcacaaat agaggagaat tccactgaca 10380
actgaaaaca atgtatgaga gacgatcacc actggagcgg cgcggcggtt gggcgcggag 10440
gtcggcagca aaaacaagcg actcgccgag caaacccgaa tcagccttca gacggtcgtg 10500
cctaacaaca cgccgttcta ccccgccttc ttcgcgcccc ttcgcgtcca agcatccttc 10560
aagtttatct ctctagttca acttcaagaa gaacaacacc accaacaccc caattttagg 10620
ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc aggtttcgtt 10680
aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct cacaaagcat 10740
ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata aactaagctc 10800
ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag acgatcacca 10860
ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga ctcgccgagc 10920
aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac cccgccttct 10980
tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa cttcaagaag 11040
aacaacacca ccaacaccca cgtgctacga gatttcgatt ccaccgccgc cttctatgaa 11100
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 11160
ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 11220
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 11280
ggtttgtcca aactcatcaa tgtatcttat catgtctgaa ttcccggggt ac 11332
<210> 5
<211> 4777
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL399 vector
<220>
<221> misc_feature
<222> (1)..(2523)
<223> FAS_fragment
<220>
<221> misc_feature
<222> (2528)..(4777)
<223> pSP73_fragment
<400> 5
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gcctcgagca 1200
acaaaagaag cagcagcagc agcagcacga gcagcagcag cagcagcacg agcagcagca 1260
gcacgagcag cagcagcagc agcagcaaga tggcgcagcc cgagtcgacg acgccgacca 1320
tgacgcccga ggaaggccag atggaggggg cgccgcagca ggataatgcc caggtgaaga 1380
agcactgctt cgccgacgcc gatgtggcaa cctgcatcgc cgcctttggc ggtcagggaa 1440
gcgactggct cagtgagctg cgctccctcc aggaaaaggg ccagaccaac gtgcgagaaa 1500
ccatcgaact cgcactcgac aaactcgagg atcttgtcaa ggccgagccc tggtacgagg 1560
agcacggagg atgcgatatc cgcgcctggc tcgagagcga cgacaatgtc cccaacttcg 1620
acctcctccg ctacgcgccc gtctccttcc ccctcatctt cctcacccaa atgtgcaatt 1680
acatgcgtgt cctcgagaaa ctcggcacct gccatgaaga cgccctccaa aagggctggg 1740
tcaaggcctc gctcggacac agccagggcg tcgtctccgc cgccgtcgtt gccgcagcca 1800
acaccgaccg cgagctgcgc aacctcgtgg tctccggcct cgaatacatg tcaaaagtcg 1860
gcatcgccgc ccagcgcacg ctcgactacg agctcggacg ccgcaacgcc ggcccggaga 1920
ccccgatgct cgctgtacag ggaatggacg aaaaagtcct taccaaggcc ttcaaggccg 1980
ccgtctcgct ctccaacgag aagcaggcca tgatggccaa aatctcccca cggccgccgc 2040
cgccaccgcc gccccggccg ccgttagcga cgaagatcgc ttctccatcg ccctccgcaa 2100
cggccacgac gactttgtcg tctgcggcga gcccaaggac ctgcgcgtcc tccgcaaggt 2160
catcgagaaa cagagcgccg agcccggcaa ggaggcacag gcgcgcacgc ccttttccaa 2220
gcgcaagccc gtcacccaga ccaccttcct ccgcatgacg gccgtcttcc acagcgctct 2280
caacaaggac gccctcgccc agatcaacac atgggccccg gagtccgcct ttagcaaggc 2340
cttcgcccag gcctcgctcc gtgttcccgt ctttgacacc aagtctggcg ctaatctgca 2400
agatgttccc gccgccgatg ttgtcgccca tcttaccacc aacatgctca ctgagcgcgc 2460
cgacgttctc gtctccctcc gtgccgccga gaccaagacc gacgccagcc acctcctctg 2520
tttaaacgtt aacctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 2580
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 2640
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 2700
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 2760
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 2820
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 2880
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 2940
ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt 3000
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 3060
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 3120
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 3180
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 3240
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 3300
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 3360
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 3420
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 3480
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 3540
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 3600
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 3660
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 3720
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 3780
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 3840
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 3900
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 3960
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 4020
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 4080
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 4140
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 4200
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 4260
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 4320
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 4380
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 4440
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 4500
tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa 4560
aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct 4620
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 4680
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc 4740
ggcatcagag cagattgtac tgagagtgca ccatatg 4777
<210> 6
<211> 4775
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL400 vector
<220>
<221> misc_feature
<222> (1)..(2528)
<223> Fas_fragment
<220>
<221> misc_feature
<222> (2533)..(4775)
<223> pSP73_fragment
<400> 6
ccatggttta aactcgcggc gtcttcgccg tcgaggcgcg tctttcgagg cgggcgaggt 60
gtttttcttt tcttttcttc tcgctgcagc tgcgccgcgg cgaacgcagt tcgccgcggc 120
ggctgcgacg cgcctgcgat gtctatgcgc aggcaaggca cgacgtcttg cggcgccgct 180
tcctgcgccg ccttgcgtct tggccccgcc gacgacgcaa gcagcggcgg cgcccccccg 240
ccctcctcca ctgtgggccg cagccctcct tttcgcgcgc ccgcagccgc gcggcgcgcc 300
ccgcgaacaa agagccgccg cgccggtccg cactgcgcgg gccgccccgc aagtgccgca 360
aacgccggcc cgaaccgccg caaacgcgcc cgcagccgcg cccgcagccg cgcgcgaccc 420
gcggtgggga cgcgcgccaa gcgtcccctt ccgcgggatg acgtaggcgg cggccccgcc 480
tatgcaatac gggaggaacc aggaaccggg aggggggggg ggcggcgcgc gcgccgtcca 540
gtgcgggacc gatcggcgcc gggatgcccg ggcgggaggg acacagccag gcagtcagtc 600
agtcagccgc acagagagag cgcgcctgcg agtcccgtct ggtctcggaa ttgtatcccg 660
cgcagagctc agaatcgcag gtcgatcgat cgagcgatgg atccatcgct ctatccgtcc 720
atcgatccat cgcatccatc gcatccatcg catccatcgt tgcatcgctt gcaccgcccg 780
cttgcatcgc gtgcgtgcgc aggcgggcgg cggccacgac gcgaccgaga gcggcggcga 840
gtgcagacgc cgccggcgcc cgcggctgcg tcgccgcagg aagaaggagg ggggcgcgtg 900
tttcccgcgg gagggaggag ggagggaggg aggtggttgg gccaaaaagg gcggcctgga 960
caggcaggca ggccggaagc gacgccagcg agcgaaggaa gaggagagag ccgcgcgggc 1020
ggccagcgcg gggcgggcgg cagcaaaccc gctactcagg gtaaaagaca gacagctctt 1080
cgagcgagct tgttcacttc gcggaagcac gcgcgcaggc acgcaggcac gcaggcagca 1140
tagcgagcag cagcagcatc gcgagcagca ttgcgagagg aggcgctgac cgccggcctc 1200
gagcaacaaa agaagcagca gcagcagcag cacgagcagc agcagcagca gcacgagcag 1260
cagcagcacg agcagcagca gcagcagcag caagatggcg cagcccgagt cgacgacgcc 1320
gaccatgacg cccgaggaag gccagatgga gggggcgccg cagcaggata atgcccaggt 1380
gaagaagcac tgcttcgccg acgccgatgt ggcaacctgc atcgccgcct ttggcggtca 1440
gggaagcgac tggctcagtg agctgcgctc cctccaggaa aagggccaga ccaacgtgcg 1500
agaaaccatc gaactcgcac tcgacaaact cgaggatctt gtcaaggccg agccctggta 1560
cgaggagcac ggaggatgcg atatccgcgc ctggctcgag agcgacgaca atgtccccaa 1620
cttcgacctc ctccgctacg cgcccgtctc cttccccctc atcttcctca cccaaatgtg 1680
caattacatg cgtgtcctcg agaaactcgg cacctgccat gaagacgccc tccaaaaggg 1740
ctgggtcaag gcctcgctcg gacacagcca gggcgtcgtc tccgccgccg tcgttgccgc 1800
agccaacacc gaccgcgagc tgcgcaacct cgtggtctcc ggcctcgaat acatgtcaaa 1860
agtcggcatc gccgcccagc gcacgctcga ctacgagctc ggacgccgca acgccggccc 1920
ggagaccccg atgctcgctg tacagggaat ggacgaaaaa gtccttacca aggccttcaa 1980
ggccgccgtc tcgctctcca acgagaagca ggccatgatg gccaaaatct ccccacggcc 2040
gccgccgcca ccgccgcccc ggccgccgtt agcgacgaag atcgcttctc catcgccctc 2100
cgcaacggcc acgacgactt tgtcgtctgc ggcgagccca aggacctgcg cgtcctccgc 2160
aaggtcatcg agaaacagag cgccgagccc ggcaaggagg cacaggcgcg cacgcccttt 2220
tccaagcgca agcccgtcac ccagaccacc ttcctccgca tgacggccgt cttccacagc 2280
gctctcaaca aggacgccct cgcccagatc aacacatggg ccccggagtc cgcctttagc 2340
aaggccttcg cccaggcctc gctccgtgtt cccgtctttg acaccaagtc tggcgctaat 2400
ctgcaagatg ttcccgccgc cgatgttgtc gcccatctta ccaccaacat gctcactgag 2460
cgcgccgacg ttctcgtctc cctccgtgcc gccgagacca agaccgacgc cagccacctc 2520
ctctgtttaa acgttaacct gcattaatga atcggccaac gcgcggggag aggcggtttg 2580
cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 2640
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 2700
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 2760
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 2820
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 2880
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 2940
ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct cagttcggtg 3000
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 3060
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 3120
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 3180
ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 3240
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 3300
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 3360
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 3420
taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 3480
aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 3540
tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 3600
tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct 3660
gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca 3720
gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 3780
aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 3840
gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 3900
ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 3960
tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 4020
atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 4080
ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 4140
ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 4200
ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 4260
atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 4320
gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 4380
tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 4440
ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc 4500
acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc 4560
tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa 4620
aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg 4680
agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac 4740
tatgcggcat cagagcagat tgtactgaga gtgca 4775
<210> 7
<211> 5991
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL401 vector
<220>
<221> misc_feature
<222> (1)..(1063)
<223> EF-1_alpha_promoter
<220>
<221> misc_feature
<222> (1076)..(1112)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (1113)..(1132)
<223> carotene_synthase_target_1
<220>
<221> misc_feature
<222> (1133)..(1212)
<223> gRNA
<220>
<221> misc_feature
<222> (1213)..(1280)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (1300)..(1939)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4474)..(4922)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (4923)..(5717)
<223> paromomycin_resistance_gene
<220>
<221> misc_feature
<222> (5718)..(5991)
<223> SV40_terminator
<400> 7
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagagatcta gcacgctgat 1080
gagtccgtga ggacgaaacg agtaagctcg tctgcggacg tcgtggacgc gcgttttaga 1140
gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1200
gtcggtgctt ttggccggca tggtcccagc ctcctcgctg gcgccggctg ggcaacatgc 1260
ttcggcatgg cgaatgggac catatgagtt atgagatccg aaagtgaacc ttgtcctaac 1320
ccgacagcga atggcgggag ggggcgggct aaaagatcgt attacatagt atttttcccc 1380
tactctttgt gtttgtcttt tttttttttt tgaacgcatt caagccactt gtctgggttt 1440
acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt cttggtcaga cggcccaaaa 1500
aagggaaaaa attcattcat ggcacagata agaaaaagaa aaagtttgtc gaccaccgtc 1560
atcagaaagc aagagaagag aaacactcgc gctcacattc tcgctcgcgt aagaatctta 1620
gccacgcata cgaagtaatt tgtccatctg gcgaatcttt acatgagcgt tttcaagctg 1680
gagcgtgaga tcataccttt cttgatcgta atgttccaac cttgcatagg cctcgttgcg 1740
atccgctagc aatgcgtcgt actcccgttg caactgcgcc atcgcctcat tgtgacgtga 1800
gttcagattc ttctcgagac cttcgagcgc tgctaatttc gcctgacgct ccttcttttg 1860
tgcttccatg acacgccgct tcaccgtgcg ttccacttct tcctcagaca tgcccttggc 1920
tgcctcgacc tgctcggtaa aacgggcccc agcacgtgct acgagatttc gattccaccg 1980
ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 2040
tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 2100
ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 2160
tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcataca tggtcgacct 2220
gcaggaacct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 2280
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 2340
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 2400
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 2460
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 2520
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 2580
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 2640
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 2700
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 2760
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 2820
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 2880
ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 2940
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 3000
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 3060
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 3120
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 3180
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 3240
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 3300
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 3360
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 3420
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 3480
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 3540
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 3600
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 3660
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 3720
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 3780
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 3840
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 3900
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 3960
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 4020
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 4080
tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 4140
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 4200
gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata 4260
ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa aacctctgac 4320
acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag 4380
cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac tatgcggcat 4440
cagagcagat tgtactgaga gtgcaccaag cttccaattt taggcccccc actgaccgag 4500
gtctgtcgat aatccacttt tccattgatt ttccaggttt cgttaactca tgccactgag 4560
caaaacttcg gtctttccta acaaaagctc tcctcacaaa gcatggcgcg gcaacggacg 4620
tgtcctcata ctccactgcc acacaaggtc gataaactaa gctcctcaca aatagaggag 4680
aattccactg acaactgaaa acaatgtatg agagacgatc accactggag cggcgcggcg 4740
gttgggcgcg gaggtcggca gcaaaaacaa gcgactcgcc gagcaaaccc gaatcagcct 4800
tcagacggtc gtgcctaaca acacgccgtt ctaccccgcc ttcttcgcgc cccttcgcgt 4860
ccaagcatcc ttcaagttta tctctctagt tcaacttcaa gaagaacaac accaccaaca 4920
ccatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 4980
tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 5040
cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 5100
tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 5160
tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 5220
aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 5280
tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 5340
gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 5400
aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg cgcatgcccg 5460
acggcgatga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 5520
atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 5580
acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 5640
tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 5700
ttgacgagtt cttctgacac gtgctacgag atttcgattc caccgccgcc ttctatgaaa 5760
ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5820
tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5880
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5940
gtttgtccaa actcatcaat gtatcttatc atgtctgaat tcccggggta c 5991
<210> 8
<211> 7612
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL402 vector
<220>
<221> misc_feature
<222> (5)..(1198)
<223> FAS_upstream_fragment
<220>
<221> misc_feature
<222> (1199)..(1647)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (1648)..(2442)
<223> paromomycin_resistance_gene
<220>
<221> misc_feature
<222> (2443)..(2716)
<223> SV40_terminator
<220>
<221> misc_feature
<222> (2717)..(3779)
<223> EF-1_alpha_promoter
<220>
<221> misc_feature
<222> (3792)..(3828)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (3829)..(3848)
<223> carotene_synthase_target_1
<220>
<221> misc_feature
<222> (3849)..(3928)
<223> gRNA
<220>
<221> misc_feature
<222> (3929)..(3996)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (4016)..(4534)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4535)..(5360)
<223> FAS_downstream_fragment
<220>
<221> misc_feature
<222> (5365)..(7612)
<223> pSP73
<400> 8
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gcctcgagcc 1200
aattttaggc cccccactga ccgaggtctg tcgataatcc acttttccat tgattttcca 1260
ggtttcgtta actcatgcca ctgagcaaaa cttcggtctt tcctaacaaa agctctcctc 1320
acaaagcatg gcgcggcaac ggacgtgtcc tcatactcca ctgccacaca aggtcgataa 1380
actaagctcc tcacaaatag aggagaattc cactgacaac tgaaaacaat gtatgagaga 1440
cgatcaccac tggagcggcg cggcggttgg gcgcggaggt cggcagcaaa aacaagcgac 1500
tcgccgagca aacccgaatc agccttcaga cggtcgtgcc taacaacacg ccgttctacc 1560
ccgccttctt cgcgcccctt cgcgtccaag catccttcaa gtttatctct ctagttcaac 1620
ttcaagaaga acaacaccac caacaccatg attgaacaag atggattgca cgcaggttct 1680
ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc 1740
tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc 1800
gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc 1860
acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg 1920
ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag 1980
aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc 2040
ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt 2100
cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc 2160
gccaggctca aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc 2220
tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg 2280
ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag 2340
cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg 2400
cagcgcatcg ccttctatcg ccttcttgac gagttcttct gacacgtgct acgagatttc 2460
gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc 2520
tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt 2580
attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca 2640
tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc 2700
tgaattcccg gggtacctct tatctgcctc gcgccgttga ccgccgcttg actcttggcg 2760
cttgccgctc gcatcctgcc tcgctcgcgc aggcgggcgg gcgagtgggt gggtccgcag 2820
ccttccgcgc tcgcccgcta gctcgctcgc gccgtgctgc agccagcagg gcagcaccgc 2880
acggcaggca ggtcccggcg cggatcgatc gatccatcga tccatcgatc catcgatcgt 2940
gcggtcaaaa agaaaggaag aagaaaggaa aaagaaaggc gtgcgcaccc gagtgcgcgc 3000
tgagcgcccg ctcgcggtcc cgcggagcct ccgcgttagt ccccgccccg cgccgcgcag 3060
tcccccggga ggcatcgcgc acctctcgcc gccccctcgc gcctcgccga ttccccgcct 3120
ccccttttcc gcttcttcgc cgcctccgct cgcggccgcg tcgcccgcgc cccgctccct 3180
atctgctccc caggggggca ctccgcacct tttgcgcccg ctgccgccgc cgcggccgcc 3240
ccgccgccct ggtttccccc gcgagcgcgg ccgcgtcgcc gcgcaaagac tcgccgcgtg 3300
ccgccccgag caacgggtgg cggcggcgcg gcggcgggcg gggcgcggcg gcgcgtaggc 3360
ggggctaggc gccggctagg cgaaacgccg cccccgggcg ccgccgccgc ccgctccaga 3420
gcagtcgccg cgccagaccg ccaacgcaga gaccgagacc gaggtacgtc gcgcccgagc 3480
acgccgcgac gcgcggcagg gacgaggagc acgacgccgc gccgcgccgc gcgggggggg 3540
ggagggagag gcaggacgcg ggagcgagcg tgcatgtttc cgcgcgagac gacgccgcgc 3600
gcgctggaga ggagataagg cgcttggatc gcgagagggc cagccaggct ggaggcgaaa 3660
atgggtggag aggatagtat cttgcgtgct tggacgagga gactgacgag gaggacggat 3720
acgtcgatga tgatgtgcac agagaagaag cagttcgaaa gcgactacta gcaagcaaga 3780
gatctagcac gctgatgagt ccgtgaggac gaaacgagta agctcgtctg cggacgtcgt 3840
ggacgcgcgt tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 3900
gaaaaagtgg caccgagtcg gtgcttttgg ccggcatggt cccagcctcc tcgctggcgc 3960
cggctgggca acatgcttcg gcatggcgaa tgggaccata tgagttatga gatccgaaag 4020
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4080
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4140
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4200
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4260
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4320
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4380
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 4440
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 4500
cctcattgtg acgtgagttc agattcttct cgagaaactc ggcacctgcc atgaagacgc 4560
cctccaaaag ggctgggtca aggcctcgct cggacacagc cagggcgtcg tctccgccgc 4620
cgtcgttgcc gcagccaaca ccgaccgcga gctgcgcaac ctcgtggtct ccggcctcga 4680
atacatgtca aaagtcggca tcgccgccca gcgcacgctc gactacgagc tcggacgccg 4740
caacgccggc ccggagaccc cgatgctcgc tgtacaggga atggacgaaa aagtccttac 4800
caaggccttc aaggccgccg tctcgctctc caacgagaag caggccatga tggccaaaat 4860
ctccccacgg ccgccgccgc caccgccgcc ccggccgccg ttagcgacga agatcgcttc 4920
tccatcgccc tccgcaacgg ccacgacgac tttgtcgtct gcggcgagcc caaggacctg 4980
cgcgtcctcc gcaaggtcat cgagaaacag agcgccgagc ccggcaagga ggcacaggcg 5040
cgcacgccct tttccaagcg caagcccgtc acccagacca ccttcctccg catgacggcc 5100
gtcttccaca gcgctctcaa caaggacgcc ctcgcccaga tcaacacatg ggccccggag 5160
tccgccttta gcaaggcctt cgcccaggcc tcgctccgtg ttcccgtctt tgacaccaag 5220
tctggcgcta atctgcaaga tgttcccgcc gccgatgttg tcgcccatct taccaccaac 5280
atgctcactg agcgcgccga cgttctcgtc tccctccgtg ccgccgagac caagaccgac 5340
gccagccacc tcctctgttt aaacgttaac ctgcattaat gaatcggcca acgcgcgggg 5400
agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 5460
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 5520
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 5580
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 5640
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 5700
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 5760
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 5820
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 5880
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 5940
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 6000
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 6060
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 6120
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 6180
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 6240
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 6300
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 6360
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 6420
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 6480
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 6540
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 6600
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 6660
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 6720
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 6780
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 6840
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 6900
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 6960
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 7020
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 7080
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 7140
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 7200
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 7260
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 7320
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc 7380
atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt 7440
gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 7500
gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 7560
ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca tg 7612
<210> 9
<211> 7609
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB36 vector
<220>
<221> misc_feature
<222> (2)..(1192)
<223> FAS_upstream_fragment
<220>
<221> misc_feature
<222> (1200)..(1648)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (1679)..(2443)
<223> paromomycin_resistance_gene
<220>
<221> misc_feature
<222> (2444)..(2717)
<223> SV40_terminator
<220>
<221> misc_feature
<222> (2718)..(3780)
<223> EF-1_alpha_promoter
<220>
<221> misc_feature
<222> (3797)..(3829)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (3830)..(3849)
<223> carotene_synthase_target_1
<220>
<221> misc_feature
<222> (3850)..(3929)
<223> gRNA
<220>
<221> misc_feature
<222> (3930)..(3997)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (4017)..(4535)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4536)..(5368)
<223> FAS_downstream_fragment
<220>
<221> misc_feature
<222> (6367)..(7227)
<223> AmpR_gene
<400> 9
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttccg cactgatgag tccgtgagga cgaaacgagt aagctcgtct gcggacgtcg 3840
tggacgcgcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3900
tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc ctcgctggcg 3960
ccggctgggc aacatgcttc ggcatggcga atgggaccat atgagttatg agatccgaaa 4020
gtgaaccttg tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt 4080
acatagtatt tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa 4140
gccacttgtc tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt 4200
ggtcagacgg cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 4260
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 4320
ctcgcgtaag aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca 4380
tgagcgtttt caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt 4440
gcataggcct cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc 4500
gcctcattgt gacgtgagtt cagattcttc tcgagaaact cggcacctgc catgaagacg 4560
ccctccaaaa gggctgggtc aaggcctcgc tcggacacag ccagggcgtc gtctccgccg 4620
ccgtcgttgc cgcagccaac accgaccgcg agctgcgcaa cctcgtggtc tccggcctcg 4680
aatacatgtc aaaagtcggc atcgccgccc agcgcacgct cgactacgag ctcggacgcc 4740
gcaacgccgg cccggagacc ccgatgctcg ctgtacaggg aatggacgaa aaagtcctta 4800
ccaaggcctt caaggccgcc gtctcgctct ccaacgagaa gcaggccatg atggccaaaa 4860
tctccccacg gccgccgccg ccaccgccgc cccggccgcc gttagcgacg aagatcgctt 4920
ctccatcgcc ctccgcaacg gccacgacga ctttgtcgtc tgcggcgagc ccaaggacct 4980
gcgcgtcctc cgcaaggtca tcgagaaaca gagcgccgag cccggcaagg aggcacaggc 5040
gcgcacgccc ttttccaagc gcaagcccgt cacccagacc accttcctcc gcatgacggc 5100
cgtcttccac agcgctctca acaaggacgc cctcgcccag atcaacacat gggccccgga 5160
gtccgccttt agcaaggcct tcgcccaggc ctcgctccgt gttcccgtct ttgacaccaa 5220
gtctggcgct aatctgcaag atgttcccgc cgccgatgtt gtcgcccatc ttaccaccaa 5280
catgctcact gagcgcgccg acgttctcgt ctccctccgt gccgccgaga ccaagaccga 5340
cgccagccac ctcctctgtt taaacgttaa cctgcattaa tgaatcggcc aacgcgcggg 5400
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 5460
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 5520
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 5580
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 5640
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 5700
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 5760
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 5820
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 5880
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5940
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 6000
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 6060
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 6120
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 6180
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 6240
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 6300
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 6360
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 6420
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 6480
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 6540
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 6600
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 6660
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 6720
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 6780
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 6840
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6900
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6960
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 7020
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 7080
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 7140
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 7200
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 7260
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 7320
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 7380
catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg 7440
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta 7500
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg 7560
gggctggctt aactatgcgg catcagagca gattgtactg agagtgcac 7609
<210> 10
<211> 7609
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB37 vector
<220>
<221> misc_feature
<222> (2)..(1192)
<223> FAS_upstream_fragment
<220>
<221> misc_feature
<222> (1200)..(1648)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (1679)..(2443)
<223> paromomycin_resistance_gene
<220>
<221> misc_feature
<222> (2444)..(2717)
<223> SV40_terminator
<220>
<221> misc_feature
<222> (2718)..(3780)
<223> EF-1_alpha_promoter
<220>
<221> misc_feature
<222> (3797)..(3829)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (3830)..(3849)
<223> carotene_synthase_target_2
<220>
<221> misc_feature
<222> (3850)..(3929)
<223> gRNA
<220>
<221> misc_feature
<222> (3930)..(3997)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (4017)..(4535)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4536)..(5368)
<223> FAS_downstream_fragment
<220>
<221> misc_feature
<222> (6367)..(7227)
<223> AmpR_gene
<400> 10
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttccg cactgatgag tccgtgagga cgaaacgagt aagctcgtcg cagaccttaa 3840
gttcgacgcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3900
tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc ctcgctggcg 3960
ccggctgggc aacatgcttc ggcatggcga atgggaccat atgagttatg agatccgaaa 4020
gtgaaccttg tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt 4080
acatagtatt tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa 4140
gccacttgtc tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt 4200
ggtcagacgg cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 4260
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 4320
ctcgcgtaag aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca 4380
tgagcgtttt caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt 4440
gcataggcct cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc 4500
gcctcattgt gacgtgagtt cagattcttc tcgagaaact cggcacctgc catgaagacg 4560
ccctccaaaa gggctgggtc aaggcctcgc tcggacacag ccagggcgtc gtctccgccg 4620
ccgtcgttgc cgcagccaac accgaccgcg agctgcgcaa cctcgtggtc tccggcctcg 4680
aatacatgtc aaaagtcggc atcgccgccc agcgcacgct cgactacgag ctcggacgcc 4740
gcaacgccgg cccggagacc ccgatgctcg ctgtacaggg aatggacgaa aaagtcctta 4800
ccaaggcctt caaggccgcc gtctcgctct ccaacgagaa gcaggccatg atggccaaaa 4860
tctccccacg gccgccgccg ccaccgccgc cccggccgcc gttagcgacg aagatcgctt 4920
ctccatcgcc ctccgcaacg gccacgacga ctttgtcgtc tgcggcgagc ccaaggacct 4980
gcgcgtcctc cgcaaggtca tcgagaaaca gagcgccgag cccggcaagg aggcacaggc 5040
gcgcacgccc ttttccaagc gcaagcccgt cacccagacc accttcctcc gcatgacggc 5100
cgtcttccac agcgctctca acaaggacgc cctcgcccag atcaacacat gggccccgga 5160
gtccgccttt agcaaggcct tcgcccaggc ctcgctccgt gttcccgtct ttgacaccaa 5220
gtctggcgct aatctgcaag atgttcccgc cgccgatgtt gtcgcccatc ttaccaccaa 5280
catgctcact gagcgcgccg acgttctcgt ctccctccgt gccgccgaga ccaagaccga 5340
cgccagccac ctcctctgtt taaacgttaa cctgcattaa tgaatcggcc aacgcgcggg 5400
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 5460
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 5520
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 5580
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 5640
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 5700
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 5760
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 5820
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 5880
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5940
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 6000
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 6060
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 6120
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 6180
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 6240
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 6300
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 6360
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 6420
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 6480
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 6540
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 6600
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 6660
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 6720
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 6780
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 6840
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6900
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6960
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 7020
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 7080
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 7140
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 7200
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 7260
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 7320
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 7380
catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg 7440
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta 7500
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg 7560
gggctggctt aactatgcgg catcagagca gattgtactg agagtgcac 7609
<210> 11
<211> 7609
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB38 vector
<220>
<221> misc_feature
<222> (2)..(1192)
<223> FAS_upstream_fragment
<220>
<221> misc_feature
<222> (1200)..(1648)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (1679)..(2443)
<223> paromomycin_resistance_gene
<220>
<221> misc_feature
<222> (2444)..(2717)
<223> SV40_terminator
<220>
<221> misc_feature
<222> (2718)..(3780)
<223> EF-1_alpha_promoter
<220>
<221> misc_feature
<222> (3797)..(3829)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (3830)..(3849)
<223> carotene_synthase_target_3
<220>
<221> misc_feature
<222> (3850)..(3929)
<223> gRNA
<220>
<221> misc_feature
<222> (3930)..(3997)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (4017)..(4535)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4536)..(5368)
<223> FAS_downstream_fragment
<220>
<221> misc_feature
<222> (6367)..(7227)
<223> AmpR_gene
<400> 11
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttccg cactgatgag tccgtgagga cgaaacgagt aagctcgtcc cgactcgtcg 3840
accgtctcag ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3900
tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc ctcgctggcg 3960
ccggctgggc aacatgcttc ggcatggcga atgggaccat atgagttatg agatccgaaa 4020
gtgaaccttg tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt 4080
acatagtatt tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa 4140
gccacttgtc tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt 4200
ggtcagacgg cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 4260
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 4320
ctcgcgtaag aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca 4380
tgagcgtttt caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt 4440
gcataggcct cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc 4500
gcctcattgt gacgtgagtt cagattcttc tcgagaaact cggcacctgc catgaagacg 4560
ccctccaaaa gggctgggtc aaggcctcgc tcggacacag ccagggcgtc gtctccgccg 4620
ccgtcgttgc cgcagccaac accgaccgcg agctgcgcaa cctcgtggtc tccggcctcg 4680
aatacatgtc aaaagtcggc atcgccgccc agcgcacgct cgactacgag ctcggacgcc 4740
gcaacgccgg cccggagacc ccgatgctcg ctgtacaggg aatggacgaa aaagtcctta 4800
ccaaggcctt caaggccgcc gtctcgctct ccaacgagaa gcaggccatg atggccaaaa 4860
tctccccacg gccgccgccg ccaccgccgc cccggccgcc gttagcgacg aagatcgctt 4920
ctccatcgcc ctccgcaacg gccacgacga ctttgtcgtc tgcggcgagc ccaaggacct 4980
gcgcgtcctc cgcaaggtca tcgagaaaca gagcgccgag cccggcaagg aggcacaggc 5040
gcgcacgccc ttttccaagc gcaagcccgt cacccagacc accttcctcc gcatgacggc 5100
cgtcttccac agcgctctca acaaggacgc cctcgcccag atcaacacat gggccccgga 5160
gtccgccttt agcaaggcct tcgcccaggc ctcgctccgt gttcccgtct ttgacaccaa 5220
gtctggcgct aatctgcaag atgttcccgc cgccgatgtt gtcgcccatc ttaccaccaa 5280
catgctcact gagcgcgccg acgttctcgt ctccctccgt gccgccgaga ccaagaccga 5340
cgccagccac ctcctctgtt taaacgttaa cctgcattaa tgaatcggcc aacgcgcggg 5400
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 5460
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 5520
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 5580
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 5640
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 5700
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 5760
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 5820
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 5880
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5940
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 6000
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 6060
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 6120
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 6180
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 6240
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 6300
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 6360
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 6420
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 6480
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 6540
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 6600
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 6660
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 6720
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 6780
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 6840
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6900
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6960
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 7020
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 7080
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 7140
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 7200
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 7260
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 7320
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 7380
catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg 7440
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta 7500
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg 7560
gggctggctt aactatgcgg catcagagca gattgtactg agagtgcac 7609
<210> 12
<211> 7608
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB39 vector
<220>
<221> misc_feature
<222> (2)..(1192)
<223> FAS_upstream_fragment
<220>
<221> misc_feature
<222> (1200)..(1648)
<223> alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (1679)..(2443)
<223> paromomycin_resistance_gene
<220>
<221> misc_feature
<222> (2444)..(2717)
<223> SV40_terminator
<220>
<221> misc_feature
<222> (2718)..(3780)
<223> EF-1_alpha_promoter
<220>
<221> misc_feature
<222> (3792)..(3828)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (3829)..(3848)
<223> carotene_synthase_target_4
<220>
<221> misc_feature
<222> (3848)..(3928)
<223> gRNA
<220>
<221> misc_feature
<222> (3929)..(3996)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (4016)..(4534)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4535)..(5367)
<223> FAS_downstream_fragment
<220>
<221> misc_feature
<222> (6366)..(7226)
<223> AmpR_gene
<400> 12
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttctt cctgatgagt ccgtgaggac gaaacgagta agctcgtcga agaacatgta 3840
ctcttcaagt tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 3900
gaaaaagtgg caccgagtcg gtgcttttgg ccggcatggt cccagcctcc tcgctggcgc 3960
cggctgggca acatgcttcg gcatggcgaa tgggaccata tgagttatga gatccgaaag 4020
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4080
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4140
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4200
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4260
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4320
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4380
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 4440
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 4500
cctcattgtg acgtgagttc agattcttct cgagaaactc ggcacctgcc atgaagacgc 4560
cctccaaaag ggctgggtca aggcctcgct cggacacagc cagggcgtcg tctccgccgc 4620
cgtcgttgcc gcagccaaca ccgaccgcga gctgcgcaac ctcgtggtct ccggcctcga 4680
atacatgtca aaagtcggca tcgccgccca gcgcacgctc gactacgagc tcggacgccg 4740
caacgccggc ccggagaccc cgatgctcgc tgtacaggga atggacgaaa aagtccttac 4800
caaggccttc aaggccgccg tctcgctctc caacgagaag caggccatga tggccaaaat 4860
ctccccacgg ccgccgccgc caccgccgcc ccggccgccg ttagcgacga agatcgcttc 4920
tccatcgccc tccgcaacgg ccacgacgac tttgtcgtct gcggcgagcc caaggacctg 4980
cgcgtcctcc gcaaggtcat cgagaaacag agcgccgagc ccggcaagga ggcacaggcg 5040
cgcacgccct tttccaagcg caagcccgtc acccagacca ccttcctccg catgacggcc 5100
gtcttccaca gcgctctcaa caaggacgcc ctcgcccaga tcaacacatg ggccccggag 5160
tccgccttta gcaaggcctt cgcccaggcc tcgctccgtg ttcccgtctt tgacaccaag 5220
tctggcgcta atctgcaaga tgttcccgcc gccgatgttg tcgcccatct taccaccaac 5280
atgctcactg agcgcgccga cgttctcgtc tccctccgtg ccgccgagac caagaccgac 5340
gccagccacc tcctctgttt aaacgttaac ctgcattaat gaatcggcca acgcgcgggg 5400
agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 5460
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 5520
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 5580
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 5640
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 5700
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 5760
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 5820
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 5880
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 5940
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 6000
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 6060
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 6120
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 6180
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 6240
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 6300
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 6360
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 6420
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 6480
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 6540
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 6600
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 6660
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 6720
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 6780
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 6840
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 6900
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 6960
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 7020
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 7080
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 7140
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 7200
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 7260
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 7320
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc 7380
atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt 7440
gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 7500
gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 7560
ggctggctta actatgcggc atcagagcag attgtactga gagtgcac 7608
<210> 13
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> 12 Tub seq F primer
<400> 13
ggatctcatg ctggagttct tc 22
<210> 14
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB32/3C R1 primer
<400> 14
gtacttctcg tggtaggcaa cc 22
<210> 15
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> CS pro Kpn IF F1 primer
<400> 15
gtctgaattc ccggggtacc gagcgggcga ttccaccgtc 40
<210> 16
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> CS pro BamH IF R1 primer
<400> 16
gtacttctta tccatggatc cctcggtctc cgagcgagcg ag 42
<210> 17
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> CS pro BamH IF F2 primer
<400> 17
tcgctcgctc ggagaccgag ggatccatgg ataagaagta c 41
<210> 18
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> CS pro Nde IF R2 primer
<400> 18
gattcactag tttagatcat atgttagacc ttgcgcttct tcttagggtc c 51
<210> 19
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> O A1-KO F primer
<400> 19
ccaagttcgc caaggcttc 19
<210> 20
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB32/3 SV40 R1 primer
<400> 20
gtggaatcga aatctcgtag cac 23
<210> 21
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> O A1-KO R primer
<400> 21
gctgttgcaa ctttgctcca c 21
<210> 22
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB32/3C F1 primer
<400> 22
gttaagaaga ccgaggtcca gac 23
<210> 23
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> 5' FAS PmeNde primer
<400> 23
tagcatatgt ttaaactcgc ggcgtctttc gc 32
<210> 24
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> 3' FAS PmeHpa primer
<400> 24
agttaacgtt taaacagagg aggtggctgg c 31
<210> 25
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL402 IF F primer
<400> 25
gaggcgctga ccgccggcca agcttccaat tttaggcc 38
<210> 26
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL402 IF R primer
<400> 26
gcaggtgccg agtttctcga gaagaatctg aactcacgtc 40
<210> 27
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB36 CS1 F primer
<400> 27
gagtcgaagg agacgttgtc g 21
<210> 28
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB36 CS1 R primer
<400> 28
gtcattgcga atgatgcgat atg 23
<210> 29
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB36 CS3 R primer
<400> 29
ggtcatcatg gaatacaacg cag 23
<210> 30
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB36 CS4 F primer
<400> 30
cgagctcatt tgtgctacac tctatg 26
<210> 31
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB36 CS4 R primer
<400> 31
cacaagattt gcaggattga tgc 23
<210> 32
<211> 5562
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB30 vector (5562 bp)
<220>
<221> misc_feature
<222> (2)..(450)
<223> Alpha_Tubulin_promoter
<220>
<221> misc_feature
<222> (457)..(549)
<223> Sec1_secretion_sequence
<220>
<221> misc_feature
<222> (550)..(1287)
<223> eGFP
<220>
<221> misc_feature
<222> (1307)..(1946)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4481)..(4929)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (4930)..(5304)
<223> Sh_ble_gene
<220>
<221> misc_feature
<222> (5305)..(5562)
<223> SV40_terminator
<400> 32
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatga agttcgcgac ctcggtcgca 480
attttgcttg tggccaacat agccaccgcc ctcgcgcaga gcgatggctg cacccccacc 540
gaccagacga tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc 600
gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat 660
gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc 720
tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac 780
cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc 840
accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc 900
gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc 960
ctgggacaca agctggagta caactacaac agccacaacg tctatatcat ggccgacaag 1020
cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga cggcagcgtg 1080
cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc 1140
gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat 1200
cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg 1260
tacaagcacc accatcacca ccactaacat atgagttatg agatccgaaa gtgaaccttg 1320
tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt acatagtatt 1380
tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa gccacttgtc 1440
tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt ggtcagacgg 1500
cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa gtttgtcgac 1560
caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg ctcgcgtaag 1620
aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca tgagcgtttt 1680
caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt gcataggcct 1740
cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc gcctcattgt 1800
gacgtgagtt cagattcttc tcgagacctt cgagcgctgc taatttcgcc tgacgctcct 1860
tcttttgtgc ttccatgaca cgccgcttca ccgtgcgttc cacttcttcc tcagacatgc 1920
ccttggctgc ctcgacctgc tcggtaaaac gggccccagc acgtgctacg agatttcgat 1980
tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg 2040
atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt 2100
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 2160
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatacatgg 2220
tcgacctgca ggaacctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 2280
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 2340
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 2400
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 2460
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 2520
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2580
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2640
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 2700
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2760
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2820
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2880
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 2940
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 3000
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 3060
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 3120
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 3180
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 3240
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 3300
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 3360
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 3420
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 3480
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 3540
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 3600
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 3660
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 3720
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 3780
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 3840
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 3900
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 3960
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 4020
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 4080
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 4140
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 4200
tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac attaacctat 4260
aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga cggtgaaaac 4320
ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc 4380
agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg gcttaactat 4440
gcggcatcag agcagattgt actgagagtg caccaagctt ccaattttag gccccccact 4500
gaccgaggtc tgtcgataat ccacttttcc attgattttc caggtttcgt taactcatgc 4560
cactgagcaa aacttcggtc tttcctaaca aaagctctcc tcacaaagca tggcgcggca 4620
acggacgtgt cctcatactc cactgccaca caaggtcgat aaactaagct cctcacaaat 4680
agaggagaat tccactgaca actgaaaaca atgtatgaga gacgatcacc actggagcgg 4740
cgcggcggtt gggcgcggag gtcggcagca aaaacaagcg actcgccgag caaacccgaa 4800
tcagccttca gacggtcgtg cctaacaaca cgccgttcta ccccgccttc ttcgcgcccc 4860
ttcgcgtcca agcatccttc aagtttatct ctctagttca acttcaagaa gaacaacacc 4920
accaacacca tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc 4980
ggagcggtcg agttctggac cgaccggctc gggttctccc gggacttcgt ggaggacgac 5040
ttcgccggtg tggtccggga cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg 5100
gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag 5160
tggtcggagg tcgtgtccac gaacttccgg gacgcctccg ggccggccat gaccgagatc 5220
ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac 5280
ttcgtggccg aggagcagga ctgacacgtg ctacgagatt tcgattccac cgccgccttc 5340
tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc 5400
ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt 5460
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 5520
agttgtggtt tgtccaaact catcaatgta tcttatcggt ac 5562
<210> 33
<211> 8887
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB61 vector (8887 bp)
<220>
<221> misc_feature
<222> (2)..(450)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (457)..(4596)
<223> Cas9
<220>
<221> misc_feature
<222> (4616)..(5255)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (6540)..(7400)
<223> Ampicillin_resistance_gene
<220>
<221> misc_feature
<222> (7790)..(8238)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (8239)..(8613)
<223> Sh_ble_gene
<220>
<221> misc_feature
<222> (8614)..(8887)
<223> SV40_terminator
<400> 33
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatgg ataagaagta ctcgatcggc 480
ctcgacattg gcaccaacag cgtcggctgg gccgtcatta ctgatgagta caaggtcccg 540
tcgaagaagt ttaaggtcct cggcaacact gaccgccact ccatcaagaa gaacctcatc 600
ggtgccctcc tttttgactc cggcgagacc gctgaggcca ctcgcctcaa gcgcactgcc 660
cgccgccgtt acacccgccg caagaaccgc atctgctacc tccaggagat tttctcgaac 720
gaaatggcca aggtcgatga ctcctttttc caccgtctcg aagaatcgtt cctcgtcgag 780
gaggacaaga agcacgagcg ccaccccatc ttcggtaaca ttgtcgatga ggttgcctac 840
cacgagaagt acccgaccat ctaccacctc cgcaagaagc tcgtcgactc caccgacaag 900
gccgatctcc gccttatcta cctcgccctc gcccacatga tcaagttccg cggccacttt 960
cttatcgagg gtgatctcaa ccctgataac tctgacgtcg acaagctttt catccagctc 1020
gtccagactt acaaccagct cttcgaggag aaccccatca acgcttccgg cgtcgacgcg 1080
aaggccattc tcagcgcccg cctcagcaag tcccgccgcc tcgaaaacct cattgcccag 1140
cttcccggcg agaagaagaa cggcctcttc ggcaacctca ttgccctcag ccttggcctc 1200
acccctaact tcaagtcgaa ctttgacctc gccgaggacg ccaagctcca gctttccaag 1260
gacacttacg acgacgatct cgacaacctc ctcgctcaga ttggcgacca gtacgctgac 1320
ctcttcctcg ccgccaagaa ccttagcgat gccatcctcc tctccgacat ccttcgtgtt 1380
aacacggaaa tcacgaaggc tccgctctcc gcctccatga tcaagcgtta cgacgagcac 1440
catcaggacc tcaccctcct caaggccctc gtccgccagc agctccccga gaagtacaag 1500
gagatcttct tcgaccagag caagaacggc tacgccggct acattgacgg cggcgcgtcg 1560
caggaggagt tttacaagtt tatcaagccc attcttgaga agatggacgg caccgaggag 1620
ctcctcgtca agctcaaccg tgaggacctt ctccgcaagc agcgcacgtt cgacaacggc 1680
tctattcccc atcagatcca cctcggtgag cttcacgcga ttcttcgccg ccaggaagac 1740
ttttacccgt tcctcaagga caaccgcgag aagattgaga agatcctcac ctttcgcatt 1800
ccctactacg tcggccccct cgcccgcggc aactcgcgct ttgcttggat gacccgcaag 1860
tccgaggaga ccatcacccc gtggaacttc gaagaggtcg tcgacaaggg cgcctccgcg 1920
cagtctttca tcgagcgcat gactaacttt gacaagaacc tcccgaacga gaaggtcctc 1980
cccaagcaca gcctccttta cgaatacttt acggtgtaca acgagctcac gaaggtcaag 2040
tacgtcactg agggcatgcg caagccggcg ttcctttcgg gcgagcagaa gaaggctatc 2100
gtcgacctcc ttttcaagac caaccgcaag gttaccgtca agcagctcaa ggaggactac 2160
ttcaagaaga tcgagtgctt tgactcggtc gagatttcgg gcgtggagga ccgtttcaac 2220
gcctccctcg gcacttacca cgaccttctc aagatcatca aggacaagga ctttctcgac 2280
aacgaggaga acgaggacat tctcgaggac atcgtcctca cgctcaccct ctttgaggac 2340
cgtgagatga tcgaggagcg cctcaagacc tacgcccatc tctttgacga caaggtcatg 2400
aagcagctca agcgccgccg ctacaccggc tggggccgcc tttcccgcaa gctcatcaac 2460
ggcatccgcg acaagcagtc tggcaagacc atccttgact ttcttaagtc tgatggtttc 2520
gccaaccgca acttcatgca gctcatccac gacgacagcc tcactttcaa ggaggacatt 2580
cagaaggccc aggtctccgg ccagggtgac tctctccacg aacacatcgc caaccttgct 2640
ggcagcccgg ctattaagaa gggcatcctc cagaccgtca aggtcgtcga cgagctcgtc 2700
aaggttatgg gccgccacaa gcccgagaac atcgtcattg agatggctcg cgaaaaccag 2760
accacccaga agggtcagaa gaactcccgc gagcgcatga agcgtatcga ggagggcatc 2820
aaggagctcg gcagccagat cctcaaggag cacccggtcg agaacaccca gctccagaac 2880
gaaaagctct acctctacta cctccagaac ggccgtgaca tgtacgttga ccaggagctc 2940
gacattaacc gcctctccga ttacgacgtc gaccatattg tcccccagag ctttctcaag 3000
gacgacagca tcgacaacaa ggtcctcacc cgctcggaca agaaccgcgg caagtccgac 3060
aacgtccctt ccgaggaggt cgtgaagaag atgaagaact actggcgcca gcttctcaac 3120
gctaagctta ttactcagcg caagttcgat aacctcacca aggccgaacg cggcggcctc 3180
tccgagctcg acaaggccgg ttttatcaag cgccagctcg ttgagactcg ccagatcacc 3240
aagcacgtgg cgcagatcct cgactcgcgc atgaacacga agtacgacga gaacgacaag 3300
ctcatccgcg aggtcaaggt catcaccctt aagtcgaagc tcgtgtccga ctttcgcaag 3360
gacttccagt tctacaaggt ccgtgaaatt aacaactacc accacgctca cgacgcttac 3420
ctcaacgcgg tcgtgggtac cgcgctcatc aagaagtacc cgaagctcga gtcggagttt 3480
gtctacggcg actacaaggt ctacgacgtg cgcaagatga tcgccaagtc cgagcaggag 3540
atcggcaagg ccacggccaa gtactttttc tactccaaca ttatgaactt ctttaagact 3600
gagatcaccc ttgccaacgg cgagatccgc aagcgccccc ttatcgagac caacggcgag 3660
accggcgaaa ttgtgtggga taagggtcgc gactttgcca ccgtccgcaa ggtcctcagc 3720
atgccccagg tcaacattgt taagaagacc gaggtccaga cgggcggctt tagcaaggag 3780
tctatcctcc ccaagcgtaa cagcgacaag ctcatcgccc gcaagaagga ctgggaccct 3840
aagaagtacg gcggcttcga ttcgcctacg gtcgcctaca gcgtcctcgt cgtcgccaag 3900
gtcgagaagg gcaagtccaa gaagctcaag tccgtcaagg agctcctcgg catcacgatc 3960
atggagcgct ccagctttga gaagaacccc attgacttcc tcgaggctaa gggttacaag 4020
gaggtcaaga aggaccttat catcaagctc cccaagtact ccctctttga gctcgaaaac 4080
ggccgcaagc gtatgctcgc tagcgctggc gaactccaga agggcaacga gctcgccctc 4140
cccagcaagt acgtcaactt tctctacctc gcctcccact acgagaagct caagggtagc 4200
ccggaggata acgagcagaa gcagcttttt gtggagcagc acaagcacta ccttgacgag 4260
atcattgaac agatctccga gttctccaag cgtgttattc ttgctgacgc caacctcgat 4320
aaggtgctct ccgcgtacaa caagcaccgc gacaagccta tccgcgagca ggccgagaac 4380
atcatccacc tctttaccct caccaacctc ggcgccccgg ccgcctttaa gtactttgat 4440
acgactatcg accgcaagcg ctacacttcg actaaggagg tcctcgacgc taccctcatt 4500
caccagtcca ttaccggcct ctacgagacc cgcattgacc tttcgcagct cggtggcgac 4560
tcgcgtgcgg accctaagaa gaagcgcaag gtctaacata tgagttatga gatccgaaag 4620
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4680
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4740
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4800
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4860
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4920
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4980
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 5040
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 5100
cctcattgtg acgtgagttc agattcttct cgagaccttc gagcgctgct aatttcgcct 5160
gacgctcctt cttttgtgct tccatgacac gccgcttcac cgtgcgttcc acttcttcct 5220
cagacatgcc cttggctgcc tcgacctgct cggtaaaacg ggccccagca cgtgctacga 5280
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 5340
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 5400
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 5460
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 5520
catacatggt cgacctgcag gaacctgcat taatgaatcg gccaacgcgc ggggagaggc 5580
ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 5640
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 5700
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 5760
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 5820
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 5880
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 5940
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 6000
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 6060
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 6120
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 6180
gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 6240
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 6300
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 6360
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 6420
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 6480
aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 6540
taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 6600
gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc 6660
agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac 6720
cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag 6780
tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac 6840
gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc 6900
agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg 6960
gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc 7020
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 7080
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 7140
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 7200
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 7260
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 7320
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 7380
cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt 7440
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 7500
ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca 7560
ttaacctata aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt cggtgatgac 7620
ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat 7680
gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg 7740
cttaactatg cggcatcaga gcagattgta ctgagagtgc accaagcttc caattttagg 7800
ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc aggtttcgtt 7860
aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct cacaaagcat 7920
ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata aactaagctc 7980
ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag acgatcacca 8040
ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga ctcgccgagc 8100
aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac cccgccttct 8160
tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa cttcaagaag 8220
aacaacacca ccaacaccat ggccaagttg accagtgccg ttccggtgct caccgcgcgc 8280
gacgtcgccg gagcggtcga gttctggacc gaccggctcg ggttctcccg ggacttcgtg 8340
gaggacgact tcgccggtgt ggtccgggac gacgtgaccc tgttcatcag cgcggtccag 8400
gaccaggtgg tgccggacaa caccctggcc tgggtgtggg tgcgcggcct ggacgagctg 8460
tacgccgagt ggtcggaggt cgtgtccacg aacttccggg acgcctccgg gccggccatg 8520
accgagatcg gcgagcagcc gtgggggcgg gagttcgccc tgcgcgaccc ggccggcaac 8580
tgcgtgcact tcgtggccga ggagcaggac tgacacgtgc tacgagattt cgattccacc 8640
gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 8700
ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 8760
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 8820
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgaattccc 8880
ggggtac 8887
<210> 34
<211> 5997
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB66 vector (5997 bp)
<220>
<221> misc_feature
<222> (1)..(1064)
<223> EF-1alpha_promoter
<220>
<221> misc_feature
<222> (1082)..(1118)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (1119)..(1138)
<223> gRNA3_CS1_target_sequence
<220>
<221> misc_feature
<222> (1139)..(1218)
<223> gRNA_scaffold
<220>
<221> misc_feature
<222> (1219)..(1286)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (1306)..(1945)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (4480)..(4928)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (4929)..(5723)
<223> Neomycin_phosphotransferase_gene
<220>
<221> misc_feature
<222> (5724)..(5997)
<223> SV40_terminator
<400> 34
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca gatcttccgc 1080
actgatgagt ccgtgaggac gaaacgagta agctcgtctg cggacgtcgt ggacgcgcgt 1140
tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg 1200
caccgagtcg gtgcttttgg ccggcatggt cccagcctcc tcgctggcgc cggctgggca 1260
acatgcttcg gcatggcgaa tgggaccata tgagttatga gatccgaaag tgaaccttgt 1320
cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta catagtattt 1380
ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag ccacttgtct 1440
gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg gtcagacggc 1500
ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag tttgtcgacc 1560
accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc tcgcgtaaga 1620
atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat gagcgttttc 1680
aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg cataggcctc 1740
gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg cctcattgtg 1800
acgtgagttc agattcttct cgagaccttc gagcgctgct aatttcgcct gacgctcctt 1860
cttttgtgct tccatgacac gccgcttcac cgtgcgttcc acttcttcct cagacatgcc 1920
cttggctgcc tcgacctgct cggtaaaacg ggccccagca cgtgctacga gatttcgatt 1980
ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 2040
tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 2100
cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 2160
tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catacatggt 2220
cgacctgcag gaacctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 2280
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 2340
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 2400
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2460
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2520
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2580
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2640
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 2700
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2760
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2820
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2880
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 2940
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 3000
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 3060
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 3120
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 3180
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 3240
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 3300
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 3360
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 3420
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 3480
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 3540
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 3600
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 3660
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 3720
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 3780
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 3840
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3900
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3960
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 4020
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 4080
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 4140
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 4200
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 4260
aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc 4320
tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca 4380
gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 4440
cggcatcaga gcagattgta ctgagagtgc accaagcttc caattttagg ccccccactg 4500
accgaggtct gtcgataatc cacttttcca ttgattttcc aggtttcgtt aactcatgcc 4560
actgagcaaa acttcggtct ttcctaacaa aagctctcct cacaaagcat ggcgcggcaa 4620
cggacgtgtc ctcatactcc actgccacac aaggtcgata aactaagctc ctcacaaata 4680
gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag acgatcacca ctggagcggc 4740
gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga ctcgccgagc aaacccgaat 4800
cagccttcag acggtcgtgc ctaacaacac gccgttctac cccgccttct tcgcgcccct 4860
tcgcgtccaa gcatccttca agtttatctc tctagttcaa cttcaagaag aacaacacca 4920
ccaacaccat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 4980
ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 5040
ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 5100
atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 5160
cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 5220
cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 5280
atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 5340
aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 5400
tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 5460
tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 5520
tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 5580
atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 5640
accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 5700
gccttcttga cgagttcttc tgacacgtgc tacgagattt cgattccacc gccgccttct 5760
atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 5820
gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 5880
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 5940
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgaattccc ggggtac 5997
<210> 35
<211> 10700
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB73 vector (10700 bp)
<220>
<221> misc_feature
<222> (2)..(450)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (457)..(4596)
<223> Cas9
<220>
<221> misc_feature
<222> (4616)..(5255)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (5546)..(6608)
<223> EF_1alpha_promoter
<220>
<221> misc_feature
<222> (6621)..(6657)
<223> Hammerhead_ribozyme
<220>
<221> misc_feature
<222> (6658)..(6677)
<223> gRNA3_CS1_target_sequence
<220>
<221> misc_feature
<222> (6678)..(6757)
<223> gRNA_scaffold
<220>
<221> misc_feature
<222> (6758)..(6825)
<223> HDV_ribozyme
<220>
<221> misc_feature
<222> (6845)..(7363)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (8369)..(9229)
<223> Ampicillin_resistance_gene
<220>
<221> misc_feature
<222> (9619)..(10067)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (10068)..(10442)
<223> Sh_ble_gene
<220>
<221> misc_feature
<222> (10443)..(10700)
<223> SV40_terminator
<400> 35
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatgg ataagaagta ctcgatcggc 480
ctcgacattg gcaccaacag cgtcggctgg gccgtcatta ctgatgagta caaggtcccg 540
tcgaagaagt ttaaggtcct cggcaacact gaccgccact ccatcaagaa gaacctcatc 600
ggtgccctcc tttttgactc cggcgagacc gctgaggcca ctcgcctcaa gcgcactgcc 660
cgccgccgtt acacccgccg caagaaccgc atctgctacc tccaggagat tttctcgaac 720
gaaatggcca aggtcgatga ctcctttttc caccgtctcg aagaatcgtt cctcgtcgag 780
gaggacaaga agcacgagcg ccaccccatc ttcggtaaca ttgtcgatga ggttgcctac 840
cacgagaagt acccgaccat ctaccacctc cgcaagaagc tcgtcgactc caccgacaag 900
gccgatctcc gccttatcta cctcgccctc gcccacatga tcaagttccg cggccacttt 960
cttatcgagg gtgatctcaa ccctgataac tctgacgtcg acaagctttt catccagctc 1020
gtccagactt acaaccagct cttcgaggag aaccccatca acgcttccgg cgtcgacgcg 1080
aaggccattc tcagcgcccg cctcagcaag tcccgccgcc tcgaaaacct cattgcccag 1140
cttcccggcg agaagaagaa cggcctcttc ggcaacctca ttgccctcag ccttggcctc 1200
acccctaact tcaagtcgaa ctttgacctc gccgaggacg ccaagctcca gctttccaag 1260
gacacttacg acgacgatct cgacaacctc ctcgctcaga ttggcgacca gtacgctgac 1320
ctcttcctcg ccgccaagaa ccttagcgat gccatcctcc tctccgacat ccttcgtgtt 1380
aacacggaaa tcacgaaggc tccgctctcc gcctccatga tcaagcgtta cgacgagcac 1440
catcaggacc tcaccctcct caaggccctc gtccgccagc agctccccga gaagtacaag 1500
gagatcttct tcgaccagag caagaacggc tacgccggct acattgacgg cggcgcgtcg 1560
caggaggagt tttacaagtt tatcaagccc attcttgaga agatggacgg caccgaggag 1620
ctcctcgtca agctcaaccg tgaggacctt ctccgcaagc agcgcacgtt cgacaacggc 1680
tctattcccc atcagatcca cctcggtgag cttcacgcga ttcttcgccg ccaggaagac 1740
ttttacccgt tcctcaagga caaccgcgag aagattgaga agatcctcac ctttcgcatt 1800
ccctactacg tcggccccct cgcccgcggc aactcgcgct ttgcttggat gacccgcaag 1860
tccgaggaga ccatcacccc gtggaacttc gaagaggtcg tcgacaaggg cgcctccgcg 1920
cagtctttca tcgagcgcat gactaacttt gacaagaacc tcccgaacga gaaggtcctc 1980
cccaagcaca gcctccttta cgaatacttt acggtgtaca acgagctcac gaaggtcaag 2040
tacgtcactg agggcatgcg caagccggcg ttcctttcgg gcgagcagaa gaaggctatc 2100
gtcgacctcc ttttcaagac caaccgcaag gttaccgtca agcagctcaa ggaggactac 2160
ttcaagaaga tcgagtgctt tgactcggtc gagatttcgg gcgtggagga ccgtttcaac 2220
gcctccctcg gcacttacca cgaccttctc aagatcatca aggacaagga ctttctcgac 2280
aacgaggaga acgaggacat tctcgaggac atcgtcctca cgctcaccct ctttgaggac 2340
cgtgagatga tcgaggagcg cctcaagacc tacgcccatc tctttgacga caaggtcatg 2400
aagcagctca agcgccgccg ctacaccggc tggggccgcc tttcccgcaa gctcatcaac 2460
ggcatccgcg acaagcagtc tggcaagacc atccttgact ttcttaagtc tgatggtttc 2520
gccaaccgca acttcatgca gctcatccac gacgacagcc tcactttcaa ggaggacatt 2580
cagaaggccc aggtctccgg ccagggtgac tctctccacg aacacatcgc caaccttgct 2640
ggcagcccgg ctattaagaa gggcatcctc cagaccgtca aggtcgtcga cgagctcgtc 2700
aaggttatgg gccgccacaa gcccgagaac atcgtcattg agatggctcg cgaaaaccag 2760
accacccaga agggtcagaa gaactcccgc gagcgcatga agcgtatcga ggagggcatc 2820
aaggagctcg gcagccagat cctcaaggag cacccggtcg agaacaccca gctccagaac 2880
gaaaagctct acctctacta cctccagaac ggccgtgaca tgtacgttga ccaggagctc 2940
gacattaacc gcctctccga ttacgacgtc gaccatattg tcccccagag ctttctcaag 3000
gacgacagca tcgacaacaa ggtcctcacc cgctcggaca agaaccgcgg caagtccgac 3060
aacgtccctt ccgaggaggt cgtgaagaag atgaagaact actggcgcca gcttctcaac 3120
gctaagctta ttactcagcg caagttcgat aacctcacca aggccgaacg cggcggcctc 3180
tccgagctcg acaaggccgg ttttatcaag cgccagctcg ttgagactcg ccagatcacc 3240
aagcacgtgg cgcagatcct cgactcgcgc atgaacacga agtacgacga gaacgacaag 3300
ctcatccgcg aggtcaaggt catcaccctt aagtcgaagc tcgtgtccga ctttcgcaag 3360
gacttccagt tctacaaggt ccgtgaaatt aacaactacc accacgctca cgacgcttac 3420
ctcaacgcgg tcgtgggtac cgcgctcatc aagaagtacc cgaagctcga gtcggagttt 3480
gtctacggcg actacaaggt ctacgacgtg cgcaagatga tcgccaagtc cgagcaggag 3540
atcggcaagg ccacggccaa gtactttttc tactccaaca ttatgaactt ctttaagact 3600
gagatcaccc ttgccaacgg cgagatccgc aagcgccccc ttatcgagac caacggcgag 3660
accggcgaaa ttgtgtggga taagggtcgc gactttgcca ccgtccgcaa ggtcctcagc 3720
atgccccagg tcaacattgt taagaagacc gaggtccaga cgggcggctt tagcaaggag 3780
tctatcctcc ccaagcgtaa cagcgacaag ctcatcgccc gcaagaagga ctgggaccct 3840
aagaagtacg gcggcttcga ttcgcctacg gtcgcctaca gcgtcctcgt cgtcgccaag 3900
gtcgagaagg gcaagtccaa gaagctcaag tccgtcaagg agctcctcgg catcacgatc 3960
atggagcgct ccagctttga gaagaacccc attgacttcc tcgaggctaa gggttacaag 4020
gaggtcaaga aggaccttat catcaagctc cccaagtact ccctctttga gctcgaaaac 4080
ggccgcaagc gtatgctcgc tagcgctggc gaactccaga agggcaacga gctcgccctc 4140
cccagcaagt acgtcaactt tctctacctc gcctcccact acgagaagct caagggtagc 4200
ccggaggata acgagcagaa gcagcttttt gtggagcagc acaagcacta ccttgacgag 4260
atcattgaac agatctccga gttctccaag cgtgttattc ttgctgacgc caacctcgat 4320
aaggtgctct ccgcgtacaa caagcaccgc gacaagccta tccgcgagca ggccgagaac 4380
atcatccacc tctttaccct caccaacctc ggcgccccgg ccgcctttaa gtactttgat 4440
acgactatcg accgcaagcg ctacacttcg actaaggagg tcctcgacgc taccctcatt 4500
caccagtcca ttaccggcct ctacgagacc cgcattgacc tttcgcagct cggtggcgac 4560
tcgcgtgcgg accctaagaa gaagcgcaag gtctaacata tgagttatga gatccgaaag 4620
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4680
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4740
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4800
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4860
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4920
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4980
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 5040
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 5100
cctcattgtg acgtgagttc agattcttct cgagaccttc gagcgctgct aatttcgcct 5160
gacgctcctt cttttgtgct tccatgacac gccgcttcac cgtgcgttcc acttcttcct 5220
cagacatgcc cttggctgcc tcgacctgct cggtaaaacg ggccccagca cgtgctacga 5280
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 5340
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 5400
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 5460
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 5520
catacatggt cgacctgcag ggtacctctt atctgcctcg cgccgttgac cgccgcttga 5580
ctcttggcgc ttgccgctcg catcctgcct cgctcgcgca ggcgggcggg cgagtgggtg 5640
ggtccgcagc cttccgcgct cgcccgctag ctcgctcgcg ccgtgctgca gccagcaggg 5700
cagcaccgca cggcaggcag gtcccggcgc ggatcgatcg atccatcgat ccatcgatcc 5760
atcgatcgtg cggtcaaaaa gaaaggaaga agaaaggaaa aagaaaggcg tgcgcacccg 5820
agtgcgcgct gagcgcccgc tcgcggtccc gcggagcctc cgcgttagtc cccgccccgc 5880
gccgcgcagt cccccgggag gcatcgcgca cctctcgccg ccccctcgcg cctcgccgat 5940
tccccgcctc cccttttccg cttcttcgcc gcctccgctc gcggccgcgt cgcccgcgcc 6000
ccgctcccta tctgctcccc aggggggcac tccgcacctt ttgcgcccgc tgccgccgcc 6060
gcggccgccc cgccgccctg gtttcccccg cgagcgcggc cgcgtcgccg cgcaaagact 6120
cgccgcgtgc cgccccgagc aacgggtggc ggcggcgcgg cggcgggcgg ggcgcggcgg 6180
cgcgtaggcg gggctaggcg ccggctaggc gaaacgccgc ccccgggcgc cgccgccgcc 6240
cgctccagag cagtcgccgc gccagaccgc caacgcagag accgagaccg aggtacgtcg 6300
cgcccgagca cgccgcgacg cgcggcaggg acgaggagca cgacgccgcg ccgcgccgcg 6360
cggggggggg gagggagagg caggacgcgg gagcgagcgt gcatgtttcc gcgcgagacg 6420
acgccgcgcg cgctggagag gagataaggc gcttggatcg cgagagggcc agccaggctg 6480
gaggcgaaaa tgggtggaga ggatagtatc ttgcgtgctt ggacgaggag actgacgagg 6540
aggacggata cgtcgatgat gatgtgcaca gagaagaagc agttcgaaag cgactactag 6600
caagcaagag atcttccgca ctgatgagtc cgtgaggacg aaacgagtaa gctcgtctgc 6660
ggacgtcgtg gacgcgcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 6720
tatcaacttg aaaaagtggc accgagtcgg tgcttttggc cggcatggtc ccagcctcct 6780
cgctggcgcc ggctgggcaa catgcttcgg catggcgaat gggaccatat gagttatgag 6840
atccgaaagt gaaccttgtc ctaacccgac agcgaatggc gggagggggc gggctaaaag 6900
atcgtattac atagtatttt tcccctactc tttgtgtttg tctttttttt ttttttgaac 6960
gcattcaagc cacttgtctg ggtttacttg tttgtttgct tgcttgcttg cttgcttgcc 7020
tgcttcttgg tcagacggcc caaaaaaggg aaaaaattca ttcatggcac agataagaaa 7080
aagaaaaagt ttgtcgacca ccgtcatcag aaagcaagag aagagaaaca ctcgcgctca 7140
cattctcgct cgcgtaagaa tcttagccac gcatacgaag taatttgtcc atctggcgaa 7200
tctttacatg agcgttttca agctggagcg tgagatcata cctttcttga tcgtaatgtt 7260
ccaaccttgc ataggcctcg ttgcgatccg ctagcaatgc gtcgtactcc cgttgcaact 7320
gcgccatcgc ctcattgtga cgtgagttca gattcttctc gagctgcagg aacctgcatt 7380
aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 7440
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 7500
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 7560
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 7620
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 7680
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 7740
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 7800
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 7860
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 7920
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 7980
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 8040
acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 8100
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 8160
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 8220
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 8280
caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 8340
gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 8400
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 8460
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 8520
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 8580
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 8640
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 8700
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 8760
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 8820
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 8880
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 8940
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 9000
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 9060
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 9120
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 9180
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 9240
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 9300
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 9360
acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc 9420
cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg 9480
agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt 9540
cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac 9600
tgagagtgca ccaagcttcc aattttaggc cccccactga ccgaggtctg tcgataatcc 9660
acttttccat tgattttcca ggtttcgtta actcatgcca ctgagcaaaa cttcggtctt 9720
tcctaacaaa agctctcctc acaaagcatg gcgcggcaac ggacgtgtcc tcatactcca 9780
ctgccacaca aggtcgataa actaagctcc tcacaaatag aggagaattc cactgacaac 9840
tgaaaacaat gtatgagaga cgatcaccac tggagcggcg cggcggttgg gcgcggaggt 9900
cggcagcaaa aacaagcgac tcgccgagca aacccgaatc agccttcaga cggtcgtgcc 9960
taacaacacg ccgttctacc ccgccttctt cgcgcccctt cgcgtccaag catccttcaa 10020
gtttatctct ctagttcaac ttcaagaaga acaacaccac caacaccatg gccaagttga 10080
ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg 10140
accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg gtccgggacg 10200
acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac accctggcct 10260
gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc gtgtccacga 10320
acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg tgggggcggg 10380
agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag gagcaggact 10440
gacacgtgct acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa 10500
tcgttttccg ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct 10560
tcgcccaccc caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 10620
caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 10680
tcaatgtatc ttatcggtac 10700
<210> 36
<211> 6300
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL310 vector (6300 bp)
<220>
<221> misc_feature
<222> (1)..(1064)
<223> EF_1alpha_promoter
<220>
<221> misc_feature
<222> (1070)..(1981)
<223> CarG_gene
<220>
<221> misc_feature
<222> (2001)..(2640)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (5175)..(5623)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (5627)..(6019)
<223> Bsd_gene
<220>
<221> misc_feature
<222> (6020)..(6300)
<223> SV40_terminator
<400> 36
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgctcaactc 1080
gcacaaccgc actgaggagc gctccactga ggacatcatc cttgagccct acacctacct 1140
catttcccag cccggcaagg acatccgcgc taagcttatt tccgctttcg acctctggct 1200
ccatgtcccc aaggacgtcc tctgcgtcat caacaagatt attggcatgc ttcacaacgc 1260
ctccctcatg atcgacgatg tccaggatga ctccgacctt cgccgtggcg tccccgtcgc 1320
ccaccatatc tacggcgtcc cccagacgat caacaccgct aactacgtca tttttctcgc 1380
tctccaggag gtcatgaagc tcaacatccc ctccatgatg caggtctgca ctgaggagct 1440
catcaacctt caccgcggcc agggtatcga gctctactgg cgcgattcgc ttacttgccc 1500
cactgaggag gagtacattg acatggtcaa caacaagacg tccggccttc tccgtcttgc 1560
cgtccgtctc atgcaggccg cctcggagtc cgacatcgac tacacccctc tcgtcaacat 1620
catcggtatt cactttcagg tccgcgacga ttacatgaac ctccagtcca ctagctacac 1680
gaacaacaag ggtttctgcg aggacctcac ggagggcaag ttttcgttcc ccatcatcca 1740
cgccattcgc aaggacccca gcaaccgcca gctccttaac attatctccc agaagcctac 1800
gtccattgag gttaagaagt acgcccttga ggttattcgc aaggccggca gctttgagta 1860
cgttcgcgag ttcctgcgcc agaaggaggc cgagtccctt aaggagatca agcgccttgg 1920
aggcaaccct ctcctcgaga agtacattga gaccatccgc gtcgaggcca cgaacgacta 1980
acatatgagt tatgagatcc gaaagtgaac cttgtcctaa cccgacagcg aatggcggga 2040
gggggcgggc taaaagatcg tattacatag tatttttccc ctactctttg tgtttgtctt 2100
tttttttttt ttgaacgcat tcaagccact tgtctgggtt tacttgtttg tttgcttgct 2160
tgcttgcttg cttgcctgct tcttggtcag acggcccaaa aaagggaaaa aattcattca 2220
tggcacagat aagaaaaaga aaaagtttgt cgaccaccgt catcagaaag caagagaaga 2280
gaaacactcg cgctcacatt ctcgctcgcg taagaatctt agccacgcat acgaagtaat 2340
ttgtccatct ggcgaatctt tacatgagcg ttttcaagct ggagcgtgag atcatacctt 2400
tcttgatcgt aatgttccaa ccttgcatag gcctcgttgc gatccgctag caatgcgtcg 2460
tactcccgtt gcaactgcgc catcgcctca ttgtgacgtg agttcagatt cttctcgaga 2520
ccttcgagcg ctgctaattt cgcctgacgc tccttctttt gtgcttccat gacacgccgc 2580
ttcaccgtgc gttccacttc ttcctcagac atgcccttgg ctgcctcgac ctgctcggta 2640
aaacgggccc cagcacgtgc tacgagattt cgattccacc gccgccttct atgaaaggtt 2700
gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 2760
gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 2820
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 2880
gtccaaactc atcaatgtat cttatcatac atggtcgacc tgcaggaacc tgcattaatg 2940
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 3000
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3060
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3120
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3180
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 3240
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 3300
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 3360
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 3420
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 3480
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 3540
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 3600
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 3660
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 3720
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 3780
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 3840
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 3900
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 3960
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4020
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4080
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4140
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4200
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 4260
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 4320
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 4380
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 4440
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 4500
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 4560
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 4620
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 4680
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 4740
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 4800
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 4860
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 4920
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 4980
tcgtctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 5040
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 5100
gggtgttggc gggtgtcggg gctggcttaa ctatgcggca tcagagcaga ttgtactgag 5160
agtgcaccaa gcttccaatt ttaggccccc cactgaccga ggtctgtcga taatccactt 5220
ttccattgat tttccaggtt tcgttaactc atgccactga gcaaaacttc ggtctttcct 5280
aacaaaagct ctcctcacaa agcatggcgc ggcaacggac gtgtcctcat actccactgc 5340
cacacaaggt cgataaacta agctcctcac aaatagagga gaattccact gacaactgaa 5400
aacaatgtat gagagacgat caccactgga gcggcgcggc ggttgggcgc ggaggtcggc 5460
agcaaaaaca agcgactcgc cgagcaaacc cgaatcagcc ttcagacggt cgtgcctaac 5520
aacacgccgt tctaccccgc cttcttcgcg ccccttcgcg tccaagcatc cttcaagttt 5580
atctctctag ttcaacttca agaagaacaa caccaccaac accatgatgc ctttgtctca 5640
agaagaatcc accctcattg aaagagcaac ggctacaatc aacagcatcc ccatctctga 5700
agactacagc gtcgccagcg cagctctctc tagcgacggc cgcatcttca ctggtgtcaa 5760
tgtatatcat tttactgggg gaccttgtgc agaactcgtg gtgctgggca ctgctgctgc 5820
tgcggcagct ggcaacctga cttgtatcgt cgcgatcgga aatgagaaca ggggcatctt 5880
gagcccctgt ggacggtgcc gacaggtgct tctcgatctg catcctggga tcaaagccat 5940
agtgaaggac agtgatggac agccgacggc agttgggatt cgtgaattgc tgccctctgg 6000
ttatgtgtgg gagggctaac acgtgctccg tgctacgaga tttcgattcc accgccgcct 6060
tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc 6120
gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg 6180
gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 6240
ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgaatt cccggggtac 6300
<210> 37
<211> 6611
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL122 vector (6611 bp)
<220>
<221> misc_feature
<222> (1)..(1064)
<223> EF_1alpha_promoter
<220>
<221> misc_feature
<222> (1070)..(1162)
<223> Sec1_secretion_signal
<220>
<221> misc_feature
<222> (1163)..(1900)
<223> eGFP_gene
<220>
<221> misc_feature
<222> (1920)..(2559)
<223> OrfC_terminator
<220>
<221> misc_feature
<222> (5094)..(5542)
<223> Alpha_tubulin_promoter
<220>
<221> misc_feature
<222> (5543)..(6337)
<223> NPT_gene
<220>
<221> misc_feature
<222> (6338)..(6611)
<223> SV40_terminator
<400> 37
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgaagttcgc 1080
gacctcggtc gcaattttgc ttgtggccaa catagccacc gccctcgcgc agagcgatgg 1140
ctgcaccccc accgaccaga cgatggtgag caagggcgag gagctgttca ccggggtggt 1200
gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga 1260
gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 1320
gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag 1380
ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 1440
cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt 1500
gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga 1560
ggacggcaac atcctgggac acaagctgga gtacaactac aacagccaca acgtctatat 1620
catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga 1680
ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc 1740
cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa 1800
cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg 1860
catggacgag ctgtacaagc accaccatca ccaccactaa catatgagtt atgagatccg 1920
aaagtgaacc ttgtcctaac ccgacagcga atggcgggag ggggcgggct aaaagatcgt 1980
attacatagt atttttcccc tactctttgt gtttgtcttt tttttttttt tgaacgcatt 2040
caagccactt gtctgggttt acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt 2100
cttggtcaga cggcccaaaa aagggaaaaa attcattcat ggcacagata agaaaaagaa 2160
aaagtttgtc gaccaccgtc atcagaaagc aagagaagag aaacactcgc gctcacattc 2220
tcgctcgcgt aagaatctta gccacgcata cgaagtaatt tgtccatctg gcgaatcttt 2280
acatgagcgt tttcaagctg gagcgtgaga tcataccttt cttgatcgta atgttccaac 2340
cttgcatagg cctcgttgcg atccgctagc aatgcgtcgt actcccgttg caactgcgcc 2400
atcgcctcat tgtgacgtga gttcagattc ttctcgagac cttcgagcgc tgctaatttc 2460
gcctgacgct ccttcttttg tgcttccatg acacgccgct tcaccgtgcg ttccacttct 2520
tcctcagaca tgcccttggc tgcctcgacc tgctcggtaa aacgggcccc agcacgtgct 2580
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 2640
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 2700
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 2760
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 2820
ttatcataca tggtcgacct gcaggaacct gcattaatga atcggccaac gcgcggggag 2880
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 2940
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 3000
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 3060
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 3120
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 3180
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 3240
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 3300
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 3360
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 3420
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 3480
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 3540
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 3600
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 3660
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 3720
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 3780
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 3840
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 3900
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 3960
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 4020
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 4080
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 4140
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 4200
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 4260
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 4320
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 4380
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 4440
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 4500
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 4560
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 4620
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 4680
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 4740
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 4800
ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 4860
gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga 4920
tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 4980
ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 5040
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccaag cttccaattt 5100
taggcccccc actgaccgag gtctgtcgat aatccacttt tccattgatt ttccaggttt 5160
cgttaactca tgccactgag caaaacttcg gtctttccta acaaaagctc tcctcacaaa 5220
gcatggcgcg gcaacggacg tgtcctcata ctccactgcc acacaaggtc gataaactaa 5280
gctcctcaca aatagaggag aattccactg acaactgaaa acaatgtatg agagacgatc 5340
accactggag cggcgcggcg gttgggcgcg gaggtcggca gcaaaaacaa gcgactcgcc 5400
gagcaaaccc gaatcagcct tcagacggtc gtgcctaaca acacgccgtt ctaccccgcc 5460
ttcttcgcgc cccttcgcgt ccaagcatcc ttcaagttta tctctctagt tcaacttcaa 5520
gaagaacaac accaccaaca ccatgattga acaagatgga ttgcacgcag gttctccggc 5580
cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 5640
tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 5700
gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac 5760
gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 5820
attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 5880
atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 5940
cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 6000
cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 6060
gctcaaggcg cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt 6120
gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 6180
tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 6240
cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 6300
catcgccttc tatcgccttc ttgacgagtt cttctgacac gtgctacgag atttcgattc 6360
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 6420
gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 6480
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 6540
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgaat 6600
tcccggggta c 6611
<210> 38
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB66 Bambgl F primer
<400> 38
caagggatcc agatcttccg cactgatgag tc 32
<210> 39
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB66 Nde R primer
<400> 39
aactcatatg gtcccattcg cca 23
<210> 40
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB66 EF1seq F primer
<400> 40
gagaggatag tatcttgcgt gcttg 25
<210> 41
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL122 OrfC R primer
<400> 41
gcaaggttgg aacattacga tcaag 25
<210> 42
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB73 gRNA Pst Kpn IF F primer
<400> 42
catacatggt cgacctgcag ggtacctctt atctgcctcg c 41
<210> 43
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB73 gRNA Xho Pst IF R primer
<400> 43
attaatgcag gttcctgcag ctcgagaaga atctgaactc acgtc 45
<210> 44
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB73 seq F primer
<400> 44
caccccaact tgtttattgc ag 22
<210> 45
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB73 seq R primer
<400> 45
gagcgaggaa gcggaagag 19
<210> 46
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> pYB13 pYB1 seq F primer
<400> 46
gagaggatag tatcttgcgt gcttgg 26
<210> 47
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> TT pYB73 HDV R primer
<400> 47
gaagcatgtt gcccagcc 18
Claims (25)
- 안내-폴리뉴클레오타이드 및 Cas 단백질을 포함하는 CRISPR-Cas 시스템의 소스를 포함하는 비-천연 또는 조작된 조성물로서, 상기 안내-폴리뉴클레오타이드가 근본적으로 숙주 세포 중의 표적-폴리뉴클레오타이드의 역 보체인 안내-서열을 포함하고, 상기 안내-폴리뉴클레오타이드가 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 상기 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시킬 수 있으며, 상기 안내-서열이 근본적으로 상기 숙주 세포의 게놈 중 5'-(N)yPAM-3' 폴리뉴클레오타이드 서열 표적의 (N)y 부분의 역 보체이고, y가 8 내지 30의 정수이며, PAM이 프로토스페이서 인접 모티프이고, 상기 숙주 세포가 라비린툴로마이세트(Labyrinthulomycete), 바람직하게는 트라우스토키트리알레스(Thraustochytriales) 목의 일원, 보다 바람직하게는 트라우스토키트리아세아에(Thraustochytriaceae) 과의 일원, 보다 바람직하게는 아우란티오키트리움(Aurantiochytrium), 오블롱기키트리움(Oblongichytrium), 스키조키트리움(Schizochytrium), 트라우스토키트리움(Thraustochytrium) 및 울케니아(Ulkenia)로 이루어지는 그룹 중에서 선택된 속의 일원, 훨씬 더 바람직하게는 스키조키트리움 종 ATCC# 20888이며, PAM이 바람직하게는 5′-XGG-3′, 5′-XGGXG-3′, 5′-XXAGAAW-3′, 5′-XXXXGATT-3′, 5′-XXAGAA-3′, 5′-XAAAAC-3′로 이루어지는 그룹 중에서 선택된 서열이고, X가 임의의 뉴클레오타이드 또는 그의 유사체일 수 있으며, 바람직하게 X가 임의의 뉴클레오타이드일 수 있고; W가 A 또는 T인 조성물.
- 제 1 항에 있어서,
Cas 단백질이 폴리뉴클레오타이드에 의해 암호화되고/되거나 안내-폴리뉴클레오타이드가 폴리뉴클레오타이드에 의해 암호화되거나 상기 폴리뉴클레오타이드상에 존재하는 조성물. - 제 1 항 또는 제 2 항에 있어서,
Cas 단백질이 폴리뉴클레오타이드에 의해 암호화되고/되거나 안내-폴리뉴클레오타이드가 또 다른 폴리뉴클레오타이드에 의해 암호화되거나 상기 또 다른 폴리뉴클레오타이드상에 존재하고 상기 폴리뉴클레오타이드가 벡터 중에 포함되는 조성물. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
안내-폴리뉴클레오타이드가, 전사되어 실제 안내-폴리뉴클레오타이드를 제공하는 폴리뉴클레오타이드에 의해 암호화되는 조성물. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
Cas 단백질이 폴리뉴클레오타이드에 의해 암호화되고 안내-폴리뉴클레오타이드가 또 다른 폴리뉴클레오타이드에 의해 암호화되거나 상기 또 다른 폴리뉴클레오타이드상에 존재하고 상기 폴리뉴클레오타이드들이 하나의 벡터 중에 포함되는 조성물. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
Cas 단백질이 벡터 중에 포함된 폴리뉴클레오타이드에 의해 암호화되고 안내-폴리뉴클레오타이드가 또 다른 벡터 중에 포함된 또 다른 폴리뉴클레오타이드에 의해 암호화되거나 상기 또 다른 폴리뉴클레오타이드상에 존재하고, 바람직하게는 상기 Cas 단백질을 암호화하는 벡터가 저강도 프로모터에 의해 구동되고, 상기 안내-폴리뉴클레오타이드를 암호화하는 벡터가 고강도 프로모터에 의해 구동되는 조성물. - 제 6 항에 있어서,
하나 이상의 또는 모든 벡터가 선택성 마커를 포함하고, 바람직하게는 각각의 벡터가 별개의 선택성 마커를 포함하는 조성물. - 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
하나 이상의 외인성 폴리뉴클레오타이드가 안내-폴리뉴클레오타이드에 작동적으로 연결되는 조성물. - 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
Cas 단백질이 하나 이상의 핵 국소화 서열, 바람직하게는 이종 핵 국소화 서열을 포함하는 조성물. - 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
Cas 단백질이 표적-서열의 위치에서 2개의 폴리뉴클레오타이드 가닥 모두의 절단을 지시하는 활성을 갖는 조성물. - 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
Cas 단백질 암호화 폴리뉴클레오타이드가 숙주 세포에 대해 코돈 최적화된, 바람직하게는 코돈쌍 최적화된 조성물. - 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
안내-폴리뉴클레오타이드가, RNA 폴리머라제 II 또는 III 프로모터, 바람직하게는 라비린툴로마이세트 EF-1 프로모터에 작동적으로 연결된 폴리뉴클레오타이드에 의해 암호화되는 조성물. - 제 1 항 내지 제 12 항 중 어느 한 항에 있어서,
RNA 폴리머라제 II 프로모터에 작동적으로 연결된 폴리뉴클레오타이드가, 안내-폴리뉴클레오타이드 및 자기-가공 리보자임을 포함하는 프리-안내-폴리뉴클레오타이드를 암호화하고, 전사시 상기 안내-폴리뉴클레오타이드가 상기 프리-안내-폴리뉴클레오타이드 전사물로부터 자기-가공 리보자임에 의해 방출되는 조성물. - 세포에서 폴리뉴클레오타이드의 발현을 조절하는 방법으로서, 숙주 세포를 제 1 항 내지 제 13 항 중 어느 한 항에 따른 조성물과 접촉시킴을 포함하며, 안내-폴리뉴클레오타이드가 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시키는 방법.
- 제 14 항에 있어서,
숙주 세포가 관심 화합물을 암호화하는 폴리뉴클레오타이드를 포함하는 방법. - 제 14 항 또는 제 15 항에 있어서,
숙주 세포가 재조합 숙주 세포인 방법. - 제 1 항 내지 제 13 항 중 어느 한 항에 따른 조성물을 포함하는 숙주 세포.
- 숙주 세포의 생산 방법으로서, 숙주 세포를 제 1 항 내지 제 13 항 중 어느 한 항에 따른 조성물과 접촉시킴을 포함하며, 안내-폴리뉴클레오타이드가 상기 숙주 세포 중의 표적-폴리뉴클레오타이드에서 Cas 단백질의 결합을 지시하여 CRISPR-Cas 복합체를 형성시키는 방법.
- 제 18 항에 있어서,
숙주 세포를 먼저 Cas 단백질의 소스와 접촉시키고 후속적으로 안내-폴리뉴클레오타이드의 소스 및 임의로 외인성 폴리뉴클레오타이드와 접촉시키는 방법. - 제 17 항 또는 제 19 항에 있어서,
숙주 세포가 관심 화합물을 암호화하는 폴리뉴클레오타이드를 포함하는 숙주 세포 또는 방법. - 제 17 항 내지 제 20 항 중 어느 한 항에 있어서,
숙주 세포가 재조합 숙주 세포인 숙주 세포 또는 방법. - 관심 화합물의 생성 방법으로서, 상기 관심 화합물의 생성에 도움이 되는 조건하에서 제 18 항 내지 제 20 항 중 어느 한 항에 따른 방법에 의해 수득할 수 있는 숙주 세포 또는 제 17 항에 따른 숙주 세포 또는 제 18 항 내지 제 20 항 중 어느 한 항에 따른 방법에 따라 생성된 숙주 세포를 배양하고 임의로 상기 관심 화합물을 정제하거나 단리시킴을 포함하는 방법.
- 제 14 항 내지 제 16 항 및 제 18 항 내지 제 22 항 중 어느 한 항에 있어서,
Cas 단백질이 Cas9 단백질인 방법. - 제 18 항 내지 제 20 항 중 어느 한 항에 있어서,
Cas 단백질의 발현을 중간 강도 프로모터에 의해 구동시키는 방법. - 제 24 항에 있어서,
중간 강도 프로모터가 알파 튜불린 프로모터인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662361741P | 2016-07-13 | 2016-07-13 | |
US62/361,741 | 2016-07-13 | ||
PCT/US2017/041949 WO2018013821A1 (en) | 2016-07-13 | 2017-07-13 | A crispr-cas system for an algal host cell |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190025910A true KR20190025910A (ko) | 2019-03-12 |
KR102319845B1 KR102319845B1 (ko) | 2021-11-01 |
Family
ID=60952752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197000858A KR102319845B1 (ko) | 2016-07-13 | 2017-07-13 | 조류 숙주 세포에 대한 crispr-cas 시스템 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11466269B2 (ko) |
EP (1) | EP3484994A4 (ko) |
JP (2) | JP2019520069A (ko) |
KR (1) | KR102319845B1 (ko) |
CN (1) | CN109689856A (ko) |
BR (1) | BR112019000430A2 (ko) |
WO (1) | WO2018013821A1 (ko) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2853829C (en) | 2011-07-22 | 2023-09-26 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
EP3242949B1 (en) * | 2015-01-06 | 2021-11-03 | DSM IP Assets B.V. | A crispr-cas system for a yeast host cell |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
CN110747223A (zh) * | 2019-11-29 | 2020-02-04 | 中国科学院海洋研究所 | 一种紫菜功能基因沉默的方法及其应用 |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016109840A2 (en) * | 2014-12-31 | 2016-07-07 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL336345A1 (en) | 1997-04-11 | 2000-06-19 | Dsm Nv | Genic conversion as a tool for constructing recombined filiform fungi |
US8003772B2 (en) | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
TWI350854B (en) | 2001-04-16 | 2011-10-21 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
DK2410048T3 (en) | 2005-01-24 | 2016-11-28 | Dsm Ip Assets Bv | A process for the preparation of a compound of interest in a filamentous fungal cell |
JP4796786B2 (ja) * | 2005-04-28 | 2011-10-19 | 富士フイルム株式会社 | ラビリンチュラ類を形質転換可能なベクター |
EA015925B1 (ru) | 2006-06-29 | 2011-12-30 | ДСМ АйПи АССЕТС Б.В. | Способ получения полипептидов |
MX346700B (es) | 2009-03-10 | 2017-03-28 | Dsm Ip Assets Bv | Metodo para mejorar el rendimiento de un polipeptido. |
TWI504749B (zh) | 2009-03-16 | 2015-10-21 | Dsm Ip Assets Bv | 於網黏菌門微生物中生產蛋白質之技術 |
CA3012998C (en) | 2009-03-19 | 2021-09-07 | Dsm Ip Assets B.V. | Polyunsaturated fatty acid synthase nucleic acid molecules and polypeptides, compositions, and methods of making and uses thereof |
CN104988078B (zh) | 2009-03-19 | 2021-07-30 | 帝斯曼知识产权资产管理有限公司 | 破囊壶菌、脂肪酸组合物和其制备方法及用途 |
CN102414323B (zh) | 2009-04-22 | 2015-07-08 | 帝斯曼知识产权资产管理有限公司 | 用于生产感兴趣的重组多肽的方法 |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
SG11201503059XA (en) * | 2012-10-23 | 2015-06-29 | Toolgen Inc | Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof |
WO2014089348A1 (en) | 2012-12-07 | 2014-06-12 | Synthetic Genomics, Inc. | Nannochloropsis spliced leader sequences and uses therefor |
CA2913869C (en) * | 2013-05-29 | 2023-01-24 | Cellectis | New compact scaffold of cas9 in the type ii crispr system |
JP2016523552A (ja) * | 2013-07-10 | 2016-08-12 | ノバルティス アーゲー | 多重プロテアーゼ欠損糸状菌細胞及びその使用方法 |
EP3375877A1 (en) * | 2013-11-18 | 2018-09-19 | Crispr Therapeutics AG | Crispr-cas system materials and methods |
US20160312233A1 (en) * | 2013-12-13 | 2016-10-27 | Cellectis | New method of selection of algal-transformed cells using nuclease |
WO2015086795A1 (en) | 2013-12-13 | 2015-06-18 | Cellectis | Cas9 nuclease platform for microalgae genome engineering |
CN113278529B (zh) * | 2014-05-22 | 2023-10-10 | 合成基因组股份有限公司 | 用于生产二十二碳六烯酸的网粘菌纲菌株 |
US10208298B2 (en) * | 2014-11-06 | 2019-02-19 | E.I. Du Pont De Nemours And Company | Peptide-mediated delivery of RNA-guided endonuclease into cells |
WO2016197136A2 (en) | 2015-06-04 | 2016-12-08 | Nmc, Inc. | Improved productivity and bioproduct formation in phototropin knock/out mutants in microalgae |
JP6937740B2 (ja) * | 2015-07-28 | 2021-09-22 | ダニスコ・ユーエス・インク | ゲノム編集システムおよび使用方法 |
CN105238806B (zh) | 2015-11-02 | 2018-11-27 | 中国科学院天津工业生物技术研究所 | 一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用 |
EP3412765B1 (en) | 2016-02-04 | 2023-01-18 | Kao Corporation | Method for producing mutant filamentous fungi |
-
2017
- 2017-07-13 EP EP17828470.9A patent/EP3484994A4/en not_active Withdrawn
- 2017-07-13 US US16/309,304 patent/US11466269B2/en active Active
- 2017-07-13 JP JP2018564999A patent/JP2019520069A/ja active Pending
- 2017-07-13 BR BR112019000430A patent/BR112019000430A2/pt not_active Application Discontinuation
- 2017-07-13 KR KR1020197000858A patent/KR102319845B1/ko active IP Right Grant
- 2017-07-13 WO PCT/US2017/041949 patent/WO2018013821A1/en unknown
- 2017-07-13 CN CN201780055558.1A patent/CN109689856A/zh active Pending
-
2022
- 2022-05-11 JP JP2022077982A patent/JP2022116027A/ja not_active Withdrawn
- 2022-08-05 US US17/817,899 patent/US20220380759A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016109840A2 (en) * | 2014-12-31 | 2016-07-07 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
Also Published As
Publication number | Publication date |
---|---|
CN109689856A (zh) | 2019-04-26 |
US11466269B2 (en) | 2022-10-11 |
KR102319845B1 (ko) | 2021-11-01 |
EP3484994A1 (en) | 2019-05-22 |
BR112019000430A2 (pt) | 2019-07-09 |
JP2019520069A (ja) | 2019-07-18 |
US20200131511A1 (en) | 2020-04-30 |
WO2018013821A1 (en) | 2018-01-18 |
JP2022116027A (ja) | 2022-08-09 |
US20220380759A1 (en) | 2022-12-01 |
EP3484994A4 (en) | 2020-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102319845B1 (ko) | 조류 숙주 세포에 대한 crispr-cas 시스템 | |
RU2763170C2 (ru) | Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом | |
AU2019203955B2 (en) | Multipartite signaling proteins and uses thereof | |
AU2013344512B2 (en) | Recombinant adenoviruses and use thereof | |
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
KR102494564B1 (ko) | 말라리아 백신 | |
US20030119104A1 (en) | Chromosome-based platforms | |
KR20180048743A (ko) | 2a 펩타이드를 포함하는 재조합 벡터 | |
KR20210108423A (ko) | 아데노 관련 바이러스 (aav) 생산자 세포주 및 관련 방법 | |
CA3109035A1 (en) | Microorganisms engineered to use unconventional sources of nitrogen | |
KR20210105382A (ko) | 단백질을 코딩하는 rna | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
CN109843909B (zh) | 利用替代的葡萄糖转运蛋白产生鼠李糖脂的细胞和方法 | |
AU2017252409A1 (en) | Compositions and methods for nucleic acid expression and protein secretion in bacteroides | |
CN115698297A (zh) | 多模块生物合成酶基因组合文库的制备方法 | |
KR20220016485A (ko) | 미엘린 단백질 제로 프로모터를 갖는 aav 벡터, 및 샤르코-마리-투스 질환과 같은 슈반 세포-관련 질환을 치료하기 위한 이의 용도 | |
DK2935601T3 (en) | RECOMBINANT MICROBELL CELLS PRODUCING AT LEAST 28% EICOSAPENTAIC ACID AS DRY WEIGHT | |
KR20240021906A (ko) | 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 | |
CN117881788A (zh) | 表达载体、无细菌序列载体及其制备和使用方法 | |
KR20240022571A (ko) | Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분 | |
CN112209883B (zh) | 一种与rna特异性结合的荧光素染料及其应用 | |
KR102721142B1 (ko) | 재배열 레오바이러스과 바이러스를 제조하는 방법 및 이를 위한 벡터 라이브러리 | |
KR102711998B1 (ko) | 조작되고 완전-기능 맞춤 당단백질 | |
RU2798786C2 (ru) | Производство молочных олигосахаридов человека в микробных продуцентах с искусственным импортом/экспортом |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |