KR20130100127A - 타겟 핵산을 적출하기 위한 핵산, 조성물 및 방법 - Google Patents
타겟 핵산을 적출하기 위한 핵산, 조성물 및 방법 Download PDFInfo
- Publication number
- KR20130100127A KR20130100127A KR1020137006317A KR20137006317A KR20130100127A KR 20130100127 A KR20130100127 A KR 20130100127A KR 1020137006317 A KR1020137006317 A KR 1020137006317A KR 20137006317 A KR20137006317 A KR 20137006317A KR 20130100127 A KR20130100127 A KR 20130100127A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- homing endonuclease
- homing
- extractable
- acid construct
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/65—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 숙주 세포의 게놈으로부터 하나 이상의 유전자 좌(loci)를 적출할 수 있는 핵산, 조성물 및 방법을 제공한다. 보다 상세하게는, 본 발명은, 5' → 3' 방향으로, 제1 탠덤 리피트 핵산, 제1 호밍 엔도뉴클레아제 인지부, 타겟 핵산, 제2 호밍 엔도뉴클레아제 인지부 및 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체를 제공한다. 일부 구현예에서, 적출성 핵산 구조체를 숙주 세포 게놈에 병합시키고, 호밍 엔도뉴클레아제 인지부를 하나 이상의 적절한 호밍 엔도뉴클레아제와 접촉시킴으로써, 숙주 세포 게놈으로부터 타겟 핵산을 적출할 수 있다.
Description
본 출원은 2010년 8월 30일자 미국 가출원번호 61/378,350에 대한 우선권을 주장하며, 문헌의 전체 내용이 원용에 의해 본 명세서에 포함된다.
본 발명에서 기술되는 핵산, 조성물 및 방법은 일반적으로 분자 생물학 및 유전공학 분야에 관한 것이다.
숙주 세포 게놈 또는 에피좀(episome)으로부터 타겟 핵산을 적출하기 위한 유전공학 기법은 대사 공학, 공업 미생물학, 합성 생물학 및 기초 분자 유전학 연구를 비롯한 다양한 분야들에서 필요한 기법이다. 그러나, 타겟 핵산을 제거하는 기존 방법들은 제한적이며, 이용에 한계가 있다. 예를 들어, 부위 특이적인 재조합효소에 의한 제거 방법은 숙주 세포에 잠재적인 게놈 불안정성을 발생시키는 유해한 특이적인 재조합효소 결합 부위를 남기게 된다. 다른 방법들은 적출 빈도가 낮아, 적출 과정이 이루어진 소수의 숙주 세포를 생장-선별하는 방법이 필연적으로 요구된다. 잠재적인 게놈 불안정성을 발생시키지 않으면서, 숙주 세포의 게놈 또는 에피좀으로부터 타겟 핵산을 높은 빈도로, 그리고 양호한 충실성으로 적출할 수 있는 핵산, 조성물 및 방법들이 요구되고 있다.
본 발명은 숙주 세포의 게놈으로부터 하나 이상의 유전자 좌를 적출할 수 있는 핵산, 조성물 및 방법을 제공한다. 제1 측면에서, 본 발명은 5' → 3' 방향으로, a) 제1 탠덤 리피트(repeat) 핵산, b) 제1 호밍 엔도뉴클레아제 인지부(first homing endonuclease recognition site), c) 타겟 핵산, d) 제2 호밍 엔도뉴클레아제 인지부, 및 e) 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체를 제공한다. 일부 구현예들에서, 상기 적출성 핵산 구조체는 숙주 세포 게놈에 병합된다. 일부 구현예들에서, 상기 제2 호밍 엔도뉴클레아제 인지부는 선택 사항이다.
제1 및 제2 호밍 엔도뉴클레아제 인지부는 호밍 엔도뉴클레아제에 의한 적출성 핵산 구조체의 절단을 허용한다. 호밍 엔도뉴클레아제 인지부에 결합된 호밍 엔도뉴클레아제는 상기 호밍 엔도뉴클레아제 인지부에서 또는 이에 인접한 부위에서 적출성 핵산 구조체를 절단할 수 있다. 일부 구현예들에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 14 -40개의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예들에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 14-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 20-40 개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 25-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 30-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 35-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 24개의 뉴클레오티드 염기 쌍으로 구성된다.
일부 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은, LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 특정 구현예에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부들은 각각 독립적으로 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다.
일부 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다.
특정 구현예들에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부들은 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 개개 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 I-SceI에 대한 인지부이다. 개개 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 F-CphI에 대한 인지부이다.
타겟 핵산의 절단 후, 제1 및 제2 탠덤 리피트에 의해 촉진되는 염색체내 재조합을 통해 숙주 세포의 게놈 복구가 이루어질 수 있다. 일부 구현예들에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18개 이상의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예들에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 500개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 200개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 숙주 세포는 효모 세포이며, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 200개의 뉴클레오티드 염기 쌍으로 구성된다.
일부 구현예들에서, 타겟 핵산은 선별 마커를 코딩한다. 일부 구현예들에서, 선별 마커는 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신(zeocin) 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택된다.
일부 구현예들에서, 전술한 적출성 핵산 구조체는 제1 탠덤 리피트의 5'에 연결되는 제1 게놈 병합부(integration site)와 제2 탠덤 리피트의 3'에 연결되는 제2 게놈 병합부를 추가로 포함한다. 유익하게는, 제1 및 제2 게놈 병합부들은 숙주 세포의 게놈으로의 적출성 핵산 구조체의 병합을 촉진시킬 수 있다.
다른 측면에서, 본 발명은 전술한 적출성 핵산 구조체를 포함하는 숙주 세포를 제공한다. 일부 구현예들에서, 적출성 핵산 구조체는 제1 탠덤 리피트의 5'에 연결되는 제1 게놈 병합부와 제2 탠덤 리피트의 3'에 연결되는 제2 게놈 병합부를 추가로 포함한다.
일부 구현예들에서, 숙주 세포는 원핵 생물이다. 일부 구현예들에서, 숙주 세포는 진핵 생물이다. 특정 구현예들에서, 숙주 세포는 단세포 진핵 유기체이다. 특정 구현예들에서, 숙주 세포는 효모 세포이다. 특정 구현예들에서, 숙주 세포는 반수체 효모 세포이다. 다른 구현예들에서, 숙주 세포는 이배체 효모 세포이다. 특정 구현예들에서, 숙주 세포는 균주 사카로마이세스 세레비지애(S. cerevisiae)의 효모 세포이다.
일부 구현예들에서, 숙주 세포는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 추가로 포함하되, 상기 호밍 엔도뉴클레아제는 제1 및/또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여, 이를 또는 이에 인접하여 절단할 수 있다. 특정 구현예들에서, 상기 벡터는, 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각에 결합하여, 이를 또는 이에 인접하여 절단할 수 있는, 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함한다.
일부 구현예들에서, 벡터는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산의 발현을 조절하는 프르모터 인자를 포함한다. 일부 구현예들에서, 프로모터 인자는 유도성 프로모터이다. 일부 구현예들에서, 프로모터 인자는 구성적인 프로모터(constitutive promoter)이다.
다른 측면에서, 본 발명은 숙주 세포의 게놈으로 병합된 전술한 적출성 핵산 구조체를 포함하는 숙주 세포를 제공한다. 특정 구현예들에서, 적출성 핵산 구조체는 5' → 3' 방향으로: a) 제1 탠덤 리피트 핵산, b) 제1 호밍 엔도뉴클레아제 인지부, c) 타겟 핵산, d) 제2 호밍 엔도뉴클레아제 인지부 및 e) 제2 탠덤 리피트 핵산을 포함한다. 일부 구현예들에서, 숙주 세포는, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는, 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 추가로 포함한다. 일부 구현예들에서, 호밍 엔도뉴클레아제 핵산은, 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각에 결합하여 이를 또는 이에 인접하여 절단할 수 있는, 호밍 엔도뉴클레아제를 코딩한다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 I-SceI이다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 F-CphI이다.
다른 측면에서, 본 발명은 전술한 적출성 핵산 구조체; 및 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함하는 키트를 제공한다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 I-SceI이다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 F-CphI이다.
다른 측면에서, 본 발명은 숙주 세포의 게놈으로부터 하나 이상의 타겟 핵산을 적출하는 방법을 제공한다. 특정 구현예들에서, 숙주 세포는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 핵산, b) 제1 호밍 엔도뉴클레아제 인지부, c) 타겟 핵산, d) 제2 호밍 엔도뉴클레아제 인지부, 및 e) 제2 탠덤 리피트 핵산인, 핵산을 포함한다. 특정 구현예들에서, 본 방법은, 호밍 엔도뉴클레아제가 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상을 그 인지부에서 또는 이에 인접하여 절단할 수 있도록, 숙주 세포에서 호밍 엔도뉴클레아제를 발현시키는 단계를 포함한다. 본 방법의 일부 구현예들에서, 호밍 엔도뉴클레아제는 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각을 절단 또는 이에 인접하여 절단한다. 일부 구현예들에서, 제1 및/또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 I-SceI에 대한 인지부이다. 일부 구현예들에서, 제1 및/또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 F-CphI에 대한 인지부이다.
다른 측면에서, 본 발명은 2 이상의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 2 이상의 타겟 핵산을 동시에 적출하는 방법을 제공하며, 이때 각각의 적출성 핵산 구조체는 독립적으로 5' → 3' 방향으로: a) 제1 탠덤 리피트 핵산; b) 제1 호밍 엔도뉴클레아제 인지부; c) 타겟 핵산; d) 제2 호밍 엔도뉴클레아제 인지부; 및 e) 제2 탠덤 리피트 핵산을 포함한다. 일부 구현예들에서, 본 방법은, 호밍 엔도뉴클레아제가 각 적출성 핵산 구조체의 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상을 절단하거나 또는 이에 인접하여 절단하도록, 2 이상의 적출성 핵산 구조체를 숙주 세포에서 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함한다. 일부 구현예들에서, 본 방법은, 하나 이상의 호밍 엔도뉴클레아제가 각 적출성 핵산 구조체의 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상을 절단하거나 또는 이에 인접하여 절단하도록, 숙주 세포에서 2 이상의 적출성 핵산 구조체를 하나 이상의 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함한다.
유리하게는, 타겟 핵산이 적출된 게놈 핵산은 제1 및 제2 탠덤 리피트에 의해 매개되는 재조합에 의해 형성된다. 일부 구현예들에서, 새롭게 생성되는 게놈 핵산은 제3의 탠덤 리피트를 포함하는데, 이것은 제1 및 제2 탠덤 리피트의 재조합 산물로서 형성된다. 바람직한 구현예들에서, 숙주 세포에 남겨지게 되는 적출성 엔도뉴클레아제 구조체의 유일한 부분은 제3 탠덤 리피트이며, 이것은 18개의 뉴클레오티드 염기 쌍 길이에 불과할 수 있다.
본 발명은 잠재적인 게놈 불안정성을 야기하지 않고도 숙주 세포 게놈 또는 에피좀으로부터 하나 이상의 타겟 핵산을 정확하고 효과적으로 적출할 수 있는 조성물 및 방법을 제공한다. 유전공학 분야에서는 선택한 게놈 또는 에피좀 위치에서 타겟 핵산을 제거하여야 하는 경우들이 다수 존재한다. 예를 들어, 전술한 조성물 및 방법은 동일한 숙주 세포 또는 이의 후대에서 재사용될 수 있는 선별 마커를 제거하는데 유용하게 사용할 수 있다. "마커 리사이클링"은, 수명이 한정된 선별 마커를 이용하여 숙주 유기체에서 다중 유전자 조작 공정이 필요한 경우에 유용할 수 있다. 또한, 본원의 조성물 및 방법은, 조작하는 중에 또는 천연 환경에서, 숙주 세포를 방출하기 전에, 숙주 세포에서 바람직하지 않은 핵산 (예, 항생제 내성 마커)을 제거하는데 이용할 수 있다.
아울러, 본원의 조성물 및 방법은 숙주 세포와 그 후대에서 특정 유전자의 발현을 개시 또는 종결시키는데 사용할 수 있다. 본원의 조성물 및 방법은, 유전자의 발현을 종결시키기 위해, 예를 들어, 유전자의 시스-작용성 조절 인자들 중 하나 이상을 나타내는 핵산, 이의 코딩 서열 일부 또는 전체, 또는 이의 하나 이상의 전사 활성인자를 적출하는데, 이용할 수 있다. 유전자 발현을 개시하고자 하는 경우, 특정 유전자의 발현에 필요한 인자들 간에 요구되는 인접한 상호작용을 형성하도록, 간섭 핵산 가닥을 적출할 수 있다.
도 1. 적출성 핵산 구조체에 대한 구현예들. 도 1A: 5' → 3' 방향으로, 제1 탠덤 리피트 핵산 ("DR1"); 제1 호밍 엔도뉴클레아제 인지부 ("ES1"); 타겟 핵산 ("Target nucleic acid"); 제2 호밍 엔도뉴클레아제 인지부 ("ES2"); 및 제2 탠덤 리피트 핵산 ("DR2")을 포함하는 적출성 핵산 구조체. 도 1B: 제1 호밍 엔도뉴클레아제 인지부의 5'에 연결되는 제1 병합부 (IS1)와 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 병합부 (IS2)를 추가로 포함하는, 도 1A에 도시된 적출성 핵산 구조체.
도 2. 적출성 핵산 구조체는 형질전환되어, 병합부 매개 상동성 재조합을 통해 숙주 세포의 게놈의 특정 유전자 좌에서 타겟 핵산을 낫-아웃(knock-out) 및/또는 낫-인(knock-in) 한다. 타겟 핵산의 양쪽에는 호밍 엔도뉴클레아제 제한효소 부위가 2 카피 (각각 ES1 및 ES2) 존재하며, 그 옆에는 절단 후 복구를 지시하는 2개의 탠덤 리피트 (각각 DR1 및 DR2)가 존재한다.
도 3. 타겟 핵산의 적출. 일부 구현예들에서, 제1 및 제2 호밍 (도 3A) 엔도뉴클레아제 인지부는 각각 (ES1 및 ES2) 하나 이상의 대응되는 호밍 엔도뉴클레아제 (HE)에 의해 절단되어, 핵산 단편 3개가 수득된다: (1) 게놈 또는 에피좀 핵산의 좌측 암, (2) 타겟 핵산을 포함하는 핵산 단편, 및 (3) 게놈 또는 에피좀 핵산의 우측 암 (도 3B). 절단 후, 숙주 세포에서 내인성의 5' → 3' 엑소뉴클레아제가 각 핵산 단편의 한쪽 가닥을 신속하게 분해하여, 타겟 핵산을 포함한 핵산 단편이 파괴되며, 게놈 또는 에피좀 핵산의 좌측 암 (4) 및 우측 암 (5)에는 3' 꼬리가 남게 된다 (도 3C).
도 4. 타겟 핵산 (cont'd)의 적출. 좌측 암과 우측 암에서 한 가닥이 분해되어, 각 암에서 확인되는 탠덤 리피트가 노출되는데, 이들 탠덤 리피트는 상호 상보적이다 (도 4A). 탠덤 리피트에서 상보적인 영역들은 헤테로두플렉스(heteroduplex)를 형성하며, 숙주 세포 단백질에 의해 촉진되는 재조합 과정을 겪게 된다. 우측 암 (7)과 좌측 암 (8)에서 단일 가닥의 3' 최말단은 상보성이 없으므로, 제1 및 제2 탠덤 리피트의 상보적인 부분들로 형성된 헤테로두플렉스 파트에 해당되지 않는다. 이들 비상보적인 3' 최말단은 플랩(flap) 뉴클레아제로 절단될 수 있다. 마지막으로, 복구 DNA 합성 및 DNA 리가제가 헤테로두플렉스를 메우고 닉(nick)을 연결하여, 타겟 핵산이 정확하게 적출된 온전한 게놈 또는 에피좀 핵산을 형성시킨다 (도 4C).
도 2. 적출성 핵산 구조체는 형질전환되어, 병합부 매개 상동성 재조합을 통해 숙주 세포의 게놈의 특정 유전자 좌에서 타겟 핵산을 낫-아웃(knock-out) 및/또는 낫-인(knock-in) 한다. 타겟 핵산의 양쪽에는 호밍 엔도뉴클레아제 제한효소 부위가 2 카피 (각각 ES1 및 ES2) 존재하며, 그 옆에는 절단 후 복구를 지시하는 2개의 탠덤 리피트 (각각 DR1 및 DR2)가 존재한다.
도 3. 타겟 핵산의 적출. 일부 구현예들에서, 제1 및 제2 호밍 (도 3A) 엔도뉴클레아제 인지부는 각각 (ES1 및 ES2) 하나 이상의 대응되는 호밍 엔도뉴클레아제 (HE)에 의해 절단되어, 핵산 단편 3개가 수득된다: (1) 게놈 또는 에피좀 핵산의 좌측 암, (2) 타겟 핵산을 포함하는 핵산 단편, 및 (3) 게놈 또는 에피좀 핵산의 우측 암 (도 3B). 절단 후, 숙주 세포에서 내인성의 5' → 3' 엑소뉴클레아제가 각 핵산 단편의 한쪽 가닥을 신속하게 분해하여, 타겟 핵산을 포함한 핵산 단편이 파괴되며, 게놈 또는 에피좀 핵산의 좌측 암 (4) 및 우측 암 (5)에는 3' 꼬리가 남게 된다 (도 3C).
도 4. 타겟 핵산 (cont'd)의 적출. 좌측 암과 우측 암에서 한 가닥이 분해되어, 각 암에서 확인되는 탠덤 리피트가 노출되는데, 이들 탠덤 리피트는 상호 상보적이다 (도 4A). 탠덤 리피트에서 상보적인 영역들은 헤테로두플렉스(heteroduplex)를 형성하며, 숙주 세포 단백질에 의해 촉진되는 재조합 과정을 겪게 된다. 우측 암 (7)과 좌측 암 (8)에서 단일 가닥의 3' 최말단은 상보성이 없으므로, 제1 및 제2 탠덤 리피트의 상보적인 부분들로 형성된 헤테로두플렉스 파트에 해당되지 않는다. 이들 비상보적인 3' 최말단은 플랩(flap) 뉴클레아제로 절단될 수 있다. 마지막으로, 복구 DNA 합성 및 DNA 리가제가 헤테로두플렉스를 메우고 닉(nick)을 연결하여, 타겟 핵산이 정확하게 적출된 온전한 게놈 또는 에피좀 핵산을 형성시킨다 (도 4C).
5.
5.1 정의
본원에서, 용어 "호밍 엔도뉴클레아제"는 본래의 생물학적 기능상 특정 유전자의 엔도뉴클레아제-코딩 대립유전자를 유전자의 엔도뉴클레아제-결핍 대립유전자에 전파하는 유전자 변환 현상을 촉매하는 수종의 임의의 엔도뉴클레아제의 일종이다. 예를 들어, Chevalier, Nucleic Acids Res 1(29): 3757-74 (2001); Jacquier, Cell 41: 383-94 (1985)를 참조한다. 1) LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, 2) HNH 호밍 엔도뉴클레아제, 3) His-Cys box 호밍 엔도뉴클레아제, 4) GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제, 및 5) 시아노박테리아 호밍 엔도뉴클레아제를 비롯하여, 5종 이상의 호밍 엔도뉴클레아제 유형들이 공지되어 있다. 예를 들어, Stoddard, Quarterly Review of Biophysics 38(1): 49-95 (2006)를 참조한다. 이들 유형의 특이적인 호밍 엔도뉴클레아제의 예로는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI이 있으나, 이로 한정되지 않는다. 당해 기술 분야의 당업자라면, 동일하거나 또는 유사한 호밍 엔도뉴클레아제 제한효소부위위를 인식하여 이를 또는 이에 인접하여 절단하는 상기한 엔도뉴클레아제의 천연 또는 인공 변이체들이 이러한 정의에 포함됨을 알 것이다.
본원에서, 용어 "호밍 엔도뉴클레아제 인지부"는 특이적인 호밍 엔도뉴클레아제에 의해 인지되는 핵산을 지칭한다. 호밍 엔도뉴클레아제는 호밍 엔도뉴클레아제 인지부에 결합한 다음, 호밍 엔도뉴클레아제 인지부에서 또는 이에 인접하여 이중가닥 브레이크(double strand break)를 행할 수 있다.
본원에서, 용어 "인접하여"는 특정 핵산으로부터 약 1 내지 약 100, 1 내지 약 75, 1 내지 약 50, 1 내지 약 25, 1 내지 약 20, 1 내지 약 15, 1 내지 약 10, 또는 1 내지 약 5개의 뉴클레오티드 간격을 의미한다.
본원에서, 용어 호밍 엔도뉴클레아제와 관련하여 "절단한다" 및 "절단"은 특정 핵산에 이중가닥 브레이크를 행하는 행위를 지칭한다. 이중가닥 브레이크는, 당해 기술 분야의 당업자에게 이해되는 바와 같이, 블런트 엔드(blunt end) 또는 스티키 엔드(sticky end) (즉, 5' 또는 3' 오버행)를 남길 수 있다.
본원에서, 용어 "탠덤 리피트"는, 각 구성원이 서로간에 재조합을 매개할만큼 충분한 뉴클레오티드 상동성을 공유하는, 2 이상의 핵산으로 구성된 그룹에 속하는 핵산을 지칭한다. 탠덤 리피트들은 탠덤 배치된 다른 구성원이 동일한 방향 ("동향 탠덤 리피트 (direct tandem repeat)") 또는 역방향 ("역위된 탠덤 리피트 (inverted tandem repeat)")으로 배열된다.
본원에서, 용어 "타겟 DNA 단편 (target DNA segment)"은 본원에 제공되는 조성물과 방법을 이용하여 숙주 세포 게놈으로부터 적출되는 임의의 타겟 DNA 단편을 지칭한다. 이용가능한 예로는, 단백질-코딩 서열, 선별 마커, 리포터 유전자, 형광 마커 코딩 서열, 프로모터, 인핸서, 종결인자, 전사 활성인자, 전사 억제인자, 전사 활성인자 결합부, 전사 언제인자 결합부, 인트론, 엑손, 폴리-A 꼬리, 다중 클로닝 부위, 핵 국지화 신호, mRNA 안정화 신호, 병합 유전자 좌, 에피토프 테그 코딩 서열, 분해 신호 또는 임의의 다른 천연 또는 합성 DNA 분자가 있으나, 이로 한정되지 않는다. 일부 구현예에서, 타겟 DNA 단편은 천연 기원의 것일 수 있다. 다른 구현예에서, 타겟 DNA 단편은 시험관내에서 제조되는 완전히 합성 기원의 것일 수 있다. 아울러, 타겟 DNA 단편은 분리된 천연 DNA 분자들간의 임의 조합 또는 분리된 천연 DNA 분자와 합성 DNA 분자의 임의 조합을 포함할 수 있다. 예를 들어, 타겟 DNA 단편은 단백질 코딩 서열에 작동가능하게 연결된 이종 프로모터, 폴리-A 꼬리에 연결된 단백질 코딩 서열, 에피토프 테그 코딩 서열과 인-프래임으로 연결된 단백질 코딩 서열 등을 포함할 수 있다.
본원에서, 용어 "벡터"는 세포에서 복제될 수 있으며, 삽입 서열이 복제될 수 있도록 삽입 서열이 작동가능하게 연결될 수 있는 염색체외 핵산 분자를 지칭한다. 이용가능한 예로는 플라스미드 구조체, 파지 구조체, 코스미드 벡터 등의 원형 DNA 분자 뿐만 아니라 선형 핵산 구조체 (예, 람다 파지 구조체, 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC) 등)가 있으나, 이로 한정되지 않는다. 벡터는 프로모터 및/또는 종결인자와 같은 발현 신호, 항생제 내성 부여 유전자와 같은 선별 마커 및 삽입 서열을 클로닝할 수 있는 하나 이상의 제한효소부위를 포함할 수 있다. 벡터는 그외 고유 특징 (예, 벡터가 수용할 수 있는 DNA 삽입체 크기)을 가질 수 있다.
본원에서 "게놈"은 숙주 세포에 포함된 염색체 DNA와 에피좀 DNA 둘다를 지칭한다.
5.2 적출성 핵산 구조체
일 측면에서, 본 발명은 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 타겟 DNA 단편 (D), 및 c) 제2 탠덤 리피트 (DR2), 뿐만 아니라 DR1과 D 사이에, 또는 D와 DR2 사이에 위치된 제1 호밍 엔도뉴클레아제 인지부 (ES1)와, 선택적으로 D와 DR2 사이에 또는 DR1과 D 사이에 위치된 제2 호밍 엔도뉴클레아제 인지부 (ES2)를 각각 포함하는, 적출성 핵산 구조체 (도 1A)를 제공한다. 따라서, 일부 구현예에서, 상기 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 제1 호밍 엔도뉴클레아제 인지부 (ES1), c) 타겟 DNA 단편 (D), 및 d) 제2 탠덤 리피트 (DR2)를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 타겟 DNA 단편 (D), c) 제1 호밍 엔도뉴클레아제 인지부 (ES1), 및 d) 제2 탠덤 리피트 (DR2)를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 제1 호밍 엔도뉴클레아제 인지부 (ES1), c) 타겟 DNA 단편 (D), d) 제2 호밍 엔도뉴클레아제 인지부 (ES2), 및 e) 제2 탠덤 리피트 (DR2)를 포함한다.
일부 구현예에서, 전술한 적출성 핵산 구조체는 추가적으로 제1 탠덤 리피트의 5'에 연결되는 제1 게놈 병합 서열 (IS1)과, 제2 탠덤 리피트의 3'에 연결되는 제2 게놈 병합 서열 (IS2)를 포함한다. 따라서, 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 병합 서열 (IS1), b) 제1 탠덤 리피트 (DR1), c) 제1 호밍 엔도뉴클레아제 인지부 (ES1), d) 타겟 DNA 단편 (D), e) 제2 탠덤 리피트 (DR2), 및 f) 제2 병합 서열 (IS2)을 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 병합 서열 (IS1), b) 제1 탠덤 리피트 (DR1), c) 타겟 DNA 단편 (D), d) 제1 호밍 엔도뉴클레아제 인지부 (ES1), e) 제2 탠덤 리피트 (DR2), 및 f) 제2 병합 서열 (IS2)을 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 병합 서열 (IS1), b) 제1 탠덤 리피트 (DR1), c) 제1 호밍 엔도뉴클레아제 인지부 (ES1), d) 타겟 DNA 단편 (D), e) 제2 호밍 엔도뉴클레아제 인지부 (ES2), f) 제2 탠덤 리피트 (DR2), 및 g) 제2 병합 서열 (IS2)을 포함한다.
유리하게는, 제1 및 제2 병합 서열은 숙주 세포 게놈으로의 적출성 핵산 구조체의 병합을 촉진할 수 있다. 적출성 핵산 구조체는, 숙주 세포 게놈에 병합될 때, 숙주 세포 게놈으로부터 타겟 DNA 단편 (D)이 높은 빈도와 높은 충실성으로 적출되도록 한다. 일부 구현예에서, 적출성 핵산 구조체는 선형 DNA 분자이다.
유전자 조작 적용시, 또는 제조 환경 또는 천연 환경으로 유기체를 방출하기 전에 항생제 내성 마커를 제거하기 위해, 적출성 핵산 구조체를 사용하여 선별 마커의 적출을 용이하게 수행할 수 있다. 또한, 이를 사용하여 숙주 세포와 이의 후손에서 유전자의 발현을 영구적으로 작동 또는 정지시킬 수 있다. 유전자의 발현을 방지하기 위해, 이의 시스-작동성 조절 서열, 이의 코딩 서열 또는 전사 활성인자를 코딩하는 유전자를 적출할 수 있다. 유전자의 발현을 촉발시키기 위해, 유전자 또는 전사 억제인자의 DNA 결합부를 적출하여, 이의 조절되는 유전자(들)가 발현되게 하거나, 또는 DNA의 간섭 가닥을 적출하여 특정 유전자의 발현에 요구되는 인자들 간에 필수적인 인접한 상호작용을 형성시킬 수 있다.
적출성 핵산 구조체는 당해 기술 분야의 당업자에게 자명한 임의 기법으로 제조할 수 있다. 특정 구현예들에서, 적출성 핵산 구조체는 당해 기술 분야에 잘 알려져 있는 중합효소 연쇄 반응 (PCR)과 분자 클로닝 기법들로 제조한다. 예를 들어, PCR Technology: Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; PCR Technology: Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989)를 참조한다.
적출성 핵산 구조체의 각각의 효소는 아래에서 상세하게 논의된다.
5.2.1. 호밍 엔도뉴클레아제 인지부
적출성 핵산 구조체는 적어도 제1 호밍 엔도뉴클레아제 인지부 (ES1)와, 선택적으로 제2 호밍 엔도뉴클레아제 인지부 (ES2)를 포함한다. 적출성 핵산 구조체가 제1 호밍 엔도뉴클레아제 인지부만을 포함하는 경우, 일부 구현예에서, ES1은 제1 탠덤 리피트 (DR1)의 3'과 타겟 DNA 단편 (D)의 5'에, 또는 타겟 DNA 단편 (D)의 3'과 제2 탠덤 리피트 (DR2)의 5'에 위치될 수 있다. 적출성 핵산 구조체가 제1 및 제2 호밍 엔도뉴클레아제 인지부를 포함하는 경우, 일부 구현예에서, ES1은 제1 탠덤 리피트 (DR1)의 3'과 타겟 DNA 단편 (D)의 5'에 위치되고, ES2는 타겟 DNA 단편 (D)의 3'과 제2 탠덤 리피트 (DR2)의 5'에 위치된다. 특정 구현예들에서, ES1은 D 영역내에 위치된다.
호밍 엔도뉴클레아제 인지부는 해당 호밍 엔도뉴클레아제가 적출성 핵산 구조체를 호밍 엔도뉴클레아제 인지부에서 또는 인접하여 절단할 수 있게 한다.
호밍 엔도뉴클레아제 인지부는 14-40개의 뉴클레오티드 염기 쌍 길이이다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 14-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 18-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 20-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 25-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 30-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 35-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 24개의 뉴클레오티드로 구성된다.
일부 구현예에서, ES1은 DR1의 3'과 D의 5'에 위치한다. 일부 구현예에서, ES1은 DR1의 3' 말단에 위치한다. 일부 구현예에서, ES1은 DR1의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1은 DR1의 3' 말단으로 하류에 위치한다. 일부 구현예에서, ES1은 D의 5' 말단에 위치한다. 일부 구현예에서, ES1은 D의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1은 D의 5' 말단으로 상류에 위치한다.
일부 구현예에서, ES1은 D의 3'과 DR2의 5'에 위치한다. 일부 구현예에서, ES1은 D의 3' 말단에 위치한다. 일부 구현예에서, ES1은 D의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1은 D의 3' 말단으로 하류에 위치한다. 일부 구현예에서, ES1은 DR2의 5' 말단에 위치한다. 일부 구현예에서, ES1은 DR2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단으로 상류에 위치한다.
일부 구현예에서, ES2는, ES1과 조합하여 존재하는 경우, D의 3'과 DR2의 5'에 위치한다. 일부 구현예에서, ES2는 D의 3' 말단에 위치한다. 일부 구현예에서, ES2는 D의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES2는 D의 3' 말단으로 하류에 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단에 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단으로 상류에 위치한다.
일부 구현예에서, ES1과 ES2가 둘다 존재하는 경우, ES1과 ES2는 서로 역방향(orientation)으로 배치된다. 일부 구현예에서, ES1과 ES2가 둘다 존재하는 경우, ES1과 ES2는 서로 동향으로 배치된다.
일부 구현예에서, ES1과 ES2는 당해 기술 분야에 공지된 임의의 호밍 엔도뉴클레아제에 대한 인지부들이다. 다수 유형의 호밍 엔도뉴클레아제 (그룹 II 인트론 제외)는 4 bp 단일가닥 3' 오버행을 가진 스테거형(staggered) 이중 가닥 브레이크 (DSB)가 만들어지게 한다. 일부 구현예에서, ES1과 ES2 중 적어도 하나는 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 특정 구현예들에서, ES1과 ES2는 각각 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 예를 들어, Stoddard, Quarterly Review of Biophysics 38(1): 49-95 (2006)를 참조한다. 이들 패밀리들은 이들의 보존된 뉴클레아제 활성부 코어 모티프 및 촉매 기전, 생물학적 및 게놈 분포, 및 비-호밍 뉴클레아제 시스템과의 광범위한 관련성 측면에 큰 차이가 있다. 이들 패밀리 유래의 유용한 특이적인 호밍 엔도뉴클레아제의 예로는 I-CreI (Rochaix et al., Nucleic Acids Res. 13: 975-984 (1985), I-MsoI (Lucas et al., Nucleic Acids Res. 29: 960-969 (2001), I-SceI (Foury et al., FEBS Lett. 440: 325-331 (1998), I-SceIV (Moran et al., Nucleic Acids Res. 20: 4069-4076 (1992), H-DreI (Chevalier et al., Mol. Cell 10: 895-905 (2002), I-HmuI (Goodrich-Blair et al., Cell 63: 417-424 (1990); Goodrich-Blair et al., Cell 84: 211-221 (1996), I-PpoI (Muscarella et al., Mol. Cell. Biol. 10: 3386-3396 (1990), I-DirI (Johansen et al., Cell 76: 725-734 (1994); Johansen, Nucleic Acids Res. 21: 4405 (1993), I-NjaI (Elde et al., Eur. J. Biochem. 259: 281-288 (1999); De Jonckheere et al., J. Eukaryot. Microbiol. 41: 457-463 (1994), I-NanI (Elde et al., S. Eur. J. Biochem. 259: 281-288 (1999); De Jonckheere et al., J. Eukaryot. Microbiol. 41: 457-463 (1994)), I-NitI (De Jonckheere et al., J. Eukaryot. Microbiol. 41: 457-463 (1994); Elde et al., Eur. J. Biochem. 259: 281-288 (1999), I-TevI (Chu et al., Cell 45: 157-166 (1986), I-TevII (Tomaschewski et al., Nucleic Acids Res. 15: 3632-3633 (1987), I-TevIII (Eddy et al., Genes Dev. 5: 1032-1041 (1991), F-TevI (Fujisawa et al., Nucleic Acids Res. 13: 7473-7481 (1985), F-TevII (Kadyrov et al., Dokl. Biochem. 339: 145-147 (1994); Kaliman, Nucleic Acids Res. 18: 4277 (1990), F-CphI (Zeng et al., Curr. Biol. 19: 218-222 (2009), PI-MgaI (Saves et al., Nucleic Acids Res. 29:4310-4318 (2001), I-CsmI (Colleaux et al., Mol. Gen. Genet. 223:288-296 (1990), I-CeuI (Turmel et al., J .Mol. Biol. 218: 293-311 (1991) 및 PI-SceI (Hirata et al., .J. Biol. Chem. 265: 6726-6733 (1990)이 있으나, 이로 한정되지 않는다.
일부 구현예에서, ES1 또는 ES2 중 하나 이상은 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 특정 구현예들에서, 각각의 ES1과 ES2는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다.
본원에 제공되는 조성물 및 방법에 대한 개개 구현예들에서, ES1과 ES2는 숙주 세포의 야생형 (조작되지 않은) 핵 DNA에 호밍 엔도뉴클레아제 인지부가 없다는 점에 기초하여 선정된다. 예를 들어, I-SceI, PI-MtuII(pps1), PI-MgaI(pps1), 및 F-CphI에 대한 인지부는 야생형 (조작되지 않은) 사카로마이세스 세레비지애의 핵 DNA에는 존재하지 않지만 (예, Curr Biol 2009;19:218-22; Proc Natl Acad Sci U S A 1988;85:6022-6; J Biol Chem 2002;277:16257-64; J Biol Chem 2002;277:40352-61; Nucleic Acids Res 2001;29:4310-8), VDE aka PI-SceI에 대한 인지부는 일부 균주들에는 존재하나 다른 균주들에는 존재하지 않는다 (예, Nucleic Acids Res 2001;29:4215-23). 따라서, 본원에 제공되는 조성물 및 방법에 대한 일부 구현예에서, ES1과 ES2는 I-SceI에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다. 일부 구현예에서, ES1과 ES2는 PI-MtuII(pps1)에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다. 일부 구현예에서, ES1과 ES2는 PI-MgaI(pps1)에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다. 일부 구현예에서, ES1과 ES2는 F-CphI에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다.
일부 구현예에서, ES1과 ES2의 선택은 하기 한가지 이상의 기준에 부합되는지를 기초로 이루어진다: (1) 호밍 엔도뉴클레아제 인지부가 숙주 세포의 야생형 (조작되지 않은) 게놈 전체 (즉, 미토콘드리아 DNA 포함)에 존재하지 않음; (2) 대응되는 호밍 엔도뉴클레아제가 발현되지 않은 경우, 호밍 엔도뉴클레아제에 대한 인지부는 절단되지 않음; 및 (3) 예컨대 게놈에 병합된 타겟 핵산의 적출을 유도하기 위한 핵내 대응되는 호밍 엔도뉴클레아제의 발현이 숙주 세포에 유해하지 않음. 일부 구현예에서, 숙주 세포의 야생형 (조작되지 않은) 핵 DNA에 존재하지 않은 것 외에도, ES1과 ES2는 전술한 기준 1, 2 또는 3가지 모두를 충족시킨다.
5.2.2. 탠덤 리피트
적출성 핵산 구조체는 제1 및 제2 탠덤 리피트를 포함한다. 제1 탠덤 리피트 (DR1)는 타겟 DNA 단편 (D)의 5'에 존재하며, 제2 탠덤 리피트 (DR2)는 타겟 DNA 단편 (D)의 3'에 존재한다.
제1 및 제2 탠덤 리피트는 호밍 엔도뉴클레아제에 의해 절단된 후 적출성 핵산 구조체의 잔류물의 재조합을 매개할 수 있다. 서로 동일한 방향으로 위치된 탠덤 리피트 (동향 탠덤 리피트)는 유리하게는 한가지 표준 어닐링 경로를 통해 숙주 세포에서 염색체간의 재조합을 매개할 수 있다. 예로, Ivanov et al., Genetics 142:693-704 (1996)를 참조한다.
DR1과 DR2는 호밍 엔도뉴클레아제에 의해 절단된 후 적출성 핵산 구조체의 잔류물의 재조합을 매개할 수 있는 임의의 탠덤 리피트일 수 있다. 이러한 재조합에 영향을 미칠 수 있는 탠덤 리피트의 특성으로는, 길이, GC 함량, 숙주 세포 게놈의 천연 서열과의 상동성 및 탠덤 리피트들 간의 서열 동일성 수준을 포함하나, 이로 한정되지 않는다. 서열 동일성 정도는 디폴트 파라미터를 이용하여, BLAST 2.2.2 또는 FASTA version 3.0t78과 같이 본원에 기술된 바를 비롯하여, 임의의 컴퓨터 프로그램과 관련 파라미터를 이용하여 결정할 수 있다.
일부 구현예에서, DR1은 ES1의 5' 말단에 위치한다. 일부 구현예에서, DR1은 ES1의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, DR1은 ES1의 5'으로 상류에 위치한다.
일부 구현예에서, DR2는 ES1의 3' 말단에 위치하거나, ES1과 ES2 둘다 ES2의 3'에 존재한다. 일부 구현예에서, DR2는 ES1의 3' 말단에 바로 인접하여 위치하거나, ES1과 ES2 둘다가 존재하는 경우에는 ES2의 3' 말단에 위치한다. 일부 구현예에서, DR2는 ES1의 3' 말단으로 하류에 위치하거나, 또는 ES1과 ES2 둘다가 존재하는 경우에는 ES2의 3' 말단에 위치한다.
일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18개 이상의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 500개의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 500, 18 - 495, 18 - 490, 18 - 485, 18 - 480, 18 - 475, 18 - 470, 18 - 465, 18 - 460, 18 - 455, 18 - 450, 18 - 445, 18 - 440, 18 - 435, 18 - 430, 18 - 425, 18 - 420, 18 - 415, 18 - 410, 18 - 405, 18 - 400, 18 - 395, 18 - 390, 18 - 385, 18 - 380, 18 - 375, 18 - 370, 18 - 365, 18 - 360, 18 - 355, 18 - 350, 18 - 345, 18 - 340, 18 - 335, 18 - 330, 18 - 325, 18 - 320, 18 - 315, 18 - 310, 18 - 305, 18 - 300, 18 - 295, 18 - 290, 18 - 285, 18 - 280, 18 - 275, 18 - 270, 18 - 265, 18 - 260, 18 - 255, 18 - 250, 18 - 245, 18 - 240, 18 - 235, 18 - 230, 18 - 225, 18 - 220, 18 - 215, 18 - 210, 18 - 205, 18 - 200, 18 - 195, 18 - 190, 18 - 185, 18 - 180, 18 - 175, 18 - 170, 18 - 165, 18 - 160, 18 - 155, 18 - 150, 18 - 145, 18 - 140, 18 - 135, 18 - 130, 18 - 125, 18 - 120, 18 - 115, 18 - 110, 18 - 105, 18 - 100, 18 - 95, 18 - 90, 18 - 85, 18 - 80, 18 - 75, 18 - 70, 18 - 65, 18 - 60, 18 - 55, 18 - 50, 18 - 45, 18 - 40, 18 - 35, 18 - 30, 18 - 25, 또는 18 - 20개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94 , 95 96, 97 ,98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194 , 195, 196, 197, 198, 199 또는 200개의 뉴클레오티드 염기 쌍으로 구성된다.
일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 200개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 150개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 100개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 80개의 뉴클레오티드 염기 쌍으로 구성된다.
일부 구현예에서, DR1과 DR2는 25% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 30% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 35% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 40% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 45% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 50% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 60% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 65% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 70% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 75% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 80% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 85% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 90% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 95% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 99% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 100%의 뉴클레오티드 서열 동일성을 공유한다.
바람직한 구현예들에서, DR1과 DR2는 서로 동일한 방향으로 위치한다 (즉, 이는 동향 탠덤 리피트임).
5.2.3. 타겟 DNA 단편
적출성 핵산 구조체는 타겟 DNA 단편 (D)을 포함한다. 일부 구현예에서, 타겟 DNA 단편 (D)는 제1 호밍 엔도뉴클레아제 인지부 (ES1)의 3'에 위치한다. 일부 구현예에서, 제2 호밍 엔도뉴클레아제 인지부 (ES2)가 존재하는 경우에는, 타겟 DNA 단편 (D)은 ES2의 5'에 위치한다. 일부 구현예에서, 타겟 DNA 단편 (D)은 제1 호밍 엔도뉴클레아제 인지부 (ES1)의 3'과 제2 탠덤 리피트 (DR2)의 5'에 위치한다. 일부 구현예에서, 타겟 DNA 단편 (D)은 제1 탠덤 리피트 (DR1)의 3'과 제1 호밍 엔도뉴클레아제 인지부 (ES1)의 5'에 위치한다.
일부 구현예에서, D의 5' 말단은 ES1의 3' 말단에 위치한다. 일부 구현예에서, D의 5' 말단은 ES1의 3'에 바로 인접하여 위치한다. 일부 구현예에서, D의 5' 말단은 ES1의 3' 말단으로 하류에 위치한다.
일부 구현예에서, D의 5' 말단은 DR1의 3' 말단에 위치한다. 일부 구현예에서, D의 5' 말단은 DR1의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, D의 5' 말단은 DR1의 3' 말단으로 하류에 위치한다.
일부 구현예에서, ES1이 ES2와 조합하여 존재하는 경우, D의 3' 말단은 ES2의 5' 말단에 위치한다. 일부 구현예에서, ES1이 ES2와 조합하여 존재하는 경우, D의 3' 말단은 ES2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1이 ES2와 조합하여 존재하는 경우, D의 3' 말단은 ES2의 5' 말단으로 상류에 위치한다.
일부 구현예에서, D의 3' 말단은 DR2의 5' 말단에 위치한다. 일부 구현예에서, D의 3' 말단은 DR2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, D의 3' 말단은 DR2의 5' 말단으로 상류에 위치한다.
타겟 DNA 단편은 당해 기술 분야의 당업자에게 유용한 것으로 간주되는 임의의 타겟 DNA 단편일 수 있다. 예를 들어, 타겟 DNA 단편은 숙주 게놈에서 "낫 인"된 다음 적출에 의해 낫 아웃될 수 있는 대상 유전자를 포함할 수 있다. 일부 구현예에서, 타겟 핵산은 적출성 핵산 구조체의 숙주 게놈으로의 병합을 선별하기 위해 이용할 수 있으며, 이후 적출에 의해 숙주 게놈으로부터 제거될 수 있는 선별 마커를 포함할 수 있다.
유용한 타겟 DNA 단편의 예로는 단백질 코팅 서열, 선별 마커, 리포터 유전자, 형광 마커 코딩 서열, 프로모터, 인핸서, 종결인자, 전사 활성인자, 전사 억제인자, 전자 활성인자 결합부, 전사 억제인자 결합부, 인트론, 엑손, 폴리-A 꼬리, 다중 클로닝 부위, 핵 국지화 신호, mRNA 안정화 신호, 병합 유전자 좌, 에피토프 테그 코딩 서열, 분해 신호 또는 임의의 그외 천연 또는 합성 DNA 분자가 있으나, 이로 한정되지 않는다. 일부 구현예에서, DNA 단편은 천연 기원의 것일 수 있다. 다른 구현예에서, 타겟 DNA 단편은 시험관에서 제조되는 완전한 합성 기원의 것일 수 있다. 아울러, 타겟 DNA 단편은 분리된 천연 DNA 분자들의 임의 조합 또는 분리된 천연 DNA 분자와 합성 DNA 분자의 임의 조합을 포함할 수 있다. 예를 들어, 타겟 DNA 단편은 단백질 코딩 서열에 작동가능하게 연결된 이종 프로모터, 폴리-A 꼬리에 연결된 단백질 코딩 서열, 에피토프 테그 코딩 서열과 인 프래임으로 연결된 단백질 코딩 서열 등을 포함할 수 있다. 타겟 DNA 단편은 클로닝된 DNA (예, DNA "라이브러리")로부터 화학 합성에 의해, cDNA 클로닝에 의해, 또는 게놈 DNA 또는 이의 단편의 클론닝에 의해, 바람직한 세포로부터 정제하여, 또는 PCR 증폭 및 클로닝에 의해, 당해 기술 분야에 공지된 표준 공정들에 의해 수득할 수 있다. 예를 들어, Sambrook et al., Molecular Cloning, A Laboratory Manual, 3d. ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001); Glover, D.M. (ed.), DNA Cloning: A Practical Approach, 2d. ed., MRL Press, Ltd., Oxford, U.K. (1995)를 참조한다.
일부 구현예에서, D는 호밍 엔도뉴클레아제를 코딩하는 핵산에 작동가능하게 연결된 프로모터 인자를 포함한다. 예를 들어, 적출성 핵산 구조체가 예컨대 호밍 엔도뉴클레아제 F-CphI에 대한 제1 및 제2 인지부를 포함하는 경우, 타겟 DNA 단편은 F-CphI을 코딩하는 핵산 서열을 포함할 수 있으며, 핵산 서열은 프로모터 인자에 작동가능하게 연결된다. 개개 구현예들에서, 호밍 엔도뉴클레아제를 코딩하는 핵산의 발현을 제어하는 프로모터 인자는, 호밍 엔도뉴클레아제를 코딩하는 서열을 비롯한 타겟 DNA 단편이, 예컨대 숙주 세포 게놈으로 적출성 핵산 구조체가 병합된 후, 선택적으로 적출될 수 있도록, 유도성 프로모터, 예를 들어, 사카로마이세스 세레비지애의 갈락토스 유도성 프로모터 (예, GAL1, GAL7 및 GAL10 유전자들의 프로모터)이다. 일부 구현예에서, 호밍 엔도뉴클레아제는 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택된다. 특정 구현예들에서, 호밍 엔도뉴클레아제는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-NgrI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, PI-MtuII, I-CsmI, I-PanI, I-CeuI 및 PI-SceI으로 이루어진 군으로부터 선택된다. 개개 구현예들에서, 호밍 엔도뉴클레아제는 I-SceI이다. 특정 구현예들에서, 호밍 엔도뉴클레아제는 F-CphI이다.
일부 구현예에서, D는 하나 이상의 선별 마커를 코딩한다. 일부 구현예에서, 선별 마커는 항생제 내성 마커이다. 항생제 내성 마커는 재조합 핵산 서열을 제조하기 위해 사용되는 플라스미드 벡터들에서 일반적이다. 예를 들어, pBR 및 pUC-유래 플라스미드는 박테리아 약물 내성 마커 AMP r 또는 BLA 유전자를 선별 마커로서 포함한다 (Sutcliffe, J. G., et al., Proc. Natl. Acad. Sci. U.S.A. 75:3737 (1978)). BLA 유전자는, 베타-락타마제로 기능하며, 협역성(narrow-spectrum) 세팔로스포린, 세파마이신 및 카바페넴 (에르타페넴), 세파만돌, 세포페라존, 및 테목실린을 제외한 모든 항-그람 음성 박테리아 페니실린류들 등의, 베타-락탐 항생제에 대한 박테리아 내성을 담당하는, 효소 Tem-1을 코딩한다.
그외 이용가능한 선별 마커로는 NAT1, PAT, AUR1-C, PDR4, SMR1, CAT, 마우스 dhfr, HPH, DSDA, KAN R , 및 SH BLE 유전자가 있으나, 이로 한정되지 않는다. S. 노우르세이(S. noursei)의 NAT1 유전자는 노우르세오트리신(노르세오트리신) N-아세틸트랜스퍼라제를 코딩하며, 노우르세오트리신에 대한 내성을 부여한다. S. 비리도크로모게네스 (S. viridochromogenes) Tu94의 PAT 유전자는 포스피노트리신 N-아세틸트랜스퍼라제를 코딩하며, 바이알로포스(bialophos)에 대한 내성을 부여한다. 사카로마이세스 세레비지애의 AUR1-C 유전자는, 출아 효모 사카로마이세스 세레비지애에 유해한 아우레오바시디윰 풀룰란스(Auerobasidium pullulans)로부터 생산되는 항진균 항생제인 아우레로바시딘 A (AbA)에 대한 내성을 부여한다. PDR4 유전자는 세룰레닌(cerulenin)에 대한 내성을 부여한다. SMR1 유전자는 설포메투론 메틸에 대한 내성을 부여한다. Tn9 유래 CAT 코딩 서열은 클로람페니콜에 대한 내성을 부여한다. 마우스 dhfr 유전자는 메토트렉세이트에 대한 내성을 부여한다. 클렙시엘라 뉴모니아 (Klebsiella pneumonia)의 HPH 유전자는 히그로마이신 B 포스포트랜스퍼라제를 코딩하며, 히그로마이신 B에 대한 내성을 부여한다. E. coli의 DSDA 유전자는 D-세린 디아미나제를 코딩하며, 효모가 단독 질소원으로서 D-세린이 첨가된 플레이트에서 생장할 수 있도록 만든다. Tn903 트랜스포존의 KAN R 유전자는 아미노글리코사이드 포스포트랜스퍼라제를 코딩하며, G418에 대한 내성을 부여한다. 스트렙토알로테이쿠스 힌두스타누스(Streptoalloteichus hindustanus)의 SH BLE 유전자는 제오신 결합 단백질을 코딩하며, 제오신 (블레오마이신)에 대한 내성을 부여한다.
다른 구현예들에서, 선별 마커는 효모 숙주 균주의 형질전환된 세포를 선별할 수 있게 하는 효모 유전자를 포함한다. 일부 구현예에서, 선별 마커는 숙주 균주에서 영양 요구성(auxotrophy), 예컨대 영양성 요구성(nutritional auxotrophy)을 복원시킨다. 이러한 구현예에서, 숙주 균주는, 예를 들어 HIS3, LEU2, LYS1, MET15 및 TRP1와 같은 영양 요구 표현형을 유발하는 숙주의 아미노산 생합성 경로의 하나 이상의 유전자의 기능적 파괴, 또는 예를 들어 ADE2 및 URA3와 같은 영양 요구 표현형을 유발하는 숙주의 뉴클레오티드 생합성 경로의 하나 이상의 유전자의 기능적 파괴를 포함한다. 개개 구현예들에서, 유전자 변형된 효모 숙주 균주는 URA3 유전자의 기능적 파괴를 포함한다. 숙주 효모에서의 영양 요구 표현형을 유발하는 기능적 파괴는 점 돌연변이, 부분 또는 전체 유전자 결손, 또는 뉴클레오티드의 부가 또는 치환일 수 있다. 아미노산 또는 뉴클레오티드 생합성 경로에서의 기능적 파괴는, 숙주 균주가, 자가 영양의 야생형 균주와는 대조적으로, 한가지 이상의 영양분을 첨가하지 않고는 배지에서 최적으로 생육할 수 없는, 영양 요구성 돌연변이가 되도록 만든다. 숙주 균주에서 기능적으로 파괴된 생합성 유전자는, 예컨대 파괴된 생합성 유전자의 기능성 카피를 포함하는 하나 이상의 플라스미드의 도입시, 나중에 복구될 수 있는 영양 요구성 유전자 마커로서 사용할 수 있다.
선별 마커로서 URA3, TRP1 및 LYS2 효모 유전자를 이용하는 것은, 양성 및 음성 선별 둘다가 가능하므로, 특히 유익하다. 양성 선별은 URA3, TRP1 및 LYS2 돌연변이의 영양 요구성 보완 (auxotrophic complementation)에 의해 이루어지는 반면, 음성 선별은 자가 영양성 균주의 생육은 저해하지만 URA3, TRP1 및 LYS2 돌연변이 각각의 생육은 허용하는, 특이적인 저해제들, 즉 5-플루오로-오로트산 (FOA), 5-플루오로안트라닐산 및 a-아미노아디프산 (aAA)을 토대로 한다. URA3 유전자는 우라실의 생합성에 필수적인 효소인 오로티딘-5' 포스페이트 데카르복실라제를 코딩한다. Ura3- (또는 ura5-) 세포는, 데카르복실라제의 작용에 의해 FOA가 독성 화합물 5-플루오로우라실로 변환되는 것으로 보이므로, ura3- 세포가 아닌 모든 URA3+ 세포를 사멸시키는, FOA가 함유된 배지에서 선별할 수 있다. FOA 배지에서의 음성 선별은 구별성이 양호하며, 통상적으로 FOA-내성 콜로니의 10-2 미만이 Ura+이다. FOA 선별 공정을 이용하여 반수체 균주에서 돌연변이 유도에 의해 ura3 마커를 만들 수 있으며, 보다 중요하게는, URA3-함유 플라스미드를 가지고 있지 않은 세포를 선별할 수 있다. TRP1 유전자는 트립토판 생합성 공정의 3번째 단계를 촉매하는 포스포리보실안트라닐레이트 이소머라제를 코딩한다. 5-플루오로안트라닐산을 이용한 역선별은 안트라닐산을 트립토판으로 변환시키는데 필수적인 효소가 없어 5-플루오로안트라닐산에 내성을 나타내는 균주에 의한 항-대사(antimetabolism)를 수반한다. LYS2 유전자는 라이신을 생합성하는데 필요한 효소인 아미노아디페이트 리덕타제를 코딩한다. 정상 균주가 아닌 Lys2- 및 lys5- 돌연변이들은 정상 질소원이 결핍된 라이신 및 aAA 함유 배지에서 생육한다. 명백하게도, lys2와 lys5 돌연변이들은 고농도의 aAA에 의해 형성되는 라이신 생합성의 유해한 중간산물의 축적을 야기한다. FOA 선별 공정과 마찬가지로, LYS2 함유 플라스미드를 lys2 숙주에서 편리하게 제거할 수 있다.
다른 구현예에서, 선별 마커는 영양 요구성 돌연변이를 복원시키는 마커 이외의 마커이다. 예를 들어, 효모 숙주 세포 균주는 다른 영양 요구성 돌연변이, 예컨대, 숙주에 치명적이지 않으며, 또한 돌연변이를 공지 선별 방법으로 동정할 수 있는 한, 예로 공업적인 발효에서, 균주의 의도한 용도에 부정적인 효과를 야기하지 않는 돌연변이를 포함할 수 있다.
5.2.4. 게놈 병합 서열
일부 구현예에서, 적출성 핵산 구조체는 제1 및 제2 게놈 병합 서열을 포함한다. 상기 게놈 병합 서열은, 본원에 기술된 적출성 핵산 구조체가, 예컨대 숙주 세포 매개의 상동성 재조합에 의해 숙주 세포의 게놈으로 병합될 수 있도록 허용한다. 상동적인 재조합에 의해 적출성 핵산 구조체를 게놈에 병합하기 위해, 적출성 핵산 구조체는, 바람직하게는 상류 게놈 병합 서열 (IS1)을 포함하는 핵산 서열과 하류 게놈 병합 서열 (IS2)을 포함하는 다른 말단 핵산 서열을 포함하며, 각 게놈 병합 서열은 그 염색체를 가진 숙주 세포에 의한 상동성 재조합이 개시될 만큼 충분한 길이와 서열 동일성을 가진다. 일부 구현예에서, 제1 게놈 병합 서열 (IS1)은 제1 탠덤 리피트 (DR1)의 5'에 위치하며, 제2 게놈 병합 서열 (IS2)은 제2 탠덤 리피트 (DR2)의 3'에 위치한다.
특정 구현예들에서, IS1은 DR1의 5'에 위치한다. 일부 구현예에서, IS1은 DR1의 5'에 바로 인접하여 위치한다. 일부 구현예에서, IS1은 DR1의 5'으로 상류에 위치한다.
특정 구현예들에서, IS2는 DR2의 3'에 위치한다. 일부 구현예에서, IS2는 DR2의 3'에 바로 인접하여 위치한다. 일부 구현예에서, IS2는 DR2의 3'으로 하류에 위치한다.
제1 및 제2 게놈 병합 서열은 상동적인 재조합을 통해 적출성 핵산 구조체가 숙주 세포 게놈, 예컨대 효모 게놈의 특정 유전자 좌에 병합될 수 있게 한다. 적출성 핵산 구조체를 숙주 세포 게놈으로 타겟화된 방식으로 병합시키는 것은 유용한 이점을 제공해 줄 수 있다. 예를 들어, 적출성 핵산 구조체는 숙주 세포 게놈내에 대상 유전자를 병합시키며, 따라서 대상 유전자를 "낫 아웃"시켜 비기능성이 되게 할 수 있다 (도 2). 다른 예로, 적출성 핵산 구조체를 타겟화된 방식으로 병합시키는 것은, 예를 들어 대상 유전자의 발현을 활성화하거나 상향-조절하기 위해, 특정 게놈 유전자 좌에 대상 유전자를 "낫 인"하거나 또는 대상 유전자 주변의 조절 인자들을 "낫 인"하는데 유용할 수 있다.
개개 게놈 유전자 좌로의 적출성 핵산 구조체의 병합에 영향을 미칠 수 있는 특성으로는, 게놈 병합 서열의 길이, 적출성 핵산 구조체의 전체 길이 및 게놈 병합 유전자 좌의 뉴클레오티드 서열 또는 위치를 포함하나, 이로 한정되지 않는다. 예를 들어, 숙주 세포 게놈에서 게놈 병합 서열 한 가닥과 특정 유전자 좌의 한가닥 간의 효과적인 헤테로두플렉스 형성은 게놈 병합 서열의 길이에 좌우될 수 있다. 게놈 병합 서열의 유효한 길이 범위는 뉴클레오티드 50 내지 5,000개이다. 게놈 병합 서열과 게놈 유전자 좌 간의 유효한 상동성 길이에 대한 내용은 Hasty et al., Mol Cell Biol 11:5586-91 (1991)을 참조한다.
IS1과 IS2는 적출성 핵산 구조체의 게놈 병합을 허용하는 숙주 세포 게놈 유전자 좌에 대해 충분한 길이와 서열 동일성을 가진 임의의 뉴클레오티드 서열을 포함할 수 있다. 일부 구현예에서, "충분한 서열 동일성"은 서열이 20 bp(base pair) 이상, 50 bp 이상, 100 bp 이상, 250 bp 이상, 500 bp 이상, 또는 500 bp 이상의 길이에 대해, 숙주 세포 게놈 유전자 좌와 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 동일성을 가지는 것을 지칭한다. 특정 구현예들에서, 숙주 세포 게놈 유전자 좌의 길이는 뉴클레오티드 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900 또는 5,000개이다. 서열 동일성 수준은, 디폴트 파라미터를 이용하여, BLAST 2.2.2 또는 FASTA version 3.0t78과 같은, 본원에 기술된 것을 비롯하여, 임의의 컴퓨터 프로그램과 관련 파라미터를 이용하여 결정할 수 있다.
특정 구현예들에서, 각각의 IS1과 IS2는, 원핵생물의 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 충분한 길이와 원핵 생물 게놈 유전자 좌에 대한 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 각각의 IS1과 IS2는, 진핵생물의 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 진핵 생물 게놈 유전자 좌에 대한 충분한 길이와 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 각각의 IS1과 IS2는, 효모 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 효모 게놈 유전자 좌에 대한 충분한 길이와 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 각각의 IS1과 IS2는, 사카로마이세스 세레비지애(Saccharomyces cerevisiae)의 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 사카로마이세스 세레비지애의 게놈 유전자 좌에 대한 충분한 길이와 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 적출성 핵산 구조체를 병합시키기에 적합한 사카로마이세스 세레비지애 게놈 유전자 좌로는 NDT80, HO, GAL80, HTX3, GAL2 및 GAL1-GAL10-GAL7 유전자 좌를 포함하나, 이로 한정되지 않는다.
특정 구현예에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 50 - 5,000개로 구성된다. 특정 구현예에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 50 - 5,000개를 포함한다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 100 - 2,500개로 구성된다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 100 - 1,000개로 구성된다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 250 - 750개로 구성된다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900 또는 5,000개로 구성된다. 일부 구현예에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 500개로 구성된다.
제1 및 제2 게놈 병합 서열을 포함하는 적출성 핵산 구조체는 당해 기술 분야의 당업자에게 자명한 임의의 기법을 이용하여 제조할 수 있다. 특정 구현예들에서, 제1 및 제2 병합 서열을 포함하는 적출성 핵산 구조체는 당해 기술 분야에 공지된 오버랩 연장 PCR 및 분자 클로닝 기법을 이용하여 제조한다. 예를 들어, 미국 특허 공개공보 2010/0136633, 미국 특허 5,023,171 (과다 연장 PCR에 의한 스플라이싱); Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY를 참조한다.
5.3 숙주 세포
다른 측면에서, 본 발명은 전술한 적출성 핵산 구조체를 포함하는 숙주 세포를 제공한다. 특정 구현예들에서, 숙주 세포는 숙주 세포 게놈에 병합된 적출성 핵산 구조체를 포함한다.
적합한 숙주 세포는 염색체 또는 에피좀 유전자 좌로부터의 타겟 DNA 단편의 적출이 바람직한 모든 세포를 포함한다. 일부 구현예에서, 숙주 세포는 원핵 세포이다. 일부 구현예에서, 숙주 세포는 박테리아 세포이다. 일부 구현예에서, 숙주 세포는 에세리키아 콜라이(Escherichia coli) 세포이다. 일부 구현예에서, 숙주 세포는 진핵 생물 세포이다. 일부 구현예에서, 숙주 세포는 진핵 생물 세포이다. 일부 구현예에서, 숙주 세포는 포유류 세포이다. 일부 구현예에서, 숙주 세포는 중국 햄스터 난소 (CHO) 세포, COS-7 세포, 마우스 섬유모세포, 마우스 배아 암 세포 또는 마우스 배아 줄기 세포이다. 일부 구현예에서, 숙주 세포는 곤충 세포이다. 일부 구현예에서, 숙주 세포는 S2 세포, Schneider 세포, S12 세포, 5B1-4 세포, Tn5 세포 또는 Sf9 세포이다. 일부 구현예에서, 숙주 세포는 단세포성 진핵 유기체 세포이다.
일부 구현예에서, 숙주 세포는 효모 세포이다. 일부 구현예에서, 숙주 세포는 이배체 효모 세포이다. 일부 구현예에서, 숙주 세포는 반수체 효모 세포이다. 이용가능한 효모 숙주 세포로는, 미생물 기탁기관 (예, IFO, ATCC 등)에 기탁된 효모 세포와, 특히 속명 아시쿨로코니듐(Aciculoconidium), 암브로시오지마(Ambrosiozyma), 아르트로아스쿠스(Arthroascus), 아르시오지마(Arxiozyma), 아시비아(Ashbya), 밥예비아(Babjevia), 벤싱토니아(Bensingtonia), 보트리요아스쿠스(Botryoascus), 보트리요지마(Botryozyma), 브레타노마이세스(Brettanomyces), 불레라(Bullera), 불레로마이세스(Bulleromyces), 칸디다(Candida), 시테로마이세스(Citeromyces), 클라비스포라(Clavispora), 크립토코커스(Cryptococcus), 시스토필로바시듐(Cystofilobasidium), 데바리요마이세스(Debaryomyces), 데카라(Dekkara), 디포다스콥시스(Dipodascopsis), 디포다스쿠스(Dipodascus), 이니엘라(Eeniella), 엔도마이콥셀라(Endomycopsella), 에레마스쿠스(Eremascus), 에레모테시움(Eremothecium), 에리트로바시듐(Erythrobasidium), 펠로마이세스(Fellomyces), 필로바시듐(Filobasidium), 갈락토마이세스(Galactomyces), 지오트리쿰(Geotrichum), 길리어몬델라(Guilliermondella), 한세니아스포라(Hanseniaspora), 한세뉼라(Hansenula), 하세가와이아(Hasegawaea), 홀터마니아(Holtermannia), 호르모아스쿠스(Hormoascus), 히포피키아(Hyphopichia), 이사첸키아(Issatchenkia), 클로엑케라(Kloeckera), 클로에케라스포라(Kloeckeraspora), 클루이베로마이세스(Kluyveromyces), 콘도아(Kondoa), 쿠라이시아(Kuraishia), 쿠르츠마노마이세스(Kurtzmanomyces), 루코스포리듐(Leucosporidium), 리포마이세스(Lipomyces), 로데로마이세스(Lodderomyces), 말라세지아(Malassezia), 메츠크니코위아(Metschnikowia), 마라키아(Mrakia), 믹소지마(Myxozyma), 나드소니아(Nadsonia), 나카자와이아(Nakazawaea), 네마토스포라(Nematospora), 오가타이아(Ogataea), 오스포리듐(Oosporidium), 파키솔렌(Pachysolen), 파키티코스포라(Phachytichospora), 파피아(Phaffia), 피키아(Pichia), 로도스포리듐(Rhodosporidium), 로도토룰라(Rhodotorula), 사카로마이세스(Saccharomyces), 사카로마이코데스(Saccharomycodes), 사카로마이콥시스(Saccharomycopsis), 사이토엘라(Saitoella), 사카구키아(Sakaguchia), 사투라노스포라(Saturnospora), 시조블라스토스포리온(Schizoblastosporion), 시조사카로마이세스(Schizosaccharomyces), 슈반니오마이세스(Schwanniomyces), 스포리디오볼루스(Sporidiobolus), 스포로볼로마이세스(Sporobolomyces), 스포로파키더미아(Sporopachydermia), 스테파노아스쿠스(Stephanoascus), 스테리그마토마이세스(Sterigmatomyces), 스테리그마토스포리듐(Sterigmatosporidium), 심바이오타프리나(Symbiotaphrina), 심포디오마이세스(Sympodiomyces), 심포디오마이콥시스(Sympodiomycopsis), 토룰라스포라(Torulaspora), 트리코스포리엘라(Trichosporiella), 트리코스포론(Trichosporon), 트리고놉시스(Trigonopsis), 츠키야이아(Tsuchiyaea), 우데니오마이세스(Udeniomyces), 왈토마이세스(Waltomyces), 위커하미아(Wickerhamia), 위커하미엘라(Wickerhamiella), 윌리옵시스(Williopsis), 야마다지마(Yamadazyma), 야로이야(Yarrowia), 지고아스쿠스(Zygoascus), 지고사카로마이세스(Zygosaccharomyces), 지고윌리옵시스(Zygowilliopsis) 및 지고지마(Zygozyma)에 속하는 효모 세포를 포함한다.
일부 구현예에서, 효모 숙주 세포는 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포, 피키아 파스토리스(Pichia pastoris) 세포, 시조사카로마이세스 품베(Schizosaccharomyces pombe) 세포, 데케라 브룩셀렌시스(Dekkera bruxellensis) 세포, 클루이베로마이세스 락티스(Kluyveromyces lactis) 세포, 아르술라 아데니니보란스(Arxula adeninivorans) 세포 또는 한세뉼라 폴리모르파(Hansenula polymorpha) (현재는 피키아 안구스타(Pichia angusta)라 함) 세포이다. 특정 구현예에서, 효모 숙주 세포는 사카로마이세스 세레비지애 세포이다. 일부 구현예에서, 효모 숙주 세포는 사카로마이세스 프라길리스(Saccharomyces fragilis) 세포 또는 클루이베로마이세스 락티스(Kluyveromyces lactis) (종래에는 사카로마이세스 락티스(Saccharomyces lactis)로 지칭되었음) 세포이다. 일부 구현예에서, 효모 숙주 세포는 칸디다 리폴리티카(Candida lipolytica), 칸디다 길리어몬디이(Candida guilliermondii), 칸디다 크루세이(Candida krusei), 칸디다 슈도트로피칼리스(Candida pseudotropicalis) 또는 칸디다 유틸리스(Candida utilis) 등의 칸디다 속에 속하는 세포이다. 다른 특정 구현예에서, 효모 숙주 세포는 클루베로마이세스 마르시아누스(Kluveromyces marxianus) 세포이다.
개개 구현예들에서, 효모 숙주 세포는 빵 효모 세포, CBS 7959 세포, CBS 7960 세포, CBS 7961 세포, CBS 7962 세포, CBS 7963 세포, CBS 7964 세포, IZ-1904 세포, TA 세포, BG-1 세포, CR-1 세포, SA-1 세포, M-26 세포, Y-904 세포, PE-2 세포, PE-5 세포, VR-1 세포, BR-1 세포, BR-2 세포, ME-2 세포, VR-2 세포, MA-3 세포, MA-4 세포, CAT-1 세포, CB-1 세포, NR-1 세포, BT-1 세포 및 AL-1 세포로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 세포이다. 일부 구현예에서, 숙주 세포는 PE-2 세포, CAT-1 세포, VR-1 세포, BG-1 세포, CR-1 세포 및 SA-1 세포로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 세포이다. 특정 구현예에서, 사카로마이세스 세레비지애 숙주 세포는 PE-2 세포이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 숙주 세포는 CAT-1 세포이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 숙주 세포는 BG-1 세포이다.
특정 구현예들에서, 전술한 바와 같이 적출성 핵산 구조체는 외인성 핵산을 당해 기술 분야에 공지된 세포에 도입하기 위한 모든 공지된 기법을 이용하여 숙주 세포에 도입할 수 있다. 이러한 방법으로는, 세포에 의한 용액으로부터 분자의 직접 흡수 또는 예컨대 리포솜 또는 면역리포솜을 이용한 리포펙션을 통한 촉진화된 흡수; 입자-매개 형질감염 등이 있으나, 이로 한정되지 않는다. 예로, 미국 특허 5,272,065; Goeddel et al., eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al., 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참조한다. 구체적인 효모 세포 형질 방법들은 당해 기술 분야에 잘 알려져 있다. Hinnen et al., Proc. Natl. Acad. Sci. USA 75:1292-3 (1978); Cregg et al., Mol. Cell. Biol. 5:3376-3385 (1985)를 참조한다. 기법의 예로는 스페로플라스팅(spheroplasting), 전기천공, PEG1000 매개 형질전환 및 리튬 아세테이트 또는 리튬 클로라이드 매개 형질전환을 포함하나, 이로 한정되지 않는다.
5.4 호밍 엔도뉴클레아제 발현 벡터
다른 측면에서, 본 발명은 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 타겟 DNA 단편을 적출하는데 유용한 호밍 엔도뉴클레아제를 코딩하는 발현 벡터를 제공한다.
특정 구현예들에서, 발현 벡터는 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩한다. 특정 구현예들에서, 발현 벡터는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-NgrI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, PI-MtuII, I-CsmI, I-PanI, I-CeuI 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩한다. 개개 구현예들에서, 발현 벡터는 I-SceI을 코딩한다. 특정 구현예들에서, 발현 벡터는 F-CphI을 코딩한다.
호밍 엔도뉴클레아제 발현 벡터는 숙주 세포에서 호밍 엔도뉴클레아제를 발현시킬 수 있는 임의의 발현 벡터이다. 적합한 발현 벡터로는 에세리키아 콜라이(Escherichia coli), 효모 또는 포유 세포에서 유전자의 발현에 이용하기 위한 공지된 벡터를 포함하나, 이로 한정되지 않는다. 에세리키아 콜라이 발현 벡터의 예로는 pSCM525, pDIC73, pSCM351 및 pSCM353가 있으나, 이로 한정되지 않는다. 호모 발현 벡터의 예로는 pPEX7과 pPEX408이 있으나, 이로 한정되지 않는다. 적합한 발현 벡터의 다른 예로는 CEN.ARS 서열 및 효모 선별 마커를 포함하는 효모-에세리키아 콜라이 pRS 시리즈의 셔틀 벡터; 및 2μ 플라스미드를 포함한다.
특정 구현예들에서, 호밍 엔도뉴클레아제 발현 벡터는 발현 벡터를 포함하는 숙주 세포를 선별할 수 있는 선별 마커를 추가로 포함한다. 특정 구현예들에서, 선별 마커는 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성, 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택된다.
특정 구현예들에서, 발현 벡터는 호밍 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열이 작동가능하게 연결된 전사 종결 서열과 프로모터를 더 포함한다. 일부 구현예에서, 프로모터는 구성적인 프로모터(constitutive promoter)이다. 일부 구현예에서, 프로모터는 유도성 프로모터이다.
효모 세포에 사용하기 적합한 프로모터에 대한 예시적인 예로는, 클루이베로마이세스 락티스(Kluyveromyces lactis)의 TEF1 유전자 프로모터, 사카로마이세스 세레비지애의 PGK1 유전자 프로모터, 사카로마이세스 세레비지애의 TDH3 유전자 프로모터, 억제성 프로모터, 예컨대 사카로마이세스 세레비지애의 CTR3 유전자 프로모터, 및 유도성 프로모터, 예컨대 사카로마이세스 세레비지애의 갈락토스 유도 프로모터 (예, GAL1, GAL7, 및 GAL10 유전자 프로모터)를 포함하지만, 이들로 한정되진 않는다.
일부 구현예에서, 핵 국지화 서열 (NLS)을 포함하는 추가적인 뉴클레오티드 서열은 호밍 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열의 5'에 연결된다. NLS는 보다 큰 (>25 kD) 호밍 엔도뉴클레아제의 핵 국지화를 촉진시킬 수 있다. 일부 구현예에서, 핵 국지화 서열은 SV40 핵 국지화 서열이다. 일부 구현예에서, 핵 국지화 서열은 효모 핵 국지화 서열이다.
호밍 엔도뉴클레아제 발현 벡터는 당해 기술 분야에 자명한 임의의 기법으로 제작할 수 있다. 특정 구현예에서, 벡터는 당해 기술 분야에 잘 공지된 중합효소 연쇄 반응 (PCR)과 분자 클로닝 기법을 이용하여 제조한다. 예로, PCR Technology: Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY를 참조한다.
5.5 타겟 DNA 단편의 적출법
다른 측면에서, 본 발명은 전술한 하나 이상의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 타겟 DNA 단편 하나 이상을 적출하는 방법을 제공한다. 특정 구현예에서, 본 방법은, 숙주 세포에서 적출성 핵산 구조체, 예컨대 염색체에 병합된 핵산 구조체를 호밍 엔도뉴클레아제와 접촉시켜, 하나 이상의 호밍 엔도뉴클레아제 인지부를 호밍 엔도뉴클레아제로 절단하거나 이에 인접하여 절단하는 단계를 포함한다. 일부 구현예에서, 호밍 엔도뉴클레아제는 각각의 호밍 엔도뉴클레아제 인지부를 또는 이 인지부의 인접부를 절단한다.
적출성 핵산 구조체는 당해 기술 분야의 당업자에게 적합한 것으로 간주되는 임의의 기법으로 호밍 엔도뉴클레아제와 접촉시킬 수 있다. 특정 구현예에서, 호밍 엔도뉴클레아제는 호밍 엔도뉴클레아제 발현 벡터를 이용하여 숙주 세포내에서 발현된다. 전술한 발현 벡터를 비롯하여, 임의의 호밍 엔도뉴클레아제 발현 벡터가 이용될 수 있다. 호밍 엔도뉴클레아제 발현 벡터는, 타겟 DNA 단편의 적출 후 발현 벡터를 포함하지 않는 숙주 세포를 선별할 수 있는, 선별 마커, 예컨대 역-선별 마커를 포함할 수 있다. 사용되는 발현 벡터는 또한 선별 마커를 구비하지 않는 일과성 벡터이거나, 또는 선별되지 않는 벡터일 수도 있다. 개별 구현예들에서, 일과성 벡터를 포함하는 숙주 세포의 자손은 시간 경과에 따라 벡터를 상실하게 된다. 다른 구현예에서, 적출성 핵산 구조체는 정제된 형태의 호밍 엔도뉴클레아제와 접촉될 수 있다.
일부 구현예에서, ES1과 ES2 각각의 절단으로 핵산 단편 (도 3A 및 3B) 3개가 유리하게 형성된다: (1) 게놈 핵산의 좌측 암; (2) 타겟 DNA 단편을 포함하는 핵산 단편; 및 (3) 게놈 핵산의 우측 암. 숙주 세포에서 발견되는 내인성 5' → 3' 엑소뉴클레아제는, 절단 후, 각 핵산 단편에서 한가닥을 신속하게 분해하여, 타겟 DNA를 포함하는 핵산 단편을 파괴하고, 상보성 영역으로서 DR1과 DR2를 포함하는 (도 4A) 게놈 핵산의 좌 (4) 및 우(5)측 암에 긴 3' 꼬리가 남게 된다 (도 3C). 상기 상보성 영역들이 헤테로두플렉스(도 4B, 6)를 형성하게 되어, 숙주 세포 단백질에 의해 촉매되는 재조합이 수행된다. 일부 구현예에서, 상보성 영역들은 유익하게는 단일 가닥 어닐링 경로를 통해 재조합이 이루어진다. 우 (7) 및 좌 (8) 측 암의 꼬리의 3' 최말단은 상보적이지 않아, 상보적인 영역들에 의해 형성된 헤테로두플렉스에서 돌출되게 된다. 이들 비-상보적인 3' 최말단은 바람직하게는 flap 뉴클레아제에 의해 절단된다. 최종적으로, 복구 DNA 합성 및 DNA 리가제로 헤테로두플렉스이 메워지고, 닉(nick)이 연결됨으로써, 타겟 핵산이 정확하게 적출된 온전한 게놈 핵산이 만들어진다 (도 4C). DR1과 DR2가 서로 100%의 뉴클레오티드 서열 동일성을 공유하는 구현예에 있어서, DR1과 DR2는 바람직하게는 재조합되어, DR1 및 DR2와 뉴클레오티드 서열 동일성 100%를 공유하는 제3 탠덤 리피트를 포함하는 게놈 핵산이 만들어진다.
다른 측면에서, 본 발명은, 2 이상의 적출성 핵산 구조체가 게놈에 병합된 숙주 세포의 게놈으로부터 2 이상의 타겟 핵산을 동시에 적출하는 방법을 제공한다. 일부 구현예에서, 본 방법은, 하나 이상의 호밍 엔도뉴클레아제가 각 적출성 핵산 구조체의 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 적어도 하나를 절단하거나 이에 인접하여 절단하도록, 숙주 세포에서 2 이상의 적출성 핵산 구조체를 하나 이상의 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함한다.
일부 구현예에서, 숙주 세포는, 각 적출성 핵산 구조체가 고유한 ES 부위를 포함하는, 즉, ES 부위가 숙주 세포에서 다른 적출성 핵산 구조체와 공유되지 않는, 2 이상의 적출성 핵산 구조체를 포함한다. 이들 구현예들에서, 하나 이상의 호밍 엔도뉴클레아제가 2 이상의 타겟 DNA 단편의 동시적인 적출을 구현하기 위해 숙주 세포에 제공된다. 일부 구현예에서, 2 이상의 호밍 엔도뉴클레아제가 2 이상의 타겟 DNA 단편의 동시적인 적출을 구현하기 위해 숙주 세포에 제공된다.
다른 구현예에서, 게놈에 병합된 적출성 핵산 구조체 각각은, 각 적출성 핵산 구조체의 ES 영역 각각을 상기 ES를 절단할 수 있는 단일 호밍 엔도뉴클레아제와 접촉시, 각 적출성 핵산 구조체의 타겟 DNA 단편들을 동시에 적출시킬 수 있도록, 하나 이상의 동일한 ES 영역을 공유한다. 일부 구현예에서, 본원에 제공되는 방법으로 숙주 세포의 게놈으로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 10 보다 많은 수의 타겟 핵산을 동시에 적출할 수 있다. 일부 구현예에서, 동시적인 다중 적출은 병합된 적출성 핵산 구조체들 각각에 공유되어 있는 ES 부위에 대해 특이성을 구비한 단일 호밍 엔도뉴클레아제로 이루어진다. 다른 구현예에서, 동시적인 다중 적출은, 병합된 적출성 핵산 구조체내 하나 이상의 ES 부위들에 대한 특이성을 각각 구비한 복수개의 호밍 엔도뉴클레아제를 이용하여 이루어진다.
본 방법의 이점은, 특정 적출성 핵산 구조체의 DR1과 DR2가 절단시 적출성 핵산 구조체의 재조합을 매개할 수 있는, 임의의 탠덤 리피트를 포함할 수 있다. 따라서, 각각 고유한 탠덤 리피트를 구비한, 복수의 적출성 핵산 구조체들이, 상이한 적출성 핵산 구조체들 간에 이루어지는 탠덤 리피트의 재조합으로 인해 게놈이 불안정해질 우려 없이, 동일 세포에서 사용될 수 있다. 아울러, 본 방법은 동일 숙주 세포 또는 자손에서의 재이용될 수 있는 선별 마커를 제거하는데 유용하게 이용할 수 있다.
다른 구현예에서, 적출 현상을 이용하여, 숙주 세포에서 목적한 내인성 유전자의 발현을 촉진, 억제 또는 변형시킬 수 있다. 예를 들어, 일부 구현예에서, 제1 게놈 병합 서열은 목적한 내인성 유전자의 코딩 서열의 5'에 위치한 뉴클레오티드 서열과 상동적인 뉴클레오티드 서열을 포함하며, 제2 게놈 병합 서열은 목적한 내인성 유전자의 코딩 서열내에 위치된 뉴클레오티드 서열과 상동적인 뉴클레오티드 서열을 포함하며, 타겟 DNA 단편은, 예컨대, 숙주 세포가 배양되는 배양 배지에 유도제 또는 억제제를 각각 첨가함으로써 유도 또는 억제시킬 수 있는, 프로모터를 코딩하는 뉴클레오티드 서열을 포함한다. 타겟 유전자 좌에 병합 서열이 병합되면, 타겟 유전자의 천연적인 프로모터는 타겟 DNA 단편의 유도성 또는 억제성 프로모터로 치환되므로, 대상 유전자의 유전자 산물의 생산은 배양 배지내 유도제 또는 억제제의 존재에 의존되게 된다. 마찬가지로, 적출성 핵산 구조체의 타겟 DNA 단편은, 각각 유도제 또는 억제제의 첨가에 의해 유도 또는 억제할 수 있는 억제인자를 코딩하는 뉴클레오티드 서열을 포함할 수 있다. 이러한 대상 유전자의 외인성 발현 조절은, 조절성 프로모터 또는 억제인자가 숙주 세포 게놈으로부터 적출되도록, 본원에 기술된 바와 같이 적출 현상을 유도함으로써, 적절하게 제거시킬 수 있다.
다른 구현예에서, 숙주 세포 게놈으로의 적출성 핵산 구조체의 병합을 이용하여, 예컨대 대상 내인성 유전자의 코딩 서열과 이의 천연적인 프로모터 인자의 작동가능한 연결을 간섭함으로써, 내인성 대상 유전자의 발현을 파괴할 수 있다. 내인성 유전자의 발현을 복원시키는 것이 바람직한 경우, 본원에 기술된 방법에 따른 적출 현상은, 천연적인 프로모터 인자가 대상 내인성 유전자의 코딩 서열과 작동가능하게 재-연결되도록, 즉 천연적인 프로모터 인자가 대상 내인성 유전자의 코딩 서열을 작동시킬 수 있는 근접한 위치로 다시 복원시키도록, 유도할 수 있다.
5.6 키트
다른 측면에서, 본 발명은 숙주 세포의 게놈으로부터 타겟 DNA 단편을 적출하기 위한 키트를 제공한다. 일부 구현예에서, 키트는, (a) 5' → 3' 방향으로: (i) 제1 탠덤 리피트 (DR1), (ii) 제1 호밍 엔도뉴클레아제 인지부 (ES1), (iii) 타겟 DNA 단편 (D), 및 (iv) 제2 탠덤 리피트 (DR2)를 포함하는 적출성 핵산 구조체; 및 (b) 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 키트는, (a) 5' → 3' 방향으로: (i) 제1 탠덤 리피트 (DR1), (ii) 타겟 DNA 단편 (D), (iii) 제1 호밍 엔도뉴클레아제 인지부 (ES1), 및 (iv) 제2 탠덤 리피트 (DR2)를 포함하는 적출성 핵산 구조체; 및 (b) 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 키트는, (a) 5' → 3' 방향으로: (i) 제1 탠덤 리피트 핵산 (DR1), (ii) 제1 호밍 엔도뉴클레아제 인지부 (ES1), (iii) 타겟 핵산, (iv) 제2 호밍 엔도뉴클레아제 인지부 (ES2), 및 (v) 제2 탠덤 리피트 핵산 (DR2)을 포함하는 적출성 핵산 구조체; 및 (b) 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함한다.
일부 구현예에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 적어도 18개의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 500개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 500, 18 - 495, 18 - 490, 18 - 485, 18 - 480, 18 - 475, 18 - 470, 18 - 465, 18 - 460, 18 - 455, 18 - 450, 18 - 445, 18 - 440, 18 - 435, 18 - 430, 18 - 425, 18 - 420, 18 - 415, 18 - 410, 18 - 405, 18 - 400, 18 - 395, 18 - 390, 18 - 385, 18 - 380, 18 - 375, 18 - 370, 18 - 365, 18 - 360, 18 - 355, 18 - 350, 18 - 345, 18 - 340, 18 - 335, 18 - 330, 18 - 325, 18 - 320, 18 - 315, 18 - 310, 18 - 305, 18 - 300, 18 - 295, 18 - 290, 18 - 285, 18 - 280, 18 - 275, 18 - 270, 18 - 265, 18 - 260, 18 - 255, 18 - 250, 18 - 245, 18 - 240, 18 - 235, 18 - 230, 18 - 225, 18 - 220, 18 - 215, 18 - 210, 18 - 205, 18 - 200, 18 - 195, 18 - 190, 18 - 185, 18 - 180, 18 - 175, 18 - 170, 18 - 165, 18 - 160, 18 - 155, 18 - 150, 18 - 145, 18 - 140, 18 - 135, 18 - 130, 18 - 125, 18 - 120, 18 - 115, 18 - 110, 18 - 105, 18 - 100, 18 - 95, 18 - 90, 18 - 85, 18 - 80, 18 - 75, 18 - 70, 18 - 65, 18 - 60, 18 - 55, 18 - 50, 18 - 45, 18 - 40, 18 - 35, 18 - 30, 18 - 25, 또는 18 - 20개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94 , 95 96, 97 ,98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194 , 195, 196, 197, 198, 199 또는 200개의 뉴클레오티드 염기 쌍으로 구성된다.
일부 구현예에서, 적출성 핵산 구조체는 제1 탠덤 리피트 핵산의 5'에 연결되는 제1 게놈 병합 서열과 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 게놈 병합 서열을 추가로 포함한다. 일부 구현예에서, 키트는, 적출성 핵산 구조체를 병합시킨 후 타겟 핵산을 적출하는 것이 바람직한 숙주 세포에 특이적인 제1 및 제2 게놈 병합 서열을 제공한다. 예를 들어, 효모에서 이용하는 경우, 키트는, 일부 구현예에서, 선별된 효모 게놈 유전자 좌와 상동적인 재조합을 개시할 만큼 충분한 길이와 상동성을 공유하는 제1 및 제2 효모-특이적인 게놈 병합 서열을 포함하는, 핵산 구조체를 제공한다. 일부 구현예에서, 키트는, 각각 특이적인 효모 게놈 유전자 좌로 타겟화된 고유한 제1 및 제2 게놈 병합 서열 쌍을 포함하는, 복수의 핵산 구조체를 제공한다.
특정 구현예에서, 본원에 제공되는 키트는, (a) 5' → 3' 방향으로: (i) 18개 이상의 뉴클레오티드 염기 쌍으로 구성된 제1 탠덤 리피트 핵산, (ii) 제 1 I-SceI 사이트, (iii) 타겟 핵산, (iv) 제2 I-SceI 사이트, 및 (v) 18개 이상의 뉴클레오티드 염기 쌍으로 구성된 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체; 및 (b) I-SceI을 코딩하는 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는 제1 호밍 엔도뉴클레아제 인지부의 5'에 연결되는 제1 병합부와 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 병합부를 추가로 포함한다.
다른 특정 구현예에서, 본원에 제공되는 키트는, 5' → 3' 방향으로: (i) 제1 탠덤 리피트 핵산, (ii) 제1 F-CphI 사이트, (iii) 타겟 핵산, (iv) 제2 F-CphI 사이트, 및 (v) 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체; 및 (b) F-CphI을 코딩하는 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는 제1 호밍 엔도뉴클레아제 인지부의 5'에 연결되는 제1 병합부와 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 병합부를 추가로 포함한다.
특정 구현예들에서, 본 발명의 키트는 전술한 적출성 핵산 구조체 및/또는 벡터로 형질전환하는데 적합한 하나 이상의 숙주 세포를 추가로 포함한다.
일부 구현예에서, 키트는 본원에 기술된 숙주 세포의 게놈으로부터 타겟 DNA 단편을 적출하는 방법이 기술된 사용 지침서를 추가로 포함한다. 일부 구현예에서, 키트는, 타겟 DNA 단편이, 예를 들어, 단백질 코딩 서열, 리포터 유전자, 형광 마커 코딩 서열, 프로모터, 인핸서, 종결인자, 인트론, 엑손, 폴리-A 꼬리, 다중 클로닝 부위, 핵 국지화 신호, mRNA 안정화 신호, 선별 마커, 병합 유전자 좌, 에피토프 테그 코딩 서열 또는 분해 신호로부터 선택되는, 타겟 DNA 단편을 포함하는 적출성 핵산 구조체를 포함한다.
6. 실시예
6.1
실시예 1: xMarker 구조체 구축
본원에 기술된 조성물 및 방법을 수행하여, "xMarker"로서 본원에 기술된, 사카로마이세스 세레비지애에 사용하기 위한 일련의 적출성 선별 마커를 제작 및 특정화하였다. 제1 세대 마커는 I-SceI 엔도뉴클레아제를 이용하였고, 도 1에 나타낸 DNA 구조체에 대한 하기를 포함한 파라미터를 테스트하였다: (1) 엔도뉴클레아제 사이트 옆에 배치된 동향 리피트의 여러가지 길이, 및 (2) 엔도뉴클레아제 사이트 1곳 대 2곳. 제2 세대 마커로, 제1 세대 테스트 결과를 I-SceI 엔도뉴클레아제를 보다 광범위하게 이용하는 방향으로 이용하였다. 제3 세대 xMarker에서는 아래 표 1에 열거된 다른 엔도뉴클레아제에 대한 유용성과 확장성이 입증되었다.
표 1: 엔도뉴클레아제에 대한 인지부 및 절단부
메가뉴클레아제 | 최소 사이트 크기(bp) | 사용 사이트 크기 (bp) | 사용한 사이트의 서열 |
I-SceI | 18 | 18 | TAGGGATAACAGGGTAAT (서열번호 3) |
VDE (PI-SceI) | 31 | 31 | TATGTCGGGTGCGGAGAAAGAGGTAATGAAA (서열번호 4) |
F-Cph | 20 | 24 | GATGCACGAGCGCAACGCTCACAA (서열번호 5) |
PI-MgaI (pps1) | 22 | 24 | GCGTAGCTGCCCAGTATGAGTCAG (서열번호 6) |
PI-MtuII (pps1) | 미정 | 40 | ACGTGCACTACGTAGAGGGTCGCACCGCACCGATCTACAA (서열번호 7) |
아래 기술된 실험들에 사용된 시약과 관련하여, 제한 효소들은 New England Biolabs and Fermentas로부터 입수하였다. Finnzymes 사의 고충실성의 내열성 중합효소인 Phusion은, 염색체 병합용 플라스미드 클로닝 또는 효모 형질전환에 사용되는 DNA의 구축에 사용하였다. 저-충실성의 내열성 중합효소 키트는 효모 콜로니에서 게놈 DNA를 PCR (Qiagen Taq PCR 키트)하는데 이용하였다. 올리고뉴클레오티드는 Integrated DNA Technologies (IDT) 사로부터 입수하였다. 그외 화학제품들은 Sigma, Fisher 및 Zymo Research (예, Tris 및 EDTA와 같은 표준 분자 생물 완충제 구성 성분들, 및 리튬 아세테이트 및 효모 질소 베이스와 같은 표준 효모 시약들) 사로부터 입수하였다. DNA 클로닝에 사용되는 컴피턴트 E. coli 세포는 Invitrogen 사에서 구입하였다. Qiagen 사의 미니프렙 키트로 DNA 미니프렙을 수행하였다. 분자 생물학, 효모 분자 유전자학 및 효모 세포 배양 기법은 표준 프로토콜에 따라 수행하였다.
6.1.1. 제1 세대 xMarker 구축
최초 xMarker 시리즈는 선별 마커로서 URA3를 사용하였고, 각 시리즈의 멤버들은 I-SceI 절단부의 수 (1 또는 2)와 동향 리피트 길이 (20, 40, 60 또는 80 bp)에 차이가 있었다. URA3는, 우라실 결핍 배지에서 생육시켜 그 존재를 선별할 수 있으며 5-플루오로오로트산이 함유된 배지에서 생육시켜 부재를 선별할 수 있는, 역선별 마커이다. 동향 리피트 서열은, 112 bp의 DNA 가닥으로 구성되며, 각 20 bp 단편의 GC 함량은 ~50%이고, 20, 40, 60 및 80 bp 가닥들이 30℃ 보다 높은 온도에서 예측한 2차 구조를 거의 취하지 않도록, 설계하였다. I-SceI 절단부들은 모두 동일한 18 bp 서열을 공유한다: 5'-TAGGGATAACAGGGTAAT-3' (서열번호 3). 표 2는 절단부의 수와 서로 간의 방향성에 대해 테스트한 모든 제1 세대 xMarker, 동향 리피트 (DR)의 길이와 서열, 및 I-SceI 절단부(들)의 서열을 열거한다. I-SceI 사이트 2개를 구비한 xMarker의 경우, 인자들의 배열은 DR→/ I-SceI 사이트→/ URA3/ I-SceI 사이트→/ DR→였다. I-SceI 사이트 1개를 구비한 xMarker의 경우, 인자들의 배열은 DR→/ I-SceI 사이트→/ URA3/ DR→였다.
표 2: 도 1에 나타낸 순서와 방향성으로 인자들이 배열된 제1 세대 I-SceI xMarker의 개개 인자들의 특징 리스트
URA3 xMarker 명칭 | DR의 길이 (bp) | I-SceI 사이트 (#) | I-SceI 사이트들의 방향성 | DR (scar) 서열 |
20mer-direct | 20 | 2 | 동향 | AAGATCCGATCGACCGAGAA (서열번호 8) |
40mer-direct | 40 | 2 | 동향 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATC (서열번호 9) |
60mer-direct (aka s0x-URA3) | 60 | 2 | 동향 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATC-AACATGATCTGCGACGAGCT (서열번호 10) |
80mer-direct | 80 | 2 | 동향 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATC-AACATGATCTGCGACGAGCTTGAGGATGCAAATGGCTGAC (서열번호 11) |
60mer-single | 60 | 1 | 솔로 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCTGCGACGAGCT (서열번호 12) |
xMarker에서 사이트가 반복되므로, 좌측 절반과 우측 절반을 연결하기 전에 별도로 구축하여야 한다. 제1 세대 xMarker를 3단계로 제작하였다.
먼저, 선별 마커의 좌측 (5')과 우측 (3')에 측면으로 서열들은 인산화된 올리고뉴클레오티드를 어닐링시킴으로써 각각 구축하였다. 어닐링에 의해 형성된 좌측 및 우측 이중 가닥 측면 서열들을, 상보적이며, 팔린드롬형이 아닌 염기 5개 (위에 TAGAC, 아래에 GTCTA)로 구성된 3' 단일가닥 오버행을 가지도록 제작하였다. 표 3은 각 xMarker에 사용한 올리고들을 열거한다. 각 어닐링 반응을 위해, DNA 리가제 완충액내 동일 몰의 올리고뉴클레오티드로 구성된 혼합물을 가열 블럭에서 5분간 95℃로 가열한 다음, 가열 블럭을 끄고, 1-2시간에 걸쳐 실온으로 서서히 냉각되게 하였다.
표 3: 제1 세대 I-SceI xMarker에서 마커 측면에 배치된 좌측 단편과 우측 단편 구축을 위한 어닐링을 위해 혼합된 올리고뉴클레오티드 리스트
URA3 xMarker 명칭 | 좌측 단편에 어닐링시킨 올리고머 | 우측 단편에 어닐링시킨 올리고머 |
20mer-direct | KB411, KB412 | KB464, KB429 |
40mer-direct | KB415, KB416 | KB419, KB420 |
60mer-direct (aka s0x-URA3) | KB423, KB425, KB426, KB427, KB428 | KB419, KB423, KB424, KB429 |
80mer-direct | KB423, KB425, KBB427, KB431, KB432, KB433 | KB419, KB423, KB429, KB432, KB434 |
60mer-single | KB423, KB425, KB426, KB427, KB428 | KB421, KB423, KB424, KB430 |
두번째로, 어닐링 혼합물에서 대응되는 좌측 및 우측에 위치한 DNA들을 3-웨이 라이게이션용 RYSE 12 엔트리 벡터와 혼합하였다. 좌측 리피트 서열의 우측 말단을 우측 리피트 서열의 좌측 말단과 스티키 엔드 라이게이션에 의해 연결하고, 반대쪽 말단들은 좌측 리피트 서열과 우측 리피트 서열을 블런트 엔드 라이게이션에 의해 플라스미드에 연결하였다. I-SceI 절단부들 사이의 스페이서에는 XbaI 사이트에 의해 이격되어 있는 다양한 SchI 제한효소 사이트들이 포함된다. 이들 플라스미드는, 마커는 아직 가지고 있지 않으며 절단 및 복구를 지시하기 위한 측면 서열만 가지고 있기 때문에, xMarker 엔트리 벡터로 칭하였다.
세번째로, xMarker 엔트리 벡터에 URA3 선별 마커를 연결하였다. 플라스미드 (RaBit 12-0-M-555)에서 PCR에 의해 URA3 마커를 증폭시켜, 블런트 말단 마커를 제조하였다. 동향 반복 배치된 이중 I-SceI 사이트 xMarker의 경우, URA3 PCR에는 올리고뉴클레오티드 KB439와 KB440을 사용하였고; 단일 I-SceI 사이트 xMarker의 경우에는 올리고뉴클레오티드 KB439와 KB44를 사용하였다. xMarker 엔트리 벡터를 SchI으로 잘라, 블런트-엔드의 선형 플라스미드를 제조하였다. 그런 후, 2개의 절편을 리가제 표준 조건을 이용하여 연결하였다. 이렇게 제조된 xMarker 구조는 도 1에 나타낸다. 연결된 플라스미드 분리체 각각을 회수하고, 플라스미드내 삽입체를 DNA 서열분석함으로써 바람직한 플라스미드를 동정하였다.
6.1.2. 제2 세대 xMarker 구축
제2 세대 xMarker들은 모두 DNA 복구를 돕기 위한 60 bp의 동향 리피트와 2개의 동향 반복된 I-SceI 절단부를 이용하여 제작하였다. 각각의 xMarker는 아래 표 4에 나타낸 바와 같은 세미-랜덤 서열로 선택되는 고유한 60 bp 서열을 가진다.
표 4: 2세대 I-SceI xMarker와 이의 60 bp 리피트 서열 리스트
xMarker 명칭 | 선별 | 60 bp 리피트 서열 |
s1x_hphA | 히그로마이신 B 내성 (hph) | CGTTACGAAGCACACACTAGTTAGCGTCGAGACACATAGCGACGCTAGAACTTGCGACTT (서열번호 13) |
s2x_hphA | 히그로마이신 B 내성 (hph) | GTACTGCCTAGTAGAAACGGATCTCCACGTACTAGAGTCCACCTGGTATCTATTAGCCCG (서열번호 14) |
s3x_kanA | 카나마이신/G418 내성 (kan) | CGAGGATTAACGTGTAAGGCCCTAAGCTATGTACCGCATCTCCTAAGAGAGTGTGACCCA (서열번호 15) |
s4x_kanA | 카나마이신/G418 내성 (kan) | TTAATCAGCGCCCAGAGACTAGCACTGAATGATCAACGGGTAGTTCACACACTGCCAGAC (서열번호 16) |
s5x_natA | 노르세트로신 내성 (nat) | ATGGAATCACGGGGCTATTCCACTTGCTAATAACGAGGCGCTTATCAACGGCGAGCACAT (서열번호 17) |
s6x_natA | 노르세트로신 내성 (nat) | AGTCAAAGCGCGATTCGCTAGGAATGAGAGCGAGAACGAACCGGAGTATATCACAATCGC (서열번호 18) |
s7x_URA3 | 우라실 프로토트로피 (URA3) | ACTAGAGCGAAATGGAGAGGTACGTGATCCTACTAGAGCCCACGCTATCATACAGTTGGC (서열번호 19) |
s8x_URA3 | 우라실 프로토프로피 (URA3) | GTACGTCCGTACTTATGCTGAGCGCTCCTACACGAAAAACTCACCGTGACTAGCATAACG (서열번호 20) |
2가지 기준에 부합되도록 60 bp 서열들을 선정하였다: (1) 제1, 제2 및 제3 20 bp 단편(window)들은 융점이 60℃ ± 2℃임, (2) 60 bp의 서열에서 13 bp 이상 길이의 서열 단편은 효모 게놈내 임의의 천연 서열과 동일함. 이 세트는 4개의 상이한 선별 마커를 포함한다: URA3; 히그로마이신 B 포스포트랜스퍼라제 또는 hph; 노르세오트리신 아세틸트랜스퍼라제 또는 nat; 및 아미노글리코사이드 포스포트랜스퍼라제 또는 kan. 박테리아 유래의 이들 3종의 약물 내성 유전자들은 모두 클루이베로마이세스 락티스(Kluyveromyces lactis) TEF1 유전자의 프로모터 및 종결인자에 해당되는 인접 서열들에 의해 모두 통제되며, 접미사 "A"를 첨부하여 TEF1-유래 조절 대조군으로 표시하였고; 카세트들은 hphA, natA 및 kanA로 지칭하였다.
xMarker내 반복된 사이트들로 인해, 좌측 절반과 우측 절반을 연결하기 전에 이들 각각을 구축하는 과정이 필요하였다. 제2 세대 xMarker를, 제1 세대와 다른 전략으로, 2단계로 제작하였다. 마커를 아래 표 5에 열거된 긴 꼬리형의 올리고뉴클레오티드로 PCR 증폭을 수행함으로써, 마커의 좌측과 우측에, 60 bp 서열과 20 bp I-SceI 절단부를 도입하였다.
표 5: 제2 세대 I-SceI xMarker의 좌측 및 우측 영역을 PCR 증폭하는데 사용한 프라이머 리스트
xMarker 명칭 | 좌측 영역 프라이머 | 우측 영역 프라이머 | 제한 효소 | 대안적인 좌측 영역 프라이머 | 대안적인 우측 영역 프라이머 | 대안적인 제한 효소 |
s1x_hphA | KB469, KB467 | KB470, KB468 | NdeI | KB469, KB492 | KB470, KB491 | RsrII 또는 BanI |
s2x_hphA | KB471, KB 467 | KB472, KB468 | NdeI | KB471, KB492 | KB472, KB491 | RsrII 또는 BanI |
s3x_kanA | KB475, KB473 | KB476, KB474 | PvuI | KB475, KB494 | KB476, KB493 | NciI 또는 BstXI |
s4x_kanA | KB477, KB473 | KB478, KB474 | PvuI | KB477, KB494 | KB478, KB493 | NciI 또는 BstXI |
s5x_natA | KB481, KB479 | KB482, KB480 | StyI | x | x | x |
s6x_natA | KB483, KB479 | KB484, KB480 | StyI | x | x | x |
s7x_URA3 | KB487, KB485 | KB488, KB486 | NcoI | KB487, KB496 | KB488, KB495 | BsiHKAI 또는 AlwNI |
s8x_URA3 | KB489, KB485 | KB490, KB486 | NcoI | KB489, KB496 | KB490, KB495 | BsiHKAI 또는 AlwNI |
올리고뉴클레오티드는 3' 말단에 20-22 bp의 프라이밍 영역과 고유한 60 bp 서열과 I-SceI 사이트를 포함하는 80 bp로 이루어진 5' 꼬리를 포함한다. 마커의 좌 및 우측에 약간 다른 2종의 I-SceI 사이트를 사용하였다: 좌측에는 버전 1 (v1) 5'-GCTAGGGATAACAGGGTAAT-3'(서열번호 21)을 사용하고, 우측에는 버전 2 (v2) 5'-ACTAGGGATAACAGGTTTAT-3' (서열번호 22)를 사용함. 제2 세대 xMarker들은 모두 DR (60 bp)→/ I-SceI 사이트 (v1)→/ 마커/ I-SceI 사이트 (v2)→/ DR (60 bp)→로 요약되는 인자 배치를 포함하였다.
xMarker 구축에 대한 전반적인 내용은 다음과 같다. 먼저, 마커의 좌측 부분과 마커의 우측 부분을 각각 PCR로 증폭시켰다. 프라이머는, 마커의 중간 부분이 좌측 및 우측 PCR 산물 둘다에 포함되어, 이러한 중복되는 부분에 단일 가닥의 상보적인 오버행을 만드는 고유한 제한효소 사이트가 포함되도록, 설계되었다. 두번째로, 2종의 PCR 산물을 선택한 제한 효소로 각각 잘라, 겔 정제한 다음, 선형화된 RYSE 12 엔트리 벡터와 함께 3-조각 라이게이션 혼합물에 첨가하였다. 제1 세대 라이게이션과 유사하게, 좌측 영역과 우측 영역을 어닐링시키고, 스티키 말단을 이용하여 라이게이션하였으며, 마커 구조체의 최말단부는 수여 플라스미드와 블런트-엔드 라이게이션하였다. 제1 세대 방법과의 차이는, 라이게이션 후, 산물에 이미 마커 유전자가 포함되어, 구축이 완료된다는 것이다. 라이게이션한 각 플라스미드 분리체를 회수하고, 플라스미드내 삽입체를 DNA 서열분석하여 바람직한 플라스미드를 동정하였다. 이들 플라스미드는, 기존 12 RaBit가 사용된 바와 같이, 화합물 DNA 구조체들의 RYSE-기반의 스티칭에 사용할 수 있는 새로운 xMarker 12 RaBit이었다.
xMarker에 대한 상세 내용은 아래에서 기술한다. 각 마커에서 우선 사용된 마커내 고유한 제한효소 사이트는 다음과 같다: hphA, NdeI (RsrII 또는 BanI); kanA, PvuI (NciI 또는 BstXI); natA, StyI; 및 URA3, NcoI (BsiHKAI 또는 AlwNI). 첫번째 효소로 양성 클론을 수득할 수 없는 경우에는 이후 선택한 효소를 사용하였으며; 이러한 경우의 이점은, 단일 가닥의 오버행이 팔린드롬형이 아니어서, 좌측 영역 2개나 우측 영역 2개와 라이게이션된 플라스미드가 만들어질 가능성이 없다는 것이다. 표시한 제한 효소 사이트의 우측에 존재하는 상위 가닥에 어닐링하는 ~20 bp 역방향 프라이머와, 5' 올리고뉴클레오티드가 다음과 같은 구조를 가지도록 5' 꼬리를 포함하는, 마커의 좌측 끝부분에 대한 프라이머로, 마커의 좌측 영역을 증폭하였다: 60 bp 서열→/ I-SceI 사이트 (v1)→/ ~20 bp 정방향 프라이머. 마커의 우측은, 표시한 제한 효소 사이트의 좌측에 존재하는 하위 가닥에 어닐링하는 ~20 bp 정방향 프라이머와, 3' 올리고뉴클레오티드가 다음과 같은 구조를 가지도록 5' 꼬리를 포함하는, 마커의 우측 끝부분에 대한 프라이머로, 증폭하였다: 60 bp 서열 (역 상보성)→/ I-SceI 사이트 (v2, 역 상보성)→/ ~20 bp 역방향 프라이머. 표 4는 각 xMarker의 좌측 영역과 우측 영역을 증폭시키는데 사용한 프로아머 리스트를 나타낸다. 마커의 PCR 증폭에 사용한 주형은 RaBit 샘플이었다: hphA의 경우 12-0-M-21, kanA의 경우 12-0-M-261, natA의 경우 12-0-M-262, 및 URA3의 경우 12-0-M-555. 최종 제작된 xMarker 제2 세대 플라스미드는 기존 12 RaBit를 사용하였을 때와 같이, 화합물 DNA 구조체들의 RYSE-기반의 스티칭에 사용할 수 있는 12 RaBit 자체였다.
6.1.3. I-SceI 발현 플라스미드 구축
I-SceI 유전자를 사카로마이세스 세레비지애의 GAL1 프로모터 통제 하에 위치시켜, 다양한 마커를 가진 CEN.ARS 플라스미드 세트에 클로닝하였다. CEN.ARS 서열과 LEU2 (pRS415 aka pAM63) 및 URA3 (pRS416 aka pAM63) 마커를 가진 효모-E.coli 셔틀 벡터가 종래에 개시된 바 있다 (예, Gene 1992;110:119-22; Genetics 1989;122:19-27). 이에, 영양 요구성 마커를 약물 내성 마커 kanA (pAM1110), natA (pAM1111) 및 hphA (pAM1112)로 치환하여, pRS416 유도체들을 제작하였다. 각각의 벡터를 폴리링커/다중 클로닝 부위내에 존재하는 고유한 블런트-말단 제한효소 사이트에서 EcoRV (약물 내성 마커) 또는 SmaI (URA3 및 LEU2)로 절단한 다음, 포스파타제를 처리하였다. 선형화된 벡터를 5' 말단을 인산화하기 위해 폴리뉴클레오티드 키나제 (PNK)로 처리된 3파트로 이루어진 PCR 산물에 연결하였다. PCR 산물은, RYSE4 및 RYSE11으로 지칭되는 올리고뉴클레오티드 프라이머를 이용하여 중첩성 말단을 가진 DNA 조각 3개를 연결함으로써, 제작하였다: (1) RaBit 23-0-P-39에서 Sap1으로 분리시킨 삽입체에 의해 제공되는, 사카로마이세스 세레비지애의 GAL1 프로모터 + RYSE 링커 2 및 3, (2) 주형으로서 사용되는 맞춤-합성 유전자와 프라이머 00177-JD-75AN 및 00177-JD-75AO에 의한 PCR 산물에 의해 제공되는, I-SceI 코딩 서열 + RYSE 링커 3 및 4, 및 (3) RaBit 45-0-T-64에서 Sap1으로 분리시킨 삽입체에 의해 제공되는 사카로마이세스 세레비지애의 TDH 종결인자 + RYSE 링커 4 및 5. 라이게이션한 플라스미드들에 대한 각 분리물을 회수한 다음, 플라스미드내 PGAL1-I-SceI-TTDH3 삽입체의 DNA를 서열분석함으로써 적정 플라스미드를 동정하였다. 발현 플라스미드들은 pAM1592 (URA3), pAM1593 (kanA), pAM1594 (natA), 및 pAM1595 (hphA)로 각각 지칭하였다. PGAL1 프로모터는 세포를 갈락토스 존재 하에 배양하였을 때 고도로 발현되며, 야생형 세포 (GAL80+ GAL4)의 경우 세포를 글루코스 존재 하에 배양하였을 때 발현되지 않는다. 그러나, GAL80 억제인자 (gal80Δ)가 결핍된 돌연변이인 경우, PGAL1은 갈락토스가 존재하지 않는 경우에도 발현되며; PGAL1의 글루코스 억제는 (오퍼레이터 구조의 경우) GAL4OC로 지칭되는 프로모터 돌연변이인 GAL4 돌연변이가 존재하는 경우 보다 완화된다.
전술한 바와 같이, 엔도뉴클레아제의 발현은 일부 숙주 균주의 유전자 백그라운드 (GAL80+)에서는 유도에 의해 발현되지만 그외 균주들 (gal80Δ +/- GAL4OC)에서는 구성적으로 발현되는, 강력한 프로모터의 통제 하에 위치되게 되었다. 프로모터가 구성적인 경우라도, 플라스미드의 상실을 통해 적정 시간 경과 후 엔도뉴클레아제의 발현은 쉽게 없어질 수 있으며; 세포의 거의 절반이 비선택적인 배지에서 10세대 이후에 플라스미드를 상실하였다 (예, Gene 1992;110:119-22; Genetics 1989;122:19-27).
6.1.4. 제3 세대 xMarker 구축: 추가적인 엔도뉴클레아제
(I-SceI 이외의) 다른 엔도뉴클레아제에 대한 첫 xMarker 시리즈에서는 선별 마커로서 URA3를 이용하였다. xMarker 시리즈의 각 멤버는 여러가지 엔도뉴클레아제 [VDE, F-CphI, PI-MgaI (pps1), PI-MtuII (pps1)]에 대한 인지/절단부를 포함한다. 절단부에 대한 설명은 상기 표 1을 참조한다. xURA3 마커들 모두 절단부가 측면에 동향 리피트로 위치된 동일한 50 bp 서열 2 카피를 포함하고 있으며; scar로 예정된 이들 고유한 50 bp 서열은 적출 후 xM0로 지칭하였다. 아래 표 6은 scar 서열에 대한 설명이다.
표 6: I-SceI 이외의 다른 엔도뉴클레아제를 이용한 제3 세대 xMarker에 사용되는 50 bp scar 서열
Scar 서열 코드 | 효소 | 마커 | 서열 |
xM0 | F-CphI, PI-MgaI, PI-MgaII, VDE | URA3 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCT (서열번호 23) |
xM1 | F-CphI | NatR | CGTTACGAAGCACACACTAGTTAGCGTCGAGACACATAGCGACGCTAGAA (서열번호 24) |
xM2 | F-CphI | HygR | GTACTGCCTAGTAGAAACGGATCTCCACGTACTAGAGTCCACCTGGTATC (서열번호 25) |
xM3 | F-CphI | KanR | CGAGGATTAACGTGTAAGGCCCTAAGCTATGTACCGCATCTCCTAAGAGA (서열번호 26) |
xM4 | F-CphI | NatR | TTAATCAGCGCCCAGAGACTAGCACTGAATGATCAACGGGTAGTTCACAC (서열번호 27) |
xM5 | F-CphI | TBD | GAATCACGGGGCTATTCCACTTGCTAATAACGAGGCGCTTATCAACGGCG (서열번호 28) |
xM6 | F-CphI | zeoR | GTCAAAGCGCGATTCGCTAGGAATGAGAGCGAGAACGAACCGGAGTATAT (서열번호 29) |
xM7 | F-CphI | TBD | ACTAGAGCGAAATGGAGAGGTACGTGATCCTACTAGAGCCCACGCTATCA (서열번호 30) |
xM8 | F-CphI | TBD | GTACGTCCGTACTTATGCTGAGCGCTCCTACACGAAAAACTCACCGTGAC (서열번호 31) |
xM9 | F-CphI | TBD | GCATTAAGTCGTAGCTAGCGGATTCTCTCTTCGTGCATCCTAGCAAATGG (서열번호 32) |
다음과 같은 기준에 부합되는 scar 서열을 선정하였다: (1) GC 함량은 ~50%임, (2) (총 50 bp에서) 20 bp의 제1 및 제2 서열은 융점이 60℃ ± 2℃임, (3) > 30℃에서 최소 이차 구조 예측됨(minimal predicted secondary structure), 및 (4) 50 bp 서열 중 13 bp 이상 길이의 서열은 효모 게놈내 임의 천연 서열과 동일함. xMarker에서 인자들의 일반적인 서열과 방향성은 도 1에 나타낸 바와 같다: DR (50bp)→, 절단부→, URA3, 절단부→, DR(50bp)→.
xMarker내 사이트 반복으로 인해, DNA 분자 제조시, 좌측 절반과 우측 절단을 연결하기 전에 각각 구축하여야 하였다. 본원에 기술된 마커 구축에는 상기 6.2에 기술된 "제2 세대" 전략을 적용하였다.
먼저, 마커의 좌측 영역과 마커의 우측 영역을 PCR로 각각 증폭시켰다. 각 xMarker를 PCR 증폭하기 위해 4종의 올리고뉴클레오티드를 설계하였다: 마커의 말단에 PCR 어닐링하기 위한 2종의 "외측" 올리고뉴클레오티드와, 마커 유전자 내부와 어닐링하는 2종의 "내측" 올리고뉴클레오티드. 외측 올리고뉴클레오티드는 주형에 상보적인 20-22 bp 서열을 3' 말단에, 주형에 어닐링되지 않고 절단 및 scar 서열을 도입하는데 사용되는 74-90 bp 서열은 5' 말단에 포함한다. 외측 올리고뉴클레오티드는, 후기 단계에서 라이게이션을 촉진하기 위해, PCR 반응에 포함시키기 전에, PNK로 인산화하였다. 내측 올리고뉴클레오티드는, 마커의 중심 단편이 좌측 및 우측 PCR 산물 둘다에 포함되고, 이들 중복되는 단편에 단일 가닥의 상보적인 오버행을 만들 수 있는 고유한 제한 효소 사이트가 포함되도록, 설계하였다. 가능한 경우, 좌측 영역 2개 (또는 우측 영역 2개)가 연결될 가능성을 낮추기 위해, 비-팔린드롬형 오버행을 만드는 제한 효소를 선택하는 것이 바람직하였다.
2번째 단계로, 2종의 PCR 산물을 선택한 제한 효소로 각각 절단하고, 겔-정제하였다. 세번째 단계로, 각각 스티키 말단 및 블런트 말단인, 좌측 및 우측 단편들을 3-조각 라이게이션을 위한 선형화된 RYSE 12 엔트리 벡터 플라스미드와 혼합하였다. 좌측 영역과 우측 영역이 어닐링되어 스티키 말단을 이용하여 라이게이션이 이루어졌으며, 마커의 최말단은 수여 플라스미드와의 블런트-엔드 라이게이션으로 연결되었다. 라이게이션된 플라스미드로부터 각각의 클론을 회수하고, 적정 플라스미드를 DNA 서열분석으로 확인하였다. 이들 플라스미드는 이전의 12 RaBit에서와 같이, 화합물 DNA 구조체의 RYSE-기반의 스티칭에 사용할 수 있는, 새로운 xMarker 12 RaBit들이다.
제1 xURA3 마커 세트를 테스트한 후, 이후 연구를 위해 F-CphI 엔도뉴클레아제를 선택하였다. F-CphI와 함께 사용하기 위해 여러가지 선별 마커가 부가된 xMarker들을 추가로 제작하였다. 이 세트에는 6종의 상이한 선별 마커가 포함된다: URA3; 히그로마이신 B 포스포트랜스퍼라제 또는 hph; 노르세오트리신 아세틸트랜스퍼라제 또는 nat; 아미노글리코사이드 포스포트랜스퍼라제 또는 kan; 제오신 내성 유전자 또는 ble; 및 포스피노트리신 N-아세틸 트랜스퍼라제 또는 pat. 이들 박테리아 유래의 약물 내성 유전자들은 클루이베로마이세사 락티스의 TEF1 유전자의 프로모터와 종결인자에 해당되는 인접한 서열들에 의해 모두 통제되며, 접미사 "A"를 붙여, TEF1-유래 조절 통제(regulatory control)를 표시하며; 카세트는 hphA, natA, kanA, zeoA 및 patA로 지칭하였다. 표 7은 각 마커에 대한 제한 효소 사이트와 내측 올리고뉴클레오티드를 열거하며, 표 8은 각 마커의 외측 올리고뉴클레오티드를 열거한다.
표 7: 제3 세대 xMarker 구축에 사용된 주형, 제한 효소 사이트 및 "내측" 올리고뉴클레오티드
마커 | PCR 주형 | 3-웨이 라이게이션을 위한 내부 제한 효소 | 역방향 내측 올리고뉴클레오티드 (RIO) | 정방향 내측 올리고뉴클레오티드 (FIO) |
URA3 | RaBit 12-0-M-555 | BsiHKAI, PpuMI, BslI, 또는 AlwNI | KB496-266-100 | KB495-266-100 |
hphA | RaBit 12-0-M-21 | RsrII 또는 BanI | KB492-266-100 | KB491-266-100 |
kanA | RaBit 12-0-M-261 | BstXI | KB494-266-100 or TD_187 | KB493-266-100 or TD_186 |
natA | RaBit 12-0-M-262 | StyI | KB479-266-81 | KB480-266-81 |
zeoA | pAM1800 | BglI | TD_183 | TD_182 |
patA | pAM1894 | TBD | TBD |
표 8: 3세대 xMarker 구축에 사용된 "외측" 올리고뉴클레오티드
마커 | scar | 절단부 | PCR 주형 | 정방향 외측 올리고뉴클레오티드 (FOO) | 역방향 외측 올리고뉴클레오티드 (ROO) |
x0.URA.VDE | xM0 | VDE | RaBit 12-0-M-555 | KB518-266-135 | KB519-266-135 |
x0.URA.PI-MgaI | xM0 | PI-MgaI | RaBit 12-0-M-555 | KB522-266-136 | KB523-266-136 |
x0.URA.PI-MtuII | xM0 | PI-MtuII | RaBit 12-0-M-555 | KB524-266-136 | KB525-266-136 |
x0.URA.F-Cph | xM0 | F-Cph | RaBit 12-0-M-555 | KB520-266-136 | KB521-266-136 |
x1.natA.F-Cph | xM1 | F-Cph | RaBit 12-0-M-262 | MF51-312-97 | MF52-312-97 |
x2.hphA.F-Cph | xM2 | F-Cph | RaBit 12-0-M-21 | MF53-312-98 | MF54-312-98 |
x3.kanA.F-Cph | xM3 | F-Cph | RaBit 12-0-M-261 | TD_180 | TD_181 |
x4.natA.F-Cph | xM4 | F-Cph | RaBit 12-0-M-262 | MF57-312-98 | MF58-312-98 |
x6.zeoA.F-Cph | xM6 | F-Cph | pAM1800 | TD_176 | TD_177 |
6.1.5. 엔도뉴클레아제 발현 플라스미드 구축
아래 표 9는 엔도뉴클레아제 유전자들, I-SceI, F-CphI, PI-MtuII (pps1), PI-MgaI (pps1) 및 VDE를 포함하는 플라스미드들을 나타낸다. 이들 엔도뉴클레아제 유전자들은 화학 합성하거나 (I-SceI, F-CphI, PI-MtuII (pps1), PI-MgaI (pps1)) 또는 사카로마이세스 세레비지애 게놈 DNA (VDE)로부터 PCR에 의해 증폭하였다.
표 9: 엔도뉴클레아제 유전자를 포함하는 플라스미드들
플라스미드 | 벡본 | 효모 마커 | 엔도뉴클레아제 | 프로모터 | 종결인자 |
pAM1592 | pRS416 | URA3 | I-SceI | GAL1 | TDH3 |
pAM1593 | pAM1110 | kanA | I-SceI | GAL1 | TDH3 |
pAM1594 | pAM1111 | natA | I-SceI | GAL1 | TDH3 |
pAM1595 | pAM1112 | hphA | I-SceI | GAL1 | TDH3 |
pAM1677 | pAM1112 | hphA | VDE + N-말단 SV40 NLS | ACS2 | ADE6 |
pAM1678 | pUC19 | 없음 | PI-MgaI (pps1) + N-말단 SV40 NLS | 없음 | 없음 |
pAM1679 | pUC19 | 없음 | PI-MtuII (pps1) + N-말단 SV40 NLS | 없음 | 없음 |
pAM1680 | pUC19 | 없음 | F-CphI | 없음 | 없음 |
pAM1749 | pAM1112 | hphA | F-CphI | ACS2 | ADE6 |
pAM1750 | pAM1112 | hphA | PI-MgaI (pps1) + N-말단 SV40 NLS | ACS2 | ADE6 |
pAM1751 | pAM1112 | hphA | PI-MtuII (pps1) + N-말단 SV40 NLS | ACS2 | ADE6 |
pAM1799 | pAM1112 | hphA | F-CphI | GAL1 | TDH3 |
pAM1800 | pAM1801/ pAM1799 | zeoA | F-CphI | GAL1 | TDH3 |
pAM1862 | pAM64 = pRS416 | URA3 | F-CphI | GAL1 | TDH3 |
pAM1863 | pAM1110 | kanA | F-CphI | GAL1 | TDH3 |
pAM1864 | pAM1111 | natA | F-CphI | GAL1 | TDH3 |
pAM1865 | pAM1112 | hphA | PI-MtuII (pps1) + N-말단 SV40 NLS | GAL1 | TDH3 |
pAM1866 | pAM1112 | hphA | PI-MgaI (pps1) + N-말단 SV40 NLS | GAL1 | TDH3 |
pAM1867 | pAM1112 | hphA | VDE + N-말단 SV40 NLS | GAL1 | TDH3 |
엔도뉴클레아제들 중 3종 (F-CphI 및 I-SceI은 제외)은 크기가 커 세포내 합성부 (세포질)에서 핵공(nuclear pore)을 통한 작용 부위 (핵)로의 이동이 자유롭지 않으므로, 단백질의 아미노-말단에 SV40 핵 국지화 서열 (NLS)을 부가하기 위해 코딩 서열의 5' 말단에 DNA 서열을 추가하였다. 천연 효모 효소는 선천적으로 감수분열시에만 핵으로 유입되기 때문에, NLS는 사카로마이세스 세레비지애가 유사분열 (정상적인 증식) 생장하는 동안의 VDE 활성에는 필수적인 것으로 알려져 있었다. 예를 들어, Mol Cell Biol 2003;23:1726-36을 참조한다. SV40 NLS의 코딩 서열을 포함하는 꼬리가 부가된 올리고뉴클레오티드를 이용하여 VDE에 NLS를 추가하였고; NLS를 전체 유전자의 화학 합성 공정의 일부분으로서 PI-MtuII 및 PI-MgaI에 추가하였다. PCR-기반의 "스티칭" 또는 "오버랩 연장"을 이용하여, 엔도뉴클레아제 코딩 서열을, NLS를 추가하거나 추가하지 않으면서, 프로모터와 종결인자와 연결시켰다. 사카로마이세스 세레비지애 ACS2의 프로모터와 ADE6의 종결인자를 이용하여, RYSE 링커를 사용하지 않고, 제1 구조체 세트를 제조하였다. 이 제1 세트에서, 프로모터-유전자-종결인자 PCR 스티칭 산물을, 각 조각을 PCR 반응시키는데 사용되는 올리고뉴클레오티드 상에 꼬리에 의해 도입되어진 고유한 제한 효소 사이트가 존재하는 SacI 및 XhoI으로 절단한 다음; 구조체를 SacI/XhoI로 자르고 포스파타제를 처리한 수여 플라스미드와 라이게이션하였다. 제2 세트에는 사카로마이세스 세레비지애의 GAL1 프로모터와 TDH3 종결인자를 사용하였으며; 프로모터 (23-0-P-39) 및 종결인자 (45-0-T-64)에 대해 RYSE 링커와 RYSE RaBit를 사용하였다. 이 제2 플라스미드 세트의 경우, 블런트-엔드 연결된 산물이, 블런트 엔드 이중 가닥 브레이크를 만드는 제한 효소에 의해 선형화된, 효모 마커를 구비한 CEN.ARS 플라스미드에 효과적으로 라이게이션될 수 있도록, 폴리뉴클레오티드 키나제 (PNK)를 이용하여 이미 인산화시킨 RYSE 프라이머들 RYSE4 및 RYSE11로, 프로모터-유전자-종결인자 구조체를 연결하였다. 마지막으로, 라이게이션된 플라스미드의 개개 분리체를 회수하여, 바람직한 플라스미드를 플라스미드내 "프로모터-유전자-종결인자"를 DNA 서열분석하여 동정하였다. 플라스미드 구축에 대한 상세한 내용은 아래에 기술한다.
수여 플라스미드들은 모두 CEN.ARS 서열과 효모 선별 마커를 구비한 "pRS" 시리즈의 효모-E.coli 셔틀 벡터를 기반으로 하며, 예를 들어 URA3 마커가 존재하는 버전 (pRS416 및 pAM64)은 이미 개시되어 있다 (예, Gene 1992;110:119-22; and Genetics 1989;122:19-27). 영양 요구 마커를 약물 내성 마커 kanA (pAM1110), natA (pAM1111) 및 hphA (pAM1112)로 치환하여, pRS416 유도체들을 제작하였다. 제2 플라스미드 세트의 경우, pAM1112를 폴리링커/다중 클로닝 사이트내 고유한 블런트-엔드의 제한효소 사이트 (EcoRV)에서 절단한 다음, 포스파타제를 처리하였다. 선형화된 벡터를, 폴리뉴클레오티드 키나제 (PNK)를 처리하여 5' 말단을 인산화한 3개의 파트가 연결된 PCR 산물과 라이게이션하였다. 제1 플라스미드 세트의 경우, 3개의 파트가 연결된 PCR 산물과 pAM1112 수여 플라스미드를 둘다 XhoI과 SacI으로 자른 다음, 라이게이션하기 위해 혼합하였다.
오버행 형태의 말단을 가진 DNA 단편 3개를 연결하여, 엔도뉴클레아제 유전자 발현을 위한 "프로모터-유전자-종결인자" PCR 산물을 제작하였다. 3개의 단편 제작에 사용되는 올리고뉴클레오티드와 주형, 그리고 이들 3개의 단편을 연결하는데 사용되는 올리고뉴클레오티드를 표 10에 나타낸다.
표 10: 프로모터-엔도뉴클레아제-종결인자의 PCR 연결에 사용된 단편들
명명 | 프로모터 단편: 올리고스 및 주형 또는 RaBit | 엔도뉴클레아제 단편: 올리고스 및 주형 | 종결인자 단편: 올리고스 및 주형 또는 RaBit | 연결용 프라이밍 올리고스 | 라이게이션 수행 전 연결시킨 산물에 대한 처리 |
PACS2-VDE-TADE6 | KB510, KB512, 게놈 DNA (KB512 꼬리는 NLS를 코딩함; KB510 꼬리는 SacI 사이트를 도입함) | KB513, KB515, 게놈 DNA (KB513 꼬리는 NLS를 코딩함) | KB514, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함) | KB510, KB511 | XhoI/ SacI로 절단 |
PACS2-F-Cph-TADE6 | KB510, KB540, 게놈 DNA (KB510 꼬리는 SacI 사이트를 도입함) | KB539, KB542, pAM1680 | KB541, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함) | KB510, KB511 | XhoI/ SacI로 절단 |
PACS2-PI-MgaI-TADE6 | KB510, KB528, 게놈 DNA (KB510 꼬리는 SacI 사이트를 도입함) | KB527, KB530, pAM1678 | KB529, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함) | KB510, KB511 | XhoI/ SacI로 절단 |
PACS2-PI-MtuII-TADE6 | KB510, KB534, 게놈 DNA (KB510 꼬리는 SacI 사이트를 도입함) | KB533, KB536, pAM1679 | KB535, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함) | KB510, KB511 | XhoI/ SacI로 절단 |
PGAL1-VDE-TTDH3 | 23-0-P-39 | round 1: KB590, KB594, pAM1677; round 2: KB589, KB594, round 1 product | 45-0-T-64 | PNK-처리된 RYSE4, RYSE11 | - |
PGAL1-F-Cph-TTDH3 | 23-0-P-39 | KB591, KB595, pAM1680 | 45-0-T-64 | PNK-처리된 RYSE4, RYSE11 | - |
PGAL1-PI-MgaI-TTDH3 | 23-0-P-39 | KB589, KB593, pAM1678 | 45-0-T-64 | PNK-처리된 RYSE4, RYSE11 | - |
PGAL1-PI-MtuII-TTDH3 | 23-0-P-39 | KB589, KB592, pAM1679 | 45-0-T-64 | PNK-처리된 RYSE4, RYSE11 | - |
6.1.6. I-SceI 발현 플라스미드의 구축
I-SceI 유전자를 사카로마이세스 세레비지애 GAL1 프로모터의 통제 하에 있도록 배치한 다음, 이를 다양한 마커를 구비한 CEN.ARS 플라스미드 세트에 클로닝하였다. CEN.ARS 서열, LEU2 (pRS415 aka pAM63) 및 URA3 (pRS416 aka pAM63) 마커를 구비한 효모-E.coli 셔틀 벡터가 이미 개시되어 있다 (예, Gene 1992;110:119-22; Genetics 1989;122:19-27). 영양 요구성 마커를 약물 내성 마커들 kanA (pAM1110), natA (pAM1111) 및 hphA (pAM1112)로 치환하여, pRS416 유도체들을 제작하였다. 각각의 벡터를 EcoRV (약물 내성 마커) 또는 SmaI (URA3 및 LEU2)으로 폴리링커/다중 클로닝 사이트내 고유한 블런트-말단 제한 효소 사이트에서 절단한 다음, 포스파타제를 처리하였다. 선형화된 벡터를, 폴리뉴클레오티드 키나제 (PNK)를 처리하여 5' 말단을 인산화한 3개의 파트가 연결된 PCR 산물과, 라이게이션하였다. RYSE4 및RYSE11으로 지칭되는 올리고뉴클레오티드 프라이머를 이용하여 오버행 형태의 말단을 가진 3개의 DNA 단편을 연결하여, PCR 산물을 제작하였다: (1) RaBit 23-0-P-39 유래 Sap1-절단한 삽입체에 의해 제공되는, 사카로마이세사 세레비지애 GAL1 프로모터 + RYSE 링커 2 및 3, (2) 주형으로서 사용된 맞춤-합성한 유전자를 프라이머 00177-JD-75AN 및 00177-JD-75AO으로 제조한 PCR 산물에 의해 제공되는, I-SceI 코딩 서열과 RYSE 링커 3 및 4, 및 (3) RaBit 45-0-T-64 유래 Sap1-절단한 삽입체에 의해 제공되는, 사카로마이세스 세레비지애 TDH 종결인자와 RYSE 링커 4 및 5. 라이게이션한 각각의 플라스미드 분리체들을 회수하고, 플라스미드내 PGAL1-I-SceI-TTDH3 삽입체의 DNA를 서열분석함으로써 적정 플라스미드를 동정하였다. 발현 플라스미드를 pAM1592 (URA3), pAM1593 (kanA), pAM1594 (natA) 및 pAM1595 (hphA)로 지칭하였다. PGAL1 프로모터는 세포를 갈락토스에서 생육시켰을 때 고도로 발현되며, 야생형 세포(GAL80+ GAL4)의 경우에는 글루코스에서 세포를 생육시켰을 때에는 발현되지 않는다. 그러나, GAL80 억제인자 (gal80Δ)가 결여된 돌연변이의 경우, PGAL1은 갈락토스가 없는 조건에서도 발현되지만; PGAL1의 글루코스 억제는 (오퍼레이터 구조의 경우) GAL4OC로 지칭되는 프로모터 돌연변이가 있는 GAL4 돌연변이의 부가시 보다 약화된다.
엔도뉴클레아제의 발현은 일부 숙주 균주 유전자 백그라운드 (GAL80+)에서는 유도에 의해 발현되지만, 그외 경우들 (gal80Δ +/- GAL4OC)에서는 구성적으로 발현되는, 강력한 프로모터의 통제 하에 배치되어 있다. 그외 여러가지 유도성 프로모터 또는 구성적인 프로모터들도 잘 작동할 것으로 예상된다. 프로모터가 구성적인 경우라도, 엔도뉴클레아제의 발현은 플라스미드를 상실하는 적정 시간이 경과한 이후에는 쉽게 없어질 수 있으며; 세포의 거의 절반이 비선택적인 배지(예, Gene 1992;110:119-22; 및 Genetics 1989;122:19-27)에서 10세대 계대 후에 이들 플라스미드를 상실하게 된다.
6.1.7. F-CphI 발현 플라스미드 구축
hphA 마커 (pAM1799)를 구비한 F-CphI 발현 플라스미드를 제작하여 테스트한 후, 수여 플라스미드 및 pAM1799내 고유 사이트를 각각 절단하는, 제한 효소 XhoI 및 XbaI을 이용하여, PGAL1-F-CphI-TTDH3 카세트를 여러가지 마커(pAM1110, pAM1111, pAM64)를 구비한 다른 CEN.ARS 플라스미드에 서브클로닝하였다. 플라스미드를 XhoI 및 XbaI으로 모두 자르고, 플라스미드 벡터에 포스파타제를 처리한 다음, PGAL1-F-CphI-TTDH3 카세트를 다른 벡본에 라이게이션하였다. 라이게이션한 후, 적정 플라스미드 분리체를 제한효소 절단을 통해 동정하였다.
다른 것으로부터 여러가지 방법으로 제오신-내성 플라스미드 (pAM1800)를 구축하였다. 구축은, PGAL1-F-CphI-TTDH3의 "프로모터-유전자-종결인자" PCR 산물을 연결한 다음 이를 제오신 내성 마커를 구비한 수여 플라스미드에 라이게이션하기 보다는, hphA 마커 (pAM1799)를 구비한 F-CphI 발현 플라스미드로 시작하여, 효모의 상동적인 재조합을 이용함으로써 마커를 치환함으로써, 히그로마이신 B 내성 유전자를 제오신 내성 유전자로 치환하였다. 먼저, pAM1799를 히그로마이신 B 내성 코딩 서열내 고유 사이트를 절단하는 제한 효소 NdeI으로 선형화하였다. 그런 후, hph 마커의 발현을 통제하는 pAM1799에서의 서열과 상동적인 PTEF 프로모터 및 TTEF 종결인자 유래 서열을 도입하는, 긴 꼬리를 구비한 올리고뉴클레오티드를 이용하여, 제오신 내성 유전자를 pAM1500 (또는 임의의 Topo 플라스미드)으로부터 PCR 증폭시켰다. 다음으로, DNA 2 조각을 겔 정제하여, 히그로마이신 B 내성 유전자가 제오신 내성 유전자로 정확하게 치환된 "갭 회복" 재조합을 위해 효모에 형질전환하였다. 적정한 플라스미드를 DNA 서열분석으로 검증하였다.
PGAL1 프로모터는 세포를 갈락토스 존재 하에 배양하였을 때 고도로 발현되며, 야생형 세포 (GAL80+ GAL4)를 글루코스 존재 하에 배양하였을 때에는 발현되지 않는다. 그러나, GAL80 억제인자가 결핍된 돌연변이 (gal80Δ)의 경우, PGAL1은 갈락토스가 존재하지 않는 경우에도 발현되며; PGAL1의 글루코스 억제는 (오퍼레이터 구조의 경우) GAL4OC로 지칭되는 프로모터 돌연변이인 GAL4 돌연변이 부여시 보다 완화된다. PACS2 프로모터는 모든 탄소원에서 적당히 발현된다.
6.2
실시예 2: 염색체 DNA로부터 선별 마커의 적출
본 실시예는 숙주 세포의 염색체 DNA로부터 선별 마커를 적출함에 있어 실시예 1에 기술된 xMarker 구조체들의 유용성을 입증한다. 후술되는 바와 같이, 구조체를 세포에 형질전환시키고, 세포를 xMarker에 선별적인 배지에 접종하고, 콜로니 PCR에 의해 병합이 바르게 이루어졌는지를 검증하였으며; 그러한 균주들을 표준 마커로 제조한 임의의 다른 균주에서와 같이 수행하였고, xMarker는 안정적으로 유지되었다. 그런 후, xMarker를 적출하는 것이 바람직한 경우, 아래 단락들에 기술되는 바와 같이, 균주에 자신의 마커와 호밍 엔도뉴클레아제 유전자에 대한 발현 구조체를 포함하는 단일-카피 (CEN.ARS) 플라스미드를 형질전환시킨다. 수 세대간 플라스미드 존재를 선별하고 호밍 엔도뉴클레아제 유전자의 발현을 유도하는 조건에서 배양한 후, 균주를 대상으로 xMarker 상실을 테스트한다. 마지막으로, 균주를 호밍 엔도뉴클레아제 발현 플라스미드가 상실될 수 있는 조건 하에 배양하고, 분리물들에서 플라스미드 상실을 테스트한다. 본 공정이 끝나면, 균주는 xMarker를 재-이용할 준비가 완료된다.
이러한 전략의 경우, 원하는 DNA 구조체가 정확하게 병합된 세포를 선별하고 검증할 만큼 충분한 시간 동안 xMarker가 안정적인 것이 좋다. 높은 안정성은 2차 형질전환에 의한 도입시까지 엔도뉴클레아제 유전자가 결여된 세포를 이용함으로써 보장할 수 있다. 그러나, 다른 방법은 유도성 프로모터의 통제 하에 안정적으로 병합된 엔도뉴클레아제 유전자를 구비한 숙주 균주를 이용한다. 이러한 다른 방법에서는, 조절된 프로모터로부터 엔도뉴클레아제의 발현이 유도되는 조건 하에 균주를 배양할 때까지, xMarker는 안정적일 것이다. 바람직한 특징을 구비한 프로모터를 이용할 수 있다면, 이러한 방법은 엔도뉴클레아제 플라스미드의 형질전환에 요구되는 시간과 노력을 절약할 수 있을 것이다.
6.2.1. I-SceI을 이용한 xMarker의 일차 테스트:
이러한 타겟 DNA의 정확한 적출 방법을 테스트하기 위해, 염색체 DNA로부터 선별 마커의 적출 효율과 충실도를 사카로마이세스 세레비지애에서 측정하였다. 첫번째로, 선정한 유전자(총칭하여, GOI = 목적 유전자)의 상류 및 하류 영역에 해당되는 2개의 >500 bp 서열 가닥 사이에 xMarker를 배치하여, 낫-아웃 구조체를 제조하였다. 2차로, 이 DNA 구조체를 효모 세포에 형질전환하여, 이중 크로스오버 현상을 수반하는 상동적인 재조합을 통해, 목적 유전자를 제거하고 이의 코딩 서열을 xMarker로 치환하였다. 3번째 단계로, 돌연변이를 I-SceI 발현 플라스미드로 형질전환시키고; 엔도뉴클레아제를 발현하여 DNA 절단 및 복원이 이루어지도록 플라스미드를 보유한 분리체들을 유지시켰다. 4번째 단계로, 마커-선별 조건에서 생육할 수 없는 콜로니들을 동정 및 계수하였다. 5번째 단계로, 예상한 바와 같이 마커가 적출되어 깔끔하게 복원되었지는지를 평가하기 위해 목적한 유전자가 제거된 유전자 좌의 염색체 DNA 서열 (goiΔ)을 확인하였다. 이들 일련의 단계들에 대한 상세한 내용은 아래 제1 세대 마커 단락에서 기술한다.
1차 단계로, 구조 GOI US/ xMarker/ GOI DS (GOI = 목적 유전자, US = 상류, DS = 하류)를 구비한 낫-아웃 구조체를 오버랩 연장 PCR을 이용하여 3개의 인자을 연결하였다. 먼저, I-SceI xMarker를 ndt80Δ 구조체에서 테스트하였는데, NDT80은 유사 분열에 의해 생장하는 세포에서의 이의 결손은 식별가능한 표현형을 나타내지 않기 때문에, 선택한 감수분열-특이 유전자이다. 각 PCR 반응에서는, SapI으로 절단하여 플라스미드 벡본으로부터 분리시킨 3종의 RaBit를 주형으로 사용하였다: (1) NDT80 상류 (01-0-U-30), (2) xMarker RaBit, 및 (3) NDT80 DS (29-0-D-23). PCR 프라이머는 RYSE0 및 RYSE19를 사용하였다. PCR 수행 후, 반응 혼합물을 아가로스 겔에 로딩하고, 적정한 전장 산물을 겔로부터 정제하였다.
2차 단계로, 효모 세포를 겔-정제한 PCR 산물로 형질전환하고, 선별 플레이트에 접종하였다. 제1 세대 xMarker에 대한 선별 플레이트는 CSM-Uracil이며; 약물 내성 마커에 대한 선별 플레이트는 YPD+drug (히그로마이신 B, 노르세오트리신, 또는 G418)이다. 모든 xMarker 테스트는 CEN.PK2 유래 균주와 S288c 균주 백그라운드에서 수행하였다. 제1 세대 xMarker에 대한 1차 테스트는, PCR 산물을 해당 유전자형으로 GAL80+ GAL4 gal1Δ을 가진 균주(Y1625)에 형질전환시키는 과정을 포함하는데; 이 유전자형은 PGAL1으로부터 야생형의 유도성 발현과, 갈락토스가 "불필요한 유도제"가 되게 하는 갈락토스에 대한 식이 불능을 부여한다. 바람직한 형질전환체들은 돌연변이 유전자형 ndt80Δ::xURA3를 가지며, 표 2에 열거된 몇가지 xURA3 마커 버전을 가진다. CSM-U 플레이트에서 생육한 콜로니를 대상으로, 재조합에 의해 제조된 새로운 DNA 정션을 증폭하는 프라이머 쌍을 이용하여 세포의 비등 용혈물 유래 게놈 DNA를 PCR ("콜로니 PCR") 증폭함으로써, 원하는 염색체 유전자 좌의 존재를 조사하였다. 프라이머 RYSE3 및 AET0065-186-63-F-pNDT80을 이용하여 새로운 5' 정션을 증폭시켜 1024 bp 산물을 수득하였고, 프라이머 RYSE4 및 AET0072-186-63-R-tNDT80를 이용하여 새로운 3' 정션을 증폭시켜 1024 bp 산물을 수득하였다. 각 xMarker 변이체에 대한 2가지 분리체들을 이후 분석용으로 선별하였다.
3차 단계로, 유전자형 ndt80Δ::xMarker를 가진 분리주에 I-SceI 발현 플라스미드를 형절전환하였다. 제1 세대 ndt80Δ::xURA3 균주의 경우, natA-표지 플라스미드 (pAM1594)를 표준 형질전환 조건을 이용하여 형질전환시키고, 세포를 액체 YPD에서 3-6시간 동안 생장시키는 동안 새로운 마커 유전자를 발현하게 둔 다음, 이를 YPD+노르세오트리신 플레이트에 접종하였다. 각 형질전환물의 절반을 일반 YPD (2% 덱스트로스)에 도말하고, 절반은 YPDG (1% 덱스트로스 + 1% 갈락토스)에 도말하였다. 숙주 균주 표현형은 GAL80+ GAL4 gal1Δ이므로, I-SceI 유전자의 GAL1 프로모터는 덱스트로스 존재시 유도되지 않았으며; 덱스트로스와 갈락토스 혼성 조건에서는 GAL1 프로모터가 오프 상태로 유지될 것으로 예상되는 반면, 덱스트로스가 고갈되어 플레이트내 갈락토스가 효능을 나타냄에 따라 턴 온으로 전환된다.
4차 단계로, 마커가 적출된 분리체들을 동정하였다. xURA3 마커는 URA3가 결핍된 세포만 생육시키는 5-FOA 플레이트에서 역선별할 수 있는 이점이 있다. 이와는 대조적으로, 다른 xMarker가 적출된 분리체들은, 예컨대 모든 분리체들이 생장하는 비-선택 플레이트를 바람직한 분리체들이 생육하지 못하는 선별 플레이트에 리플리카 플레이팅하여 스크리닝함으로써 동정하여야 한다. 제1 세대 xMarker는 역선별 이점을 이용하기 위해 URA3를 사용하였다. 기대한 바와 같이, 전술한 플라스미드-보유 형질전환체를 YPD 플레이트에서 취하여 5-FOA에 스트리킹하였을 때, I-SceI가 YPD에서 발현되지 않기 때문에, 콜로니가 증식되지 않았다. 플라스미드-보유 형질전환체를 YPDG 플레이트에서 취하여 5-FOA에 스트리킹하였을 때, 다수의 콜로니들이 증식되었다. YPDG 플레이트는 갈락토스를 포함하며, I-SceI의 발현을 유도한다. 5-FOA 플레이트는 온전한 URA3를 보유한 세포에 대해 역선별한다. 대조군 ura3Δ 균주 대비 I-SecI 형질전환체를 다시 스트리킹하였을 때 증식하는 5-FOA 콜로니의 수를 기초로, 세포의 ≥30%가 I-SecI 2곳 사이에 위치한 URA3를 상실하는 것으로 추정되며; 그 빈도는 하나의 I-SceI 사이트를 구비한 xURA3에서 더 낮게 나타났다. URA3 xMarker는, I-SceI 발현없이는 거의 적출되지 않지만(세포의 <10-6), I-SecI의 발현 유도 후에는 URA3가 빈번하게 적출되는 것으로 시사되었다. 이후 적출 빈도를 보다 직접적으로 테스트하였다.
5차 단계로, xMarker가 병합된 염색체 유전자 좌의 서열을 분석하여 I-SceI 절단 및 이후 DNA 이중-가닥 브레이크 복원 후에 생기는 scar를 확인하였다. 마커의 기능이 상실된 것으로 입증된 콜로니는, xMarker와 GOI 타겟팅 서열 사이 정션의 상류와 하류에 어닐링하는 프라이머로 콜로니 PCR한 다음, PCR 산물의 서열을 분석하였다. ndt80Δ::xMarker의 경우, 프라이머는 xMarker와 NDT80 서열 사이 정션부의 208 bp 상류 (JU-197-168-125-NDT80US-F) 및 234 bp 하류 (JU-198-168-125-NDT80DS-R)에 어닐링한다. 예상되는 PCR 산물 크기는, URA3가 깔끔하게 적출된 경우에는 462-522 bp이었고, URA3가 완전히 온전한 경우에는 2072 bp이었다. 콜로니 PCR에 사용된 5-FOA 내성 콜로니 총 27개에서는 적출된 것으로 예상되는 ~500 bp의 산물이 확인되었다. 이들 27개의 PCR 산물을 서열분석하였을 때 모두 도 1에 나타낸 예상되는 정확한 scar를 나타내었다 (표 11 참조). 표 11에 나타낸 바와 같이, 27개의 테스트한 콜로니들 모두 xMarker가 병합되고, 이후 I-SecI이 발현되어, xMarker가 적출되는 것으로 확인되었다.
표 11: 마커 적출 후 제1 세대 I-SceI xMarker scar의 서열분석을 통한 적출 충실도를 나타낸 결과
URA3 xMarker 명 | DR 길이 (bp) | I-SceI 사이트(#) | 서열 분석한 scar 수 (#) | scar 일치율 (%) |
20mer-direct | 20 | 2 | 8 | 100 |
40mer-direct | 40 | 2 | 4 | 100 |
60mer-direct (aka s0x-URA3) | 60 | 2 | 4 | 100 |
80mer-direct | 80 | 2 | 8 | 100 |
60mer-single | 60 | 1 | 3 | 100 |
또한, 제1 및 제2 세대 xMarker (표 2 및 4)를 GAL1 프로모터가 구성적인 여러가지 사카로마이세스 세레비지애 균주 (gal80Δ GAL4OC)에서 테스트하였다. ndt80Δ::xMarker 구조체를 연결하여, 전술한 바와 같이 효모에 형질전환하였다. xURA3를 구비한 형질전환 혼합물을 직접 CSM-U 플레이트에 도말하고; 약물 내성 마커를 가진 균주를 먼저 교반 인큐베이터에서 액체 YPD 중에서 3-6시간 배양한 후, YPD + 약물 플레이트에 도말하였다. 콜로니 PCR을 통해 ndt80Δ::xMarker이 병합된 것으로 검증된 2종의 형질전환체에서 각각의 xMarker 변이체를 독립적으로 I-SceI 발현 플라스미드 중 하나에 형질전환시켜, 전술한 바와 같이 선별 플레이트에 도말하였다.
PGAL1-I-SceI 발현은 구성적이므로, 플라스미드 형질전환 선별 플레이트에서의 콜로니들은 xMarker를 유지하거나 적출된 세포들의 혼성 집단인 것으로 예측되었다. 각 플레이트에서 수개의 콜로니를 취하여, 플라스미드 또는 마커 또는 둘다를 상실한 세포의 증식을 허용하는 비-선택적인 YPD 플레이트에 다시 스트리킹하였다. 이러한 다시 스트리킹한 플레이트에서 생장한 콜로니를 YPD 플레이트에 접종하여 밤새 배양한 후, YPD + 약물, CSM - 우라실 및 5-FOA 플레이트에 대해 리플리카를 제작하였다. 다수의 패치들이 5-FOA 및 CSM-우라실 둘다에서 증식하여, 패치내 세포 집단의 혼성인 것으로 확인되었고, 콜로니를 분리하기 전에 비-선별 조건에서 추가적으로 증식시키는 것이 분석을 위한 동종 집단을 수득하는데 필요한 것으로 생각되었다. 마커 적출 빈도는 일반적으로 혼성 패치로 인해 본 실험에서는 과소 평가되었지만, 일반적으로 패치의 18% 이상, 흔히 35-50%는 마커가 적출된 세포를 어느 정도 포함하고 있었다 (표 12). 대부분의 패치 (53-88%)는 리플리카 플레이트 제작 전에 I-SecI 발현 플라스미드를 완전히 상실하였다. 패칭 및 리플리카 플레이트 제작과 병행하여, YPD에 다시 스트리킹한 플레이트에서 2종의 독립적인 ndt80Δ::s1x-hphA 균주 유래의 콜로니 90개를 대상으로 콜로니 PCR로 마커 적출을 확인하였는데; 콜로니의 48% (43/90)가 hphA 마커의 완전한 적출시 예상되는 크기 밴드를 나타내었다.
표 12: 제2 세대 I-SceI xMarker의 적출 빈도와 엔도뉴클레아제 발현 플라스미드의 상실 빈도를 나타낸 결과
하기 상태의 세포를 일부 세포를 함유한 패치 % | |||||
xMarker | 플라스미드 마커 | xMarker 온전 | xMarker 적출됨 | 플라스미드 보유 | 플라스미드 상실 |
s1x-hphA | URA3 | 65 | n/a | 28 | 100 |
s5x-natA | URA3 | 98 | n/a | 48 | 100 |
s7x-URA3 | hphA | 58 | 46 | 13 | n/a |
s8x-URA3 | hphA | 79 | 40 | 19 | n/a |
20mer-URA3 | hphA | 92 | 19 | 15 | n/a |
60mer-URA3 (aka s0x-URA3) | hphA | 35 | 75 | 15 | n/a |
80mer-direct | hphA | 48 | 58 | 33 | n/a |
전술한 바와 유사한 실험을 이용하여 조사하기 위해 xMarker들을 추가로 구축하였다. 아울러, 동일 균주에서 여러가지 유전자 좌에 병합시킨 복수의 xMarker들이 성공적으로 동시 적출됨을 확인하였으며, 게놈 불안정성 징후는 나타나지 않았다 (예, 염색체 전위) (아래 실시예 6.2.4 참조).
6.2.2. 다른 엔도뉴클레아제를 이용한 xMarker 테스트:
다른 엔도뉴클레아제 4종을 6에 나타낸 xURA3 마커 세트를 이용하여 테스트하였다. 각 xMarker에는 2개의 엔도뉴클레아제 절단 사이트가 양측에 위치한 URA3 선별 마커 유전자가 포함되어 있으며, 상기 절단 사이트 옆에는 바로 50 bp의 리피트 서열이 위치되어 있다. 각각의 경우, GOI US/ xMarker/ GOI DS (GOI = 대상 유전자, US = 상류, DS = 하류) 구조의 낫-아웃 구조체는 3개의 인자를 오버랩 연장 PCR로 연결하였다. 먼저 새로운 엔도뉴클레아제 URA3 xMarker를 대상 유전자 (GOI)로서 HXT3와 함께 테스트하였다. 각 PCR 반응에서는 주형으로서 SapI으로 플라스미드 벡본에서 분리한 3개의 RaBit를 사용하였다: (1) HXT3 상류 (01-0-U-407), (2) xMarker RaBit (x0.URA.VDE, x0.URA.F-CphI, 12-0-x0.URA.PI-MtuII, 12-0-x0.URA.PI-MgaI), 및 (3) HXT3 DS (29-0-D-408). PCR 연결에 사용한 프라이머는 RYSE0와 RYSE19이다. PCR 반응 후, 반응 혼합물을 아가로스 겔에 로딩하고, 원하는 전장 크기의 산물을 겔에서 정제하였다. 겔-정제한 PCR 산물을 효모 세포에 형질전환한 다음, URA3(CSM-Uracil)에 선택적인 플레이트에 도말하였다. 바람직한 형질전환체는 돌연변이 유전자형 hxt3Δ::xURA3를 가지며, 표 6에 열거된 여러가지 버전의 xURA3 마커들을 포함한다. CSM-우라실 플레이트에서 증식시킨 콜로니를 대상으로, 재조합에 의해 제조된 새로운 DNA 정션을 증폭하는 프라이머 쌍을 이용하여 세포의 비등 용혈물 유래 게놈 DNA를 PCR ("콜로니 PCR") 증폭함으로써, 원하는 염색체 유전자 좌의 존재를 테스트하였다. 프라이머는 KB502, KB503 및 CPK904를 사용하였는데, 후자 2개는 hxt3Δ::xURA3에 대해 738 bp의 단편을 증폭하며, 전자 2개는 온전한 HXT3에 대해 538 bp 단편을 증폭하였다. 각 xMarker 변이체에 대한 2개 분리체를 이후 분석을 위해 선별하였다.
xURA3 마커는 URA3 결핍 세포만 생육하는 5-FOA 플레이트에서 역선별할 수 있는 이점이 있다. 이와는 대조적으로, 다른 xMarker가 적출된 분리체들은, 예컨대 모든 분리체들이 생장하는 비-선택 플레이트를 바람직한 분리체들이 생육하지 못하는 선별 플레이트에 리플리카 플레이팅하여 스크리닝함으로써 동정해야 한다. 제1 세대 xMarker는 드물에 발생하는 적출 현상을 정량화할 수 있는 역선별 이점을 위해 URA3를 사용하였다. 기대한 바에 따라, xURA3 마커를 포함하나 엔도뉴클레아제 발현 플라스미드는 결핍된 균주를 5-FOA에 스트리킹하여 도말하였을 때, 콜로니는 생기지 않았다. 이는, xMarker의 자발적인 적출이 엔도뉴클레아테-촉매화된 절단이 없는 경우에 매우 드물게 이루어짐을 의미한다. 이는, 엔도뉴클레아제를 발현시키지 않고는 URA3 xMarker의 적출이 거의 이루어지지 않음을 의미한다 (세포의 <10-6).
유전자형 hxt3Δ::xURA3로 확인된 분리체들을 마커 유전자 hphA (pAM1799, pAM1865, pAM1866)로 표시된 엔도뉴클레아제에 대한 동계 발현 플라스미드로 형질전환하였다. 형질전환 혼합물에서 세포를 액체 YPD에서 3-6시간의 생장 기간 동안 새로운 마커 유전자를 발현하게 둔 다음, 이를 YPD+히그로마이신 B 플레이트에 접종하였다. 숙주의 유전자형은 gal80Δ GAL4oc이므로, 엔도뉴클레아제 유전자의 발현을 지시하는 GAL1 프로모터가 구성적으로 발현되어, 유도제가 필요하지 않았다. 3일간 배양한 후, 형질전환 콜로니를 YPD+히그로마이신 B 플레이트에 다시 스트리닝하여, 다시 3일간 배양하였다. 다시 스트리킹한 플레이트에서 콜로니를 취하여 (엔도뉴클레아제 당 콜로니 4개) YPD 3 ml에 현탁한 다음, 플라스미드 상실을 허용하는 비-선별 조건에서 밤새 배양하였다. 세포 밀도를 측정하고, 배양물을 희석한 후, 세포를 플레이트 당 세포 수 150, 15,000 또는 150,000의 밀도로 3가지의 다른 고체 배지에 접종하였다: YPD, YPD + 히그로마이신 B 및 5-FOA. 세포는 모두 YPD에서 콜로니를 형성할 것으로 예상되었고, 엔도뉴클레아제 발현 플라스미드를 유지한 세포만 히그로마이신 B에서 콜로니를 형성하고, xURA3 마커가 적출된 세포만 5-FOA에서 콜로니를 형성할 것으로 예상되었다.
표 13에 나타낸 결과는, F-CphI이 고도의 효율적인 xMarker 적출을 매개하며, PI-MtuII는 효율성이 낮은 xMarker 적출을 매개하며, PI-MgaI의 xMarker 적출 수준은 검출 불가한 수준임을 보여준다. CEN.ARS 엔도뉴클레아제 발현 플라스미드의 상실은 매우 흔히 발생되는 현상으로, 이는 새로운 xMarker로 형질전환하는 다음 단계를 수행하기 전에 엔도뉴클레아제를 상실한 세포를 쉽게 분리할 수 있다는 것을 의미한다.
표 13: 여러가지 엔도뉴클레아제의 xMarker 적출 효율과 수 세대의 비-선택적인 증식 후 발현 플라스미드 소실 빈도를 비교하여 나타낸 결과
엔도뉴클레아제 | xURA3 xMarker가 소실된 세포의 % | hphA-표시된 엔도뉴클레아제 발현 플라스미드가 소실된 세포의 % |
F-CphI | 90.8% | 31.9% |
PI-MgaI | 0.058% | 76.5% |
PI-MtuII | <0.0007% | ND |
VDE | ND | ND |
마커의 F-CphI 매개 적출로 "퍼펙트" scar가 남겨지는지를 확인하기 위해, 5-FOA 내성 (기능적으로 ura3-) 콜로니를 대상으로 xURA3 마커의 병합부의 측면의 올리고뉴클레오티드 프라이머 (올리고뉴클레오티드 KB503 및 KB604)를 이용하여 콜로니 PCR을 수행하였고; 533 bp의 PCR 산물을 의뢰하여, 올리고뉴클레오티드 프라이머 KB503로 DNA 서열을 분석하였다. 테스트한 16개의 콜로니들은 모두 xMarker 유래의 DNA 서열 50 bp 단일 카피만 남아있는 "퍼펙트" scar를 가지고 있었다.
6.2.3. F-Cph xMarker 적출 빈도 및 충실도에 대한 추가적인 테스트
F-CphI 절단부와 다양한 선별 마커를 구비한 추가적인 xMarker들을 제작하여, 테스트하였다 (natA, kanA, hphA, zeoA). 이들 마커의 적출 빈도와 적출 충실도를 사카로마이세스 세레비지애 반수체 및 이배체 균주에서 단독으로 그리고 조합하여 테스트하였다. 적출 빈도는 테스트한 콜로니들에서 거의 100%였으며, 늘 > 80%이었다. 적출 충실도도 거의 100%였다. 다수의 개별 배양물에서의 적출 현상들에서는 모두 예상된 scar이 발생되었으며; 적출을 통해 xMarker에 동향 리피트로서 도입된 50 pb 서열 한 카피가 남겨졌으며, 마커 자체는 없었다 (표 14).
표 14 - 여러가지 엔도뉴클레아제와 50 bp 길이 이상의 DR에서의 xMarker 적출 빈도
엔도뉴클레아제 | DR의 길이 (bp) | ES의 수 | xMarker 표적 구조체 | 엔도뉴클레아제 발현 플라스미드 | xMarker 적출 | 적출 정확도 | |||
테스트 세포 수 a) | xMarker 적출된 세포 수 | 적출 빈도 | 테스트 세포 수 | 퍼펙트 scar 함유 세포 수 b) | |||||
F-CphI | 50 | 2 | HXT3-US_ xM0.URA.F-CphI _ HXT3-DS | pAM1799 | 402 | 365 | 0.91 | ND | ND |
50 | 2 | GAL80-US_xM0.URA.F-CphI_GAL80-DS | pAM1800 | 8 | 8 | 1 | 8 | 8 | |
50 | 2 | GAL80-US_xM1.nat.F-CphI_GAL80-DS | pAM1800 | 16 | 16 | 1 | 8 | 8 | |
50 | 2 | GAL80-US_xM3.kan.F-CphI_GAL80-DS | pAM1800 | 8 | 8 | 1 | 8 | 8 | |
50 | 2 | GAL80-US_xM4.nat.F-CphI_GAL80-DS | pAM1800 | 8 | 8 | 1 | 8 | 8 | |
50 | 2 | GAL80-US_xM6.zeo.F-CphI_GAL80-DS | pAM1862/ pAM1864 |
16 | 16 | 1 | 16 | 16 | |
PI-MgaI | 50 | 2 | HXT3-US_ xM0.URA.PI-MgaI _ HXT3-DS | pAM1866 | ~6.6 x 105 | 0 | <1.5 x 10-6 | ND | ND |
PI-MtuII | 50 | 2 | HXT3-US_ xM0.URA.PI-MtuII _ HXT3-DS | pAM1865 | ~6.6 x 105 | 419 | 6.3 x 10-4 | ND | ND |
VDE | 50 | 2 | HXT3-US_ xM0.URA.VDE _ HXT3-DS | pAM1677 | 535 | 9 | 1.7 x 10-2 | ND | ND |
I-SceI | 60 | 2 | NDT80-US_ s60M.URA.I-SceI_NDT80-DS | pAM1595 | 288 | 155 | 0.54 | 4 | 4 |
80 | 2 | NDT80-US_ s80M.URA.I-SceI_NDT80-DS | pAM1595 | 237 | 76 | 0.32 | 8 | 8 | |
a) YPD 플레이트에서의 콜로니의 수, 희석 인자로 조정됨. b) 퍼펙트 scar = 적출 후, xMarker로부터 남겨지는 DNA 서열은 DR 서열의 단일 카피임. ND = 검출 안됨. |
NDT80 유전자 좌에 xMarker를 포함하는 (NDT80 유전자 결손) 균주를 다음과 같이 제작하였다. 세포의 형질전환에 사용되는 연결된 PCR 산물을 RYSE0 및 RYSE19로 지칭되는 올리고뉴클레오티드를 이용하여 (12 RaBit와 같이) xMarker를 01-0-U-97 및 29-0-U-23 RaBit와 연결함으로써, 제조하였다. 이를 형질전환한 후, 하나(CPK650)는 형질전환된 DNA의 외측에 존재하고, 다른 하나(예, URA3의 경우 KB561 및 KB562; natA, kanA 및 hygA의 경우 KB563 및 KB564)는 마커의 내부에 존재하여 ~1.1 kb의 PCR 산물을 증폭시키는, 한쌍의 올리고뉴클레오티드 프라이머를 이용하여 콜로니 PCR을 수행함으로써, 동정한 적정 분리체를 검증하였다. 천연 NDT80 서열의 제거는, 온전한 NDT80 유전자 좌를 구비한 모체 균주로부터 442 bp의 PCR 산물을 증폭하는, 올리고뉴클레오티드 AET83 및 AET84를 이용한 콜로니 PCR 수행시, PCR 산물의 부재로 검증하였다. F-CphI 발현 플라스미드 (pAM1800)로 형질전환한 후, 개개 콜로니들을, 단지 50 bp scar 서열 한 카피만 남기는 퍼펙트 적출로 인해 492 bp를 증폭하는, JU197 및 JU198을 이용한 콜로니 PCR을 이용하여 의도한 적출에 대해 조사하였으며; 이 밴드를 가시화하고 임의의 다른 DNA로부터 분리하기 위해 겔에서 전개시킨 다음, 겔에서 추출하여 PCR 반응에 사용한 동일한 올리고뉴클레오티드를 이용하여 DNA 서열 분석을 의뢰하였다.
GAL80 유전자 좌에 xMarker를 포함하는 균주 (GAL80 유전자 결손)를 다음과 같이 제작하였다. 세포의 형질전환에 사용한 연결된 PCR 산물은, RYSE0 및 RYSE19로 지칭되는 올리고뉴클레오티드를 이용하여 xMarker (12 RaBit로서)를 01-0-U-270 및 29-0-U-95 RaBit와 연결시켜 제조하였다. 형질전환 후, 적정 분리체의 실체를 콜로니 PCR로 검증하였다. 올리고뉴클레오티드 JU436 및 RYSE3는 형질전환된 DNA가 GAL80 상류 서열내에 병합되어 있는 5' 정션 주변부를 증폭하여, 572 bp의 PCR 산물을 만들며 (다른 예로, JU210 및 RYSE3를 이용하여 182 bp의 PCR 산물을 수득함); JU221 및 RYSE4는 GAL80 하류 서열 bp를 구비한 마커의 3' 정션을 증폭하여 386 bp의 산물을 만들며 (다른 예로, JU439와 RYSE4를 이용하여 531 bp의 PCR 산물을 수득함); 음성 대조군은 프라이머 JU212 및 JU210로 콜로니 PCR하면, 온전한 GAL80 유전자 좌에 대해 290 bp의 산물을 만들어내지만 원하는 유전자 좌에 대해서는 산물이 제조되지 않는다. F-CphI 발현 플라스미드 (pAM1800 또는 pAM1799)로 형질전환한 후, 개개 콜로니를 JU210 및 JU211으로 콜로니 PCR하여 의도한 적출을 평가하였으며, 퍼펙트 적출의 경우 단지 50 bp scar 서열 한 카피만 남겨져 277 bp가 제조되었으며; 이 밴드를 가시화하고 임의의 다른 DNA로부터 분리하기 위해 겔에서 전개시킨 다음, 추출하여 PCR 반응에 사용된 동일 올리고뉴클레오티드를 이용하여 DNA 서열 분석하였다.
F-CphI 발현 플라스미드로 형질전환한 후, 선별 플레이트에서 증식한 콜로니 8개를 랜덤 선택하여, 적출을 확인하기 위해 콜로니 PCR을 수행하였다. 아래 xMarker의 경우, 콜로니 8개 모두에서 예상되는 PCR 산물이 증폭되었으며, DNA 서열을 분석하여 퍼펙트 scar을 검증하였다: x0URA3, x1nat, x3kan, x4nat, 및 x6zeo. x2hph 마커에서는 비정상적인 결과가 나타났으며; scar 서열분석과 xMarker (12 RaBit) 서열분석을 통해, 동향 리피트가 의도한 바와 다른 것으로 확인되었는데, 19 bp만 마커 측면에 배치된 동향 리피트였으며, 인접한 서열들은 스크램블형으로 존재하였다. 작은 영역으로도 이중 가닥 브레이크의 복구가 제공되었음에도 불구하고, 적출 빈도와 충실도는 양호하였으며; 1차 실험에서, 콜로니 8개 중 6개에서 마커가 깔끔하게 적출되고 다양한 길이의 scar이 남겨졌으며; 2차 실험에서, 8개의 콜로니 모두 마커가 적출되었고 19 bp의 scar이 남겨졌다. 이는, 17-18 bp가 동향 리피트 길이로 충분하며, 50 bp가 F-CphI에 의한 절단 후 염색체의 복구를 유도하기에 충분함을 시사해준다.
xMarker의 높은 적출 빈도와 정확도는 여러가지 조건들에서도 관찰되었다. 가장 단순한 조건은 각 균주내 하나의 xMarker였다. 좀더 복잡한 조건은 온전한 GAL80 대립유전자 하나와 xMarker가 결손된 대립유전자 하나를 포함하는 이형 이배수체 균주에서의 xMarker 적출이었으며; 이 경우, GAL80 유전자 좌는 파괴된 대립유전자에서 xMarker의 적출 후 온전한 상태로 남겨진다. 이는, F-CphI의 작용 후, xMarker 근처 절단된 염색체 말단은 복구를 위한 주형으로서 염색체의 온전한 제2 카피를 이용하여, 제거된 염색체에서 온전한 GAL80 유전자 좌를 복원시키는 유전자 변환을 유도하는 현상이 이루어질 수도 있다는 점에서, 중요하다. 이러한 유전자 변환은 확인되지 않았으며, 대신 세포는 염색체내 단일 가닥 어닐링 기전을 통해 파괴된 염색체를 거의 바람직하게 복원한다.
6.2.4. 동시적인 다중 xMarker 적출
본 실시예는 숙주 세포의 염색체 DNA로부터 다중 선별 마커의 동시 적출을 매개하는데 있어서의 xMarker의 유용성을 입증하며, 이때 각 xMarker를 이용하여 고유한 유전자 좌로의 병합을 표시한다.
GAL80 및 GAL4 유전자 좌 양쪽에 xMarker를 구비한 균주를 다음과 같이 제작하였다. 히그로마이신 민감성 세포를 xMarker 타겟팅 구조체 GAL80-US_xM4.Hph.FCphI_GAL80-DS로 형질전환하였다. 형질전환주를 3 mL YPD 액체 배지에서 5시간 동안 배양한 다음, YPD + 히그로마이신 배지에 접종하였다. 형질전환주는 콜로니 PCR로 검증하였다. 올리고뉴클레오티드 HJ53와 HJ848은 GAL80 상류 서열내 형질전환된 DNA가 병합되어 있는 5' 정션 주변부를 증폭하여, 761 bp의 PCR 산물을 증폭시키며 (다른 예로, HJ53와 HJ253를 이용하여 PCR 산물 1 kb를 수득함); H727과 HJ258은 GAL80 하류 서열 bp와 함께 마커의 3' 정션을 증폭하여 1033 bp의 산물을 증폭시킨다 (다른 예로, HJ727과 HJ54를 이용하여 627 bp의 PCR 산물을 수득함). 그런 다음, 선별된 분리체에 xMarker 타겟팅 구조체 GAL4-US_xM0.Kan.FCphI_GAL4-DS를 형질전환하였다. 형질전환주를 3 mL YPD 액체 배지에서 5시간 동안 배양한 다음, YPD + G418 배지에 접종하였다. 형질전환주는 콜로니 PCR로 검증하였다. 올리고뉴클레오티드 HJ270과 HJ253은 GAL4 상류 서열내 형질전환된 DNA가 병합된 5' 정션 주변부를 증폭하여, 1.1 kp의 PCR 산물을 증폭시키며 (다른 예로, HJ270과 HJ54를 이용하여 PCR 산물 774 bp를 수득함); H239와 HJ706은 GAL4 하류 서열 bp와 함께 마커의 3' 정션을 증폭하여 793 bp의 산물이 수득된다 (다른 예로, HJ239와 HJ241을 이용하여 1038 bp의 PCR 산물을 수득함).
유전자형이 gal80Δ::xHph gal4Δ::xKan인 분리주를 natA-marked F-CphI 발현 플라스미드 (pAM1864)로 형질전환하였다. 형질전환주를 3 mL YPD 액체 배지에서 5시간 동안 배양한 다음, YPD + 노르세오트리신 배지에 접종하였다. 30℃에서 3일간 배양한 후, 형질전환주 4개를 신선한 YPD 배지에 스트리킹하여, pAM1864를 소실시켰다. xMarker 적출과 pAM1864의 소실을 테스트하기 위해, 콜로니 50개 (각 스트리크 당 콜로니 약 12-13개)를 YPD 플레이트에 패치한 다음, 24시간 후 YPD, YPD + 히그로마이신, G418 또는 노르세오트리신 플레이트에 리플리카를 찍었다. 리플리카 플레이팅 후 48시간 후에 플레이트를 시험하였다.
동시적인 다중 병합 빈도는 100%였으며, 즉, 50/50 콜로니들이 히그로마이신과 G418 둘다에 대한 내성을 상실하였는데, 이는, 테스트한 콜로니들 모두 xMarker를 둘다 소실했다는 것을 의미한다. 또한, 약 20% (10/50)의 콜로니가 노르세오트리신에 대한 내성을 상실하였는데, 이는 20%의 콜로니가 F-CphI 플라스미드를 소실했다는 것을 의미한다. 비슷한 빈도는 2개의 xMarker 구조체가 게놈에 병합된 2종의 다른 균주들에서도 관찰되었다. F-CphI을 발현하는 제2 gal80Δ::xHph gal4Δ::xKan 균주의 경우, 50/50개의 콜로니가 히그로마이신과 G418 둘다에 대한 내성을 상실하였으며, 10/50개의 콜로니가 노르세오트리신에 대한 내성을 상실하였다. F-CphI을 발현하는 제3의 gal80Δ::xHph gal4Δ::xKan 균주의 경우, 48/48개의 콜로니가 히그로마이신과 G418 둘다에 대한 내성을 상실하였으며, 5/50개의 콜로니가 노르세오트리신에 대한 내성을 상실하였다. 3가지 약물 모두에 대해 내성을 상실한 콜로니들을 또한 콜로니 PCR로 검증하였다. 예상된 바와 같이, 이들 모두 양쪽 xMarke가 F-CphI으로 적출되었다.
본 실시예는 단일 반수체 균주에서의 2개 마커가 고도의 빈도로 퍼펙트 적출됨을 입증해준다. 아울러, 본 실시예는, 염색체 전위 또는 게놈 불안정성에 대한 증거가 없음을 보여준다. 이러한 결과는, xMarker 구조체가 숙주 세포 게놈으로부터 타겟 DNA를 동시적으로 다중 적출하는 것을 매우 효과적으로 촉진함을 의미한다.
6.2.5. 다양한 길이의 DR을 포함하는 xMarker 구조체의 게놈 안정성
본 실시예는, 효모 게놈에 병합되었을 때, 엔도뉴클레아제의 발현 부재시, 다양한 길이의 동향 리피트 (DR)를 포함하는 xMarker 구조체의 안정성을 보여준다.
조건부 유전자 결손 시스템은 유도 및 비-유도 조건 전에는 현저한 적출이 이루어지 않도록 엄격하게 제어되는 것이 좋다. 게놈 조작 측면에서, 자발적인 상동 재조합 현상의 높은 발생율 게놈의 불안정화, 선별 마커의 부적절한 소실, 그리고 그 결과로서 바람직한 게놈형의 선별 능력 상실을 유도할 수 있다.
천연적이고, 내인성의, 자발적인 상동성 재조합 현상은 사이에 배치된 DNA를 결손시키는 동향 리피트 서열들 (일반적으로, > 300 bp) 간의 재조합 교차를 드물게 촉매할 수 있다. 공개된 보고서에 따르면, DR과 측면 서열 간의 자발적인 재조합 교차 ("루프-아웃")를 통해 효모 숙주 세포 게놈으로부터 서열이 적출될 수 있는 것으로 확인된 바 있다. 300 bp - 1.1 kb 길이의 DR들 간에 이러한 루프-아웃이 발생하는 비율은 세포 1000개 중 하나 (1 x 10-3) 내지 10,000개 중 하나 (1 x 10-4)인 것으로 보고되었다 (Alani et al. (1987) Genetics 116(4):541-5 (동향 리피트 길이 1100 bp의 경우, 10-4); Wach et al. (1994) Yeast 10(13):1793-808 (동향 리피트 길이 430 bp의 경우, 10-3 - 10-4); Erdeniz et al. (1997) Genome Res 7(12):1174-83) (동향 리피트 길이 ~300 - 3000 bp의 경우, 10-3 내지 10-4). 다양한 길이의 동향 리피트를 가진 병합된 xMarker 구조체의 게놈 안정성을 확인하기 위해, 다양한 길이의 DR들 간의 자발적인 재조합 교차율을 엔도뉴클레아제 발현 부재 조건에서 분석하였다.
NDT80 유전자 좌에 xMarker가 병합되고 (NDT80 유전자 결손), 동향 리피트의 길이가 50, 60, 80 및 198 bp인 균주를 다음과 같이 제조하였다. 하기 URA3 xMarker 변이체를 01-0-U-30 및 29-0-D-23 RaBit와 프라이머로서 RYSE0 및 RYSE19 올리고뉴클레오티드를 이용하여 연결함으로써, 병합 벡터를 제작하였다.
표 15: 게놈 안정성에 대한 탠덤 반복체 길이의 효과를 분석하기 위해 사용한 xMarker 개개 인자들의 특징 리스트
URA3 xMarker 명칭 | DR의 길이 (bp) | ES 사이트 (#) | ES 사이트의 상호 방향성 | DR(scar) 서열 |
50mer-direct (aka xM0_URA3) | 50 | F-CphI (2) | 동향 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCT (서열번호 23) |
60mer-direct (aka s0x-URA3) | 60 | I-SceI (2) | 동향 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCTGCGACGAGCT (SEQ ID NO:10) |
80mer-direct | 80 | I-SceI (2) | 동향 | AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCTGCGACGAGCTTGAGGATGCAAATGGCTGAC (서열번호 85) |
198mer-direct (aka Rabit 606) | 198 | 0 | 동향 | TCACTATTATTCCATAAGATGATCATTAGCATTACGTTCAAAACGAGTACAAATAACTTAAGTAATAACACGAGCCATATGACCATTAGCAAGATGACAAGCAAGTTAAGACCAATCAGCTTCCATCATAGCATCAGCTTAACGTTCACCATTAATAAGAGTAGAAATTTCACCTTCAAGACAATAACGATTTTCGTG (서열번호 145) |
ura3- 균주로 형질전환한 후, 세포를 ura3- 플레이트에 접종한 다음, 콜로니 PCR로 병합이 바르게 이루어졌는지를 콜로니에서 검증하였다. 올리고뉴클레오티드 AET0065-186-63-F-pNDT80과 RYSE3은 형질전환 DNA가 NDT80 상류 서열내로 병합된 5' 정션 주변부를 증폭시켜, 1024 bp의 PCR 산물을 만들어내며; AET0072-186-63-R-tNDT80과 RYSE4는 NDT80 하류 서열과 함께 마커의 3' 정션을 증폭시켜 1024 bp의 산물을 만들었다. 이러한 결과는 xMarker의 병합 및 NDT80의 파괴를 의미한다. 각 xMarker 변이체에서 검증된 분리주 2종을 이후 분석을 위해 선별하였다.
콜로니를 우라실 결핍성 CSM 배지에 스트리킹한 다음, DR들 간의 URA3 마커의 자발적인 적출이 이루어지도록 하고, 세포를 YPD 액체 배지에서 2일간 배양하고, 12-24시간 마다 희석하였다 (대략 25회 배가). URA3+ 및 ura3- 콜로니는 이 배양 배지에서 잘 증식하기 때문에, 유전자 적출은 선별되지 않는다. 아울러, 천연 URA3, 즉 임의의 동향 리피트들이 측면에 존재하지 않는 URA3를 포함하는 세포를, URA3 코딩 서열의 루프-아웃 없이, (5-FOA에서의 숙주 세포를 생존시키는) URA3의 활성을 감소 또는 실활시키는 점 돌연변이(들)를 유도할 수 있는, 자발적인 돌연변이율을 평가하기 위한 대조군으로서 배양하였다.
배양물을 마지막으로 5-FOA가 함유된 고체 배지에 접종하여, 2.5일간 배양한 후, 콜로니의 수를 측정하였다. 각 유전자형에 대해 16개의 개개 ura3- (5-FOA 내성) 콜로니를 콜로니 PCR을 통해, URA3 유전자의 자발적인 루프-아웃에 대해 또는 다른 예로 온전한 URA3 유전자의 존재에 대해 검증하였다. xMarker와 NDT80 서열 사이의 정션의 208 bp 상류 (JU-197-168-125-NDT80US-F) 및 234 bp 하류 (JU-198-168-125-NDT80DS-R)에 어닐링하는 프라이머를 사용하였다. PCR 산물의 예상 크기는, URA3가 깔끔하게 적출된 경우 462-522 bp였고, URA3가 온전한 경우에는 2072 bp였다.
표 16에서 알 수 있는 바와 같이, 동향 리피트가 측면에 존재하지 않는 URA3를 포함하는 세포에서의 5-FOA 평균 내성 빈도는 대략 1.7 x 10-6 세포였는데, 이는 URA3를 실활시키는 내적 자발적인 돌연변이 발생율이다. 50-80 bp 길이의 동향 리피트가 측면에 위치된 URA3를 포함하는 세포에서의 평균 5-FOA 내성 빈도는 대략 4.5 x 10-6 내지 1.14 x 10-5 세포이며, 198 bp 길이의 동향 리피트가 측면에 위치된 URA3를 포함하는 세포에서의 평균 5-FOA 내성 빈도는 대략 4.7 x 10-5 세포였다.
콜로니 PCR (cPCR) 결과를 통해, 어느 정도의 5-FOA 내성 xMarker 콜로니가 URA3 마커의 루프-아웃과는 상반되게 URA3를 실활시키는 자발적인 돌연변이의 결과로서 생긴다는 것이 검증되었다. 특히, 50 bp 및 80 bp의 DR 길이를 가진 xMarker 구조체가 병합된 콜로니의 경우, cPCR에 의해 스크리닝된 5-FOA 내성 콜로니 12개 중 4개 (4/12)가 온전한 URA3 유전자를 가지고 있었는데, 이는 이들 콜로니에서의 5-FOA 내성이 URA3 루프-아웃 보다는 URA3에서의 자발적인 돌연변이 실활로 인해 생긴다는 것을 의미한다. 따라서, xMarker 균주에서의 DR-매개 자발적인 루프-아웃 빈도는 관찰되는 5-FOA 내성 빈도 보다 훨씬 낮을 것으로 예상된다. 5-FOA 내성을 대용체(proxy)로서 이용하는 경우에서의 이러한 한계는 알고 있지만, 이러한 결과들은, 약 50 - 200 bp 길이의 DR과 관련된 자발적인 루프-아웃 빈도가, 300 bp 내지 1.1 kb 길이의 DR에서 보고된 자발적인 루프-아웃 빈도 보다 1 내지 3배 낮은 것으로 나타났다 (전술한 바와 같이, 10-6 내지 10-5 대 10-4 내지 10-3).
이러한 결과들에서, 약 200 bp 길이의 DR이 자발적인 루프-아웃의 발생 빈도를 300 bp 이상 길이의 DR에 비해 1-2 log로 낮추는 것으로 확인되었다. 특히, 198 bp 길이의 DR에서의 자발적인 루프-아웃 발생 빈도는 1.7 x 10-6 세포였으며, 동향 리피트가 존재하지 않는 경우의 세포에서의 빈도 약 4.7 x 10-5 세포와 대비되었다.
더 짧은 길이의 DR의 경우 결과가 훨씬 더 극적이었다. 전술한 바와 같이, 50 - 80 bp 길이의 DR이 300 bp 이상 길이의 DR에 비해 자발적인 루프-아웃 발생 빈도를 2-3 log로 낮추는 것으로 확인되었다.
아울러, 이들 결과는, 자발적인 URA3 루프-아웃 발생 빈도가, DR 길이가 200 미만으로 짧아짐에 따라, 자발적인 URA3 돌연변이 발생율에 근접함을 보여준다. 50, 60 및 80 길이의 DR은 자발적인 돌연변이 실활과 비교하여 루프-아웃으로 인해 URA3 소실을 대략 2.7 내지 7배 증가시켰다.
이러한 결과는, 약 200 bp 이하 길이의 DR이 300 bp 이상 길이의 DR과 비교하여 게놈 안정성에 실질적인 이점을 제공함을 시사한다. 타겟 DNA의 적출은 엄격하게 통제되어, 호밍 엔도뉴클레아제로 유도하기 전에는 유의하게 적출되지 않는다. 따라서, 본원에 기술된 xMarker 방법 및 조성물은 비-유도성 조건에서 타겟 DNA, 예컨대 선별 마커의 체류성을 개선시켜, 게놈 안정성을 높이고, 균주 조작시 유전자형의 선별 효율을 높일 수 있다.
표 16. 다양한 길이의 동향 리피트 (DR)에 의해 매개되는 자발적인 재조합 현상
DR 길이 | 분리체 | 평균 콜로니 수 | 표준 편차 | 접종한 세포 수 | 5-FOA 내성 빈도 | 평균 5-FOA 내성 | cPCR로 cPCR로 테스트한 콜로니 수 | URA3 유전자가 결핍된 콜로니 수 | URA3 유전자를 가진 콜로니 수 | |
0 | a | 32.17 | 16.69 | 2.68E+07 | 1.20E-06 | 16 | 0 | 16 | ||
0 | b | 57.67 | 34.14 | 2.72E+07 | 2.12E-06 | 1.66E-06 | ||||
50 | a | 240.83 | 157.67 | 2.76E+07 | 8.74E-06 | 16 | 12 | 4 | ||
50 | b | 164.67 | 68.95 | 2.74E+07 | 6.02E-06 | 7.38E-06 | ||||
60 | a | 260.83 | 142.14 | 2.74E+07 | 9.52E-06 | 16 | 15 | 1 | ||
60 | b | 361.00 | 214.56 | 2.72E+07 | 1.33E-05 | 1.14E-05 | ||||
80 | a | 113.83 | 53.15 | 2.58E+07 | 4.41E-06 | 16 | 12 | 4 | ||
80 | b | 116.33 | 22.91 | 2.49E+07 | 4.67E-06 | 4.54E-06 | ||||
198 | a | 1212.00 | 343.09 | 2.52E+07 | 4.81E-05 | 16 | 16 | 0 | ||
198 | b | 1118.67 | 132.32 | 2.44E+07 | 4.58E-05 | 4.69E-05 |
이들 결과는, 특별한 선별 마커 변이체를 제작 및 적출하기 위한, 본원에 기술된 조성물 및 방법이, 높은 빈도, 효율, 충실도 및 안정성으로 구현됨을 입증해준다. I-SceI 및 F-CphI 엔도뉴클레아제는 이러한 방식으로 유효하게 작동하며, F-CphI의 경우 사카로마이세스 세레비지애 세포에서 예측치 못한 우수한 적출 빈도와 충실도가 확인되었다. 적출 현상 자체는 이배체 세포에서도, 그리고 2 이상의 xMarker를 구비한 세포에서도 게놈 불안정성을 야기하지 않는다. 이 방법의 장점은 한번에 다수의 xMarker를 동시에 적출할 수 있는 역량, 그리고 동일한 균주에서 xMarker의 반복 사용 및 재이용시 각 scar가 독특하게 설계될 수 있는, 매우 다양한 고유한 scar 서열들을 선택할 수 있다는 것이다. 이는, 부위-특이적인 재조합효소에 대한 결합 사이트와 절단 사이트를 복수 카피로 필연적으로 남기게 되고, 이것이 게놈 전체에 산재되어, 염색체 단편의 전위와 적출을 일으킬 수 있는 재조합효소가 재-도입되어 재절단될 때까지 대기하는 Flp/FRT 또는 Cre/lox 시스템에 비해 유익하다. 다른 이점은, 적출 빈도가 대부분 50% 보다 높아, 이러한 방법을 이용하여, 성공적으로 적출된 생산 분리주들만 증식시킬 수 있는 이용가능한 선별 방법이 없는 경우에라도, 바람직한 생산 균주를 동정하기 위한 스크리닝 방법을 이용하여, 임의의 바람직한 타겟 DNA를 적출할 수 있다는 것이다.
본 명세서에서 인용된 모든 간행물, 특허 및 특허 출원들은 그 각각의 간행물 또는 특허 출원이 구체적이고 개별적으로 원용에 의해 본 명세서에 포함되는 것으로 명시된 바와 같이 원용에 의해 본 명세서에 포함된다. 상기 본 발명은 예로서 그리고 명확한 이해를 돕기 위해 일부 상세하게 기술되어 있지만, 본 발명의 내용에 비추어 당해 기술 분야의 당업자라면 첨부된 청구항의 사상 및 범위로부터 이탈되지 않으면서 본 발명에 대한 일부 변화 및 수정을 가할 수 있음은 자명할 것이다.
SEQUENCE LISTING
<110> AMYRIS INC.
Benjamin, Kirsten R.
<120> NUCLEIC ACIDS, COMPOSITIONS AND METHODS FOR THE EXCISION OF
TARGET NUCLEIC ACIDS
<130> 107345.00067
<140> PCT/US2011/049615
<141> 2011-08-29
<150> 61/378,350
<151> 2010-08-30
<160> 144
<170> PatentIn version 3.5
<210> 1
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Motif sequence for LAGLIDADG homing endonuclease
<400> 1
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 2
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Motif sequence for GIY-YIG homing endonuclease
<400> 2
Gly Ile Tyr Tyr Ile Gly
1 5
<210> 3
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Recognition sequence for I-SceI
<400> 3
tagggataac agggtaat 18
<210> 4
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Recognition sequence for VDE (PI-SceI)
<400> 4
tatgtcgggt gcggagaaag aggtaatgaa a 31
<210> 5
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Recognition sequence for F-Cph
<400> 5
gatgcacgag cgcaacgctc acaa 24
<210> 6
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Recognition sequence for PI-MgaI (pps1)
<400> 6
gcgtagctgc ccagtatgag tcag 24
<210> 7
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Recognition sequence for PI-MtuII (pps1)
<400> 7
acgtgcacta cgtagagggt cgcaccgcac cgatctacaa 40
<210> 8
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) s20M
<400> 8
aagatccgat cgaccgagaa 20
<210> 9
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) s40M
<400> 9
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc 40
<210> 10
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) s60M
<400> 10
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60
<210> 11
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) s80M
<400> 11
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60
tgaggatgca aatggctgac 80
<210> 12
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Single sequence s60M
<400> 12
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60
<210> 13
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s1x_hphA repeat sequence
<400> 13
cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa cttgcgactt 60
<210> 14
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s2x_hphA repeat sequence
<400> 14
gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc tattagcccg 60
<210> 15
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s3x_kanA repeat sequence
<400> 15
cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga gtgtgaccca 60
<210> 16
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s4x_kanA repeat sequence
<400> 16
ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac actgccagac 60
<210> 17
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s5x_natA repeat sequence
<400> 17
atggaatcac ggggctattc cacttgctaa taacgaggcg cttatcaacg gcgagcacat 60
<210> 18
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s6x_natA repeat sequence
<400> 18
agtcaaagcg cgattcgcta ggaatgagag cgagaacgaa ccggagtata tcacaatcgc 60
<210> 19
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s7x_URA3 repeat sequence
<400> 19
actagagcga aatggagagg tacgtgatcc tactagagcc cacgctatca tacagttggc 60
<210> 20
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> s8x_URA3 repeat sequence
<400> 20
gtacgtccgt acttatgctg agcgctccta cacgaaaaac tcaccgtgac tagcataacg 60
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> I-SceI primer sequence
<400> 21
gctagggata acagggtaat 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> I-SceI primer sequence
<400> 22
actagggata acaggtttat 20
<210> 23
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM0
<400> 23
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct 50
<210> 24
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM1
<400> 24
cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa 50
<210> 25
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM2
<400> 25
gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc 50
<210> 26
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM3
<400> 26
cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga 50
<210> 27
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM4
<400> 27
ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac 50
<210> 28
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM5
<400> 28
gaatcacggg gctattccac ttgctaataa cgaggcgctt atcaacggcg 50
<210> 29
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM6
<400> 29
gtcaaagcgc gattcgctag gaatgagagc gagaacgaac cggagtatat 50
<210> 30
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM7
<400> 30
actagagcga aatggagagg tacgtgatcc tactagagcc cacgctatca 50
<210> 31
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM8
<400> 31
gtacgtccgt acttatgctg agcgctccta cacgaaaaac tcaccgtgac 50
<210> 32
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Directly repeated sequence (DR) xM9
<400> 32
gcattaagtc gtagctagcg gattctctct tcgtgcatcc tagcaaatgg 50
<210> 33
<211> 2733
<212> DNA
<213> Artificial Sequence
<220>
<223> RYSE 12 entry vector
<400> 33
gtaaaacgac ggccagtatt aaccctcact aaagggaact cgaggctctt cagctcacac 60
gcggccaggg ggagcctggc agactccata tgctatgcgg catcagagca gattgtactg 120
agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc 180
aggcgccatt cgccattcag gctgcgcaac tgttgggaag ggcgatcggt gcgggcctct 240
tcgctattac gccagctggc gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg 300
ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtgaattcga gctcggtacc 360
cggggatcct ctagcgtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct 420
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 480
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgcgc 540
tagcgagtca tccacgctcg tccaacgccg gcggaccttg aagagcgagc tcccgctgag 600
caataactag cgtcatagct gtttcctggg tcgttcggct gcggcgagcg gtatcagctc 660
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 720
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 780
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 840
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 900
ctgttccgac cctgccgctt acccgatacc tgtccgcctt tctcccttcg ggaagcgtgg 960
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 1020
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 1080
gtcttgattc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 1140
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 1200
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 1260
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1320
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1380
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1440
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1500
tctaaagtat atatgagtaa cttggtcgca tgcttaccaa tgcttaatca gtgaggcacc 1560
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactgcccg tcgtgtagat 1620
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 1680
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 1740
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 1800
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 1860
ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 1920
agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 1980
tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 2040
tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 2100
attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 2160
taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 2220
aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 2280
caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 2340
gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatcaattg 2400
cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gttacatatt 2460
tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 2520
acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac 2580
gaggcccttt catctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct 2640
cccggagaca gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg 2700
cgcgtcagcg ggtgttggcg ggtgtcgggg ctg 2733
<210> 34
<211> 1692
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker ss60M.URA.I-SceI
<400> 34
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60
tagggataac agggtaatat gcgtccatct ttacagtcct gtcttattgt tcttgatttg 120
tgccccgtaa aatactgtta cttggttctg gcgaggtatt ggatagttcc tttttataaa 180
ggccatgaag ctttttcttt ccaatttttt ttttttcgtc attatagaaa tcattacgac 240
cgagattccc gggtaataac tgatataatt aaattgaagc tctaatttgt gagtttagta 300
tacatgcatt tacttataat acagtttttt agttttgctg gccgcatctt ctcaaatatg 360
cttcccagcc tgcttttctg taacgttcac cctctacctt agcatccctt ccctttgcaa 420
atagtcctct tccaacaata ataatgtcag atcctgtaga gaccacatca tccacggttc 480
tatactgttg acccaatgcg tctcccttgt catctaaacc cacaccgggt gtcataatca 540
accaatcgta accttcatct cttccaccca tgtctctttg agcaataaag ccgataacaa 600
aatctttgtc actcttcgca atgtcaacag tacccttagt atattctcca gtagataggg 660
agcccttgca tgacaattct gctaacatca aaaggcctct aggttccttt gttacttctt 720
ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac cacaccgtgt gcattcgtaa 780
tgtctgccca ttctgctatt ctgtatacac ccgcagagta ctgcaatttg actgtattac 840
caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt gtacttggcg gataatgcct 900
ttagcggctt aactgtgccc tccatggaaa aatcagtcaa gatatccaca tgtgttttta 960
gtaaacaaat tttgggacct aatgcttcaa ctaactccag taattccttg gtggtacgaa 1020
catccaatga agcacacaag tttgtttgct tttcgtgcat gatattaaat agcttggcag 1080
caacaggact aggatgagta gcagcacgtt ccttatatgt agctttcgac atgatttatc 1140
ttcgtttcct gcaggttttt gttctgtgca gttgggttaa gaatactggg caatttcatg 1200
tttcttcaac accacatatg cgtatatata ccaatctaag tctgtgctcc ttccttcgtt 1260
cttccttctg ctcggagatt accgaatcaa aaaaatttca aagaaaccgg aatcaaaaaa 1320
aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg accctgaaac cacagccaca 1380
ttaaccttct ttgatggtca aaacttatcc ttcaccataa atatgcctcg caaaaaaggt 1440
aattaacata tatagaatta cattatttat gaaatatcat cactatctct tagcatcttt 1500
aatccttttc tacatcagat aacttcggtt tgttatcatc gtctgtattg tcatcaattg 1560
gcgcagtagc ctcaatttca acgtcgtttg actctggtgt ttgttcatgt gcagatccat 1620
gagatgatga acaagatccg atcgaccgag aactgagaac ggtgcaatga tcaacatgat 1680
ctgcgacgag ct 1692
<210> 35
<211> 1602
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit12-0-M-555
<400> 35
gctcacacgc ggccaggggg agccgttcat catctcatgg atctgcacat gaacaaacac 60
cagagtcaaa cgacgttgaa attgaggcta ctgcgccaat tgatgacaat acagacgatg 120
ataacaaacc gaagttatct gatgtagaaa aggattaaag atgctaagag atagtgatga 180
tatttcataa ataatgtaat tctatatatg ttaattacct tttttgcgag gcatatttat 240
ggtgaaggat aagttttgac catcaaagaa ggttaatgtg gctgtggttt cagggtccat 300
aaagcttttc aattcatctt tttttttttt gttctttttt ttgattccgg tttctttgaa 360
atttttttga ttcggtaatc tccgagcaga aggaagaacg aaggaaggag cacagactta 420
gattggtata tatacgcata tgtggtgttg aagaaacatg aaattgccca gtattcttaa 480
cccaactgca cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat 540
ataaggaacg tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc 600
acgaaaagca aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg 660
agttagttga agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga 720
ctgatttttc catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt 780
ttttactctt cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact 840
ctgcgggtgt atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg 900
gcccaggtat tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag 960
gccttttgat gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta 1020
agggtactgt tgacattgcg aagagtgaca aagattttgt tatcggcttt attgctcaaa 1080
gagacatggg tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt 1140
tagatgacaa gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta 1200
caggatctga cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg 1260
tagagggtga acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc 1320
aaaactaaaa aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt 1380
caatttaatt atatcagtta ttacccggga atctcggtcg taatgatttc tataatgacg 1440
aaaaaaaaaa aattggaaag aaaaagcttc atggccttta taaaaaggaa ctatccaata 1500
cctcgccaga accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga 1560
ctgtaaagat ggacgcatcg ctcgtccaac gccggcggac ct 1602
<210> 36
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB520-266-136
<400> 36
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gatgcacgag 60
cgcaacgctc acaagttcat catctcatgg atctg 95
<210> 37
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB521-266-136
<400> 37
agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt gtgagcgttg 60
cgctcgtgca tcatgcgtcc atctttacag tcc 93
<210> 38
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB522-266-136
<400> 38
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgtagctgc 60
ccagtatgag tcaggttcat catctcatgg atctg 95
<210> 39
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB523-266-136
<400> 39
agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt ctgactcata 60
ctgggcagct acgcatgcgt ccatctttac agtcc 95
<210> 40
<211> 111
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB524-266-136
<400> 40
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct acgtgcacta 60
cgtagagggt cgcaccgcac cgatctacaa gttcatcatc tcatggatct g 111
<210> 41
<211> 109
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB525-266-136
<400> 41
agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt gtagatcggt 60
gcggtgcgac cctctacgta gtgcacgtat gcgtccatct ttacagtcc 109
<210> 42
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB518-266-135
<400> 42
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct tatgtcgggt 60
gcggagaaag aggtaatgaa agttcatcat ctcatggatc tg 102
<210> 43
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB519-266-135
<400> 43
agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt tttcattacc 60
tctttctccg cacccgacat aatgcgtcca tctttacagt c 101
<210> 44
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB496-266-100
<400> 44
ccaacaataa taatgtcaga tcc 23
<210> 45
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB495-266-100
<400> 45
ccgagcagaa ggaagaacg 19
<210> 46
<211> 1504
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit12-0-M-262
<400> 46
gctcacacgc ggccaggggg agcctcgaca ctagtaatac acatcatcgt cctacaagtt 60
catcaaagtg ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc 120
ccgctctctc gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag 180
tagcgtttat acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa 240
aaaaaagaaa aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat 300
ttggtgattt tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc 360
gaaaaaattt ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta 420
ttattatgga ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt 480
ttgtttaatc ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa 540
aaatgaccac tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg 600
aggccatcga ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca 660
ccggggacgg cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc 720
ccgacgacga atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga 780
cgttcgtcgc gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg 840
gctggaaccg ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg 900
gggtcgggcg cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc 960
acctctggct ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg 1020
ggttcaccct ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc 1080
aggcgctcta catgagcatg ccctgcccct gagtttaact tgatactact agattttttc 1140
tcttcattta taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt 1200
ttttcattct ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa 1260
acctaacaaa agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct 1320
gttttcccat ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga 1380
tttagtttct ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag 1440
tatttagtta ttcatataat cttaacttct cgaggagctc cgctcgtcca acgccggcgg 1500
acct 1504
<210> 47
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MF51-312-97
<400> 47
cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcat 97
<210> 48
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MF52-312-97
<400> 48
ttctagcgtc gctatgtgtc tcgacgctaa ctagtgtgtg cttcgtaacg ttgtgagcgt 60
tgcgctcgtg catcgagctc ctcgagaagt taag 94
<210> 49
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MF57-312-98
<400> 49
ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcat 97
<210> 50
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MF58-312-98
<400> 50
gtgtgaacta cccgttgatc attcagtgct agtctctggg cgctgattaa ttgtgagcgt 60
tgcgctcgtg catcgagctc ctcgagaagt taag 94
<210> 51
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB479-266-81
<400> 51
cgtccgattc gtcgtcg 17
<210> 52
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB480-266-81
<400> 52
gaggtgccgg tggacc 16
<210> 53
<211> 1960
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit12-0-M-21
<400> 53
gctcacacgc ggccaggggg agcctcgaca ctagtaatac acatcatcgt cctacaagtt 60
catcaaagtg ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc 120
ccgctctctc gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag 180
tagcgtttat acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa 240
aaaaaagaaa aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat 300
ttggtgattt tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc 360
gaaaaaattt ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta 420
ttattatgga ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt 480
ttgtttaatc ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa 540
aaatgaaaaa gcctgaactc accgcgacgt ctgtcgagaa gtttctgatc gaaaagttcg 600
acagcgtctc cgacctgatg cagctctcgg agggcgaaga atctcgtgct ttcagcttcg 660
atgtaggagg gcgtggatat gtcctgcggg taaatagctg cgccgatggt ttctacaaag 720
atcgttatgt ttatcggcac tttgcatcgg ccgcgctccc gattccggaa gtgcttgaca 780
ttggggaatt cagcgagagc ctgacctatt gcatctcccg ccgtgcacag ggtgtcacgt 840
tgcaagacct gcctgaaacc gaactgcccg ctgttctgca gccggtcgcg gaggccatgg 900
atgcgatcgc tgcggccgat cttagccaga cgagcgggtt cggcccattc ggaccgcaag 960
gaatcggtca atacactaca tggcgtgatt tcatatgcgc gattgctgat ccccatgtgt 1020
atcactggca aactgtgatg gacgacaccg tcagtgcgtc cgtcgcgcag gctctcgatg 1080
agctgatgct ttgggccgag gactgccccg aagtccggca cctcgtgcac gcggatttcg 1140
gctccaacaa tgtcctgacg gacaatggcc gcataacagc ggtcattgac tggagcgagg 1200
cgatgttcgg ggattcccaa tacgaggtcg ccaacatctt cttctggagg ccgtggttgg 1260
cttgtatgga gcagcagacg cgctacttcg agcggaggca tccggagctt gcaggatcgc 1320
cgcggctccg ggcgtatatg ctccgcattg gtcttgacca actctatcag agcttggttg 1380
acggcaattt cgatgatgca gcttgggcgc agggtcgatg cgacgcaatc gtccgatccg 1440
gagccgggac tgtcgggcgt acacaaatcg cccgcagaag cgcggccgtc tggaccgatg 1500
gctgtgtaga agtactcgcc gatagtggaa accgacgccc cagcactcgt ccgagggcaa 1560
aggaataggt ttaacttgat actactagat tttttctctt catttataaa atttttggtt 1620
ataattgaag ctttagaagt atgaaaaaat cctttttttt cattctttgc aaccaaaata 1680
agaagcttct tttattcatt gaaatgatga atataaacct aacaaaagaa aaagactcga 1740
atatcaaaca ttaaaaaaaa ataaaagagg ttatctgttt tcccatttag ttggagtttg 1800
cattttctaa tagatagaac tctcaattaa tgtggattta gtttctctgt tcgttttttt 1860
ttgttttgtt ctcactgtat ttacatttct atttagtatt tagttattca tataatctta 1920
acttctcgag gagctccgct cgtccaacgc cggcggacct 1960
<210> 54
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MF53-312-98
<400> 54
gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcat 97
<210> 55
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MF54-312-98
<400> 55
gataccaggt ggactctagt acgtggagat ccgtttctac taggcagtac ttgtgagcgt 60
tgcgctcgtg catcgagctc ctcgagaagt taag 94
<210> 56
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB492-266-100
<400> 56
gccgaaatcc gcgtgc 16
<210> 57
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB491-266-100
<400> 57
cggaagtgct tgacattgg 19
<210> 58
<211> 1744
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit 12-0-M-261
<400> 58
gctcacacgc ggccaggggg agcctcgaca ctagtaatac acatcatcgt cctacaagtt 60
catcaaagtg ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc 120
ccgctctctc gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag 180
tagcgtttat acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa 240
aaaaaagaaa aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat 300
ttggtgattt tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc 360
gaaaaaattt ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta 420
ttattatgga ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt 480
ttgtttaatc ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa 540
aaatgggtaa ggaaaagact cacgtttcga ggccgcgatt aaattccaac atggatgctg 600
atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg acaatctatc 660
gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg 720
ccaatgatgt tacagatgag atggtcagac taaactggct gacggaattt atgcctcttc 780
cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc actgcgatcc 840
ccggcaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa aatattgttg 900
atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat tgtcctttta 960
acagcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac ggtttggttg 1020
atgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa 1080
tgcataagct tttgccattc tcaccggatt cagtcgtcac tcatggtgat ttctcacttg 1140
ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga cgagtcggaa 1200
tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag ttttctcctt 1260
cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg aataaattgc 1320
agtttcattt gatgctcgat gagtttttct aagtttaact tgatactact agattttttc 1380
tcttcattta taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt 1440
ttttcattct ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa 1500
acctaacaaa agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct 1560
gttttcccat ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga 1620
tttagtttct ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag 1680
tatttagtta ttcatataat cttaacttct cgaggagctc cgctcgtcca acgccggcgg 1740
acct 1744
<210> 59
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TD_180
<400> 59
cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cc 102
<210> 60
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TD_181
<400> 60
tctcttagga gatgcggtac atagcttagg gccttacacg ttaatcctcg ttgtgagcgt 60
tgcgctcgtg catcgagctc ctcgagaagt taagattata tg 102
<210> 61
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB494-266-100
<400> 61
tatctattag aaaatgcaaa ctcc 24
<210> 62
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB493-266-100
<400> 62
gttactcacc actgcgatcc 20
<210> 63
<211> 429
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for F-CphI
<400> 63
atgactaagt tgtattctga cttgtacagg acctgcatga catgcggaga agaaaaattg 60
tcaaccgagt tctacgtcag gaacaagaag accggagtta gacattcatc atgcaaagag 120
tgtgacaagg tcagggtcaa atcaagacac aaggagaacc ctgaaaggac caaaaacaac 180
gacttgaaga gattgtacgg aatcaccttg gacgagcata cccaaatgta tgaggaacaa 240
aatggtgtat gtgcaatttg caagggagaa ggagatggaa agtggaagaa attgtgtgtt 300
gaccatgatc acgaaacagg aaaggtcagg cagttgttgt gtaggaactg caatatgatg 360
ttgggtcagg tcaacgacaa cgttaactta ttatcagaaa tgataaagta tttgaaaaga 420
tatcagtaa 429
<210> 64
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TD_176
<400> 64
gtcaaagcgc gattcgctag gaatgagagc gagaacgaac cggagtatat gatgcacgag 60
cgcaacgctc acaaaataca catcatcgtc ctacaagttc atc 103
<210> 65
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TD_177
<400> 65
atatactccg gttcgttctc gctctcattc ctagcgaatc gcgctttgac ttgtgagcgt 60
tgcgctcgtg catcaagtta agattatatg aataactaaa tac 103
<210> 66
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TD_183
<400> 66
tcggccacga agtgcacgca gttg 24
<210> 67
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TD_182
<400> 67
tcgagttctg gaccgaccgg ctcg 24
<210> 68
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer RYSE0
<400> 68
gacggcacgg ccacgcgttt aaaccgcc 28
<210> 69
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer RYSE19
<400> 69
cggtgtttaa accccagcgc ctggcggg 28
<210> 70
<211> 598
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit01-0-U-407
<400> 70
gacggcacgg ccacgcgttt aaaccgccga gctattcgcg gaacattcta gctcgtttgc 60
atcttcttgc atttggtagg ttttcaatag ttcggtaata ttaacggata cctactatta 120
tcccctagta ggctcttttc acggagaaat tcgggagtgt tttttttccg tgcgcatttt 180
cttagctata ttcttccagc ttcgcctgct gcccggtcat cgttcctgtc acgtagtttt 240
tccggattcg tccggctcat ataataccgc aataaacacg gaatatctcg ttccgcggat 300
tcggttaaac tctcggtcgc ggattatcac agagaaagct tcgtggagaa tttttccaga 360
ttttccgctt tccccgatgt tggtatttcc ggaggtcatt atactgaccg ccattataat 420
gactgtacaa cgaccttctg gagaaagaaa caactcaata acgatgtggg acattggggg 480
cccactcaaa aaatctgggg actatatccc cagagaattt ctccagaaga gaagaaaagt 540
caaagttttt tttcgcttgg gggttgcata taaagctcac acgcggccag ggggagcc 598
<210> 71
<211> 574
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit29-0-D-408
<400> 71
cgctcgtcca acgccggcgg acctaataaa agacattggt acatgatatc aaacagaatt 60
ttaacatttc ttgatccagt ttgtaaacaa aacaaacaat ttttctacca tttaacttca 120
taccatcggc gagagccgaa caggaaaaaa aagaagtctc cggttatcgt aagcagtatc 180
aaataataag aatgtatgtg tgtgcaattt gttataccca cgaagaagtg cgcagtagag 240
ttagaaaacc aactgagtaa tctttactcc cgacaatcgt ccaataatcc tcttgttgct 300
aggaacgtga tgatggattt cgtttgaaat ccggacggaa aactcaaaag aagtccaacc 360
accaaccatt ttcgagcctc aagaatctct aagcaggttt ctttactaag gggatggcct 420
ttctgtcctg gacatttttt ccttcctttt ttcatttcct tgaaaggaac agattttttt 480
tgacttttgc cacacagctg cactatctca acccctttta cattttaagt tttcgggttg 540
aatggccggt gtttaaaccc cagcgcctgg cggg 574
<210> 72
<211> 668
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit23-0-P-39
<400> 72
cgctcgtcca acgccggcgg accttacttt ttttttggat ggacgcaaag aagtttaata 60
atcatattac atggcattac caccatatac atatccatat ctaatcttac ttatatgttg 120
tggaaatgta aagagcccca ttatcttagc ctaaaaaaac cttctctttg gaactttcag 180
taatacgctt aactgctcat tgctatattg aagtacggat tagaagccgc cgagcgggcg 240
acagccctcc gacggaagac tctcctccgt gcgtcctcgt cttcaccggt cgcgttcctg 300
aaacgcagat gtgcctcgcg ccgcactgct ccgaacaata aagattctac aatactagct 360
tttatggtta tgaagaggaa aaattggcag taacctggcc ccacaaacct tcaaattaac 420
gaatcaaatt aacaaccata ggatgataat gcgattagtt ttttagcctt atttctgggg 480
taattaatca gcgaagcgat gatttttgat ctattaacag atatataaat ggaaaagctg 540
cataaccact ttaactaata ctttcaacat tttcagtttg tattacttct tattcaaatg 600
tcataaaagt atcaacaaaa aattgttaat atacctctat acttatcccc gcgtgcttgg 660
ccggccgt 668
<210> 73
<211> 311
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit45-0-T-64
<400> 73
aacctgcagg ccgcgagcgc cgattaagtg aatttacttt aaatcttgca tttaaataaa 60
ttttcttttt atagctttat gacttagttt caatttatat actattttaa tgacattttc 120
gattcattga ttgaaagctt tgtgtttttt cttgatgcgc tattgcattg ttcttgtctt 180
tttcgccaca tgtaatatct gtagtagata cctgatacat tgtggatgct gagtgaaatt 240
ttagttaata atggaggcgc tcttaataat tttggggata ttggcttaac gcgatcgccg 300
acgccgccga t 311
<210> 74
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer RYSE4
<400> 74
cgctcgtcca acgccggcgg acct 24
<210> 75
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer RYSE11
<400> 75
atcggcggcg tcggcgatcg cgtt 24
<210> 76
<211> 547
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit01-0-U-97
<400> 76
gacggcacgg ccacgcgttt aaaccgccct ccaagctgac ataaatcgca ctttgtatct 60
actttttttt attcgaaaac aaggcacaac aatgaatcta tcgccctgtg agattttcaa 120
tctcaagttt gtgtaataga tagcgttata ttatagaact ataaaggtcc ttgaatatac 180
atagtgtttc attcctatta ctgtatatgt gactttacat tgttacttcc gcggctattt 240
gacgttttct gcttcaggtg cggcttggag ggcaaagtgt cagaaaatcg gccaggccgt 300
atgacacaaa agagtagaaa acgagatctc aaatatctcg aggcctgtcc tctatacaac 360
cgcccagctc tctgacaaag ctccagaacg gttgtctttt gtttcgaaaa gccaaggtcc 420
cttataattg ccctccattt tgtgtcacct atttaagcaa aaaattgaaa gtttactaac 480
ctttcattaa agagaaataa caatattata aaaagcgctt aaagctcaca cgcggccagg 540
gggagcc 547
<210> 77
<211> 568
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit29-0-D-23
<400> 77
cgctcgtcca acgccggcgg acctataaac taatgatttt aaatcgttaa aaaaatatgc 60
gaattctgtg gatcgaacac aggacctcca gataacttga ccgaagtttt ttcttcagtc 120
tggcgctctc ccaactgagc taaatccgct tactatttgt tatcagttcc cttcatatct 180
acatagaata ggttaagtat tttattagtt gccagaagaa ctactgatag ttgggaatat 240
ttggtgaata atgaagattg ggtgaataat ttgataattt tgagattcaa ttgttaatca 300
atgttacaat attatgtata cagagtatac tagaagttct cttcggagat cttgaagttc 360
acaaaaggga atcgatattt ctacataata ttatcattac ttcttcccca tcttatattt 420
gtcattcatt attgattatg atcaatgcaa taatgattgg tagttgccaa acatttaata 480
cgatcctctg taatatttct atgaataatt atcacagcaa cgttcaatta tcttcaattc 540
cggtgtttaa accccagcgc ctggcggg 568
<210> 78
<211> 552
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit01-0-U-270
<400> 78
gacggcacgg ccacgcgttt aaaccgccca gatggaatcc cttccataga gagaaggagc 60
aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 120
tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 180
ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 240
tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 300
tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 360
gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 420
actttttttt ttgaacctga atatatatac atcacatatc actgctggtc cttgccgacc 480
agcgtataca atctcgatag ttggtttccc gttctttcca ctcccgtcgc tcacacgcgg 540
ccagggggag cc 552
<210> 79
<211> 561
<212> DNA
<213> Artificial Sequence
<220>
<223> RaBit29-0-D-95
<400> 79
cgctcgtcca acgccggcgg acctcgtgca tgcgggtgtt cttatttatt agcatactac 60
atttgaaata tcaaatttcc ttagtagaaa agtgagagaa ggtgcactga cacaaaaaat 120
aaaatgctac gtataactgt caaaactttg cagcagcggg catccttcca tcatagcttc 180
aaacatatta gcgttcctga tcttcatacc cgtgctcaaa atgatcaaac aaactgttat 240
tgccaagaaa taaacgcaag gctgccttca aaaactgatc cattagatcc tcatatcaag 300
cttcctcata gaacgcccaa ttacaataag catgttttgc tgttatcacc gggtgatagg 360
tttgctcaac catggaaggt agcatggaat cataatttgg atactaatac aaatcggcca 420
tataatgcca ttagtaaatt gcgctcccat ttaggtggtt ctccaggaat actaataaat 480
gcggtgcatt tgcaaaatga atttattcca aggccaaaac aacacgatga atgcggtgtt 540
taaaccccag cgcctggcgg g 561
<210> 80
<211> 1179
<212> DNA
<213> Artificial Sequence
<220>
<223> Coding sequence for PI-MgaI(pps1) with N-terminal SV40 NLS
<400> 80
atgttaattt ctccaaagaa gaagaggaag gtcgagttgg gatgtttagc aggtgatacc 60
ttggtttgga ccgccaatag aggacaggtc ccaatcaagg agatagagtt cggtgacagg 120
gtcttctctt acgacgaatc agcagagaga ttcgtagttg ccccagtaaa agcatctgct 180
caaacagaca ccaggttaac ctacgaggta aagactacca gaaggtcagt tagggctact 240
gacaaccacc caatgttggt cttgagggat gaaaggaagg agggtagaca aagagccagg 300
tatgctagga gatgggtaac agtaggacag ataaagcctg gtgactttat cgctgttcca 360
agagctgtac caaacttcgg agtcgctgag cagttgcctt cagtcgccgg tttgaccaca 420
ccagccacct catcagcaga tttgatgtgg ttattgggat tgtacgtcgg agacggaaac 480
ttgcacttgt caaccaagac ctatagggta caatttgcta tacctgcaac cgatagagag 540
ttaagggccg agttgactag agttatcaag gacttgttcg gattgaggtg cattgaggca 600
gatgagtaca gggttgtcgt caattcaaag gcattaaccg aatggatcgc agctttgggt 660
tttggaggtt tgtcattgac aaaaagagtc ccagactggg tttatggatt gccagtcgat 720
caaagattgg cattcttagg tggatgggta gatgccgatg gttatgtctc tccagacaaa 780
tcaggttcaa ttttattgac atgtgccaat caggccttga taggtcaggc cagggaatta 840
gctgagttag ctggtttgag ggctggaggt ccttggtcat tcactcaacc ttacagacat 900
gcaccagaca ggatgcaaat tgcatggagg ttgggtatct ctggtgattt cgagagattg 960
ggttgtagga acccaaagag aaccgacagg ttcggtagga gaaggtacat gcattcatct 1020
tcaggtgccc acggaaccac cattagggcc cactgcaacg attggttggg atttgagagg 1080
gtcaaagcag tcgagccata tgcagttgag cctgtatacg acatcgaggt tgacggtcca 1140
cacaacttcg tcgcagaggg attagtagtt cataactaa 1179
<210> 81
<211> 1122
<212> DNA
<213> Artificial Sequence
<220>
<223> Coding sequence for PI-MtuII(pps1) with N-terminal SV40 NLS
<400> 81
atgttgatct caccaaagaa gaagagaaaa gtcgagttgg gttgcttacc tgctggagag 60
ttaataacta cagccgacgg tgacttgagg cctatcgagt ctataagggt aggagacttc 120
gttacaggtc acgatggtag gccacacaga gtcacagcag ttcaggtcag agatttagat 180
ggagaattgt tcactttcac ccctatgtct cctgctaacg cattttctgt taccgccgaa 240
catcctttat tagcaatccc tagggacgaa gtcagggtta tgaggaagga gaggaatggt 300
tggaaggctg aagtcaactc taccaaatta agatctgcag agccaaggtg gatcgcagct 360
aaagatgttg ccgagggtga tttcttgatc taccctaaac caaagcctat ccctcacagg 420
accgtattgc cattggagtt cgctaggttg gctggatact acttagcaga aggtcatgct 480
tgtttaacca acggatgcga gtctttaatc ttctcattcc actctgatga atttgaatac 540
gtagaggacg ttaggcaagc ctgtaaatca ttatacgaaa agtctggatc agtcttgatc 600
gaggagcata aacactcagc aagggtaacc gtctacacta aagctggata tgctgccatg 660
agggacaacg tcggtatagg ttcttcaaat aaaaagttat cagacttgtt aatgaggcag 720
gacgaaacct ttttgaggga gttggttgac gcatatgtta acggagatgg aaacgtaacc 780
agaaggaatg gagcagtttg gaaaagggtc cacacaacat caaggttgtg ggcatttcaa 840
ttacagtcaa ttttggcaag attgggtcat tacgcaaccg tagaattaag gagaccaggt 900
ggtccaggtg taataatggg taggaacgtt gttaggaaag acatctacca ggtacagtgg 960
accgagggag gtaggggtcc aaagcaggca agggactgcg gagattactt cgcagttcca 1020
atcaagaaga gagctgttag ggaagcccac gagccagtct acaacttgga cgtcgaaaac 1080
ccagactcat acttggccta tggttttgca gtccataact aa 1122
<210> 82
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<223> Coding sequence for I-SceI
<400> 82
atgaagaaca tcaagaagaa ccaggtcatg aatctgggtc ctaactctaa attattgaaa 60
gaatataaga gccaacttat cgaactaaac attgaacaat ttgaggctgg aataggttta 120
attttaggtg atgcgtacat taggtccaga gatgagggta aaacatactg tatgcagttt 180
gagtggaaaa ataaagccta tatggatcat gtttgtttgc tgtatgatca atgggtatta 240
tctcctcctc ataagaaaga aagagttaat cacctaggga atttagtgat aacgtgggga 300
gcacagactt ttaagcacca agcgttcaac aaattagcaa atttgtttat tgtcaataat 360
aagaaaacaa ttcctaataa tttggtggaa aactacctaa ctccaatgtc tttagcatat 420
tggttcatgg atgacggtgg aaaatgggat tacaacaaaa acagcacaaa caaatctata 480
gtgctaaata cgcaaagttt tacttttgaa gaagtagaat acttagttaa aggattgcgt 540
aacaagtttc aacttaattg ttatgttaag attaataaaa ataaaccgat catttacata 600
gattctatgt catatttaat attctacaat cttattaaac cttatttaat tccgcaaatg 660
atgtataaac tgccaaatac catatcttcc gagacgttcc tcaagtag 708
<210> 83
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB510-266-134
<400> 83
ctgagctcta aatataaaca ttaaatacat tacacg 36
<210> 84
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB511-266-134
<400> 84
gactcgaggc tcaaaagaag actaactaag ag 32
<210> 85
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB512-266-134
<400> 85
aattcgacct ttctcttctt ttttggagag attgtcatat tttattattg tattg 55
<210> 86
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB513-266-134
<400> 86
caaaaaagaa gagaaaggtc gaattaggtt ttgccaaggg taccaatg 48
<210> 87
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB514-266-134
<400> 87
ggttgtcgtc cataattgct gaaagatttt tgtagttttt gtat 44
<210> 88
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB515-266-134
<400> 88
atacaaaaac tacaaaaatc tttcagcaat tatggacgac aacc 44
<210> 89
<211> 1700
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM0.URA.F-CphI
<400> 89
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gatgcacgag 60
cgcaacgctc acaagttcat catctcatgg atctgcacat gaacaaacac cagagtcaaa 120
cgacgttgaa attgaggcta ctgcgccaat tgatgacaat acagacgatg ataacaaacc 180
gaagttatct gatgtagaaa aggattaaag atgctaagag atagtgatga tatttcataa 240
ataatgtaat tctatatatg ttaattacct tttttgcgag gcatatttat ggtgaaggat 300
aagttttgac catcaaagaa ggttaatgtg gctgtggttt cagggtccat aaagcttttc 360
aattcatctt tttttttttt gttctttttt ttgattccgg tttctttgaa atttttttga 420
ttcggtaatc tccgagcaga aggaagaacg aaggaaggag cacagactta gattggtata 480
tatacgcata tgtggtgttg aagaaacatg aaattgccca gtattcttaa cccaactgca 540
cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat ataaggaacg 600
tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc acgaaaagca 660
aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg agttagttga 720
agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga ctgatttttc 780
catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt ttttactctt 840
cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt 900
atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg gcccaggtat 960
tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag gccttttgat 1020
gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta agggtactgt 1080
tgacattgcg aagagtgaca aagattttgt tatcggcttt attgctcaaa gagacatggg 1140
tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt tagatgacaa 1200
gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta caggatctga 1260
cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg tagagggtga 1320
acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc aaaactaaaa 1380
aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt caatttaatt 1440
atatcagtta ttacccggga atctcggtcg taatgatttc tataatgacg aaaaaaaaaa 1500
aattggaaag aaaaagcttc atggccttta taaaaaggaa ctatccaata cctcgccaga 1560
accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga ctgtaaagat 1620
ggacgcatga tgcacgagcg caacgctcac aagatccgat cgaccgagaa ctgagaacgg 1680
tgcaatgatc aacatgatct 1700
<210> 90
<211> 1702
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM0.URA.PI-MgaI
<400> 90
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgtagctgc 60
ccagtatgag tcaggttcat catctcatgg atctgcacat gaacaaacac cagagtcaaa 120
cgacgttgaa attgaggcta ctgcgccaat tgatgacaat acagacgatg ataacaaacc 180
gaagttatct gatgtagaaa aggattaaag atgctaagag atagtgatga tatttcataa 240
ataatgtaat tctatatatg ttaattacct tttttgcgag gcatatttat ggtgaaggat 300
aagttttgac catcaaagaa ggttaatgtg gctgtggttt cagggtccat aaagcttttc 360
aattcatctt tttttttttt gttctttttt ttgattccgg tttctttgaa atttttttga 420
ttcggtaatc tccgagcaga aggaagaacg aaggaaggag cacagactta gattggtata 480
tatacgcata tgtggtgttg aagaaacatg aaattgccca gtattcttaa cccaactgca 540
cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat ataaggaacg 600
tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc acgaaaagca 660
aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg agttagttga 720
agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga ctgatttttc 780
catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt ttttactctt 840
cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt 900
atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg gcccaggtat 960
tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag gccttttgat 1020
gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta agggtactgt 1080
tgacattgcg aagagtgaca aagattttgt tatcggcttt attgctcaaa gagacatggg 1140
tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt tagatgacaa 1200
gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta caggatctga 1260
cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg tagagggtga 1320
acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc aaaactaaaa 1380
aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt caatttaatt 1440
atatcagtta ttacccggga atctcggtcg taatgatttc tataatgacg aaaaaaaaaa 1500
aattggaaag aaaaagcttc atggccttta taaaaaggaa ctatccaata cctcgccaga 1560
accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga ctgtaaagat 1620
ggacgcatgc gtagctgccc agtatgagtc agaagatccg atcgaccgag aactgagaac 1680
ggtgcaatga tcaacatgat ct 1702
<210> 91
<211> 1732
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM0.URA.PI-MtuII
<400> 91
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct acgtgcacta 60
cgtagagggt cgcaccgcac cgatctacaa gttcatcatc tcatggatct gcacatgaac 120
aaacaccaga gtcaaacgac gttgaaattg aggctactgc gccaattgat gacaatacag 180
acgatgataa caaaccgaag ttatctgatg tagaaaagga ttaaagatgc taagagatag 240
tgatgatatt tcataaataa tgtaattcta tatatgttaa ttaccttttt tgcgaggcat 300
atttatggtg aaggataagt tttgaccatc aaagaaggtt aatgtggctg tggtttcagg 360
gtccataaag cttttcaatt catctttttt ttttttgttc ttttttttga ttccggtttc 420
tttgaaattt ttttgattcg gtaatctccg agcagaagga agaacgaagg aaggagcaca 480
gacttagatt ggtatatata cgcatatgtg gtgttgaaga aacatgaaat tgcccagtat 540
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 600
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 660
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 720
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 780
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 840
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 900
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 960
tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 1020
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 1080
atactaaggg tactgttgac attgcgaaga gtgacaaaga ttttgttatc ggctttattg 1140
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1200
tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1260
tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1320
ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1380
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1440
gagcttcaat ttaattatat cagttattac ccgggaatct cggtcgtaat gatttctata 1500
atgacgaaaa aaaaaaaatt ggaaagaaaa agcttcatgg cctttataaa aaggaactat 1560
ccaatacctc gccagaacca agtaacagta ttttacgggg cacaaatcaa gaacaataag 1620
acaggactgt aaagatggac gcatacgtgc actacgtaga gggtcgcacc gcaccgatct 1680
acaagatccg atcgaccgag aactgagaac ggtgcaatga tcaacatgat ct 1732
<210> 92
<211> 1716
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM0.URA.VDE
<400> 92
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct tatgtcgggt 60
gcggagaaag aggtaatgaa agttcatcat ctcatggatc tgcacatgaa caaacaccag 120
agtcaaacga cgttgaaatt gaggctactg cgccaattga tgacaataca gacgatgata 180
acaaaccgaa gttatctgat gtagaaaagg attaaagatg ctaagagata gtgatgatat 240
ttcataaata atgtaattct atatatgtta attacctttt ttgcgaggca tatttatggt 300
gaaggataag ttttgaccat caaagaaggt taatgtggct gtggtttcag ggtccataaa 360
gcttttcaat tcatcttttt tttttttgtt cttttttttg attccggttt ctttgaaatt 420
tttttgattc ggtaatctcc gagcagaagg aagaacgaag gaaggagcac agacttagat 480
tggtatatat acgcatatgt ggtgttgaag aaacatgaaa ttgcccagta ttcttaaccc 540
aactgcacag aacaaaaacc tgcaggaaac gaagataaat catgtcgaaa gctacatata 600
aggaacgtgc tgctactcat cctagtcctg ttgctgccaa gctatttaat atcatgcacg 660
aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac caccaaggaa ttactggagt 720
tagttgaagc attaggtccc aaaatttgtt tactaaaaac acatgtggat atcttgactg 780
atttttccat ggagggcaca gttaagccgc taaaggcatt atccgccaag tacaattttt 840
tactcttcga agacagaaaa tttgctgaca ttggtaatac agtcaaattg cagtactctg 900
cgggtgtata cagaatagca gaatgggcag acattacgaa tgcacacggt gtggtgggcc 960
caggtattgt tagcggtttg aagcaggcgg cagaagaagt aacaaaggaa cctagaggcc 1020
ttttgatgtt agcagaattg tcatgcaagg gctccctatc tactggagaa tatactaagg 1080
gtactgttga cattgcgaag agtgacaaag attttgttat cggctttatt gctcaaagag 1140
acatgggtgg aagagatgaa ggttacgatt ggttgattat gacacccggt gtgggtttag 1200
atgacaaggg agacgcattg ggtcaacagt atagaaccgt ggatgatgtg gtctctacag 1260
gatctgacat tattattgtt ggaagaggac tatttgcaaa gggaagggat gctaaggtag 1320
agggtgaacg ttacagaaaa gcaggctggg aagcatattt gagaagatgc ggccagcaaa 1380
actaaaaaac tgtattataa gtaaatgcat gtatactaaa ctcacaaatt agagcttcaa 1440
tttaattata tcagttatta cccgggaatc tcggtcgtaa tgatttctat aatgacgaaa 1500
aaaaaaaaat tggaaagaaa aagcttcatg gcctttataa aaaggaacta tccaatacct 1560
cgccagaacc aagtaacagt attttacggg gcacaaatca agaacaataa gacaggactg 1620
taaagatgga cgcattatgt cgggtgcgga gaaagaggta atgaaaaaga tccgatcgac 1680
cgagaactga gaacggtgca atgatcaaca tgatct 1716
<210> 93
<211> 1604
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM1.nat.F-CphI
<400> 93
cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120
ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180
gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240
acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300
aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360
tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420
ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480
ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540
ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgaccac 600
tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg aggccatcga 660
ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca ccggggacgg 720
cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc ccgacgacga 780
atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga cgttcgtcgc 840
gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg gctggaaccg 900
ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg gggtcgggcg 960
cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc acctctggct 1020
ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg ggttcaccct 1080
ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc aggcgctcta 1140
catgagcatg ccctgcccct gagtttaact tgatactact agattttttc tcttcattta 1200
taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt ttttcattct 1260
ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa acctaacaaa 1320
agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct gttttcccat 1380
ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga tttagtttct 1440
ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag tatttagtta 1500
ttcatataat cttaacttct cgaggagctc gatgcacgag cgcaacgctc acaacgttac 1560
gaagcacaca ctagttagcg tcgagacaca tagcgacgct agaa 1604
<210> 94
<211> 1604
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM4.nat.F-CphI
<400> 94
ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120
ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180
gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240
acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300
aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360
tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420
ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480
ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540
ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgaccac 600
tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg aggccatcga 660
ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca ccggggacgg 720
cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc ccgacgacga 780
atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga cgttcgtcgc 840
gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg gctggaaccg 900
ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg gggtcgggcg 960
cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc acctctggct 1020
ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg ggttcaccct 1080
ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc aggcgctcta 1140
catgagcatg ccctgcccct gagtttaact tgatactact agattttttc tcttcattta 1200
taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt ttttcattct 1260
ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa acctaacaaa 1320
agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct gttttcccat 1380
ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga tttagtttct 1440
ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag tatttagtta 1500
ttcatataat cttaacttct cgaggagctc gatgcacgag cgcaacgctc acaattaatc 1560
agcgcccaga gactagcact gaatgatcaa cgggtagttc acac 1604
<210> 95
<211> 2060
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM2.hph.F-CphI
<400> 95
gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120
ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180
gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240
acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300
aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360
tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420
ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480
ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540
ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgaaaaa 600
gcctgaactc accgcgacgt ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc 660
cgacctgatg cagctctcgg agggcgaaga atctcgtgct ttcagcttcg atgtaggagg 720
gcgtggatat gtcctgcggg taaatagctg cgccgatggt ttctacaaag atcgttatgt 780
ttatcggcac tttgcatcgg ccgcgctccc gattccggaa gtgcttgaca ttggggaatt 840
cagcgagagc ctgacctatt gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct 900
gcctgaaacc gaactgcccg ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc 960
tgcggccgat cttagccaga cgagcgggtt cggcccattc ggaccgcaag gaatcggtca 1020
atacactaca tggcgtgatt tcatatgcgc gattgctgat ccccatgtgt atcactggca 1080
aactgtgatg gacgacaccg tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct 1140
ttgggccgag gactgccccg aagtccggca cctcgtgcac gcggatttcg gctccaacaa 1200
tgtcctgacg gacaatggcc gcataacagc ggtcattgac tggagcgagg cgatgttcgg 1260
ggattcccaa tacgaggtcg ccaacatctt cttctggagg ccgtggttgg cttgtatgga 1320
gcagcagacg cgctacttcg agcggaggca tccggagctt gcaggatcgc cgcggctccg 1380
ggcgtatatg ctccgcattg gtcttgacca actctatcag agcttggttg acggcaattt 1440
cgatgatgca gcttgggcgc agggtcgatg cgacgcaatc gtccgatccg gagccgggac 1500
tgtcgggcgt acacaaatcg cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga 1560
agtactcgcc gatagtggaa accgacgccc cagcactcgt ccgagggcaa aggaataggt 1620
ttaacttgat actactagat tttttctctt catttataaa atttttggtt ataattgaag 1680
ctttagaagt atgaaaaaat cctttttttt cattctttgc aaccaaaata agaagcttct 1740
tttattcatt gaaatgatga atataaacct aacaaaagaa aaagactcga atatcaaaca 1800
ttaaaaaaaa ataaaagagg ttatctgttt tcccatttag ttggagtttg cattttctaa 1860
tagatagaac tctcaattaa tgtggattta gtttctctgt tcgttttttt ttgttttgtt 1920
ctcactgtat ttacatttct atttagtatt tagttattca tataatctta acttctcgag 1980
gagctcgatg cacgagcgca acgctcacaa gtactgccta gtagaaacgg atctccacgt 2040
actagagtcc acctggtatc 2060
<210> 96
<211> 1844
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM3.kan.F-CphI
<400> 96
cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga gatgcacgag 60
cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120
ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180
gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240
acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300
aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360
tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420
ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480
ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540
ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgggtaa 600
ggaaaagact cacgtttcga ggccgcgatt aaattccaac atggatgctg atttatatgg 660
gtataaatgg gctcgcgata atgtcgggca atcaggtgcg acaatctatc gattgtatgg 720
gaagcccgat gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt 780
tacagatgag atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa 840
gcattttatc cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggcaaaac 900
agcattccag gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc 960
agtgttcctg cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg 1020
cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga 1080
ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataagct 1140
tttgccattc tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat 1200
ttttgacgag gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg 1260
ataccaggat cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa 1320
acggcttttt caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt 1380
gatgctcgat gagtttttct aagtttaact tgatactact agattttttc tcttcattta 1440
taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt ttttcattct 1500
ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa acctaacaaa 1560
agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct gttttcccat 1620
ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga tttagtttct 1680
ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag tatttagtta 1740
ttcatataat cttaacttct cgaggagctc gatgcacgag cgcaacgctc acaacgagga 1800
ttaacgtgta aggccctaag ctatgtaccg catctcctaa gaga 1844
<210> 97
<211> 1386
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker xM6.zeo.F-CphI
<400> 97
gtcaaagcgc gattcgctag gaatgagagc gagaacgaac cggagtatat gatgcacgag 60
cgcaacgctc acaaaataca catcatcgtc ctacaagttc atcaaagtgt tggacagaca 120
actataccag catggatctc ttgtatcggt tcttttctcc cgctctctcg caataacaat 180
gaacactggg tcaatcatag cctacacagg tgaacagagt agcgtttata cagggtttat 240
acggtgattc ctacggcaaa aatttttcat ttctaaaaaa aaaaagaaaa atttttcttt 300
ccaacgctag aaggaaaaga aaaatctaat taaattgatt tggtgatttt ctgagagttc 360
cctttttcat atatcgaatt ttgaatataa aaggagatcg aaaaaatttt tctattcaat 420
ctgttttctg gttttatttg atagtttttt tgtgtattat tattatggat tagtactggt 480
ttatatgggt ttttctgtat aacttctttt tattttagtt tgtttaatct tattttgagt 540
tacattatag ttccctaact gcaagagaag taacattaaa aatggccaag ttgaccagtg 600
ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg accgaccggc 660
tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg gacgacgtga 720
ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg gcctgggtgt 780
gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc 840
gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg cgggagttcg 900
ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag gactgagttt 960
aacttgatac tactagattt tttctcttca tttataaaat ttttggttat aattgaagct 1020
ttagaagtat gaaaaaatcc ttttttttca ttctttgcaa ccaaaataag aagcttcttt 1080
tattcattga aatgatgaat ataaacctaa caaaagaaaa agactcgaat atcaaacatt 1140
aaaaaaaaat aaaagaggtt atctgttttc ccatttagtt ggagtttgca ttttctaata 1200
gatagaactc tcaattaatg tggatttagt ttctctgttc gttttttttt gttttgttct 1260
cactgtattt acatttctat ttagtattta gttattcata taatcttaac ttgatgcacg 1320
agcgcaacgc tcacaagtca aagcgcgatt cgctaggaat gagagcgaga acgaaccgga 1380
gtatat 1386
<210> 98
<211> 1630
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker s20M.URA.I-SceI
<400> 98
aagatccgat cgaccgagaa tagggataac agggtaatat gcgtccatct ttacagtcct 60
gtcttattgt tcttgatttg tgccccgtaa aatactgtta cttggttctg gcgaggtatt 120
ggatagttcc tttttataaa ggccatgaag ctttttcttt ccaatttttt ttttttcgtc 180
attatagaaa tcattacgac cgagattccc gggtaataac tgatataatt aaattgaagc 240
tctaatttgt gagtttagta tacatgcatt tacttataat acagtttttt agttttgctg 300
gccgcatctt ctcaaatatg cttcccagcc tgcttttctg taacgttcac cctctacctt 360
agcatccctt ccctttgcaa atagtcctct tccaacaata ataatgtcag atcctgtaga 420
gaccacatca tccacggttc tatactgttg acccaatgcg tctcccttgt catctaaacc 480
cacaccgggt gtcataatca accaatcgta accttcatct cttccaccca tgtctctttg 540
agcaataaag ccgataacaa aatctttgtc actcttcgca atgtcaacag tacccttagt 600
atattctcca gtagataggg agcccttgca tgacaattct gctaacatca aaaggcctct 660
aggttccttt gttacttctt ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac 720
cacaccgtgt gcattcgtaa tgtctgccca ttctgctatt ctgtatacac ccgcagagta 780
ctgcaatttg actgtattac caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt 840
gtacttggcg gataatgcct ttagcggctt aactgtgccc tccatggaaa aatcagtcaa 900
gatatccaca tgtgttttta gtaaacaaat tttgggacct aatgcttcaa ctaactccag 960
taattccttg gtggtacgaa catccaatga agcacacaag tttgtttgct tttcgtgcat 1020
gatattaaat agcttggcag caacaggact aggatgagta gcagcacgtt ccttatatgt 1080
agctttcgac atgatttatc ttcgtttcct gcaggttttt gttctgtgca gttgggttaa 1140
gaatactggg caatttcatg tttcttcaac accacatatg cgtatatata ccaatctaag 1200
tctgtgctcc ttccttcgtt cttccttctg ctcggagatt accgaatcaa aaaaatttca 1260
aagaaaccgg aatcaaaaaa aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg 1320
accctgaaac cacagccaca ttaaccttct ttgatggtca aaacttatcc ttcaccataa 1380
atatgcctcg caaaaaaggt aattaacata tatagaatta cattatttat gaaatatcat 1440
cactatctct tagcatcttt aatccttttc tacatcagat aacttcggtt tgttatcatc 1500
gtctgtattg tcatcaattg gcgcagtagc ctcaatttca acgtcgtttg actctggtgt 1560
ttgttcatgt gcagatccat gagatgatga actagggata acagggtaat aagatccgat 1620
cgaccgagaa 1630
<210> 99
<211> 1670
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker s40M.URA.I-SceI
<400> 99
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc tagggataac agggtaatat 60
gcgtccatct ttacagtcct gtcttattgt tcttgatttg tgccccgtaa aatactgtta 120
cttggttctg gcgaggtatt ggatagttcc tttttataaa ggccatgaag ctttttcttt 180
ccaatttttt ttttttcgtc attatagaaa tcattacgac cgagattccc gggtaataac 240
tgatataatt aaattgaagc tctaatttgt gagtttagta tacatgcatt tacttataat 300
acagtttttt agttttgctg gccgcatctt ctcaaatatg cttcccagcc tgcttttctg 360
taacgttcac cctctacctt agcatccctt ccctttgcaa atagtcctct tccaacaata 420
ataatgtcag atcctgtaga gaccacatca tccacggttc tatactgttg acccaatgcg 480
tctcccttgt catctaaacc cacaccgggt gtcataatca accaatcgta accttcatct 540
cttccaccca tgtctctttg agcaataaag ccgataacaa aatctttgtc actcttcgca 600
atgtcaacag tacccttagt atattctcca gtagataggg agcccttgca tgacaattct 660
gctaacatca aaaggcctct aggttccttt gttacttctt ctgccgcctg cttcaaaccg 720
ctaacaatac ctgggcccac cacaccgtgt gcattcgtaa tgtctgccca ttctgctatt 780
ctgtatacac ccgcagagta ctgcaatttg actgtattac caatgtcagc aaattttctg 840
tcttcgaaga gtaaaaaatt gtacttggcg gataatgcct ttagcggctt aactgtgccc 900
tccatggaaa aatcagtcaa gatatccaca tgtgttttta gtaaacaaat tttgggacct 960
aatgcttcaa ctaactccag taattccttg gtggtacgaa catccaatga agcacacaag 1020
tttgtttgct tttcgtgcat gatattaaat agcttggcag caacaggact aggatgagta 1080
gcagcacgtt ccttatatgt agctttcgac atgatttatc ttcgtttcct gcaggttttt 1140
gttctgtgca gttgggttaa gaatactggg caatttcatg tttcttcaac accacatatg 1200
cgtatatata ccaatctaag tctgtgctcc ttccttcgtt cttccttctg ctcggagatt 1260
accgaatcaa aaaaatttca aagaaaccgg aatcaaaaaa aagaacaaaa aaaaaaaaga 1320
tgaattgaaa agctttatgg accctgaaac cacagccaca ttaaccttct ttgatggtca 1380
aaacttatcc ttcaccataa atatgcctcg caaaaaaggt aattaacata tatagaatta 1440
cattatttat gaaatatcat cactatctct tagcatcttt aatccttttc tacatcagat 1500
aacttcggtt tgttatcatc gtctgtattg tcatcaattg gcgcagtagc ctcaatttca 1560
acgtcgtttg actctggtgt ttgttcatgt gcagatccat gagatgatga actagggata 1620
acagggtaat aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc 1670
<210> 100
<211> 1710
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker s60M.URA.I-SceI
<400> 100
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60
tagggataac agggtaatat gcgtccatct ttacagtcct gtcttattgt tcttgatttg 120
tgccccgtaa aatactgtta cttggttctg gcgaggtatt ggatagttcc tttttataaa 180
ggccatgaag ctttttcttt ccaatttttt ttttttcgtc attatagaaa tcattacgac 240
cgagattccc gggtaataac tgatataatt aaattgaagc tctaatttgt gagtttagta 300
tacatgcatt tacttataat acagtttttt agttttgctg gccgcatctt ctcaaatatg 360
cttcccagcc tgcttttctg taacgttcac cctctacctt agcatccctt ccctttgcaa 420
atagtcctct tccaacaata ataatgtcag atcctgtaga gaccacatca tccacggttc 480
tatactgttg acccaatgcg tctcccttgt catctaaacc cacaccgggt gtcataatca 540
accaatcgta accttcatct cttccaccca tgtctctttg agcaataaag ccgataacaa 600
aatctttgtc actcttcgca atgtcaacag tacccttagt atattctcca gtagataggg 660
agcccttgca tgacaattct gctaacatca aaaggcctct aggttccttt gttacttctt 720
ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac cacaccgtgt gcattcgtaa 780
tgtctgccca ttctgctatt ctgtatacac ccgcagagta ctgcaatttg actgtattac 840
caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt gtacttggcg gataatgcct 900
ttagcggctt aactgtgccc tccatggaaa aatcagtcaa gatatccaca tgtgttttta 960
gtaaacaaat tttgggacct aatgcttcaa ctaactccag taattccttg gtggtacgaa 1020
catccaatga agcacacaag tttgtttgct tttcgtgcat gatattaaat agcttggcag 1080
caacaggact aggatgagta gcagcacgtt ccttatatgt agctttcgac atgatttatc 1140
ttcgtttcct gcaggttttt gttctgtgca gttgggttaa gaatactggg caatttcatg 1200
tttcttcaac accacatatg cgtatatata ccaatctaag tctgtgctcc ttccttcgtt 1260
cttccttctg ctcggagatt accgaatcaa aaaaatttca aagaaaccgg aatcaaaaaa 1320
aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg accctgaaac cacagccaca 1380
ttaaccttct ttgatggtca aaacttatcc ttcaccataa atatgcctcg caaaaaaggt 1440
aattaacata tatagaatta cattatttat gaaatatcat cactatctct tagcatcttt 1500
aatccttttc tacatcagat aacttcggtt tgttatcatc gtctgtattg tcatcaattg 1560
gcgcagtagc ctcaatttca acgtcgtttg actctggtgt ttgttcatgt gcagatccat 1620
gagatgatga actagggata acagggtaat aagatccgat cgaccgagaa ctgagaacgg 1680
tgcaatgatc aacatgatct gcgacgagct 1710
<210> 101
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB589-324-35
<400> 101
atccccgcgt gcttggccgg ccgtatgttg atcccaaaga agaagagaaa ggtcgagttg 60
gg 62
<210> 102
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 00177-JD-75AN
<400> 102
atccccgcgt gcttggccgg ccgtatgaag aacatcaaga agaaccaggt c 51
<210> 103
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB591-324-36
<400> 103
atccccgcgt gcttggccgg ccgtatgact aagttgtatt ctgacttgta c 51
<210> 104
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB592-324-36
<400> 104
atcggcgctc gcggcctgca ggttttagtt atggactgca aaacc 45
<210> 105
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB593-324-36
<400> 105
atcggcgctc gcggcctgca ggttttagtt atgaactact aatccctc 48
<210> 106
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 00177-JD-75AO
<400> 106
atcggcgctc gcggcctgca ggttctactt gaggaacgtc tcggaag 47
<210> 107
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KB595-324-36
<400> 107
atcggcgctc gcggcctgca ggttttactg atatcttttc aaatacttta tc 52
<210> 108
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Endonuclease recognition/cleavage site (ES) VDE (PI-SceI)
<400> 108
tatgtcgggt gcggagaaag aggtaatgaa a 31
<210> 109
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Endonuclease recognition/cleavage site (ES) F-CphI
<400> 109
gatgcacgag cgcaacgctc acaa 24
<210> 110
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Endonuclease recognition/cleavage site (ES) PI-MgaI (pps1)
<400> 110
gcgtagctgc ccagtatgag tcag 24
<210> 111
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Endonuclease recognition/cleavage site (ES) PI-MtuII (pps1)
<400> 111
acgtgcacta cgtagagggt cgcaccgcac cgatctacaa 40
<210> 112
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Endonuclease recognition/cleavage site (ES) I-SceI
<400> 112
tagggataac agggtaat 18
<210> 113
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB411-266-26
<400> 113
aagatccgat cgaccgagaa tagggataac agggtaatcg actctagac 49
<210> 114
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB412-266-26
<400> 114
gagtcgatta ccctgttatc cctattctcg gtcgatcgga tctt 44
<210> 115
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB415-266-26
<400> 115
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc tagggataac agggtaatcg 60
actctagac 69
<210> 116
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB416-266-26
<400> 116
gagtcgatta ccctgttatc cctagatcat tgcaccgttc tcagttctcg gtcgatcgga 60
tctt 64
<210> 117
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB419-266-27
<400> 117
gagtcgtagg gataacaggg taataagatc cgatcgaccg agaactgaga acggtgcaat 60
gatc 64
<210> 118
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB420-266-27
<400> 118
gatcattgca ccgttctcag ttctcggtcg atcggatctt attaccctgt tatccctacg 60
actcgtcta 69
<210> 119
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB421-266-27
<400> 119
gagtcgaaga tccgatcgac cgagaactga gaacggtgca atgatc 46
<210> 120
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB423-266-27
<400> 120
agctcgtcgc agatcatgtt gatcattgca ccgttctcag 40
<210> 121
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB424-266-27
<400> 121
aacatgatct gcgacgagct 20
<210> 122
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB425-266-27
<400> 122
ttctcggtcg atcggatctt 20
<210> 123
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB426-266-27
<400> 123
gagtcgatta ccctgttatc ccta 24
<210> 124
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB427-266-27
<400> 124
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc 40
<210> 125
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB428-266-27
<400> 125
aacatgatct gcgacgagct tagggataac agggtaatcg actctagac 49
<210> 126
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB429-266-27
<400> 126
ttctcggtcg atcggatctt attaccctgt tatccctacg actcgtcta 49
<210> 127
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB430-266-28
<400> 127
ttctcggtcg atcggatctt cgactcgtct a 31
<210> 128
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB431-266-28
<400> 128
gagtcgatta ccctgttatc cctagtcagc catttgcatc ctca 44
<210> 129
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB432-266-28
<400> 129
aacatgatct gcgacgagct tgaggatgca aatggctgac 40
<210> 130
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB433-266-28
<400> 130
tagggataac agggtaatcg actctagac 29
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB434-266-28
<400> 131
gtcagccatt tgcatcctca 20
<210> 132
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB439-266-34
<400> 132
taatatgcgt ccatctttac agtcc 25
<210> 133
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB440-266-34
<400> 133
cctagttcat catctcatgg atctgc 26
<210> 134
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB441-266-34
<400> 134
tcttgttcat catctcatgg atctgc 26
<210> 135
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide KB464-266-58
<400> 135
gagtcgtagg gataacaggg taataagatc cgatcgaccg agaa 44
<210> 136
<211> 1750
<212> DNA
<213> Artificial Sequence
<220>
<223> xMarker s80M.URA.I-SceI
<400> 136
aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60
tgaggatgca aatggctgac tagggataac agggtaatat gcgtccatct ttacagtcct 120
gtcttattgt tcttgatttg tgccccgtaa aatactgtta cttggttctg gcgaggtatt 180
ggatagttcc tttttataaa ggccatgaag ctttttcttt ccaatttttt ttttttcgtc 240
attatagaaa tcattacgac cgagattccc gggtaataac tgatataatt aaattgaagc 300
tctaatttgt gagtttagta tacatgcatt tacttataat acagtttttt agttttgctg 360
gccgcatctt ctcaaatatg cttcccagcc tgcttttctg taacgttcac cctctacctt 420
agcatccctt ccctttgcaa atagtcctct tccaacaata ataatgtcag atcctgtaga 480
gaccacatca tccacggttc tatactgttg acccaatgcg tctcccttgt catctaaacc 540
cacaccgggt gtcataatca accaatcgta accttcatct cttccaccca tgtctctttg 600
agcaataaag ccgataacaa aatctttgtc actcttcgca atgtcaacag tacccttagt 660
atattctcca gtagataggg agcccttgca tgacaattct gctaacatca aaaggcctct 720
aggttccttt gttacttctt ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac 780
cacaccgtgt gcattcgtaa tgtctgccca ttctgctatt ctgtatacac ccgcagagta 840
ctgcaatttg actgtattac caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt 900
gtacttggcg gataatgcct ttagcggctt aactgtgccc tccatggaaa aatcagtcaa 960
gatatccaca tgtgttttta gtaaacaaat tttgggacct aatgcttcaa ctaactccag 1020
taattccttg gtggtacgaa catccaatga agcacacaag tttgtttgct tttcgtgcat 1080
gatattaaat agcttggcag caacaggact aggatgagta gcagcacgtt ccttatatgt 1140
agctttcgac atgatttatc ttcgtttcct gcaggttttt gttctgtgca gttgggttaa 1200
gaatactggg caatttcatg tttcttcaac accacatatg cgtatatata ccaatctaag 1260
tctgtgctcc ttccttcgtt cttccttctg ctcggagatt accgaatcaa aaaaatttca 1320
aagaaaccgg aatcaaaaaa aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg 1380
accctgaaac cacagccaca ttaaccttct ttgatggtca aaacttatcc ttcaccataa 1440
atatgcctcg caaaaaaggt aattaacata tatagaatta cattatttat gaaatatcat 1500
cactatctct tagcatcttt aatccttttc tacatcagat aacttcggtt tgttatcatc 1560
gtctgtattg tcatcaattg gcgcagtagc ctcaatttca acgtcgtttg actctggtgt 1620
ttgttcatgt gcagatccat gagatgatga actagggata acagggtaat aagatccgat 1680
cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct tgaggatgca 1740
aatggctgac 1750
<210> 137
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<220>
<221> misc_feature
<222> (28)..(35)
<223> n is a, c, g, or t
<400> 137
accgatagtt acgatcgagg tactcatnnn nnnnn 35
<210> 138
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<220>
<221> misc_feature
<222> (28)..(34)
<223> n is a, c, g, or t
<400> 138
agtagtacct cgatcgtaac tatcggtnnn nnnn 34
<210> 139
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<220>
<221> misc_feature
<222> (28)..(35)
<223> n is a, c, g, or t
<400> 139
accgatagtt acgatcgagg tactactnnn nnnnn 35
<210> 140
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<220>
<221> misc_feature
<222> (28)..(34)
<223> n is a, c, g, or t
<400> 140
agtagtacct cgatcgtaac tatcggtnnn nnnn 34
<210> 141
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 141
accgatagtt acgatcgagg tactcattag ggataa 36
<210> 142
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 142
agtagtacct cgatcgtaac tatcggttat taccctgtta t 41
<210> 143
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 143
accgatagtt acgatcgagg tactcat 27
<210> 144
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 144
atgagtacct cgatcgtaac tatcggt 27
Claims (108)
- 적출성 핵산 구조체(excisable nucleic acid construct)로서,
5' → 3' 방향으로,
(a) 제1 탠덤 리피트 핵산(tandem repeat nucleic acid);
(b) 제1 F-CphI 엔도뉴클레아제 인지부;
(c) 타겟 핵산;
(d) 제2 F-CphI 엔도뉴클레아제 인지부; 및
(e) 제2 탠덤 리피트 핵산을 포함하는 것을 특징으로 하는, 적출성 핵산 구조체. - 제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 20 bp(base pair)로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제1항 내지 제5항 중 어느 한항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 적출성 핵산 구조체.
- 제6항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신(zeocin) 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 적출성 핵산 구조체.
- 제1항 내지 제7항 중 어느 한항에 있어서, 상기 제1 탠덤 리피트 핵산의 5'에 연결되는 제1 게놈 병합부(integration site)와 상기 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 게놈 병합부를 더 포함하는 것을 특징으로 하는 적출성 핵산 구조체.
- 제1항 내지 제8항 중 어느 한항에 있어서, 상기 타겟 핵산이 F-CphI 엔도뉴클레아제를 코딩하는 핵산에 작동가능하게 연결되는 프로모터 인자를 포함하는 것을 특징으로 하는 적출성 핵산 구조체.
- 제1항 내지 제7항 중 어느 한항에 따른 적출성 핵산 구조체를 포함하는 숙주 세포.
- 제10항에 있어서, F-CphI 엔도뉴클레아제를 코딩하는 핵산을 포함하는 벡터를 더 포함하는 것을 특징으로 하는 숙주 세포.
- 제11항에 있어서, 상기 벡터가 F-CphI 엔도뉴클레아제를 코딩하는 핵산의 발현을 제어하는 프로모터 인자를 포함하는 것을 특징으로 하는 숙주 세포.
- 제12항에 있어서, 상기 프로모터 인자가 유도성 프로모터인 것을 특징으로 하는 숙주 세포.
- 제10항 내지 제13항 중 어느 한항에 있어서, 효모 세포인 것을 특징으로 하는 숙주 세포.
- 제14항에 있어서, 반수체 효모 세포인 것을 특징으로 하는 숙주 세포.
- 제14항에 있어서, 이배체 효모 세포인 것을 특징으로 하는 숙주 세포.
- 제14항에 있어서, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 숙주 세포.
- 제10항 내지 제17항 중 어느 한항에 있어서, 상기 적출성 핵산 구조체가 숙주 세포의 게놈에 병합된 것을 특징으로 하는 숙주 세포.
- 제1항에 따른 적출성 핵산 구조체를 포함하는 숙주 세포에서 적출성 핵산 구조체를 F-CphI와 접촉시키는 단계를 포함하는, 제 1항의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 하나 이상의 타겟 핵산을 적출하는 방법.
- 제19항에 있어서, 상기 적출시 프로모터 인자가 대상 유전자에 작동가능하게 연결되는 것을 특징으로 하는 방법.
- 제19항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 방법.
- 제21항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
- 제19항 내지 제22항 중 어느 한항에 있어서, 상기 숙주 세포는 효모 세포인 것을 특징으로 하는 방법.
- 제23항에 있어서, 상기 숙주 세포는 반수체 효모 세포인 것을 특징으로 하는 방법.
- 제23항에 있어서, 상기 숙주 세포는 이배체 효모 세포인 것을 특징으로 하는 방법.
- 제23항에 있어서, 상기 숙주 세포는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 방법.
- 적출성 핵산 구조체로서,
5' → 3' 방향으로,
(a) 제1 게놈 병합 서열;
(b) 뉴클레오티드 18 - 200 bp로 구성된 제1 탠덤 리피트 핵산;
(c) 제1 호밍 엔도뉴클레아제 인지부;
(d) 타겟 핵산;
(e) 제2 호밍 엔도뉴클레아제 인지부;
(f) 뉴클레오티드 18 - 200 bp로 구성된 제2 탠덤 리피트 핵산; 및
(g) 제2 게놈 병합 서열을 포함하며,
상기 제1 및 제2 게놈 병합 서열은 각각 효모 게놈 유전자 좌(loci)와 상동적인 재조합을 개시하기에 충분한 길이와 동일성(identity)을 가지는 것을 특징으로 하는 적출성 핵산 구조체. - 제27항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 적어도 하나가 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 적어도 하나가 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 적어도 하나가 I-SceI에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 적어도 하나가 F-CphI에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제36항 중 어느 한항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 적출성 핵산 구조체.
- 제37항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제38항 중 어느 한항에 있어서, 상기 제1 및 제2 게놈 병합 서열이 각각 독립적으로 뉴클레오티드 약 50 - 5000 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제38항 중 어느 한항에 있어서, 상기 제1 및 제2 게놈 병합 서열이 각각 독립적으로 뉴클레오티드 약 500 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
- 제27항 내지 제40항 중 어느 한항에 따른 적출성 핵산 구조체를 포함하는 효모 세포.
- 제41항에 있어서, 반수체 효모 세포인 것을 특징으로 하는 숙주 세포.
- 제41항에 있어서, 이배체 효모 세포인 것을 특징으로 하는 숙주 세포.
- 제41항에 있어서, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 숙주 세포.
- 효모 세포로서,
(a) 5' → 3' 방향으로,
(i) 뉴클레오티드 18 - 200 bp로 구성된 제1 탠덤 리피트 핵산;
(ii) 제1 호밍 엔도뉴클레아제 인지부;
(iii) 타겟 핵산;
(iv) 제2 호밍 엔도뉴클레아제 인지부; 및
(v) 뉴클레오티드 18 - 200 bp로 구성된 제2 탠덤 리피트 핵산을 포함하는, 적출성 핵산 구조체와,
(b) 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터,
를 포함하는 것을 특징으로 하는 효모 세포. - 제45항에 있어서, 상기 호밍 엔도뉴클레아제가 제1 및 제2 호밍 엔도뉴클레아제 인지부들 각각에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 효모 세포.
- 제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, an His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 효모 세포.
- 제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 효모 세포.
- 제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-SceI을 코딩하는 것을 특징으로 하는 효모 세포.
- 제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 F-CphI을 코딩하는 것을 특징으로 하는 효모 세포.
- 제45항 내지 제50항 중 어느 한항에 있어서, 상기 벡터가 상기 호밍 엔도뉴클레아제 핵산의 발현을 제어하는 프로모터 인자를 포함하는 것을 특징으로 하는 효모 세포.
- 제51항에 있어서, 상기 프로모터 인자가 유도성 프로모터인 것을 특징으로 하는 효모 세포.
- 제51항에 있어서, 상기 프로모터 인자가 구성적인 프로모터(constitutive promoter)인 것을 특징으로 하는 효모 세포.
- 제45항 내지 제53항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 효모 세포.
- 제45항 내지 제53항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 효모 세포.
- 제45항 내지 제53항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 효모 세포.
- 제454항 내지 제56항 중 어느 한항에 있어서, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 효모 세포.
- 제454항 내지 제57항 중 어느 한항에 있어서, 상기 적출성 핵산 구조체가 효모 세포 게놈으로 병합되는 것을 특징으로 하는 효모 세포.
- 키트로서,
(a) 제27항에 따른 적출성 핵산 구조체와,
(b) 제1또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함하는 것을 특징으로 하는 키트. - 제59항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 키트.
- 제59항 또는 제60항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, an His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 키트.
- 제59항 또는 제60항 중 어느 한항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 키트.
- 제59항 또는 제60항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-SceI을 코딩하는 것을 특징으로 하는 키트.
- 제59항 또는 제60항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 F-CphI을 코딩하는 것을 특징으로 하는 키트.
- 제59항 내지 제64항 중 어느 한항에 있어서, 상기 벡터가 호밍 엔도뉴클레아제 핵산의 발현을 제어하는 프로모터 인자를 포함하는 것을 특징으로 하는 키트.
- 제65항에 있어서, 상기 프로모터 인자가 유도성 프로모터인 것을 특징으로 하는 키트.
- 제65항에 있어서, 상기 프로모터 인자가 구성적인 프로모터인 것을 특징으로 하는 키트.
- 제59항 내지 제67항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 키트.
- 제59항 내지 제67항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 키트.
- 제59항 내지 제67항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 키트.
- 적출성 핵산 구조체를 포함하는 효모 세포의 게놈으로부터 하나 이상의 타겟 핵산을 적출하는 방법으로서,
상기 적출성 핵산 구조체는, 5' → 3' 방향으로
(a) 뉴클레오티드 18 - 200 bp로 구성된 제1 탠덤 리피트 핵산;
(b) 제1 호밍 엔도뉴클레아제 인지부;
(c) 타겟 핵산;
(d) 제2 호밍 엔도뉴클레아제 인지부; 및
(e) 뉴클레오티드 18 - 200 bp로 구성된 제2 탠덤 리피트 핵산을 포함하며,
상기 방법이, 호밍 엔도뉴클레아제가 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상을 절단하거나 이에 인접하여 절단할 수 있도록, 효모 세포에서 상기 적출성 핵산 구조체를 상기 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함하는 것을 특징으로 하는 방법. - 제71항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 방법.
- 제71항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 방법.
- 제71항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 방법.
- 제71항 내지 제74항 중 어느 한항에 있어서, 상기 호밍 엔도뉴클레아제가 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각을 절단하거나 이에 인접하여 절단하는 것을 특징으로 하는 방법.
- 제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, an His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상이 I-SceI에 대한 인지부인 것을 특징으로 하는 방법.
- 제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상이 F-CphI에 대한 인지부인 것을 특징으로 하는 방법.
- 제71항 내지 제81항 중 어느 한항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 방법.
- 제82항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
- 제71항 내지 제83항 중 어느 한항에 있어서, 상기 효모 세포가 반수체 효모 세포인 것을 특징으로 하는 방법.
- 제71항 내지 제83항 중 어느 한항에 있어서, 상기 효모 세포가 이배체 효모 세포인 것을 특징으로 하는 방법.
- 제71항 내지 제83항 중 어느 한항에 있어서, 상기 효모 세포가 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 방법.
- 제71항 내지 제86항 중 어느 한항에 있어서, 상기 효모 세포의 게놈으로부터 하나 이상의 타겟 핵산의 적출에 의해 원하는 유전자의 발현이 활성화되는 것을 특징으로 하는 방법.
- 제45항에 있어서, 상기 효모 세포의 게놈으로부터 하나 이상의 타겟 핵산의 적출에 의해 원하는 유전자의 발현이 억제되는 것을 특징으로 하는 방법.
- 2 이상의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 2 이상의 타겟 핵산을 동시에 적출하는 방법으로서,
상기 적출성 핵산 구조체가 각각 독립적으로 5' → 3' 방향으로,
(a) 제1 탠덤 리피트 핵산;
(b) 제1 호밍 엔도뉴클레아제 인지부;
(c) 타겟 핵산;
(d) 제2 호밍 엔도뉴클레아제 인지부; 및
(e) 제2 탠덤 리피트 핵산을 포함하며,
상기 방법이, 하나 이상의 호밍 엔도뉴클레아제가 각각의 상기 적출성 핵산 구조체의 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상을 절단하거나 이에 인접하여 절단할 수 있도록, 효모 세포에서 상기 2 이상의 적출성 핵산 구조체를 상기 하나 이상의 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함하는 것을 특징으로 하는 방법. - 제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 200 bp로 구성된 것을 특징으로 하는 방법.
- 제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 방법.
- 제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 방법.
- 제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 방법.
- 제89항 내지 제93항 중 어느 한항에 있어서, 상기 호밍 엔도뉴클레아제가 상기 각각의 적출성 핵산 구조체의 제1 및 제2 호밍 엔도뉴클레아제 인지부를 각각 절단하거나 또는 이에 인접하여 절단하는 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 하나 이상의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-SceI에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 하나 이상의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 F-CphI에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-SceI에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 F-CphI에 대한 인지부인 것을 특징으로 하는 방법.
- 제89항 내지 제102항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 방법.
- 제103항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
- 제89항 내지 제102항 중 어느 한항에 있어서, 상기 숙주 세포가 효모 세포인 것을 특징으로 하는 방법.
- 제105항에 있어서, 상기 효모 세포가 반수체 효모 세포인 것을 특징으로 하는 방법.
- 제105항에 있어서, 상기 효모 세포가 이배체 효모 세포인 것을 특징으로 하는 방법.
- 제105항에 있어서, 상기 효모 세포가 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37835010P | 2010-08-30 | 2010-08-30 | |
US61/378,350 | 2010-08-30 | ||
PCT/US2011/049615 WO2012030747A1 (en) | 2010-08-30 | 2011-08-29 | Nucleic acids, compositions and methods for the excision of target nucleic acids |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130100127A true KR20130100127A (ko) | 2013-09-09 |
Family
ID=43805849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137006317A KR20130100127A (ko) | 2010-08-30 | 2011-08-29 | 타겟 핵산을 적출하기 위한 핵산, 조성물 및 방법 |
Country Status (13)
Country | Link |
---|---|
US (2) | US7919605B1 (ko) |
EP (2) | EP2611923B1 (ko) |
JP (1) | JP5883449B2 (ko) |
KR (1) | KR20130100127A (ko) |
CN (1) | CN103228789B (ko) |
AU (1) | AU2011296245B2 (ko) |
CA (1) | CA2809645A1 (ko) |
DK (1) | DK2611923T3 (ko) |
HK (1) | HK1181070A1 (ko) |
MX (1) | MX2013002249A (ko) |
SG (1) | SG188251A1 (ko) |
WO (1) | WO2012030747A1 (ko) |
ZA (1) | ZA201301177B (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7919605B1 (en) | 2010-08-30 | 2011-04-05 | Amyris, Inc. | Nucleic acids, compositions and methods for the excision of target nucleic acids |
CN103492578B (zh) | 2011-04-27 | 2016-10-19 | 阿迈瑞斯公司 | 用于基因组修饰的方法 |
NL2011912C2 (en) * | 2013-12-06 | 2015-06-09 | Univ Delft Tech | Novel genome alteration system for microorganisms. |
AU2014368982B2 (en) * | 2013-12-19 | 2021-03-25 | Amyris, Inc. | Methods for genomic integration |
NL2012608B1 (en) | 2014-04-11 | 2016-05-09 | Heineken Supply Chain Bv | Ureohydrolases as dominant selectable markers in yeast. |
US11293033B2 (en) | 2016-05-18 | 2022-04-05 | Amyris, Inc. | Compositions and methods for genomic integration of nucleic acids into exogenous landing pads |
WO2018025206A1 (en) * | 2016-08-02 | 2018-02-08 | Kyoto University | Method for genome editing |
GB201805676D0 (en) * | 2018-04-05 | 2018-05-23 | Imperial Innovations Ltd | Compositions |
CN112239765A (zh) * | 2020-10-15 | 2021-01-19 | 天津科技大学 | 酵母定点双dsb同步诱导模型的构建方法 |
JP2022087881A (ja) * | 2020-12-02 | 2022-06-14 | トヨタ自動車株式会社 | 形質転換用プラスミド及びこれを用いた形質転換体の製造方法、並びに形質転換方法 |
JP2022099419A (ja) * | 2020-12-23 | 2022-07-05 | トヨタ自動車株式会社 | 形質転換用プラスミド及びこれを用いた形質転換体の製造方法、並びに形質転換方法 |
WO2023081756A1 (en) | 2021-11-03 | 2023-05-11 | The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone | Precise genome editing using retrons |
WO2023141602A2 (en) | 2022-01-21 | 2023-07-27 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2024044723A1 (en) | 2022-08-25 | 2024-02-29 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5272065A (en) | 1983-10-20 | 1993-12-21 | Research Foundation Of State University Of New York | Regulation of gene expression by employing translational inhibition of MRNA utilizing interfering complementary MRNA |
US5023171A (en) | 1989-08-10 | 1991-06-11 | Mayo Foundation For Medical Education And Research | Method for gene splicing by overlap extension using the polymerase chain reaction |
DE10131786A1 (de) | 2001-07-04 | 2003-01-16 | Sungene Gmbh & Co Kgaa | Rekombinationssysteme und Verfahren zum Entfernen von Nukleinsäuresequenzen aus dem Genom eukaryotischer Organismen |
KR101794298B1 (ko) | 2008-11-19 | 2017-11-20 | 아미리스 인코퍼레이티드 | 폴리뉴클레오타이드의 집합체 조성물 및 이에 대한 방법 |
CN102421897B (zh) * | 2009-03-06 | 2015-12-16 | 合成基因组股份有限公司 | 用于克隆和操作基因组的方法 |
US7919605B1 (en) | 2010-08-30 | 2011-04-05 | Amyris, Inc. | Nucleic acids, compositions and methods for the excision of target nucleic acids |
-
2010
- 2010-12-23 US US12/978,061 patent/US7919605B1/en active Active
-
2011
- 2011-08-29 SG SG2013012547A patent/SG188251A1/en unknown
- 2011-08-29 KR KR1020137006317A patent/KR20130100127A/ko not_active Application Discontinuation
- 2011-08-29 CA CA2809645A patent/CA2809645A1/en not_active Abandoned
- 2011-08-29 WO PCT/US2011/049615 patent/WO2012030747A1/en active Application Filing
- 2011-08-29 CN CN201180051803.4A patent/CN103228789B/zh active Active
- 2011-08-29 DK DK11755188.7T patent/DK2611923T3/da active
- 2011-08-29 JP JP2013526203A patent/JP5883449B2/ja active Active
- 2011-08-29 MX MX2013002249A patent/MX2013002249A/es not_active Application Discontinuation
- 2011-08-29 EP EP11755188.7A patent/EP2611923B1/en active Active
- 2011-08-29 EP EP14164800.6A patent/EP2765199A1/en not_active Withdrawn
- 2011-08-29 AU AU2011296245A patent/AU2011296245B2/en active Active
- 2011-08-29 US US13/220,553 patent/US9018364B2/en active Active
-
2013
- 2013-02-14 ZA ZA2013/01177A patent/ZA201301177B/en unknown
- 2013-07-11 HK HK13108147.0A patent/HK1181070A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
EP2611923A1 (en) | 2013-07-10 |
ZA201301177B (en) | 2014-04-30 |
MX2013002249A (es) | 2013-05-30 |
US9018364B2 (en) | 2015-04-28 |
CA2809645A1 (en) | 2012-03-08 |
AU2011296245A1 (en) | 2013-04-11 |
EP2765199A1 (en) | 2014-08-13 |
JP5883449B2 (ja) | 2016-03-15 |
US7919605B1 (en) | 2011-04-05 |
SG188251A1 (en) | 2013-04-30 |
AU2011296245B2 (en) | 2015-01-15 |
CN103228789A (zh) | 2013-07-31 |
JP2013537799A (ja) | 2013-10-07 |
HK1181070A1 (en) | 2013-11-01 |
WO2012030747A1 (en) | 2012-03-08 |
EP2611923B1 (en) | 2014-07-02 |
DK2611923T3 (da) | 2014-09-08 |
US20120052582A1 (en) | 2012-03-01 |
CN103228789B (zh) | 2015-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20130100127A (ko) | 타겟 핵산을 적출하기 위한 핵산, 조성물 및 방법 | |
KR102274445B1 (ko) | 게놈 삽입을 위한 방법 | |
KR101794298B1 (ko) | 폴리뉴클레오타이드의 집합체 조성물 및 이에 대한 방법 | |
US6265186B1 (en) | Yeast cells comprising at least two copies of a desired gene integrated into the chromosomal genome at more than one non-ribosomal RNA encoding domain, particularly with Kluyveromyces | |
CN113631704A (zh) | 可用于基因编辑的多肽及使用方法 | |
KR101311619B1 (ko) | 클로스트리디아에서 dna 서열 대체 및 염색체 통합하기 위한 방법 | |
CN112210573B (zh) | 一种用基因编辑改造原代细胞的dna模板及定点插入方法 | |
AU6278196A (en) | Synthetic mammalian chromosome and methods for construction | |
US20220162621A1 (en) | Methods For Polynucleotide Integration Into The Genome Of Bacillus Using Dual Circular Recombinant DNA Constructs And Compositions Thereof | |
US20220177923A1 (en) | Methods for integrating a donor DNA sequence into the genome of bacillus using linear recombinant DNA constructs and compositions thereof | |
US5688663A (en) | Gene encoding carboxypeptidase of Aspergillus niger | |
AU2022204029A1 (en) | Oleic acid-enriched plant body having genetically modified FAD2 and production method thereof | |
AU2021254373A1 (en) | Genome engineering method and genome engineering kit | |
JP2001340090A (ja) | 乳酸菌シャトルベクター | |
CN115427560A (zh) | 使用无催化活性rna指导的内切核酸酶的crispr-aid | |
ES2308805T3 (es) | Celulas de levadura que comprenden al menos dos copias de un gen deseado integradas en el genoma cromosomico en mas de un domicio que codifica el arn no ribosomico particularmente con kluyveromyces. | |
US20230265460A1 (en) | A modular and pooled approach for multiplexed crispr genome editing | |
US20210348175A1 (en) | Genetic toolbox for metabolic engineering of non-conventional yeast | |
GB2464264A (en) | Vector comprising chloroplast replicating sequence | |
US20020090714A1 (en) | Bacteriophage vectors generated by bacteriophage/plasmid recombination |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |