KR20130100127A

KR20130100127A - 타겟 핵산을 적출하기 위한 핵산, 조성물 및 방법

Info

Publication number: KR20130100127A
Application number: KR1020137006317A
Authority: KR
Inventors: 커스틴 알 벤자민
Original assignee: 아미리스 인코퍼레이티드
Priority date: 2010-08-30
Filing date: 2011-08-29
Publication date: 2013-09-09
Also published as: EP2611923A1; ZA201301177B; MX2013002249A; US9018364B2; CA2809645A1; AU2011296245A1; EP2765199A1; JP5883449B2; US7919605B1; SG188251A1; AU2011296245B2; CN103228789A; JP2013537799A; HK1181070A1; WO2012030747A1; EP2611923B1; DK2611923T3; US20120052582A1; CN103228789B

Abstract

본 발명은 숙주 세포의 게놈으로부터 하나 이상의 유전자 좌(loci)를 적출할 수 있는 핵산, 조성물 및 방법을 제공한다. 보다 상세하게는, 본 발명은, 5' → 3' 방향으로, 제1 탠덤 리피트 핵산, 제1 호밍 엔도뉴클레아제 인지부, 타겟 핵산, 제2 호밍 엔도뉴클레아제 인지부 및 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체를 제공한다. 일부 구현예에서, 적출성 핵산 구조체를 숙주 세포 게놈에 병합시키고, 호밍 엔도뉴클레아제 인지부를 하나 이상의 적절한 호밍 엔도뉴클레아제와 접촉시킴으로써, 숙주 세포 게놈으로부터 타겟 핵산을 적출할 수 있다.

Description

타겟 핵산을 적출하기 위한 핵산, 조성물 및 방법 {NUCLEIC ACIDS, COMPOSITIONS AND METHODS FOR THE EXCISION OF TARGET NUCLEIC ACIDS}

본 출원은 2010년 8월 30일자 미국 가출원번호 61/378,350에 대한 우선권을 주장하며, 문헌의 전체 내용이 원용에 의해 본 명세서에 포함된다.

본 발명에서 기술되는 핵산, 조성물 및 방법은 일반적으로 분자 생물학 및 유전공학 분야에 관한 것이다.

숙주 세포 게놈 또는 에피좀(episome)으로부터 타겟 핵산을 적출하기 위한 유전공학 기법은 대사 공학, 공업 미생물학, 합성 생물학 및 기초 분자 유전학 연구를 비롯한 다양한 분야들에서 필요한 기법이다. 그러나, 타겟 핵산을 제거하는 기존 방법들은 제한적이며, 이용에 한계가 있다. 예를 들어, 부위 특이적인 재조합효소에 의한 제거 방법은 숙주 세포에 잠재적인 게놈 불안정성을 발생시키는 유해한 특이적인 재조합효소 결합 부위를 남기게 된다. 다른 방법들은 적출 빈도가 낮아, 적출 과정이 이루어진 소수의 숙주 세포를 생장-선별하는 방법이 필연적으로 요구된다. 잠재적인 게놈 불안정성을 발생시키지 않으면서, 숙주 세포의 게놈 또는 에피좀으로부터 타겟 핵산을 높은 빈도로, 그리고 양호한 충실성으로 적출할 수 있는 핵산, 조성물 및 방법들이 요구되고 있다.

본 발명은 숙주 세포의 게놈으로부터 하나 이상의 유전자 좌를 적출할 수 있는 핵산, 조성물 및 방법을 제공한다. 제1 측면에서, 본 발명은 5' → 3' 방향으로, a) 제1 탠덤 리피트(repeat) 핵산, b) 제1 호밍 엔도뉴클레아제 인지부(first homing endonuclease recognition site), c) 타겟 핵산, d) 제2 호밍 엔도뉴클레아제 인지부, 및 e) 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체를 제공한다. 일부 구현예들에서, 상기 적출성 핵산 구조체는 숙주 세포 게놈에 병합된다. 일부 구현예들에서, 상기 제2 호밍 엔도뉴클레아제 인지부는 선택 사항이다.

제1 및 제2 호밍 엔도뉴클레아제 인지부는 호밍 엔도뉴클레아제에 의한 적출성 핵산 구조체의 절단을 허용한다. 호밍 엔도뉴클레아제 인지부에 결합된 호밍 엔도뉴클레아제는 상기 호밍 엔도뉴클레아제 인지부에서 또는 이에 인접한 부위에서 적출성 핵산 구조체를 절단할 수 있다. 일부 구현예들에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 14 -40개의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예들에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 14-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 20-40 개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 25-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 30-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 35-40개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 상기 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 24개의 뉴클레오티드 염기 쌍으로 구성된다.

일부 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은, LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 특정 구현예에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부들은 각각 독립적으로 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다.

일부 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다.

특정 구현예들에서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부들은 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 개개 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 I-SceI에 대한 인지부이다. 개개 구현예들에서, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 F-CphI에 대한 인지부이다.

타겟 핵산의 절단 후, 제1 및 제2 탠덤 리피트에 의해 촉진되는 염색체내 재조합을 통해 숙주 세포의 게놈 복구가 이루어질 수 있다. 일부 구현예들에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18개 이상의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예들에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 500개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 200개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예들에서, 숙주 세포는 효모 세포이며, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 200개의 뉴클레오티드 염기 쌍으로 구성된다.

일부 구현예들에서, 타겟 핵산은 선별 마커를 코딩한다. 일부 구현예들에서, 선별 마커는 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신(zeocin) 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택된다.

일부 구현예들에서, 전술한 적출성 핵산 구조체는 제1 탠덤 리피트의 5'에 연결되는 제1 게놈 병합부(integration site)와 제2 탠덤 리피트의 3'에 연결되는 제2 게놈 병합부를 추가로 포함한다. 유익하게는, 제1 및 제2 게놈 병합부들은 숙주 세포의 게놈으로의 적출성 핵산 구조체의 병합을 촉진시킬 수 있다.

다른 측면에서, 본 발명은 전술한 적출성 핵산 구조체를 포함하는 숙주 세포를 제공한다. 일부 구현예들에서, 적출성 핵산 구조체는 제1 탠덤 리피트의 5'에 연결되는 제1 게놈 병합부와 제2 탠덤 리피트의 3'에 연결되는 제2 게놈 병합부를 추가로 포함한다.

일부 구현예들에서, 숙주 세포는 원핵 생물이다. 일부 구현예들에서, 숙주 세포는 진핵 생물이다. 특정 구현예들에서, 숙주 세포는 단세포 진핵 유기체이다. 특정 구현예들에서, 숙주 세포는 효모 세포이다. 특정 구현예들에서, 숙주 세포는 반수체 효모 세포이다. 다른 구현예들에서, 숙주 세포는 이배체 효모 세포이다. 특정 구현예들에서, 숙주 세포는 균주 사카로마이세스 세레비지애(S. cerevisiae)의 효모 세포이다.

일부 구현예들에서, 숙주 세포는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 추가로 포함하되, 상기 호밍 엔도뉴클레아제는 제1 및/또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여, 이를 또는 이에 인접하여 절단할 수 있다. 특정 구현예들에서, 상기 벡터는, 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각에 결합하여, 이를 또는 이에 인접하여 절단할 수 있는, 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함한다.

일부 구현예들에서, 벡터는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산의 발현을 조절하는 프르모터 인자를 포함한다. 일부 구현예들에서, 프로모터 인자는 유도성 프로모터이다. 일부 구현예들에서, 프로모터 인자는 구성적인 프로모터(constitutive promoter)이다.

다른 측면에서, 본 발명은 숙주 세포의 게놈으로 병합된 전술한 적출성 핵산 구조체를 포함하는 숙주 세포를 제공한다. 특정 구현예들에서, 적출성 핵산 구조체는 5' → 3' 방향으로: a) 제1 탠덤 리피트 핵산, b) 제1 호밍 엔도뉴클레아제 인지부, c) 타겟 핵산, d) 제2 호밍 엔도뉴클레아제 인지부 및 e) 제2 탠덤 리피트 핵산을 포함한다. 일부 구현예들에서, 숙주 세포는, 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는, 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 추가로 포함한다. 일부 구현예들에서, 호밍 엔도뉴클레아제 핵산은, 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각에 결합하여 이를 또는 이에 인접하여 절단할 수 있는, 호밍 엔도뉴클레아제를 코딩한다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 I-SceI이다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 F-CphI이다.

다른 측면에서, 본 발명은 전술한 적출성 핵산 구조체; 및 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함하는 키트를 제공한다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 I-SceI이다. 일부 구현예들에서, 호밍 엔도뉴클레아제는 F-CphI이다.

다른 측면에서, 본 발명은 숙주 세포의 게놈으로부터 하나 이상의 타겟 핵산을 적출하는 방법을 제공한다. 특정 구현예들에서, 숙주 세포는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 핵산, b) 제1 호밍 엔도뉴클레아제 인지부, c) 타겟 핵산, d) 제2 호밍 엔도뉴클레아제 인지부, 및 e) 제2 탠덤 리피트 핵산인, 핵산을 포함한다. 특정 구현예들에서, 본 방법은, 호밍 엔도뉴클레아제가 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상을 그 인지부에서 또는 이에 인접하여 절단할 수 있도록, 숙주 세포에서 호밍 엔도뉴클레아제를 발현시키는 단계를 포함한다. 본 방법의 일부 구현예들에서, 호밍 엔도뉴클레아제는 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각을 절단 또는 이에 인접하여 절단한다. 일부 구현예들에서, 제1 및/또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 I-SceI에 대한 인지부이다. 일부 구현예들에서, 제1 및/또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상은 F-CphI에 대한 인지부이다.

다른 측면에서, 본 발명은 2 이상의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 2 이상의 타겟 핵산을 동시에 적출하는 방법을 제공하며, 이때 각각의 적출성 핵산 구조체는 독립적으로 5' → 3' 방향으로: a) 제1 탠덤 리피트 핵산; b) 제1 호밍 엔도뉴클레아제 인지부; c) 타겟 핵산; d) 제2 호밍 엔도뉴클레아제 인지부; 및 e) 제2 탠덤 리피트 핵산을 포함한다. 일부 구현예들에서, 본 방법은, 호밍 엔도뉴클레아제가 각 적출성 핵산 구조체의 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상을 절단하거나 또는 이에 인접하여 절단하도록, 2 이상의 적출성 핵산 구조체를 숙주 세포에서 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함한다. 일부 구현예들에서, 본 방법은, 하나 이상의 호밍 엔도뉴클레아제가 각 적출성 핵산 구조체의 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상을 절단하거나 또는 이에 인접하여 절단하도록, 숙주 세포에서 2 이상의 적출성 핵산 구조체를 하나 이상의 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함한다.

유리하게는, 타겟 핵산이 적출된 게놈 핵산은 제1 및 제2 탠덤 리피트에 의해 매개되는 재조합에 의해 형성된다. 일부 구현예들에서, 새롭게 생성되는 게놈 핵산은 제3의 탠덤 리피트를 포함하는데, 이것은 제1 및 제2 탠덤 리피트의 재조합 산물로서 형성된다. 바람직한 구현예들에서, 숙주 세포에 남겨지게 되는 적출성 엔도뉴클레아제 구조체의 유일한 부분은 제3 탠덤 리피트이며, 이것은 18개의 뉴클레오티드 염기 쌍 길이에 불과할 수 있다.

본 발명은 잠재적인 게놈 불안정성을 야기하지 않고도 숙주 세포 게놈 또는 에피좀으로부터 하나 이상의 타겟 핵산을 정확하고 효과적으로 적출할 수 있는 조성물 및 방법을 제공한다. 유전공학 분야에서는 선택한 게놈 또는 에피좀 위치에서 타겟 핵산을 제거하여야 하는 경우들이 다수 존재한다. 예를 들어, 전술한 조성물 및 방법은 동일한 숙주 세포 또는 이의 후대에서 재사용될 수 있는 선별 마커를 제거하는데 유용하게 사용할 수 있다. "마커 리사이클링"은, 수명이 한정된 선별 마커를 이용하여 숙주 유기체에서 다중 유전자 조작 공정이 필요한 경우에 유용할 수 있다. 또한, 본원의 조성물 및 방법은, 조작하는 중에 또는 천연 환경에서, 숙주 세포를 방출하기 전에, 숙주 세포에서 바람직하지 않은 핵산 (예, 항생제 내성 마커)을 제거하는데 이용할 수 있다.

아울러, 본원의 조성물 및 방법은 숙주 세포와 그 후대에서 특정 유전자의 발현을 개시 또는 종결시키는데 사용할 수 있다. 본원의 조성물 및 방법은, 유전자의 발현을 종결시키기 위해, 예를 들어, 유전자의 시스-작용성 조절 인자들 중 하나 이상을 나타내는 핵산, 이의 코딩 서열 일부 또는 전체, 또는 이의 하나 이상의 전사 활성인자를 적출하는데, 이용할 수 있다. 유전자 발현을 개시하고자 하는 경우, 특정 유전자의 발현에 필요한 인자들 간에 요구되는 인접한 상호작용을 형성하도록, 간섭 핵산 가닥을 적출할 수 있다.

도 1. 적출성 핵산 구조체에 대한 구현예들. 도 1A: 5' → 3' 방향으로, 제1 탠덤 리피트 핵산 ("DR1"); 제1 호밍 엔도뉴클레아제 인지부 ("ES1"); 타겟 핵산 ("Target nucleic acid"); 제2 호밍 엔도뉴클레아제 인지부 ("ES2"); 및 제2 탠덤 리피트 핵산 ("DR2")을 포함하는 적출성 핵산 구조체. 도 1B: 제1 호밍 엔도뉴클레아제 인지부의 5'에 연결되는 제1 병합부 (IS1)와 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 병합부 (IS2)를 추가로 포함하는, 도 1A에 도시된 적출성 핵산 구조체.
도 2. 적출성 핵산 구조체는 형질전환되어, 병합부 매개 상동성 재조합을 통해 숙주 세포의 게놈의 특정 유전자 좌에서 타겟 핵산을 낫-아웃(knock-out) 및/또는 낫-인(knock-in) 한다. 타겟 핵산의 양쪽에는 호밍 엔도뉴클레아제 제한효소 부위가 2 카피 (각각 ES1 및 ES2) 존재하며, 그 옆에는 절단 후 복구를 지시하는 2개의 탠덤 리피트 (각각 DR1 및 DR2)가 존재한다.
도 3. 타겟 핵산의 적출. 일부 구현예들에서, 제1 및 제2 호밍 (도 3A) 엔도뉴클레아제 인지부는 각각 (ES1 및 ES2) 하나 이상의 대응되는 호밍 엔도뉴클레아제 (HE)에 의해 절단되어, 핵산 단편 3개가 수득된다: (1) 게놈 또는 에피좀 핵산의 좌측 암, (2) 타겟 핵산을 포함하는 핵산 단편, 및 (3) 게놈 또는 에피좀 핵산의 우측 암 (도 3B). 절단 후, 숙주 세포에서 내인성의 5' → 3' 엑소뉴클레아제가 각 핵산 단편의 한쪽 가닥을 신속하게 분해하여, 타겟 핵산을 포함한 핵산 단편이 파괴되며, 게놈 또는 에피좀 핵산의 좌측 암 (4) 및 우측 암 (5)에는 3' 꼬리가 남게 된다 (도 3C).
도 4. 타겟 핵산 (cont'd)의 적출. 좌측 암과 우측 암에서 한 가닥이 분해되어, 각 암에서 확인되는 탠덤 리피트가 노출되는데, 이들 탠덤 리피트는 상호 상보적이다 (도 4A). 탠덤 리피트에서 상보적인 영역들은 헤테로두플렉스(heteroduplex)를 형성하며, 숙주 세포 단백질에 의해 촉진되는 재조합 과정을 겪게 된다. 우측 암 (7)과 좌측 암 (8)에서 단일 가닥의 3' 최말단은 상보성이 없으므로, 제1 및 제2 탠덤 리피트의 상보적인 부분들로 형성된 헤테로두플렉스 파트에 해당되지 않는다. 이들 비상보적인 3' 최말단은 플랩(flap) 뉴클레아제로 절단될 수 있다. 마지막으로, 복구 DNA 합성 및 DNA 리가제가 헤테로두플렉스를 메우고 닉(nick)을 연결하여, 타겟 핵산이 정확하게 적출된 온전한 게놈 또는 에피좀 핵산을 형성시킨다 (도 4C).

5.

5.1 정의

본원에서, 용어 "호밍 엔도뉴클레아제"는 본래의 생물학적 기능상 특정 유전자의 엔도뉴클레아제-코딩 대립유전자를 유전자의 엔도뉴클레아제-결핍 대립유전자에 전파하는 유전자 변환 현상을 촉매하는 수종의 임의의 엔도뉴클레아제의 일종이다. 예를 들어, Chevalier, Nucleic Acids Res 1(29): 3757-74 (2001); Jacquier, Cell 41: 383-94 (1985)를 참조한다. 1) LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, 2) HNH 호밍 엔도뉴클레아제, 3) His-Cys box 호밍 엔도뉴클레아제, 4) GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제, 및 5) 시아노박테리아 호밍 엔도뉴클레아제를 비롯하여, 5종 이상의 호밍 엔도뉴클레아제 유형들이 공지되어 있다. 예를 들어, Stoddard, Quarterly Review of Biophysics 38(1): 49-95 (2006)를 참조한다. 이들 유형의 특이적인 호밍 엔도뉴클레아제의 예로는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI이 있으나, 이로 한정되지 않는다. 당해 기술 분야의 당업자라면, 동일하거나 또는 유사한 호밍 엔도뉴클레아제 제한효소부위위를 인식하여 이를 또는 이에 인접하여 절단하는 상기한 엔도뉴클레아제의 천연 또는 인공 변이체들이 이러한 정의에 포함됨을 알 것이다.

본원에서, 용어 "호밍 엔도뉴클레아제 인지부"는 특이적인 호밍 엔도뉴클레아제에 의해 인지되는 핵산을 지칭한다. 호밍 엔도뉴클레아제는 호밍 엔도뉴클레아제 인지부에 결합한 다음, 호밍 엔도뉴클레아제 인지부에서 또는 이에 인접하여 이중가닥 브레이크(double strand break)를 행할 수 있다.

본원에서, 용어 "인접하여"는 특정 핵산으로부터 약 1 내지 약 100, 1 내지 약 75, 1 내지 약 50, 1 내지 약 25, 1 내지 약 20, 1 내지 약 15, 1 내지 약 10, 또는 1 내지 약 5개의 뉴클레오티드 간격을 의미한다.

본원에서, 용어 호밍 엔도뉴클레아제와 관련하여 "절단한다" 및 "절단"은 특정 핵산에 이중가닥 브레이크를 행하는 행위를 지칭한다. 이중가닥 브레이크는, 당해 기술 분야의 당업자에게 이해되는 바와 같이, 블런트 엔드(blunt end) 또는 스티키 엔드(sticky end) (즉, 5' 또는 3' 오버행)를 남길 수 있다.

본원에서, 용어 "탠덤 리피트"는, 각 구성원이 서로간에 재조합을 매개할만큼 충분한 뉴클레오티드 상동성을 공유하는, 2 이상의 핵산으로 구성된 그룹에 속하는 핵산을 지칭한다. 탠덤 리피트들은 탠덤 배치된 다른 구성원이 동일한 방향 ("동향 탠덤 리피트 (direct tandem repeat)") 또는 역방향 ("역위된 탠덤 리피트 (inverted tandem repeat)")으로 배열된다.

본원에서, 용어 "타겟 DNA 단편 (target DNA segment)"은 본원에 제공되는 조성물과 방법을 이용하여 숙주 세포 게놈으로부터 적출되는 임의의 타겟 DNA 단편을 지칭한다. 이용가능한 예로는, 단백질-코딩 서열, 선별 마커, 리포터 유전자, 형광 마커 코딩 서열, 프로모터, 인핸서, 종결인자, 전사 활성인자, 전사 억제인자, 전사 활성인자 결합부, 전사 언제인자 결합부, 인트론, 엑손, 폴리-A 꼬리, 다중 클로닝 부위, 핵 국지화 신호, mRNA 안정화 신호, 병합 유전자 좌, 에피토프 테그 코딩 서열, 분해 신호 또는 임의의 다른 천연 또는 합성 DNA 분자가 있으나, 이로 한정되지 않는다. 일부 구현예에서, 타겟 DNA 단편은 천연 기원의 것일 수 있다. 다른 구현예에서, 타겟 DNA 단편은 시험관내에서 제조되는 완전히 합성 기원의 것일 수 있다. 아울러, 타겟 DNA 단편은 분리된 천연 DNA 분자들간의 임의 조합 또는 분리된 천연 DNA 분자와 합성 DNA 분자의 임의 조합을 포함할 수 있다. 예를 들어, 타겟 DNA 단편은 단백질 코딩 서열에 작동가능하게 연결된 이종 프로모터, 폴리-A 꼬리에 연결된 단백질 코딩 서열, 에피토프 테그 코딩 서열과 인-프래임으로 연결된 단백질 코딩 서열 등을 포함할 수 있다.

본원에서, 용어 "벡터"는 세포에서 복제될 수 있으며, 삽입 서열이 복제될 수 있도록 삽입 서열이 작동가능하게 연결될 수 있는 염색체외 핵산 분자를 지칭한다. 이용가능한 예로는 플라스미드 구조체, 파지 구조체, 코스미드 벡터 등의 원형 DNA 분자 뿐만 아니라 선형 핵산 구조체 (예, 람다 파지 구조체, 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC) 등)가 있으나, 이로 한정되지 않는다. 벡터는 프로모터 및/또는 종결인자와 같은 발현 신호, 항생제 내성 부여 유전자와 같은 선별 마커 및 삽입 서열을 클로닝할 수 있는 하나 이상의 제한효소부위를 포함할 수 있다. 벡터는 그외 고유 특징 (예, 벡터가 수용할 수 있는 DNA 삽입체 크기)을 가질 수 있다.

본원에서 "게놈"은 숙주 세포에 포함된 염색체 DNA와 에피좀 DNA 둘다를 지칭한다.

5.2 적출성 핵산 구조체

일 측면에서, 본 발명은 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 타겟 DNA 단편 (D), 및 c) 제2 탠덤 리피트 (DR2), 뿐만 아니라 DR1과 D 사이에, 또는 D와 DR2 사이에 위치된 제1 호밍 엔도뉴클레아제 인지부 (ES1)와, 선택적으로 D와 DR2 사이에 또는 DR1과 D 사이에 위치된 제2 호밍 엔도뉴클레아제 인지부 (ES2)를 각각 포함하는, 적출성 핵산 구조체 (도 1A)를 제공한다. 따라서, 일부 구현예에서, 상기 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 제1 호밍 엔도뉴클레아제 인지부 (ES1), c) 타겟 DNA 단편 (D), 및 d) 제2 탠덤 리피트 (DR2)를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 타겟 DNA 단편 (D), c) 제1 호밍 엔도뉴클레아제 인지부 (ES1), 및 d) 제2 탠덤 리피트 (DR2)를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 탠덤 리피트 (DR1), b) 제1 호밍 엔도뉴클레아제 인지부 (ES1), c) 타겟 DNA 단편 (D), d) 제2 호밍 엔도뉴클레아제 인지부 (ES2), 및 e) 제2 탠덤 리피트 (DR2)를 포함한다.

일부 구현예에서, 전술한 적출성 핵산 구조체는 추가적으로 제1 탠덤 리피트의 5'에 연결되는 제1 게놈 병합 서열 (IS1)과, 제2 탠덤 리피트의 3'에 연결되는 제2 게놈 병합 서열 (IS2)를 포함한다. 따라서, 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 병합 서열 (IS1), b) 제1 탠덤 리피트 (DR1), c) 제1 호밍 엔도뉴클레아제 인지부 (ES1), d) 타겟 DNA 단편 (D), e) 제2 탠덤 리피트 (DR2), 및 f) 제2 병합 서열 (IS2)을 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 병합 서열 (IS1), b) 제1 탠덤 리피트 (DR1), c) 타겟 DNA 단편 (D), d) 제1 호밍 엔도뉴클레아제 인지부 (ES1), e) 제2 탠덤 리피트 (DR2), 및 f) 제2 병합 서열 (IS2)을 포함한다. 일부 구현예에서, 적출성 핵산 구조체는, 5' → 3' 방향으로: a) 제1 병합 서열 (IS1), b) 제1 탠덤 리피트 (DR1), c) 제1 호밍 엔도뉴클레아제 인지부 (ES1), d) 타겟 DNA 단편 (D), e) 제2 호밍 엔도뉴클레아제 인지부 (ES2), f) 제2 탠덤 리피트 (DR2), 및 g) 제2 병합 서열 (IS2)을 포함한다.

유리하게는, 제1 및 제2 병합 서열은 숙주 세포 게놈으로의 적출성 핵산 구조체의 병합을 촉진할 수 있다. 적출성 핵산 구조체는, 숙주 세포 게놈에 병합될 때, 숙주 세포 게놈으로부터 타겟 DNA 단편 (D)이 높은 빈도와 높은 충실성으로 적출되도록 한다. 일부 구현예에서, 적출성 핵산 구조체는 선형 DNA 분자이다.

유전자 조작 적용시, 또는 제조 환경 또는 천연 환경으로 유기체를 방출하기 전에 항생제 내성 마커를 제거하기 위해, 적출성 핵산 구조체를 사용하여 선별 마커의 적출을 용이하게 수행할 수 있다. 또한, 이를 사용하여 숙주 세포와 이의 후손에서 유전자의 발현을 영구적으로 작동 또는 정지시킬 수 있다. 유전자의 발현을 방지하기 위해, 이의 시스-작동성 조절 서열, 이의 코딩 서열 또는 전사 활성인자를 코딩하는 유전자를 적출할 수 있다. 유전자의 발현을 촉발시키기 위해, 유전자 또는 전사 억제인자의 DNA 결합부를 적출하여, 이의 조절되는 유전자(들)가 발현되게 하거나, 또는 DNA의 간섭 가닥을 적출하여 특정 유전자의 발현에 요구되는 인자들 간에 필수적인 인접한 상호작용을 형성시킬 수 있다.

적출성 핵산 구조체는 당해 기술 분야의 당업자에게 자명한 임의 기법으로 제조할 수 있다. 특정 구현예들에서, 적출성 핵산 구조체는 당해 기술 분야에 잘 알려져 있는 중합효소 연쇄 반응 (PCR)과 분자 클로닝 기법들로 제조한다. 예를 들어, PCR Technology: Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3^rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; PCR Technology: Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989)를 참조한다.

적출성 핵산 구조체의 각각의 효소는 아래에서 상세하게 논의된다.

5.2.1. 호밍 엔도뉴클레아제 인지부

적출성 핵산 구조체는 적어도 제1 호밍 엔도뉴클레아제 인지부 (ES1)와, 선택적으로 제2 호밍 엔도뉴클레아제 인지부 (ES2)를 포함한다. 적출성 핵산 구조체가 제1 호밍 엔도뉴클레아제 인지부만을 포함하는 경우, 일부 구현예에서, ES1은 제1 탠덤 리피트 (DR1)의 3'과 타겟 DNA 단편 (D)의 5'에, 또는 타겟 DNA 단편 (D)의 3'과 제2 탠덤 리피트 (DR2)의 5'에 위치될 수 있다. 적출성 핵산 구조체가 제1 및 제2 호밍 엔도뉴클레아제 인지부를 포함하는 경우, 일부 구현예에서, ES1은 제1 탠덤 리피트 (DR1)의 3'과 타겟 DNA 단편 (D)의 5'에 위치되고, ES2는 타겟 DNA 단편 (D)의 3'과 제2 탠덤 리피트 (DR2)의 5'에 위치된다. 특정 구현예들에서, ES1은 D 영역내에 위치된다.

호밍 엔도뉴클레아제 인지부는 해당 호밍 엔도뉴클레아제가 적출성 핵산 구조체를 호밍 엔도뉴클레아제 인지부에서 또는 인접하여 절단할 수 있게 한다.

호밍 엔도뉴클레아제 인지부는 14-40개의 뉴클레오티드 염기 쌍 길이이다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 14-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 18-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 20-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 25-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 30-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 35-40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오티드로 구성된다. 일부 구현예에서, 각각의 호밍 엔도뉴클레아제 인지부는 24개의 뉴클레오티드로 구성된다.

일부 구현예에서, ES1은 DR1의 3'과 D의 5'에 위치한다. 일부 구현예에서, ES1은 DR1의 3' 말단에 위치한다. 일부 구현예에서, ES1은 DR1의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1은 DR1의 3' 말단으로 하류에 위치한다. 일부 구현예에서, ES1은 D의 5' 말단에 위치한다. 일부 구현예에서, ES1은 D의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1은 D의 5' 말단으로 상류에 위치한다.

일부 구현예에서, ES1은 D의 3'과 DR2의 5'에 위치한다. 일부 구현예에서, ES1은 D의 3' 말단에 위치한다. 일부 구현예에서, ES1은 D의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1은 D의 3' 말단으로 하류에 위치한다. 일부 구현예에서, ES1은 DR2의 5' 말단에 위치한다. 일부 구현예에서, ES1은 DR2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단으로 상류에 위치한다.

일부 구현예에서, ES2는, ES1과 조합하여 존재하는 경우, D의 3'과 DR2의 5'에 위치한다. 일부 구현예에서, ES2는 D의 3' 말단에 위치한다. 일부 구현예에서, ES2는 D의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES2는 D의 3' 말단으로 하류에 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단에 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES2는 DR2의 5' 말단으로 상류에 위치한다.

일부 구현예에서, ES1과 ES2가 둘다 존재하는 경우, ES1과 ES2는 서로 역방향(orientation)으로 배치된다. 일부 구현예에서, ES1과 ES2가 둘다 존재하는 경우, ES1과 ES2는 서로 동향으로 배치된다.

일부 구현예에서, ES1과 ES2는 당해 기술 분야에 공지된 임의의 호밍 엔도뉴클레아제에 대한 인지부들이다. 다수 유형의 호밍 엔도뉴클레아제 (그룹 II 인트론 제외)는 4 bp 단일가닥 3' 오버행을 가진 스테거형(staggered) 이중 가닥 브레이크 (DSB)가 만들어지게 한다. 일부 구현예에서, ES1과 ES2 중 적어도 하나는 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 특정 구현예들에서, ES1과 ES2는 각각 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 예를 들어, Stoddard, Quarterly Review of Biophysics 38(1): 49-95 (2006)를 참조한다. 이들 패밀리들은 이들의 보존된 뉴클레아제 활성부 코어 모티프 및 촉매 기전, 생물학적 및 게놈 분포, 및 비-호밍 뉴클레아제 시스템과의 광범위한 관련성 측면에 큰 차이가 있다. 이들 패밀리 유래의 유용한 특이적인 호밍 엔도뉴클레아제의 예로는 I-CreI (Rochaix et al., Nucleic Acids Res. 13: 975-984 (1985), I-MsoI (Lucas et al., Nucleic Acids Res. 29: 960-969 (2001), I-SceI (Foury et al., FEBS Lett. 440: 325-331 (1998), I-SceIV (Moran et al., Nucleic Acids Res. 20: 4069-4076 (1992), H-DreI (Chevalier et al., Mol. Cell 10: 895-905 (2002), I-HmuI (Goodrich-Blair et al., Cell 63: 417-424 (1990); Goodrich-Blair et al., Cell 84: 211-221 (1996), I-PpoI (Muscarella et al., Mol. Cell. Biol. 10: 3386-3396 (1990), I-DirI (Johansen et al., Cell 76: 725-734 (1994); Johansen, Nucleic Acids Res. 21: 4405 (1993), I-NjaI (Elde et al., Eur. J. Biochem. 259: 281-288 (1999); De Jonckheere et al., J. Eukaryot. Microbiol. 41: 457-463 (1994), I-NanI (Elde et al., S. Eur. J. Biochem. 259: 281-288 (1999); De Jonckheere et al., J. Eukaryot. Microbiol. 41: 457-463 (1994)), I-NitI (De Jonckheere et al., J. Eukaryot. Microbiol. 41: 457-463 (1994); Elde et al., Eur. J. Biochem. 259: 281-288 (1999), I-TevI (Chu et al., Cell 45: 157-166 (1986), I-TevII (Tomaschewski et al., Nucleic Acids Res. 15: 3632-3633 (1987), I-TevIII (Eddy et al., Genes Dev. 5: 1032-1041 (1991), F-TevI (Fujisawa et al., Nucleic Acids Res. 13: 7473-7481 (1985), F-TevII (Kadyrov et al., Dokl. Biochem. 339: 145-147 (1994); Kaliman, Nucleic Acids Res. 18: 4277 (1990), F-CphI (Zeng et al., Curr. Biol. 19: 218-222 (2009), PI-MgaI (Saves et al., Nucleic Acids Res. 29:4310-4318 (2001), I-CsmI (Colleaux et al., Mol. Gen. Genet. 223:288-296 (1990), I-CeuI (Turmel et al., J .Mol. Biol. 218: 293-311 (1991) 및 PI-SceI (Hirata et al., .J. Biol. Chem. 265: 6726-6733 (1990)이 있으나, 이로 한정되지 않는다.

일부 구현예에서, ES1 또는 ES2 중 하나 이상은 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다. 특정 구현예들에서, 각각의 ES1과 ES2는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부이다.

본원에 제공되는 조성물 및 방법에 대한 개개 구현예들에서, ES1과 ES2는 숙주 세포의 야생형 (조작되지 않은) 핵 DNA에 호밍 엔도뉴클레아제 인지부가 없다는 점에 기초하여 선정된다. 예를 들어, I-SceI, PI-MtuII(pps1), PI-MgaI(pps1), 및 F-CphI에 대한 인지부는 야생형 (조작되지 않은) 사카로마이세스 세레비지애의 핵 DNA에는 존재하지 않지만 (예, Curr Biol 2009;19:218-22; Proc Natl Acad Sci U S A 1988;85:6022-6; J Biol Chem 2002;277:16257-64; J Biol Chem 2002;277:40352-61; Nucleic Acids Res 2001;29:4310-8), VDE aka PI-SceI에 대한 인지부는 일부 균주들에는 존재하나 다른 균주들에는 존재하지 않는다 (예, Nucleic Acids Res 2001;29:4215-23). 따라서, 본원에 제공되는 조성물 및 방법에 대한 일부 구현예에서, ES1과 ES2는 I-SceI에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다. 일부 구현예에서, ES1과 ES2는 PI-MtuII(pps1)에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다. 일부 구현예에서, ES1과 ES2는 PI-MgaI(pps1)에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다. 일부 구현예에서, ES1과 ES2는 F-CphI에 대한 인지부이고, 숙주 세포는 사카로마이세스 세레비지애이다.

일부 구현예에서, ES1과 ES2의 선택은 하기 한가지 이상의 기준에 부합되는지를 기초로 이루어진다: (1) 호밍 엔도뉴클레아제 인지부가 숙주 세포의 야생형 (조작되지 않은) 게놈 전체 (즉, 미토콘드리아 DNA 포함)에 존재하지 않음; (2) 대응되는 호밍 엔도뉴클레아제가 발현되지 않은 경우, 호밍 엔도뉴클레아제에 대한 인지부는 절단되지 않음; 및 (3) 예컨대 게놈에 병합된 타겟 핵산의 적출을 유도하기 위한 핵내 대응되는 호밍 엔도뉴클레아제의 발현이 숙주 세포에 유해하지 않음. 일부 구현예에서, 숙주 세포의 야생형 (조작되지 않은) 핵 DNA에 존재하지 않은 것 외에도, ES1과 ES2는 전술한 기준 1, 2 또는 3가지 모두를 충족시킨다.

5.2.2. 탠덤 리피트

적출성 핵산 구조체는 제1 및 제2 탠덤 리피트를 포함한다. 제1 탠덤 리피트 (DR1)는 타겟 DNA 단편 (D)의 5'에 존재하며, 제2 탠덤 리피트 (DR2)는 타겟 DNA 단편 (D)의 3'에 존재한다.

제1 및 제2 탠덤 리피트는 호밍 엔도뉴클레아제에 의해 절단된 후 적출성 핵산 구조체의 잔류물의 재조합을 매개할 수 있다. 서로 동일한 방향으로 위치된 탠덤 리피트 (동향 탠덤 리피트)는 유리하게는 한가지 표준 어닐링 경로를 통해 숙주 세포에서 염색체간의 재조합을 매개할 수 있다. 예로, Ivanov et al., Genetics 142:693-704 (1996)를 참조한다.

DR1과 DR2는 호밍 엔도뉴클레아제에 의해 절단된 후 적출성 핵산 구조체의 잔류물의 재조합을 매개할 수 있는 임의의 탠덤 리피트일 수 있다. 이러한 재조합에 영향을 미칠 수 있는 탠덤 리피트의 특성으로는, 길이, GC 함량, 숙주 세포 게놈의 천연 서열과의 상동성 및 탠덤 리피트들 간의 서열 동일성 수준을 포함하나, 이로 한정되지 않는다. 서열 동일성 정도는 디폴트 파라미터를 이용하여, BLAST 2.2.2 또는 FASTA version 3.0t78과 같이 본원에 기술된 바를 비롯하여, 임의의 컴퓨터 프로그램과 관련 파라미터를 이용하여 결정할 수 있다.

일부 구현예에서, DR1은 ES1의 5' 말단에 위치한다. 일부 구현예에서, DR1은 ES1의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, DR1은 ES1의 5'으로 상류에 위치한다.

일부 구현예에서, DR2는 ES1의 3' 말단에 위치하거나, ES1과 ES2 둘다 ES2의 3'에 존재한다. 일부 구현예에서, DR2는 ES1의 3' 말단에 바로 인접하여 위치하거나, ES1과 ES2 둘다가 존재하는 경우에는 ES2의 3' 말단에 위치한다. 일부 구현예에서, DR2는 ES1의 3' 말단으로 하류에 위치하거나, 또는 ES1과 ES2 둘다가 존재하는 경우에는 ES2의 3' 말단에 위치한다.

일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18개 이상의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 500개의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 500, 18 - 495, 18 - 490, 18 - 485, 18 - 480, 18 - 475, 18 - 470, 18 - 465, 18 - 460, 18 - 455, 18 - 450, 18 - 445, 18 - 440, 18 - 435, 18 - 430, 18 - 425, 18 - 420, 18 - 415, 18 - 410, 18 - 405, 18 - 400, 18 - 395, 18 - 390, 18 - 385, 18 - 380, 18 - 375, 18 - 370, 18 - 365, 18 - 360, 18 - 355, 18 - 350, 18 - 345, 18 - 340, 18 - 335, 18 - 330, 18 - 325, 18 - 320, 18 - 315, 18 - 310, 18 - 305, 18 - 300, 18 - 295, 18 - 290, 18 - 285, 18 - 280, 18 - 275, 18 - 270, 18 - 265, 18 - 260, 18 - 255, 18 - 250, 18 - 245, 18 - 240, 18 - 235, 18 - 230, 18 - 225, 18 - 220, 18 - 215, 18 - 210, 18 - 205, 18 - 200, 18 - 195, 18 - 190, 18 - 185, 18 - 180, 18 - 175, 18 - 170, 18 - 165, 18 - 160, 18 - 155, 18 - 150, 18 - 145, 18 - 140, 18 - 135, 18 - 130, 18 - 125, 18 - 120, 18 - 115, 18 - 110, 18 - 105, 18 - 100, 18 - 95, 18 - 90, 18 - 85, 18 - 80, 18 - 75, 18 - 70, 18 - 65, 18 - 60, 18 - 55, 18 - 50, 18 - 45, 18 - 40, 18 - 35, 18 - 30, 18 - 25, 또는 18 - 20개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94 , 95 96, 97 ,98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194 , 195, 196, 197, 198, 199 또는 200개의 뉴클레오티드 염기 쌍으로 구성된다.

일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 200개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 150개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 100개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 80개의 뉴클레오티드 염기 쌍으로 구성된다.

일부 구현예에서, DR1과 DR2는 25% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 30% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 35% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 40% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 45% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 50% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 60% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 65% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 70% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 75% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 80% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 85% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 90% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 95% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 99% 이상의 뉴클레오티드 서열 동일성을 공유한다. 일부 구현예에서, DR1과 DR2는 100%의 뉴클레오티드 서열 동일성을 공유한다.

바람직한 구현예들에서, DR1과 DR2는 서로 동일한 방향으로 위치한다 (즉, 이는 동향 탠덤 리피트임).

5.2.3. 타겟 DNA 단편

적출성 핵산 구조체는 타겟 DNA 단편 (D)을 포함한다. 일부 구현예에서, 타겟 DNA 단편 (D)는 제1 호밍 엔도뉴클레아제 인지부 (ES1)의 3'에 위치한다. 일부 구현예에서, 제2 호밍 엔도뉴클레아제 인지부 (ES2)가 존재하는 경우에는, 타겟 DNA 단편 (D)은 ES2의 5'에 위치한다. 일부 구현예에서, 타겟 DNA 단편 (D)은 제1 호밍 엔도뉴클레아제 인지부 (ES1)의 3'과 제2 탠덤 리피트 (DR2)의 5'에 위치한다. 일부 구현예에서, 타겟 DNA 단편 (D)은 제1 탠덤 리피트 (DR1)의 3'과 제1 호밍 엔도뉴클레아제 인지부 (ES1)의 5'에 위치한다.

일부 구현예에서, D의 5' 말단은 ES1의 3' 말단에 위치한다. 일부 구현예에서, D의 5' 말단은 ES1의 3'에 바로 인접하여 위치한다. 일부 구현예에서, D의 5' 말단은 ES1의 3' 말단으로 하류에 위치한다.

일부 구현예에서, D의 5' 말단은 DR1의 3' 말단에 위치한다. 일부 구현예에서, D의 5' 말단은 DR1의 3' 말단에 바로 인접하여 위치한다. 일부 구현예에서, D의 5' 말단은 DR1의 3' 말단으로 하류에 위치한다.

일부 구현예에서, ES1이 ES2와 조합하여 존재하는 경우, D의 3' 말단은 ES2의 5' 말단에 위치한다. 일부 구현예에서, ES1이 ES2와 조합하여 존재하는 경우, D의 3' 말단은 ES2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, ES1이 ES2와 조합하여 존재하는 경우, D의 3' 말단은 ES2의 5' 말단으로 상류에 위치한다.

일부 구현예에서, D의 3' 말단은 DR2의 5' 말단에 위치한다. 일부 구현예에서, D의 3' 말단은 DR2의 5' 말단에 바로 인접하여 위치한다. 일부 구현예에서, D의 3' 말단은 DR2의 5' 말단으로 상류에 위치한다.

타겟 DNA 단편은 당해 기술 분야의 당업자에게 유용한 것으로 간주되는 임의의 타겟 DNA 단편일 수 있다. 예를 들어, 타겟 DNA 단편은 숙주 게놈에서 "낫 인"된 다음 적출에 의해 낫 아웃될 수 있는 대상 유전자를 포함할 수 있다. 일부 구현예에서, 타겟 핵산은 적출성 핵산 구조체의 숙주 게놈으로의 병합을 선별하기 위해 이용할 수 있으며, 이후 적출에 의해 숙주 게놈으로부터 제거될 수 있는 선별 마커를 포함할 수 있다.

유용한 타겟 DNA 단편의 예로는 단백질 코팅 서열, 선별 마커, 리포터 유전자, 형광 마커 코딩 서열, 프로모터, 인핸서, 종결인자, 전사 활성인자, 전사 억제인자, 전자 활성인자 결합부, 전사 억제인자 결합부, 인트론, 엑손, 폴리-A 꼬리, 다중 클로닝 부위, 핵 국지화 신호, mRNA 안정화 신호, 병합 유전자 좌, 에피토프 테그 코딩 서열, 분해 신호 또는 임의의 그외 천연 또는 합성 DNA 분자가 있으나, 이로 한정되지 않는다. 일부 구현예에서, DNA 단편은 천연 기원의 것일 수 있다. 다른 구현예에서, 타겟 DNA 단편은 시험관에서 제조되는 완전한 합성 기원의 것일 수 있다. 아울러, 타겟 DNA 단편은 분리된 천연 DNA 분자들의 임의 조합 또는 분리된 천연 DNA 분자와 합성 DNA 분자의 임의 조합을 포함할 수 있다. 예를 들어, 타겟 DNA 단편은 단백질 코딩 서열에 작동가능하게 연결된 이종 프로모터, 폴리-A 꼬리에 연결된 단백질 코딩 서열, 에피토프 테그 코딩 서열과 인 프래임으로 연결된 단백질 코딩 서열 등을 포함할 수 있다. 타겟 DNA 단편은 클로닝된 DNA (예, DNA "라이브러리")로부터 화학 합성에 의해, cDNA 클로닝에 의해, 또는 게놈 DNA 또는 이의 단편의 클론닝에 의해, 바람직한 세포로부터 정제하여, 또는 PCR 증폭 및 클로닝에 의해, 당해 기술 분야에 공지된 표준 공정들에 의해 수득할 수 있다. 예를 들어, Sambrook et al., Molecular Cloning, A Laboratory Manual, 3d. ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001); Glover, D.M. (ed.), DNA Cloning: A Practical Approach, 2d. ed., MRL Press, Ltd., Oxford, U.K. (1995)를 참조한다.

일부 구현예에서, D는 호밍 엔도뉴클레아제를 코딩하는 핵산에 작동가능하게 연결된 프로모터 인자를 포함한다. 예를 들어, 적출성 핵산 구조체가 예컨대 호밍 엔도뉴클레아제 F-CphI에 대한 제1 및 제2 인지부를 포함하는 경우, 타겟 DNA 단편은 F-CphI을 코딩하는 핵산 서열을 포함할 수 있으며, 핵산 서열은 프로모터 인자에 작동가능하게 연결된다. 개개 구현예들에서, 호밍 엔도뉴클레아제를 코딩하는 핵산의 발현을 제어하는 프로모터 인자는, 호밍 엔도뉴클레아제를 코딩하는 서열을 비롯한 타겟 DNA 단편이, 예컨대 숙주 세포 게놈으로 적출성 핵산 구조체가 병합된 후, 선택적으로 적출될 수 있도록, 유도성 프로모터, 예를 들어, 사카로마이세스 세레비지애의 갈락토스 유도성 프로모터 (예, GAL1, GAL7 및 GAL10 유전자들의 프로모터)이다. 일부 구현예에서, 호밍 엔도뉴클레아제는 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택된다. 특정 구현예들에서, 호밍 엔도뉴클레아제는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-NgrI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, PI-MtuII, I-CsmI, I-PanI, I-CeuI 및 PI-SceI으로 이루어진 군으로부터 선택된다. 개개 구현예들에서, 호밍 엔도뉴클레아제는 I-SceI이다. 특정 구현예들에서, 호밍 엔도뉴클레아제는 F-CphI이다.

일부 구현예에서, D는 하나 이상의 선별 마커를 코딩한다. 일부 구현예에서, 선별 마커는 항생제 내성 마커이다. 항생제 내성 마커는 재조합 핵산 서열을 제조하기 위해 사용되는 플라스미드 벡터들에서 일반적이다. 예를 들어, pBR 및 pUC-유래 플라스미드는 박테리아 약물 내성 마커 AMP ^r 또는 BLA 유전자를 선별 마커로서 포함한다 (Sutcliffe, J. G., et al., Proc. Natl. Acad. Sci. U.S.A. 75:3737 (1978)). BLA 유전자는, 베타-락타마제로 기능하며, 협역성(narrow-spectrum) 세팔로스포린, 세파마이신 및 카바페넴 (에르타페넴), 세파만돌, 세포페라존, 및 테목실린을 제외한 모든 항-그람 음성 박테리아 페니실린류들 등의, 베타-락탐 항생제에 대한 박테리아 내성을 담당하는, 효소 Tem-1을 코딩한다.

그외 이용가능한 선별 마커로는 NAT1, PAT, AUR1-C, PDR4, SMR1, CAT, 마우스 dhfr, HPH, DSDA, KAN ^R , 및 SH BLE 유전자가 있으나, 이로 한정되지 않는다. S. 노우르세이(S. noursei)의 NAT1 유전자는 노우르세오트리신(노르세오트리신) N-아세틸트랜스퍼라제를 코딩하며, 노우르세오트리신에 대한 내성을 부여한다. S. 비리도크로모게네스 (S. viridochromogenes) Tu94의 PAT 유전자는 포스피노트리신 N-아세틸트랜스퍼라제를 코딩하며, 바이알로포스(bialophos)에 대한 내성을 부여한다. 사카로마이세스 세레비지애의 AUR1-C 유전자는, 출아 효모 사카로마이세스 세레비지애에 유해한 아우레오바시디윰 풀룰란스(Auerobasidium pullulans)로부터 생산되는 항진균 항생제인 아우레로바시딘 A (AbA)에 대한 내성을 부여한다. PDR4 유전자는 세룰레닌(cerulenin)에 대한 내성을 부여한다. SMR1 유전자는 설포메투론 메틸에 대한 내성을 부여한다. Tn9 유래 CAT 코딩 서열은 클로람페니콜에 대한 내성을 부여한다. 마우스 dhfr 유전자는 메토트렉세이트에 대한 내성을 부여한다. 클렙시엘라 뉴모니아 (Klebsiella pneumonia)의 HPH 유전자는 히그로마이신 B 포스포트랜스퍼라제를 코딩하며, 히그로마이신 B에 대한 내성을 부여한다. E. coli의 DSDA 유전자는 D-세린 디아미나제를 코딩하며, 효모가 단독 질소원으로서 D-세린이 첨가된 플레이트에서 생장할 수 있도록 만든다. Tn903 트랜스포존의 KAN ^R 유전자는 아미노글리코사이드 포스포트랜스퍼라제를 코딩하며, G418에 대한 내성을 부여한다. 스트렙토알로테이쿠스 힌두스타누스(Streptoalloteichus hindustanus)의 SH BLE 유전자는 제오신 결합 단백질을 코딩하며, 제오신 (블레오마이신)에 대한 내성을 부여한다.

다른 구현예들에서, 선별 마커는 효모 숙주 균주의 형질전환된 세포를 선별할 수 있게 하는 효모 유전자를 포함한다. 일부 구현예에서, 선별 마커는 숙주 균주에서 영양 요구성(auxotrophy), 예컨대 영양성 요구성(nutritional auxotrophy)을 복원시킨다. 이러한 구현예에서, 숙주 균주는, 예를 들어 HIS3, LEU2, LYS1, MET15 및 TRP1와 같은 영양 요구 표현형을 유발하는 숙주의 아미노산 생합성 경로의 하나 이상의 유전자의 기능적 파괴, 또는 예를 들어 ADE2 및 URA3와 같은 영양 요구 표현형을 유발하는 숙주의 뉴클레오티드 생합성 경로의 하나 이상의 유전자의 기능적 파괴를 포함한다. 개개 구현예들에서, 유전자 변형된 효모 숙주 균주는 URA3 유전자의 기능적 파괴를 포함한다. 숙주 효모에서의 영양 요구 표현형을 유발하는 기능적 파괴는 점 돌연변이, 부분 또는 전체 유전자 결손, 또는 뉴클레오티드의 부가 또는 치환일 수 있다. 아미노산 또는 뉴클레오티드 생합성 경로에서의 기능적 파괴는, 숙주 균주가, 자가 영양의 야생형 균주와는 대조적으로, 한가지 이상의 영양분을 첨가하지 않고는 배지에서 최적으로 생육할 수 없는, 영양 요구성 돌연변이가 되도록 만든다. 숙주 균주에서 기능적으로 파괴된 생합성 유전자는, 예컨대 파괴된 생합성 유전자의 기능성 카피를 포함하는 하나 이상의 플라스미드의 도입시, 나중에 복구될 수 있는 영양 요구성 유전자 마커로서 사용할 수 있다.

선별 마커로서 URA3, TRP1 및 LYS2 효모 유전자를 이용하는 것은, 양성 및 음성 선별 둘다가 가능하므로, 특히 유익하다. 양성 선별은 URA3, TRP1 및 LYS2 돌연변이의 영양 요구성 보완 (auxotrophic complementation)에 의해 이루어지는 반면, 음성 선별은 자가 영양성 균주의 생육은 저해하지만 URA3, TRP1 및 LYS2 돌연변이 각각의 생육은 허용하는, 특이적인 저해제들, 즉 5-플루오로-오로트산 (FOA), 5-플루오로안트라닐산 및 a-아미노아디프산 (aAA)을 토대로 한다. URA3 유전자는 우라실의 생합성에 필수적인 효소인 오로티딘-5' 포스페이트 데카르복실라제를 코딩한다. Ura3- (또는 ura5-) 세포는, 데카르복실라제의 작용에 의해 FOA가 독성 화합물 5-플루오로우라실로 변환되는 것으로 보이므로, ura3- 세포가 아닌 모든 URA3+ 세포를 사멸시키는, FOA가 함유된 배지에서 선별할 수 있다. FOA 배지에서의 음성 선별은 구별성이 양호하며, 통상적으로 FOA-내성 콜로니의 10^-2 미만이 Ura+이다. FOA 선별 공정을 이용하여 반수체 균주에서 돌연변이 유도에 의해 ura3 마커를 만들 수 있으며, 보다 중요하게는, URA3-함유 플라스미드를 가지고 있지 않은 세포를 선별할 수 있다. TRP1 유전자는 트립토판 생합성 공정의 3번째 단계를 촉매하는 포스포리보실안트라닐레이트 이소머라제를 코딩한다. 5-플루오로안트라닐산을 이용한 역선별은 안트라닐산을 트립토판으로 변환시키는데 필수적인 효소가 없어 5-플루오로안트라닐산에 내성을 나타내는 균주에 의한 항-대사(antimetabolism)를 수반한다. LYS2 유전자는 라이신을 생합성하는데 필요한 효소인 아미노아디페이트 리덕타제를 코딩한다. 정상 균주가 아닌 Lys2- 및 lys5- 돌연변이들은 정상 질소원이 결핍된 라이신 및 aAA 함유 배지에서 생육한다. 명백하게도, lys2와 lys5 돌연변이들은 고농도의 aAA에 의해 형성되는 라이신 생합성의 유해한 중간산물의 축적을 야기한다. FOA 선별 공정과 마찬가지로, LYS2 함유 플라스미드를 lys2 숙주에서 편리하게 제거할 수 있다.

다른 구현예에서, 선별 마커는 영양 요구성 돌연변이를 복원시키는 마커 이외의 마커이다. 예를 들어, 효모 숙주 세포 균주는 다른 영양 요구성 돌연변이, 예컨대, 숙주에 치명적이지 않으며, 또한 돌연변이를 공지 선별 방법으로 동정할 수 있는 한, 예로 공업적인 발효에서, 균주의 의도한 용도에 부정적인 효과를 야기하지 않는 돌연변이를 포함할 수 있다.

5.2.4. 게놈 병합 서열

일부 구현예에서, 적출성 핵산 구조체는 제1 및 제2 게놈 병합 서열을 포함한다. 상기 게놈 병합 서열은, 본원에 기술된 적출성 핵산 구조체가, 예컨대 숙주 세포 매개의 상동성 재조합에 의해 숙주 세포의 게놈으로 병합될 수 있도록 허용한다. 상동적인 재조합에 의해 적출성 핵산 구조체를 게놈에 병합하기 위해, 적출성 핵산 구조체는, 바람직하게는 상류 게놈 병합 서열 (IS1)을 포함하는 핵산 서열과 하류 게놈 병합 서열 (IS2)을 포함하는 다른 말단 핵산 서열을 포함하며, 각 게놈 병합 서열은 그 염색체를 가진 숙주 세포에 의한 상동성 재조합이 개시될 만큼 충분한 길이와 서열 동일성을 가진다. 일부 구현예에서, 제1 게놈 병합 서열 (IS1)은 제1 탠덤 리피트 (DR1)의 5'에 위치하며, 제2 게놈 병합 서열 (IS2)은 제2 탠덤 리피트 (DR2)의 3'에 위치한다.

특정 구현예들에서, IS1은 DR1의 5'에 위치한다. 일부 구현예에서, IS1은 DR1의 5'에 바로 인접하여 위치한다. 일부 구현예에서, IS1은 DR1의 5'으로 상류에 위치한다.

특정 구현예들에서, IS2는 DR2의 3'에 위치한다. 일부 구현예에서, IS2는 DR2의 3'에 바로 인접하여 위치한다. 일부 구현예에서, IS2는 DR2의 3'으로 하류에 위치한다.

제1 및 제2 게놈 병합 서열은 상동적인 재조합을 통해 적출성 핵산 구조체가 숙주 세포 게놈, 예컨대 효모 게놈의 특정 유전자 좌에 병합될 수 있게 한다. 적출성 핵산 구조체를 숙주 세포 게놈으로 타겟화된 방식으로 병합시키는 것은 유용한 이점을 제공해 줄 수 있다. 예를 들어, 적출성 핵산 구조체는 숙주 세포 게놈내에 대상 유전자를 병합시키며, 따라서 대상 유전자를 "낫 아웃"시켜 비기능성이 되게 할 수 있다 (도 2). 다른 예로, 적출성 핵산 구조체를 타겟화된 방식으로 병합시키는 것은, 예를 들어 대상 유전자의 발현을 활성화하거나 상향-조절하기 위해, 특정 게놈 유전자 좌에 대상 유전자를 "낫 인"하거나 또는 대상 유전자 주변의 조절 인자들을 "낫 인"하는데 유용할 수 있다.

개개 게놈 유전자 좌로의 적출성 핵산 구조체의 병합에 영향을 미칠 수 있는 특성으로는, 게놈 병합 서열의 길이, 적출성 핵산 구조체의 전체 길이 및 게놈 병합 유전자 좌의 뉴클레오티드 서열 또는 위치를 포함하나, 이로 한정되지 않는다. 예를 들어, 숙주 세포 게놈에서 게놈 병합 서열 한 가닥과 특정 유전자 좌의 한가닥 간의 효과적인 헤테로두플렉스 형성은 게놈 병합 서열의 길이에 좌우될 수 있다. 게놈 병합 서열의 유효한 길이 범위는 뉴클레오티드 50 내지 5,000개이다. 게놈 병합 서열과 게놈 유전자 좌 간의 유효한 상동성 길이에 대한 내용은 Hasty et al., Mol Cell Biol 11:5586-91 (1991)을 참조한다.

IS1과 IS2는 적출성 핵산 구조체의 게놈 병합을 허용하는 숙주 세포 게놈 유전자 좌에 대해 충분한 길이와 서열 동일성을 가진 임의의 뉴클레오티드 서열을 포함할 수 있다. 일부 구현예에서, "충분한 서열 동일성"은 서열이 20 bp(base pair) 이상, 50 bp 이상, 100 bp 이상, 250 bp 이상, 500 bp 이상, 또는 500 bp 이상의 길이에 대해, 숙주 세포 게놈 유전자 좌와 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 동일성을 가지는 것을 지칭한다. 특정 구현예들에서, 숙주 세포 게놈 유전자 좌의 길이는 뉴클레오티드 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900 또는 5,000개이다. 서열 동일성 수준은, 디폴트 파라미터를 이용하여, BLAST 2.2.2 또는 FASTA version 3.0t78과 같은, 본원에 기술된 것을 비롯하여, 임의의 컴퓨터 프로그램과 관련 파라미터를 이용하여 결정할 수 있다.

특정 구현예들에서, 각각의 IS1과 IS2는, 원핵생물의 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 충분한 길이와 원핵 생물 게놈 유전자 좌에 대한 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 각각의 IS1과 IS2는, 진핵생물의 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 진핵 생물 게놈 유전자 좌에 대한 충분한 길이와 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 각각의 IS1과 IS2는, 효모 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 효모 게놈 유전자 좌에 대한 충분한 길이와 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 각각의 IS1과 IS2는, 사카로마이세스 세레비지애(Saccharomyces cerevisiae)의 게놈 유전자 좌로의 적출성 핵산 구조체의 병합을 허용하기 위해, 사카로마이세스 세레비지애의 게놈 유전자 좌에 대한 충분한 길이와 서열 동일성을 가진 뉴클레오티드 서열을 포함한다. 적출성 핵산 구조체를 병합시키기에 적합한 사카로마이세스 세레비지애 게놈 유전자 좌로는 NDT80, HO, GAL80, HTX3, GAL2 및 GAL1-GAL10-GAL7 유전자 좌를 포함하나, 이로 한정되지 않는다.

특정 구현예에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 50 - 5,000개로 구성된다. 특정 구현예에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 50 - 5,000개를 포함한다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 100 - 2,500개로 구성된다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 100 - 1,000개로 구성된다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 250 - 750개로 구성된다. 특정 구현예들에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900 또는 5,000개로 구성된다. 일부 구현예에서, 각각의 IS1과 IS2는 독립적으로 뉴클레오티드 약 500개로 구성된다.

제1 및 제2 게놈 병합 서열을 포함하는 적출성 핵산 구조체는 당해 기술 분야의 당업자에게 자명한 임의의 기법을 이용하여 제조할 수 있다. 특정 구현예들에서, 제1 및 제2 병합 서열을 포함하는 적출성 핵산 구조체는 당해 기술 분야에 공지된 오버랩 연장 PCR 및 분자 클로닝 기법을 이용하여 제조한다. 예를 들어, 미국 특허 공개공보 2010/0136633, 미국 특허 5,023,171 (과다 연장 PCR에 의한 스플라이싱); Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3^rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY를 참조한다.

5.3 숙주 세포

다른 측면에서, 본 발명은 전술한 적출성 핵산 구조체를 포함하는 숙주 세포를 제공한다. 특정 구현예들에서, 숙주 세포는 숙주 세포 게놈에 병합된 적출성 핵산 구조체를 포함한다.

적합한 숙주 세포는 염색체 또는 에피좀 유전자 좌로부터의 타겟 DNA 단편의 적출이 바람직한 모든 세포를 포함한다. 일부 구현예에서, 숙주 세포는 원핵 세포이다. 일부 구현예에서, 숙주 세포는 박테리아 세포이다. 일부 구현예에서, 숙주 세포는 에세리키아 콜라이(Escherichia coli) 세포이다. 일부 구현예에서, 숙주 세포는 진핵 생물 세포이다. 일부 구현예에서, 숙주 세포는 진핵 생물 세포이다. 일부 구현예에서, 숙주 세포는 포유류 세포이다. 일부 구현예에서, 숙주 세포는 중국 햄스터 난소 (CHO) 세포, COS-7 세포, 마우스 섬유모세포, 마우스 배아 암 세포 또는 마우스 배아 줄기 세포이다. 일부 구현예에서, 숙주 세포는 곤충 세포이다. 일부 구현예에서, 숙주 세포는 S2 세포, Schneider 세포, S12 세포, 5B1-4 세포, Tn5 세포 또는 Sf9 세포이다. 일부 구현예에서, 숙주 세포는 단세포성 진핵 유기체 세포이다.

일부 구현예에서, 숙주 세포는 효모 세포이다. 일부 구현예에서, 숙주 세포는 이배체 효모 세포이다. 일부 구현예에서, 숙주 세포는 반수체 효모 세포이다. 이용가능한 효모 숙주 세포로는, 미생물 기탁기관 (예, IFO, ATCC 등)에 기탁된 효모 세포와, 특히 속명 아시쿨로코니듐(Aciculoconidium), 암브로시오지마(Ambrosiozyma), 아르트로아스쿠스(Arthroascus), 아르시오지마(Arxiozyma), 아시비아(Ashbya), 밥예비아(Babjevia), 벤싱토니아(Bensingtonia), 보트리요아스쿠스(Botryoascus), 보트리요지마(Botryozyma), 브레타노마이세스(Brettanomyces), 불레라(Bullera), 불레로마이세스(Bulleromyces), 칸디다(Candida), 시테로마이세스(Citeromyces), 클라비스포라(Clavispora), 크립토코커스(Cryptococcus), 시스토필로바시듐(Cystofilobasidium), 데바리요마이세스(Debaryomyces), 데카라(Dekkara), 디포다스콥시스(Dipodascopsis), 디포다스쿠스(Dipodascus), 이니엘라(Eeniella), 엔도마이콥셀라(Endomycopsella), 에레마스쿠스(Eremascus), 에레모테시움(Eremothecium), 에리트로바시듐(Erythrobasidium), 펠로마이세스(Fellomyces), 필로바시듐(Filobasidium), 갈락토마이세스(Galactomyces), 지오트리쿰(Geotrichum), 길리어몬델라(Guilliermondella), 한세니아스포라(Hanseniaspora), 한세뉼라(Hansenula), 하세가와이아(Hasegawaea), 홀터마니아(Holtermannia), 호르모아스쿠스(Hormoascus), 히포피키아(Hyphopichia), 이사첸키아(Issatchenkia), 클로엑케라(Kloeckera), 클로에케라스포라(Kloeckeraspora), 클루이베로마이세스(Kluyveromyces), 콘도아(Kondoa), 쿠라이시아(Kuraishia), 쿠르츠마노마이세스(Kurtzmanomyces), 루코스포리듐(Leucosporidium), 리포마이세스(Lipomyces), 로데로마이세스(Lodderomyces), 말라세지아(Malassezia), 메츠크니코위아(Metschnikowia), 마라키아(Mrakia), 믹소지마(Myxozyma), 나드소니아(Nadsonia), 나카자와이아(Nakazawaea), 네마토스포라(Nematospora), 오가타이아(Ogataea), 오스포리듐(Oosporidium), 파키솔렌(Pachysolen), 파키티코스포라(Phachytichospora), 파피아(Phaffia), 피키아(Pichia), 로도스포리듐(Rhodosporidium), 로도토룰라(Rhodotorula), 사카로마이세스(Saccharomyces), 사카로마이코데스(Saccharomycodes), 사카로마이콥시스(Saccharomycopsis), 사이토엘라(Saitoella), 사카구키아(Sakaguchia), 사투라노스포라(Saturnospora), 시조블라스토스포리온(Schizoblastosporion), 시조사카로마이세스(Schizosaccharomyces), 슈반니오마이세스(Schwanniomyces), 스포리디오볼루스(Sporidiobolus), 스포로볼로마이세스(Sporobolomyces), 스포로파키더미아(Sporopachydermia), 스테파노아스쿠스(Stephanoascus), 스테리그마토마이세스(Sterigmatomyces), 스테리그마토스포리듐(Sterigmatosporidium), 심바이오타프리나(Symbiotaphrina), 심포디오마이세스(Sympodiomyces), 심포디오마이콥시스(Sympodiomycopsis), 토룰라스포라(Torulaspora), 트리코스포리엘라(Trichosporiella), 트리코스포론(Trichosporon), 트리고놉시스(Trigonopsis), 츠키야이아(Tsuchiyaea), 우데니오마이세스(Udeniomyces), 왈토마이세스(Waltomyces), 위커하미아(Wickerhamia), 위커하미엘라(Wickerhamiella), 윌리옵시스(Williopsis), 야마다지마(Yamadazyma), 야로이야(Yarrowia), 지고아스쿠스(Zygoascus), 지고사카로마이세스(Zygosaccharomyces), 지고윌리옵시스(Zygowilliopsis) 및 지고지마(Zygozyma)에 속하는 효모 세포를 포함한다.

일부 구현예에서, 효모 숙주 세포는 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포, 피키아 파스토리스(Pichia pastoris) 세포, 시조사카로마이세스 품베(Schizosaccharomyces pombe) 세포, 데케라 브룩셀렌시스(Dekkera bruxellensis) 세포, 클루이베로마이세스 락티스(Kluyveromyces lactis) 세포, 아르술라 아데니니보란스(Arxula adeninivorans) 세포 또는 한세뉼라 폴리모르파(Hansenula polymorpha) (현재는 피키아 안구스타(Pichia angusta)라 함) 세포이다. 특정 구현예에서, 효모 숙주 세포는 사카로마이세스 세레비지애 세포이다. 일부 구현예에서, 효모 숙주 세포는 사카로마이세스 프라길리스(Saccharomyces fragilis) 세포 또는 클루이베로마이세스 락티스(Kluyveromyces lactis) (종래에는 사카로마이세스 락티스(Saccharomyces lactis)로 지칭되었음) 세포이다. 일부 구현예에서, 효모 숙주 세포는 칸디다 리폴리티카(Candida lipolytica), 칸디다 길리어몬디이(Candida guilliermondii), 칸디다 크루세이(Candida krusei), 칸디다 슈도트로피칼리스(Candida pseudotropicalis) 또는 칸디다 유틸리스(Candida utilis) 등의 칸디다 속에 속하는 세포이다. 다른 특정 구현예에서, 효모 숙주 세포는 클루베로마이세스 마르시아누스(Kluveromyces marxianus) 세포이다.

개개 구현예들에서, 효모 숙주 세포는 빵 효모 세포, CBS 7959 세포, CBS 7960 세포, CBS 7961 세포, CBS 7962 세포, CBS 7963 세포, CBS 7964 세포, IZ-1904 세포, TA 세포, BG-1 세포, CR-1 세포, SA-1 세포, M-26 세포, Y-904 세포, PE-2 세포, PE-5 세포, VR-1 세포, BR-1 세포, BR-2 세포, ME-2 세포, VR-2 세포, MA-3 세포, MA-4 세포, CAT-1 세포, CB-1 세포, NR-1 세포, BT-1 세포 및 AL-1 세포로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 세포이다. 일부 구현예에서, 숙주 세포는 PE-2 세포, CAT-1 세포, VR-1 세포, BG-1 세포, CR-1 세포 및 SA-1 세포로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 세포이다. 특정 구현예에서, 사카로마이세스 세레비지애 숙주 세포는 PE-2 세포이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 숙주 세포는 CAT-1 세포이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 숙주 세포는 BG-1 세포이다.

특정 구현예들에서, 전술한 바와 같이 적출성 핵산 구조체는 외인성 핵산을 당해 기술 분야에 공지된 세포에 도입하기 위한 모든 공지된 기법을 이용하여 숙주 세포에 도입할 수 있다. 이러한 방법으로는, 세포에 의한 용액으로부터 분자의 직접 흡수 또는 예컨대 리포솜 또는 면역리포솜을 이용한 리포펙션을 통한 촉진화된 흡수; 입자-매개 형질감염 등이 있으나, 이로 한정되지 않는다. 예로, 미국 특허 5,272,065; Goeddel et al., eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al., 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참조한다. 구체적인 효모 세포 형질 방법들은 당해 기술 분야에 잘 알려져 있다. Hinnen et al., Proc. Natl. Acad. Sci. USA 75:1292-3 (1978); Cregg et al., Mol. Cell. Biol. 5:3376-3385 (1985)를 참조한다. 기법의 예로는 스페로플라스팅(spheroplasting), 전기천공, PEG1000 매개 형질전환 및 리튬 아세테이트 또는 리튬 클로라이드 매개 형질전환을 포함하나, 이로 한정되지 않는다.

5.4 호밍 엔도뉴클레아제 발현 벡터

다른 측면에서, 본 발명은 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 타겟 DNA 단편을 적출하는데 유용한 호밍 엔도뉴클레아제를 코딩하는 발현 벡터를 제공한다.

특정 구현예들에서, 발현 벡터는 LAGLIDADG (서열번호 1) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG (서열번호 2) 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩한다. 특정 구현예들에서, 발현 벡터는 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-NgrI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, PI-MtuII, I-CsmI, I-PanI, I-CeuI 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩한다. 개개 구현예들에서, 발현 벡터는 I-SceI을 코딩한다. 특정 구현예들에서, 발현 벡터는 F-CphI을 코딩한다.

호밍 엔도뉴클레아제 발현 벡터는 숙주 세포에서 호밍 엔도뉴클레아제를 발현시킬 수 있는 임의의 발현 벡터이다. 적합한 발현 벡터로는 에세리키아 콜라이(Escherichia coli), 효모 또는 포유 세포에서 유전자의 발현에 이용하기 위한 공지된 벡터를 포함하나, 이로 한정되지 않는다. 에세리키아 콜라이 발현 벡터의 예로는 pSCM525, pDIC73, pSCM351 및 pSCM353가 있으나, 이로 한정되지 않는다. 호모 발현 벡터의 예로는 pPEX7과 pPEX408이 있으나, 이로 한정되지 않는다. 적합한 발현 벡터의 다른 예로는 CEN.ARS 서열 및 효모 선별 마커를 포함하는 효모-에세리키아 콜라이 pRS 시리즈의 셔틀 벡터; 및 2μ 플라스미드를 포함한다.

특정 구현예들에서, 호밍 엔도뉴클레아제 발현 벡터는 발현 벡터를 포함하는 숙주 세포를 선별할 수 있는 선별 마커를 추가로 포함한다. 특정 구현예들에서, 선별 마커는 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성, 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택된다.

특정 구현예들에서, 발현 벡터는 호밍 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열이 작동가능하게 연결된 전사 종결 서열과 프로모터를 더 포함한다. 일부 구현예에서, 프로모터는 구성적인 프로모터(constitutive promoter)이다. 일부 구현예에서, 프로모터는 유도성 프로모터이다.

효모 세포에 사용하기 적합한 프로모터에 대한 예시적인 예로는, 클루이베로마이세스 락티스(Kluyveromyces lactis)의 TEF1 유전자 프로모터, 사카로마이세스 세레비지애의 PGK1 유전자 프로모터, 사카로마이세스 세레비지애의 TDH3 유전자 프로모터, 억제성 프로모터, 예컨대 사카로마이세스 세레비지애의 CTR3 유전자 프로모터, 및 유도성 프로모터, 예컨대 사카로마이세스 세레비지애의 갈락토스 유도 프로모터 (예, GAL1, GAL7, 및 GAL10 유전자 프로모터)를 포함하지만, 이들로 한정되진 않는다.

일부 구현예에서, 핵 국지화 서열 (NLS)을 포함하는 추가적인 뉴클레오티드 서열은 호밍 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열의 5'에 연결된다. NLS는 보다 큰 (>25 kD) 호밍 엔도뉴클레아제의 핵 국지화를 촉진시킬 수 있다. 일부 구현예에서, 핵 국지화 서열은 SV40 핵 국지화 서열이다. 일부 구현예에서, 핵 국지화 서열은 효모 핵 국지화 서열이다.

호밍 엔도뉴클레아제 발현 벡터는 당해 기술 분야에 자명한 임의의 기법으로 제작할 수 있다. 특정 구현예에서, 벡터는 당해 기술 분야에 잘 공지된 중합효소 연쇄 반응 (PCR)과 분자 클로닝 기법을 이용하여 제조한다. 예로, PCR Technology: Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3^rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY를 참조한다.

5.5 타겟 DNA 단편의 적출법

다른 측면에서, 본 발명은 전술한 하나 이상의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 타겟 DNA 단편 하나 이상을 적출하는 방법을 제공한다. 특정 구현예에서, 본 방법은, 숙주 세포에서 적출성 핵산 구조체, 예컨대 염색체에 병합된 핵산 구조체를 호밍 엔도뉴클레아제와 접촉시켜, 하나 이상의 호밍 엔도뉴클레아제 인지부를 호밍 엔도뉴클레아제로 절단하거나 이에 인접하여 절단하는 단계를 포함한다. 일부 구현예에서, 호밍 엔도뉴클레아제는 각각의 호밍 엔도뉴클레아제 인지부를 또는 이 인지부의 인접부를 절단한다.

적출성 핵산 구조체는 당해 기술 분야의 당업자에게 적합한 것으로 간주되는 임의의 기법으로 호밍 엔도뉴클레아제와 접촉시킬 수 있다. 특정 구현예에서, 호밍 엔도뉴클레아제는 호밍 엔도뉴클레아제 발현 벡터를 이용하여 숙주 세포내에서 발현된다. 전술한 발현 벡터를 비롯하여, 임의의 호밍 엔도뉴클레아제 발현 벡터가 이용될 수 있다. 호밍 엔도뉴클레아제 발현 벡터는, 타겟 DNA 단편의 적출 후 발현 벡터를 포함하지 않는 숙주 세포를 선별할 수 있는, 선별 마커, 예컨대 역-선별 마커를 포함할 수 있다. 사용되는 발현 벡터는 또한 선별 마커를 구비하지 않는 일과성 벡터이거나, 또는 선별되지 않는 벡터일 수도 있다. 개별 구현예들에서, 일과성 벡터를 포함하는 숙주 세포의 자손은 시간 경과에 따라 벡터를 상실하게 된다. 다른 구현예에서, 적출성 핵산 구조체는 정제된 형태의 호밍 엔도뉴클레아제와 접촉될 수 있다.

일부 구현예에서, ES1과 ES2 각각의 절단으로 핵산 단편 (도 3A 및 3B) 3개가 유리하게 형성된다: (1) 게놈 핵산의 좌측 암; (2) 타겟 DNA 단편을 포함하는 핵산 단편; 및 (3) 게놈 핵산의 우측 암. 숙주 세포에서 발견되는 내인성 5' → 3' 엑소뉴클레아제는, 절단 후, 각 핵산 단편에서 한가닥을 신속하게 분해하여, 타겟 DNA를 포함하는 핵산 단편을 파괴하고, 상보성 영역으로서 DR1과 DR2를 포함하는 (도 4A) 게놈 핵산의 좌 (4) 및 우(5)측 암에 긴 3' 꼬리가 남게 된다 (도 3C). 상기 상보성 영역들이 헤테로두플렉스(도 4B, 6)를 형성하게 되어, 숙주 세포 단백질에 의해 촉매되는 재조합이 수행된다. 일부 구현예에서, 상보성 영역들은 유익하게는 단일 가닥 어닐링 경로를 통해 재조합이 이루어진다. 우 (7) 및 좌 (8) 측 암의 꼬리의 3' 최말단은 상보적이지 않아, 상보적인 영역들에 의해 형성된 헤테로두플렉스에서 돌출되게 된다. 이들 비-상보적인 3' 최말단은 바람직하게는 flap 뉴클레아제에 의해 절단된다. 최종적으로, 복구 DNA 합성 및 DNA 리가제로 헤테로두플렉스이 메워지고, 닉(nick)이 연결됨으로써, 타겟 핵산이 정확하게 적출된 온전한 게놈 핵산이 만들어진다 (도 4C). DR1과 DR2가 서로 100%의 뉴클레오티드 서열 동일성을 공유하는 구현예에 있어서, DR1과 DR2는 바람직하게는 재조합되어, DR1 및 DR2와 뉴클레오티드 서열 동일성 100%를 공유하는 제3 탠덤 리피트를 포함하는 게놈 핵산이 만들어진다.

다른 측면에서, 본 발명은, 2 이상의 적출성 핵산 구조체가 게놈에 병합된 숙주 세포의 게놈으로부터 2 이상의 타겟 핵산을 동시에 적출하는 방법을 제공한다. 일부 구현예에서, 본 방법은, 하나 이상의 호밍 엔도뉴클레아제가 각 적출성 핵산 구조체의 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 적어도 하나를 절단하거나 이에 인접하여 절단하도록, 숙주 세포에서 2 이상의 적출성 핵산 구조체를 하나 이상의 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함한다.

일부 구현예에서, 숙주 세포는, 각 적출성 핵산 구조체가 고유한 ES 부위를 포함하는, 즉, ES 부위가 숙주 세포에서 다른 적출성 핵산 구조체와 공유되지 않는, 2 이상의 적출성 핵산 구조체를 포함한다. 이들 구현예들에서, 하나 이상의 호밍 엔도뉴클레아제가 2 이상의 타겟 DNA 단편의 동시적인 적출을 구현하기 위해 숙주 세포에 제공된다. 일부 구현예에서, 2 이상의 호밍 엔도뉴클레아제가 2 이상의 타겟 DNA 단편의 동시적인 적출을 구현하기 위해 숙주 세포에 제공된다.

다른 구현예에서, 게놈에 병합된 적출성 핵산 구조체 각각은, 각 적출성 핵산 구조체의 ES 영역 각각을 상기 ES를 절단할 수 있는 단일 호밍 엔도뉴클레아제와 접촉시, 각 적출성 핵산 구조체의 타겟 DNA 단편들을 동시에 적출시킬 수 있도록, 하나 이상의 동일한 ES 영역을 공유한다. 일부 구현예에서, 본원에 제공되는 방법으로 숙주 세포의 게놈으로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 10 보다 많은 수의 타겟 핵산을 동시에 적출할 수 있다. 일부 구현예에서, 동시적인 다중 적출은 병합된 적출성 핵산 구조체들 각각에 공유되어 있는 ES 부위에 대해 특이성을 구비한 단일 호밍 엔도뉴클레아제로 이루어진다. 다른 구현예에서, 동시적인 다중 적출은, 병합된 적출성 핵산 구조체내 하나 이상의 ES 부위들에 대한 특이성을 각각 구비한 복수개의 호밍 엔도뉴클레아제를 이용하여 이루어진다.

본 방법의 이점은, 특정 적출성 핵산 구조체의 DR1과 DR2가 절단시 적출성 핵산 구조체의 재조합을 매개할 수 있는, 임의의 탠덤 리피트를 포함할 수 있다. 따라서, 각각 고유한 탠덤 리피트를 구비한, 복수의 적출성 핵산 구조체들이, 상이한 적출성 핵산 구조체들 간에 이루어지는 탠덤 리피트의 재조합으로 인해 게놈이 불안정해질 우려 없이, 동일 세포에서 사용될 수 있다. 아울러, 본 방법은 동일 숙주 세포 또는 자손에서의 재이용될 수 있는 선별 마커를 제거하는데 유용하게 이용할 수 있다.

다른 구현예에서, 적출 현상을 이용하여, 숙주 세포에서 목적한 내인성 유전자의 발현을 촉진, 억제 또는 변형시킬 수 있다. 예를 들어, 일부 구현예에서, 제1 게놈 병합 서열은 목적한 내인성 유전자의 코딩 서열의 5'에 위치한 뉴클레오티드 서열과 상동적인 뉴클레오티드 서열을 포함하며, 제2 게놈 병합 서열은 목적한 내인성 유전자의 코딩 서열내에 위치된 뉴클레오티드 서열과 상동적인 뉴클레오티드 서열을 포함하며, 타겟 DNA 단편은, 예컨대, 숙주 세포가 배양되는 배양 배지에 유도제 또는 억제제를 각각 첨가함으로써 유도 또는 억제시킬 수 있는, 프로모터를 코딩하는 뉴클레오티드 서열을 포함한다. 타겟 유전자 좌에 병합 서열이 병합되면, 타겟 유전자의 천연적인 프로모터는 타겟 DNA 단편의 유도성 또는 억제성 프로모터로 치환되므로, 대상 유전자의 유전자 산물의 생산은 배양 배지내 유도제 또는 억제제의 존재에 의존되게 된다. 마찬가지로, 적출성 핵산 구조체의 타겟 DNA 단편은, 각각 유도제 또는 억제제의 첨가에 의해 유도 또는 억제할 수 있는 억제인자를 코딩하는 뉴클레오티드 서열을 포함할 수 있다. 이러한 대상 유전자의 외인성 발현 조절은, 조절성 프로모터 또는 억제인자가 숙주 세포 게놈으로부터 적출되도록, 본원에 기술된 바와 같이 적출 현상을 유도함으로써, 적절하게 제거시킬 수 있다.

다른 구현예에서, 숙주 세포 게놈으로의 적출성 핵산 구조체의 병합을 이용하여, 예컨대 대상 내인성 유전자의 코딩 서열과 이의 천연적인 프로모터 인자의 작동가능한 연결을 간섭함으로써, 내인성 대상 유전자의 발현을 파괴할 수 있다. 내인성 유전자의 발현을 복원시키는 것이 바람직한 경우, 본원에 기술된 방법에 따른 적출 현상은, 천연적인 프로모터 인자가 대상 내인성 유전자의 코딩 서열과 작동가능하게 재-연결되도록, 즉 천연적인 프로모터 인자가 대상 내인성 유전자의 코딩 서열을 작동시킬 수 있는 근접한 위치로 다시 복원시키도록, 유도할 수 있다.

5.6 키트

다른 측면에서, 본 발명은 숙주 세포의 게놈으로부터 타겟 DNA 단편을 적출하기 위한 키트를 제공한다. 일부 구현예에서, 키트는, (a) 5' → 3' 방향으로: (i) 제1 탠덤 리피트 (DR1), (ii) 제1 호밍 엔도뉴클레아제 인지부 (ES1), (iii) 타겟 DNA 단편 (D), 및 (iv) 제2 탠덤 리피트 (DR2)를 포함하는 적출성 핵산 구조체; 및 (b) 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 키트는, (a) 5' → 3' 방향으로: (i) 제1 탠덤 리피트 (DR1), (ii) 타겟 DNA 단편 (D), (iii) 제1 호밍 엔도뉴클레아제 인지부 (ES1), 및 (iv) 제2 탠덤 리피트 (DR2)를 포함하는 적출성 핵산 구조체; 및 (b) 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 키트는, (a) 5' → 3' 방향으로: (i) 제1 탠덤 리피트 핵산 (DR1), (ii) 제1 호밍 엔도뉴클레아제 인지부 (ES1), (iii) 타겟 핵산, (iv) 제2 호밍 엔도뉴클레아제 인지부 (ES2), 및 (v) 제2 탠덤 리피트 핵산 (DR2)을 포함하는 적출성 핵산 구조체; 및 (b) 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함한다.

일부 구현예에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 적어도 18개의 뉴클레오티드 염기 쌍을 포함한다. 일부 구현예에서, 각각의 DR1과 DR2는 독립적으로 18 - 500개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 제1 및 제2 탠덤 리피트 핵산들은 각각 독립적으로 18 - 500, 18 - 495, 18 - 490, 18 - 485, 18 - 480, 18 - 475, 18 - 470, 18 - 465, 18 - 460, 18 - 455, 18 - 450, 18 - 445, 18 - 440, 18 - 435, 18 - 430, 18 - 425, 18 - 420, 18 - 415, 18 - 410, 18 - 405, 18 - 400, 18 - 395, 18 - 390, 18 - 385, 18 - 380, 18 - 375, 18 - 370, 18 - 365, 18 - 360, 18 - 355, 18 - 350, 18 - 345, 18 - 340, 18 - 335, 18 - 330, 18 - 325, 18 - 320, 18 - 315, 18 - 310, 18 - 305, 18 - 300, 18 - 295, 18 - 290, 18 - 285, 18 - 280, 18 - 275, 18 - 270, 18 - 265, 18 - 260, 18 - 255, 18 - 250, 18 - 245, 18 - 240, 18 - 235, 18 - 230, 18 - 225, 18 - 220, 18 - 215, 18 - 210, 18 - 205, 18 - 200, 18 - 195, 18 - 190, 18 - 185, 18 - 180, 18 - 175, 18 - 170, 18 - 165, 18 - 160, 18 - 155, 18 - 150, 18 - 145, 18 - 140, 18 - 135, 18 - 130, 18 - 125, 18 - 120, 18 - 115, 18 - 110, 18 - 105, 18 - 100, 18 - 95, 18 - 90, 18 - 85, 18 - 80, 18 - 75, 18 - 70, 18 - 65, 18 - 60, 18 - 55, 18 - 50, 18 - 45, 18 - 40, 18 - 35, 18 - 30, 18 - 25, 또는 18 - 20개의 뉴클레오티드 염기 쌍으로 구성된다. 일부 구현예에서, 각각의 DR1과 DR2는 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94 , 95 96, 97 ,98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194 , 195, 196, 197, 198, 199 또는 200개의 뉴클레오티드 염기 쌍으로 구성된다.

일부 구현예에서, 적출성 핵산 구조체는 제1 탠덤 리피트 핵산의 5'에 연결되는 제1 게놈 병합 서열과 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 게놈 병합 서열을 추가로 포함한다. 일부 구현예에서, 키트는, 적출성 핵산 구조체를 병합시킨 후 타겟 핵산을 적출하는 것이 바람직한 숙주 세포에 특이적인 제1 및 제2 게놈 병합 서열을 제공한다. 예를 들어, 효모에서 이용하는 경우, 키트는, 일부 구현예에서, 선별된 효모 게놈 유전자 좌와 상동적인 재조합을 개시할 만큼 충분한 길이와 상동성을 공유하는 제1 및 제2 효모-특이적인 게놈 병합 서열을 포함하는, 핵산 구조체를 제공한다. 일부 구현예에서, 키트는, 각각 특이적인 효모 게놈 유전자 좌로 타겟화된 고유한 제1 및 제2 게놈 병합 서열 쌍을 포함하는, 복수의 핵산 구조체를 제공한다.

특정 구현예에서, 본원에 제공되는 키트는, (a) 5' → 3' 방향으로: (i) 18개 이상의 뉴클레오티드 염기 쌍으로 구성된 제1 탠덤 리피트 핵산, (ii) 제 1 I-SceI 사이트, (iii) 타겟 핵산, (iv) 제2 I-SceI 사이트, 및 (v) 18개 이상의 뉴클레오티드 염기 쌍으로 구성된 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체; 및 (b) I-SceI을 코딩하는 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는 제1 호밍 엔도뉴클레아제 인지부의 5'에 연결되는 제1 병합부와 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 병합부를 추가로 포함한다.

다른 특정 구현예에서, 본원에 제공되는 키트는, 5' → 3' 방향으로: (i) 제1 탠덤 리피트 핵산, (ii) 제1 F-CphI 사이트, (iii) 타겟 핵산, (iv) 제2 F-CphI 사이트, 및 (v) 제2 탠덤 리피트 핵산을 포함하는 적출성 핵산 구조체; 및 (b) F-CphI을 코딩하는 핵산을 포함하는 벡터를 포함한다. 일부 구현예에서, 적출성 핵산 구조체는 제1 호밍 엔도뉴클레아제 인지부의 5'에 연결되는 제1 병합부와 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 병합부를 추가로 포함한다.

특정 구현예들에서, 본 발명의 키트는 전술한 적출성 핵산 구조체 및/또는 벡터로 형질전환하는데 적합한 하나 이상의 숙주 세포를 추가로 포함한다.

일부 구현예에서, 키트는 본원에 기술된 숙주 세포의 게놈으로부터 타겟 DNA 단편을 적출하는 방법이 기술된 사용 지침서를 추가로 포함한다. 일부 구현예에서, 키트는, 타겟 DNA 단편이, 예를 들어, 단백질 코딩 서열, 리포터 유전자, 형광 마커 코딩 서열, 프로모터, 인핸서, 종결인자, 인트론, 엑손, 폴리-A 꼬리, 다중 클로닝 부위, 핵 국지화 신호, mRNA 안정화 신호, 선별 마커, 병합 유전자 좌, 에피토프 테그 코딩 서열 또는 분해 신호로부터 선택되는, 타겟 DNA 단편을 포함하는 적출성 핵산 구조체를 포함한다.

6. 실시예

6.1 실시예 1: xMarker 구조체 구축

본원에 기술된 조성물 및 방법을 수행하여, "xMarker"로서 본원에 기술된, 사카로마이세스 세레비지애에 사용하기 위한 일련의 적출성 선별 마커를 제작 및 특정화하였다. 제1 세대 마커는 I-SceI 엔도뉴클레아제를 이용하였고, 도 1에 나타낸 DNA 구조체에 대한 하기를 포함한 파라미터를 테스트하였다: (1) 엔도뉴클레아제 사이트 옆에 배치된 동향 리피트의 여러가지 길이, 및 (2) 엔도뉴클레아제 사이트 1곳 대 2곳. 제2 세대 마커로, 제1 세대 테스트 결과를 I-SceI 엔도뉴클레아제를 보다 광범위하게 이용하는 방향으로 이용하였다. 제3 세대 xMarker에서는 아래 표 1에 열거된 다른 엔도뉴클레아제에 대한 유용성과 확장성이 입증되었다.

표 1: 엔도뉴클레아제에 대한 인지부 및 절단부

메가뉴클레아제	최소 사이트 크기(bp)	사용 사이트 크기 (bp)	사용한 사이트의 서열
I-SceI	18	18	TAGGGATAACAGGGTAAT (서열번호 3)
VDE (PI-SceI)	31	31	TATGTCGGGTGCGGAGAAAGAGGTAATGAAA (서열번호 4)
F-Cph	20	24	GATGCACGAGCGCAACGCTCACAA (서열번호 5)
PI-MgaI (pps1)	22	24	GCGTAGCTGCCCAGTATGAGTCAG (서열번호 6)
PI-MtuII (pps1)	미정	40	ACGTGCACTACGTAGAGGGTCGCACCGCACCGATCTACAA (서열번호 7)

아래 기술된 실험들에 사용된 시약과 관련하여, 제한 효소들은 New England Biolabs and Fermentas로부터 입수하였다. Finnzymes 사의 고충실성의 내열성 중합효소인 Phusion은, 염색체 병합용 플라스미드 클로닝 또는 효모 형질전환에 사용되는 DNA의 구축에 사용하였다. 저-충실성의 내열성 중합효소 키트는 효모 콜로니에서 게놈 DNA를 PCR (Qiagen Taq PCR 키트)하는데 이용하였다. 올리고뉴클레오티드는 Integrated DNA Technologies (IDT) 사로부터 입수하였다. 그외 화학제품들은 Sigma, Fisher 및 Zymo Research (예, Tris 및 EDTA와 같은 표준 분자 생물 완충제 구성 성분들, 및 리튬 아세테이트 및 효모 질소 베이스와 같은 표준 효모 시약들) 사로부터 입수하였다. DNA 클로닝에 사용되는 컴피턴트 E. coli 세포는 Invitrogen 사에서 구입하였다. Qiagen 사의 미니프렙 키트로 DNA 미니프렙을 수행하였다. 분자 생물학, 효모 분자 유전자학 및 효모 세포 배양 기법은 표준 프로토콜에 따라 수행하였다.

6.1.1. 제1 세대 xMarker 구축

최초 xMarker 시리즈는 선별 마커로서 URA3를 사용하였고, 각 시리즈의 멤버들은 I-SceI 절단부의 수 (1 또는 2)와 동향 리피트 길이 (20, 40, 60 또는 80 bp)에 차이가 있었다. URA3는, 우라실 결핍 배지에서 생육시켜 그 존재를 선별할 수 있으며 5-플루오로오로트산이 함유된 배지에서 생육시켜 부재를 선별할 수 있는, 역선별 마커이다. 동향 리피트 서열은, 112 bp의 DNA 가닥으로 구성되며, 각 20 bp 단편의 GC 함량은 ~50%이고, 20, 40, 60 및 80 bp 가닥들이 30℃ 보다 높은 온도에서 예측한 2차 구조를 거의 취하지 않도록, 설계하였다. I-SceI 절단부들은 모두 동일한 18 bp 서열을 공유한다: 5'-TAGGGATAACAGGGTAAT-3' (서열번호 3). 표 2는 절단부의 수와 서로 간의 방향성에 대해 테스트한 모든 제1 세대 xMarker, 동향 리피트 (DR)의 길이와 서열, 및 I-SceI 절단부(들)의 서열을 열거한다. I-SceI 사이트 2개를 구비한 xMarker의 경우, 인자들의 배열은 DR→/ I-SceI 사이트→/ URA3/ I-SceI 사이트→/ DR→였다. I-SceI 사이트 1개를 구비한 xMarker의 경우, 인자들의 배열은 DR→/ I-SceI 사이트→/ URA3/ DR→였다.

표 2: 도 1에 나타낸 순서와 방향성으로 인자들이 배열된 제1 세대 I-SceI xMarker의 개개 인자들의 특징 리스트

URA3 xMarker 명칭	DR의 길이 (bp)	I-SceI 사이트 (#)	I-SceI 사이트들의 방향성	DR (scar) 서열
20mer-direct	20	2	동향	AAGATCCGATCGACCGAGAA (서열번호 8)
40mer-direct	40	2	동향	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATC (서열번호 9)
60mer-direct (aka s0x-URA3)	60	2	동향	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATC-AACATGATCTGCGACGAGCT (서열번호 10)
80mer-direct	80	2	동향	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATC-AACATGATCTGCGACGAGCTTGAGGATGCAAATGGCTGAC (서열번호 11)
60mer-single	60	1	솔로	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCTGCGACGAGCT (서열번호 12)

xMarker에서 사이트가 반복되므로, 좌측 절반과 우측 절반을 연결하기 전에 별도로 구축하여야 한다. 제1 세대 xMarker를 3단계로 제작하였다.

먼저, 선별 마커의 좌측 (5')과 우측 (3')에 측면으로 서열들은 인산화된 올리고뉴클레오티드를 어닐링시킴으로써 각각 구축하였다. 어닐링에 의해 형성된 좌측 및 우측 이중 가닥 측면 서열들을, 상보적이며, 팔린드롬형이 아닌 염기 5개 (위에 TAGAC, 아래에 GTCTA)로 구성된 3' 단일가닥 오버행을 가지도록 제작하였다. 표 3은 각 xMarker에 사용한 올리고들을 열거한다. 각 어닐링 반응을 위해, DNA 리가제 완충액내 동일 몰의 올리고뉴클레오티드로 구성된 혼합물을 가열 블럭에서 5분간 95℃로 가열한 다음, 가열 블럭을 끄고, 1-2시간에 걸쳐 실온으로 서서히 냉각되게 하였다.

표 3: 제1 세대 I-SceI xMarker에서 마커 측면에 배치된 좌측 단편과 우측 단편 구축을 위한 어닐링을 위해 혼합된 올리고뉴클레오티드 리스트

URA3 xMarker 명칭	좌측 단편에 어닐링시킨 올리고머	우측 단편에 어닐링시킨 올리고머
20mer-direct	KB411, KB412	KB464, KB429
40mer-direct	KB415, KB416	KB419, KB420
60mer-direct (aka s0x-URA3)	KB423, KB425, KB426, KB427, KB428	KB419, KB423, KB424, KB429
80mer-direct	KB423, KB425, KBB427, KB431, KB432, KB433	KB419, KB423, KB429, KB432, KB434
60mer-single	KB423, KB425, KB426, KB427, KB428	KB421, KB423, KB424, KB430

두번째로, 어닐링 혼합물에서 대응되는 좌측 및 우측에 위치한 DNA들을 3-웨이 라이게이션용 RYSE 12 엔트리 벡터와 혼합하였다. 좌측 리피트 서열의 우측 말단을 우측 리피트 서열의 좌측 말단과 스티키 엔드 라이게이션에 의해 연결하고, 반대쪽 말단들은 좌측 리피트 서열과 우측 리피트 서열을 블런트 엔드 라이게이션에 의해 플라스미드에 연결하였다. I-SceI 절단부들 사이의 스페이서에는 XbaI 사이트에 의해 이격되어 있는 다양한 SchI 제한효소 사이트들이 포함된다. 이들 플라스미드는, 마커는 아직 가지고 있지 않으며 절단 및 복구를 지시하기 위한 측면 서열만 가지고 있기 때문에, xMarker 엔트리 벡터로 칭하였다.

세번째로, xMarker 엔트리 벡터에 URA3 선별 마커를 연결하였다. 플라스미드 (RaBit 12-0-M-555)에서 PCR에 의해 URA3 마커를 증폭시켜, 블런트 말단 마커를 제조하였다. 동향 반복 배치된 이중 I-SceI 사이트 xMarker의 경우, URA3 PCR에는 올리고뉴클레오티드 KB439와 KB440을 사용하였고; 단일 I-SceI 사이트 xMarker의 경우에는 올리고뉴클레오티드 KB439와 KB44를 사용하였다. xMarker 엔트리 벡터를 SchI으로 잘라, 블런트-엔드의 선형 플라스미드를 제조하였다. 그런 후, 2개의 절편을 리가제 표준 조건을 이용하여 연결하였다. 이렇게 제조된 xMarker 구조는 도 1에 나타낸다. 연결된 플라스미드 분리체 각각을 회수하고, 플라스미드내 삽입체를 DNA 서열분석함으로써 바람직한 플라스미드를 동정하였다.

6.1.2. 제2 세대 xMarker 구축

제2 세대 xMarker들은 모두 DNA 복구를 돕기 위한 60 bp의 동향 리피트와 2개의 동향 반복된 I-SceI 절단부를 이용하여 제작하였다. 각각의 xMarker는 아래 표 4에 나타낸 바와 같은 세미-랜덤 서열로 선택되는 고유한 60 bp 서열을 가진다.

표 4: 2세대 I-SceI xMarker와 이의 60 bp 리피트 서열 리스트

xMarker 명칭	선별	60 bp 리피트 서열
s1x_hphA	히그로마이신 B 내성 (hph)	CGTTACGAAGCACACACTAGTTAGCGTCGAGACACATAGCGACGCTAGAACTTGCGACTT (서열번호 13)
s2x_hphA	히그로마이신 B 내성 (hph)	GTACTGCCTAGTAGAAACGGATCTCCACGTACTAGAGTCCACCTGGTATCTATTAGCCCG (서열번호 14)
s3x_kanA	카나마이신/G418 내성 (kan)	CGAGGATTAACGTGTAAGGCCCTAAGCTATGTACCGCATCTCCTAAGAGAGTGTGACCCA (서열번호 15)
s4x_kanA	카나마이신/G418 내성 (kan)	TTAATCAGCGCCCAGAGACTAGCACTGAATGATCAACGGGTAGTTCACACACTGCCAGAC (서열번호 16)
s5x_natA	노르세트로신 내성 (nat)	ATGGAATCACGGGGCTATTCCACTTGCTAATAACGAGGCGCTTATCAACGGCGAGCACAT (서열번호 17)
s6x_natA	노르세트로신 내성 (nat)	AGTCAAAGCGCGATTCGCTAGGAATGAGAGCGAGAACGAACCGGAGTATATCACAATCGC (서열번호 18)
s7x_URA3	우라실 프로토트로피 (URA3)	ACTAGAGCGAAATGGAGAGGTACGTGATCCTACTAGAGCCCACGCTATCATACAGTTGGC (서열번호 19)
s8x_URA3	우라실 프로토프로피 (URA3)	GTACGTCCGTACTTATGCTGAGCGCTCCTACACGAAAAACTCACCGTGACTAGCATAACG (서열번호 20)

2가지 기준에 부합되도록 60 bp 서열들을 선정하였다: (1) 제1, 제2 및 제3 20 bp 단편(window)들은 융점이 60℃ ± 2℃임, (2) 60 bp의 서열에서 13 bp 이상 길이의 서열 단편은 효모 게놈내 임의의 천연 서열과 동일함. 이 세트는 4개의 상이한 선별 마커를 포함한다: URA3; 히그로마이신 B 포스포트랜스퍼라제 또는 hph; 노르세오트리신 아세틸트랜스퍼라제 또는 nat; 및 아미노글리코사이드 포스포트랜스퍼라제 또는 kan. 박테리아 유래의 이들 3종의 약물 내성 유전자들은 모두 클루이베로마이세스 락티스(Kluyveromyces lactis) TEF1 유전자의 프로모터 및 종결인자에 해당되는 인접 서열들에 의해 모두 통제되며, 접미사 "A"를 첨부하여 TEF1-유래 조절 대조군으로 표시하였고; 카세트들은 hphA, natA 및 kanA로 지칭하였다.

xMarker내 반복된 사이트들로 인해, 좌측 절반과 우측 절반을 연결하기 전에 이들 각각을 구축하는 과정이 필요하였다. 제2 세대 xMarker를, 제1 세대와 다른 전략으로, 2단계로 제작하였다. 마커를 아래 표 5에 열거된 긴 꼬리형의 올리고뉴클레오티드로 PCR 증폭을 수행함으로써, 마커의 좌측과 우측에, 60 bp 서열과 20 bp I-SceI 절단부를 도입하였다.

표 5: 제2 세대 I-SceI xMarker의 좌측 및 우측 영역을 PCR 증폭하는데 사용한 프라이머 리스트

xMarker 명칭	좌측 영역 프라이머	우측 영역 프라이머	제한 효소	대안적인 좌측 영역 프라이머	대안적인 우측 영역 프라이머	대안적인 제한 효소
s1x_hphA	KB469, KB467	KB470, KB468	NdeI	KB469, KB492	KB470, KB491	RsrII 또는 BanI
s2x_hphA	KB471, KB 467	KB472, KB468	NdeI	KB471, KB492	KB472, KB491	RsrII 또는 BanI
s3x_kanA	KB475, KB473	KB476, KB474	PvuI	KB475, KB494	KB476, KB493	NciI 또는 BstXI
s4x_kanA	KB477, KB473	KB478, KB474	PvuI	KB477, KB494	KB478, KB493	NciI 또는 BstXI
s5x_natA	KB481, KB479	KB482, KB480	StyI	x	x	x
s6x_natA	KB483, KB479	KB484, KB480	StyI	x	x	x
s7x_URA3	KB487, KB485	KB488, KB486	NcoI	KB487, KB496	KB488, KB495	BsiHKAI 또는 AlwNI
s8x_URA3	KB489, KB485	KB490, KB486	NcoI	KB489, KB496	KB490, KB495	BsiHKAI 또는 AlwNI

올리고뉴클레오티드는 3' 말단에 20-22 bp의 프라이밍 영역과 고유한 60 bp 서열과 I-SceI 사이트를 포함하는 80 bp로 이루어진 5' 꼬리를 포함한다. 마커의 좌 및 우측에 약간 다른 2종의 I-SceI 사이트를 사용하였다: 좌측에는 버전 1 (v1) 5'-GCTAGGGATAACAGGGTAAT-3'(서열번호 21)을 사용하고, 우측에는 버전 2 (v2) 5'-ACTAGGGATAACAGGTTTAT-3' (서열번호 22)를 사용함. 제2 세대 xMarker들은 모두 DR (60 bp)→/ I-SceI 사이트 (v1)→/ 마커/ I-SceI 사이트 (v2)→/ DR (60 bp)→로 요약되는 인자 배치를 포함하였다.

xMarker 구축에 대한 전반적인 내용은 다음과 같다. 먼저, 마커의 좌측 부분과 마커의 우측 부분을 각각 PCR로 증폭시켰다. 프라이머는, 마커의 중간 부분이 좌측 및 우측 PCR 산물 둘다에 포함되어, 이러한 중복되는 부분에 단일 가닥의 상보적인 오버행을 만드는 고유한 제한효소 사이트가 포함되도록, 설계되었다. 두번째로, 2종의 PCR 산물을 선택한 제한 효소로 각각 잘라, 겔 정제한 다음, 선형화된 RYSE 12 엔트리 벡터와 함께 3-조각 라이게이션 혼합물에 첨가하였다. 제1 세대 라이게이션과 유사하게, 좌측 영역과 우측 영역을 어닐링시키고, 스티키 말단을 이용하여 라이게이션하였으며, 마커 구조체의 최말단부는 수여 플라스미드와 블런트-엔드 라이게이션하였다. 제1 세대 방법과의 차이는, 라이게이션 후, 산물에 이미 마커 유전자가 포함되어, 구축이 완료된다는 것이다. 라이게이션한 각 플라스미드 분리체를 회수하고, 플라스미드내 삽입체를 DNA 서열분석하여 바람직한 플라스미드를 동정하였다. 이들 플라스미드는, 기존 12 RaBit가 사용된 바와 같이, 화합물 DNA 구조체들의 RYSE-기반의 스티칭에 사용할 수 있는 새로운 xMarker 12 RaBit이었다.

xMarker에 대한 상세 내용은 아래에서 기술한다. 각 마커에서 우선 사용된 마커내 고유한 제한효소 사이트는 다음과 같다: hphA, NdeI (RsrII 또는 BanI); kanA, PvuI (NciI 또는 BstXI); natA, StyI; 및 URA3, NcoI (BsiHKAI 또는 AlwNI). 첫번째 효소로 양성 클론을 수득할 수 없는 경우에는 이후 선택한 효소를 사용하였으며; 이러한 경우의 이점은, 단일 가닥의 오버행이 팔린드롬형이 아니어서, 좌측 영역 2개나 우측 영역 2개와 라이게이션된 플라스미드가 만들어질 가능성이 없다는 것이다. 표시한 제한 효소 사이트의 우측에 존재하는 상위 가닥에 어닐링하는 ~20 bp 역방향 프라이머와, 5' 올리고뉴클레오티드가 다음과 같은 구조를 가지도록 5' 꼬리를 포함하는, 마커의 좌측 끝부분에 대한 프라이머로, 마커의 좌측 영역을 증폭하였다: 60 bp 서열→/ I-SceI 사이트 (v1)→/ ~20 bp 정방향 프라이머. 마커의 우측은, 표시한 제한 효소 사이트의 좌측에 존재하는 하위 가닥에 어닐링하는 ~20 bp 정방향 프라이머와, 3' 올리고뉴클레오티드가 다음과 같은 구조를 가지도록 5' 꼬리를 포함하는, 마커의 우측 끝부분에 대한 프라이머로, 증폭하였다: 60 bp 서열 (역 상보성)→/ I-SceI 사이트 (v2, 역 상보성)→/ ~20 bp 역방향 프라이머. 표 4는 각 xMarker의 좌측 영역과 우측 영역을 증폭시키는데 사용한 프로아머 리스트를 나타낸다. 마커의 PCR 증폭에 사용한 주형은 RaBit 샘플이었다: hphA의 경우 12-0-M-21, kanA의 경우 12-0-M-261, natA의 경우 12-0-M-262, 및 URA3의 경우 12-0-M-555. 최종 제작된 xMarker 제2 세대 플라스미드는 기존 12 RaBit를 사용하였을 때와 같이, 화합물 DNA 구조체들의 RYSE-기반의 스티칭에 사용할 수 있는 12 RaBit 자체였다.

6.1.3. I-SceI 발현 플라스미드 구축

I-SceI 유전자를 사카로마이세스 세레비지애의 GAL1 프로모터 통제 하에 위치시켜, 다양한 마커를 가진 CEN.ARS 플라스미드 세트에 클로닝하였다. CEN.ARS 서열과 LEU2 (pRS415 aka pAM63) 및 URA3 (pRS416 aka pAM63) 마커를 가진 효모-E.coli 셔틀 벡터가 종래에 개시된 바 있다 (예, Gene 1992;110:119-22; Genetics 1989;122:19-27). 이에, 영양 요구성 마커를 약물 내성 마커 kanA (pAM1110), natA (pAM1111) 및 hphA (pAM1112)로 치환하여, pRS416 유도체들을 제작하였다. 각각의 벡터를 폴리링커/다중 클로닝 부위내에 존재하는 고유한 블런트-말단 제한효소 사이트에서 EcoRV (약물 내성 마커) 또는 SmaI (URA3 및 LEU2)로 절단한 다음, 포스파타제를 처리하였다. 선형화된 벡터를 5' 말단을 인산화하기 위해 폴리뉴클레오티드 키나제 (PNK)로 처리된 3파트로 이루어진 PCR 산물에 연결하였다. PCR 산물은, RYSE4 및 RYSE11으로 지칭되는 올리고뉴클레오티드 프라이머를 이용하여 중첩성 말단을 가진 DNA 조각 3개를 연결함으로써, 제작하였다: (1) RaBit 23-0-P-39에서 Sap1으로 분리시킨 삽입체에 의해 제공되는, 사카로마이세스 세레비지애의 GAL1 프로모터 + RYSE 링커 2 및 3, (2) 주형으로서 사용되는 맞춤-합성 유전자와 프라이머 00177-JD-75AN 및 00177-JD-75AO에 의한 PCR 산물에 의해 제공되는, I-SceI 코딩 서열 + RYSE 링커 3 및 4, 및 (3) RaBit 45-0-T-64에서 Sap1으로 분리시킨 삽입체에 의해 제공되는 사카로마이세스 세레비지애의 TDH 종결인자 + RYSE 링커 4 및 5. 라이게이션한 플라스미드들에 대한 각 분리물을 회수한 다음, 플라스미드내 P_GAL1-I-SceI-T_TDH3 삽입체의 DNA를 서열분석함으로써 적정 플라스미드를 동정하였다. 발현 플라스미드들은 pAM1592 (URA3), pAM1593 (kanA), pAM1594 (natA), 및 pAM1595 (hphA)로 각각 지칭하였다. P_GAL1 프로모터는 세포를 갈락토스 존재 하에 배양하였을 때 고도로 발현되며, 야생형 세포 (GAL80+ GAL4)의 경우 세포를 글루코스 존재 하에 배양하였을 때 발현되지 않는다. 그러나, GAL80 억제인자 (gal80Δ)가 결핍된 돌연변이인 경우, P_GAL1은 갈락토스가 존재하지 않는 경우에도 발현되며; P_GAL1의 글루코스 억제는 (오퍼레이터 구조의 경우) GAL4_OC로 지칭되는 프로모터 돌연변이인 GAL4 돌연변이가 존재하는 경우 보다 완화된다.

전술한 바와 같이, 엔도뉴클레아제의 발현은 일부 숙주 균주의 유전자 백그라운드 (GAL80+)에서는 유도에 의해 발현되지만 그외 균주들 (gal80Δ +/- GAL4_OC)에서는 구성적으로 발현되는, 강력한 프로모터의 통제 하에 위치되게 되었다. 프로모터가 구성적인 경우라도, 플라스미드의 상실을 통해 적정 시간 경과 후 엔도뉴클레아제의 발현은 쉽게 없어질 수 있으며; 세포의 거의 절반이 비선택적인 배지에서 10세대 이후에 플라스미드를 상실하였다 (예, Gene 1992;110:119-22; Genetics 1989;122:19-27).

6.1.4. 제3 세대 xMarker 구축: 추가적인 엔도뉴클레아제

(I-SceI 이외의) 다른 엔도뉴클레아제에 대한 첫 xMarker 시리즈에서는 선별 마커로서 URA3를 이용하였다. xMarker 시리즈의 각 멤버는 여러가지 엔도뉴클레아제 [VDE, F-CphI, PI-MgaI (pps1), PI-MtuII (pps1)]에 대한 인지/절단부를 포함한다. 절단부에 대한 설명은 상기 표 1을 참조한다. xURA3 마커들 모두 절단부가 측면에 동향 리피트로 위치된 동일한 50 bp 서열 2 카피를 포함하고 있으며; scar로 예정된 이들 고유한 50 bp 서열은 적출 후 xM0로 지칭하였다. 아래 표 6은 scar 서열에 대한 설명이다.

표 6: I-SceI 이외의 다른 엔도뉴클레아제를 이용한 제3 세대 xMarker에 사용되는 50 bp scar 서열

Scar 서열 코드	효소	마커	서열
xM0	F-CphI, PI-MgaI, PI-MgaII, VDE	URA3	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCT (서열번호 23)
xM1	F-CphI	NatR	CGTTACGAAGCACACACTAGTTAGCGTCGAGACACATAGCGACGCTAGAA (서열번호 24)
xM2	F-CphI	HygR	GTACTGCCTAGTAGAAACGGATCTCCACGTACTAGAGTCCACCTGGTATC (서열번호 25)
xM3	F-CphI	KanR	CGAGGATTAACGTGTAAGGCCCTAAGCTATGTACCGCATCTCCTAAGAGA (서열번호 26)
xM4	F-CphI	NatR	TTAATCAGCGCCCAGAGACTAGCACTGAATGATCAACGGGTAGTTCACAC (서열번호 27)
xM5	F-CphI	TBD	GAATCACGGGGCTATTCCACTTGCTAATAACGAGGCGCTTATCAACGGCG (서열번호 28)
xM6	F-CphI	zeoR	GTCAAAGCGCGATTCGCTAGGAATGAGAGCGAGAACGAACCGGAGTATAT (서열번호 29)
xM7	F-CphI	TBD	ACTAGAGCGAAATGGAGAGGTACGTGATCCTACTAGAGCCCACGCTATCA (서열번호 30)
xM8	F-CphI	TBD	GTACGTCCGTACTTATGCTGAGCGCTCCTACACGAAAAACTCACCGTGAC (서열번호 31)
xM9	F-CphI	TBD	GCATTAAGTCGTAGCTAGCGGATTCTCTCTTCGTGCATCCTAGCAAATGG (서열번호 32)

다음과 같은 기준에 부합되는 scar 서열을 선정하였다: (1) GC 함량은 ~50%임, (2) (총 50 bp에서) 20 bp의 제1 및 제2 서열은 융점이 60℃ ± 2℃임, (3) > 30℃에서 최소 이차 구조 예측됨(minimal predicted secondary structure), 및 (4) 50 bp 서열 중 13 bp 이상 길이의 서열은 효모 게놈내 임의 천연 서열과 동일함. xMarker에서 인자들의 일반적인 서열과 방향성은 도 1에 나타낸 바와 같다: DR (50bp)→, 절단부→, URA3, 절단부→, DR(50bp)→.

xMarker내 사이트 반복으로 인해, DNA 분자 제조시, 좌측 절반과 우측 절단을 연결하기 전에 각각 구축하여야 하였다. 본원에 기술된 마커 구축에는 상기 6.2에 기술된 "제2 세대" 전략을 적용하였다.

먼저, 마커의 좌측 영역과 마커의 우측 영역을 PCR로 각각 증폭시켰다. 각 xMarker를 PCR 증폭하기 위해 4종의 올리고뉴클레오티드를 설계하였다: 마커의 말단에 PCR 어닐링하기 위한 2종의 "외측" 올리고뉴클레오티드와, 마커 유전자 내부와 어닐링하는 2종의 "내측" 올리고뉴클레오티드. 외측 올리고뉴클레오티드는 주형에 상보적인 20-22 bp 서열을 3' 말단에, 주형에 어닐링되지 않고 절단 및 scar 서열을 도입하는데 사용되는 74-90 bp 서열은 5' 말단에 포함한다. 외측 올리고뉴클레오티드는, 후기 단계에서 라이게이션을 촉진하기 위해, PCR 반응에 포함시키기 전에, PNK로 인산화하였다. 내측 올리고뉴클레오티드는, 마커의 중심 단편이 좌측 및 우측 PCR 산물 둘다에 포함되고, 이들 중복되는 단편에 단일 가닥의 상보적인 오버행을 만들 수 있는 고유한 제한 효소 사이트가 포함되도록, 설계하였다. 가능한 경우, 좌측 영역 2개 (또는 우측 영역 2개)가 연결될 가능성을 낮추기 위해, 비-팔린드롬형 오버행을 만드는 제한 효소를 선택하는 것이 바람직하였다.

2번째 단계로, 2종의 PCR 산물을 선택한 제한 효소로 각각 절단하고, 겔-정제하였다. 세번째 단계로, 각각 스티키 말단 및 블런트 말단인, 좌측 및 우측 단편들을 3-조각 라이게이션을 위한 선형화된 RYSE 12 엔트리 벡터 플라스미드와 혼합하였다. 좌측 영역과 우측 영역이 어닐링되어 스티키 말단을 이용하여 라이게이션이 이루어졌으며, 마커의 최말단은 수여 플라스미드와의 블런트-엔드 라이게이션으로 연결되었다. 라이게이션된 플라스미드로부터 각각의 클론을 회수하고, 적정 플라스미드를 DNA 서열분석으로 확인하였다. 이들 플라스미드는 이전의 12 RaBit에서와 같이, 화합물 DNA 구조체의 RYSE-기반의 스티칭에 사용할 수 있는, 새로운 xMarker 12 RaBit들이다.

제1 xURA3 마커 세트를 테스트한 후, 이후 연구를 위해 F-CphI 엔도뉴클레아제를 선택하였다. F-CphI와 함께 사용하기 위해 여러가지 선별 마커가 부가된 xMarker들을 추가로 제작하였다. 이 세트에는 6종의 상이한 선별 마커가 포함된다: URA3; 히그로마이신 B 포스포트랜스퍼라제 또는 hph; 노르세오트리신 아세틸트랜스퍼라제 또는 nat; 아미노글리코사이드 포스포트랜스퍼라제 또는 kan; 제오신 내성 유전자 또는 ble; 및 포스피노트리신 N-아세틸 트랜스퍼라제 또는 pat. 이들 박테리아 유래의 약물 내성 유전자들은 클루이베로마이세사 락티스의 TEF1 유전자의 프로모터와 종결인자에 해당되는 인접한 서열들에 의해 모두 통제되며, 접미사 "A"를 붙여, TEF1-유래 조절 통제(regulatory control)를 표시하며; 카세트는 hphA, natA, kanA, zeoA 및 patA로 지칭하였다. 표 7은 각 마커에 대한 제한 효소 사이트와 내측 올리고뉴클레오티드를 열거하며, 표 8은 각 마커의 외측 올리고뉴클레오티드를 열거한다.

표 7: 제3 세대 xMarker 구축에 사용된 주형, 제한 효소 사이트 및 "내측" 올리고뉴클레오티드

마커	PCR 주형	3-웨이 라이게이션을 위한 내부 제한 효소	역방향 내측 올리고뉴클레오티드 (RIO)	정방향 내측 올리고뉴클레오티드 (FIO)
URA3	RaBit 12-0-M-555	BsiHKAI, PpuMI, BslI, 또는 AlwNI	KB496-266-100	KB495-266-100
hphA	RaBit 12-0-M-21	RsrII 또는 BanI	KB492-266-100	KB491-266-100
kanA	RaBit 12-0-M-261	BstXI	KB494-266-100 or TD_187	KB493-266-100 or TD_186
natA	RaBit 12-0-M-262	StyI	KB479-266-81	KB480-266-81
zeoA	pAM1800	BglI	TD_183	TD_182
patA	pAM1894	TBD		TBD

표 8: 3세대 xMarker 구축에 사용된 "외측" 올리고뉴클레오티드

마커	scar	절단부	PCR 주형	정방향 외측 올리고뉴클레오티드 (FOO)	역방향 외측 올리고뉴클레오티드 (ROO)
x0.URA.VDE	xM0	VDE	RaBit 12-0-M-555	KB518-266-135	KB519-266-135
x0.URA.PI-MgaI	xM0	PI-MgaI	RaBit 12-0-M-555	KB522-266-136	KB523-266-136
x0.URA.PI-MtuII	xM0	PI-MtuII	RaBit 12-0-M-555	KB524-266-136	KB525-266-136
x0.URA.F-Cph	xM0	F-Cph	RaBit 12-0-M-555	KB520-266-136	KB521-266-136
x1.natA.F-Cph	xM1	F-Cph	RaBit 12-0-M-262	MF51-312-97	MF52-312-97
x2.hphA.F-Cph	xM2	F-Cph	RaBit 12-0-M-21	MF53-312-98	MF54-312-98
x3.kanA.F-Cph	xM3	F-Cph	RaBit 12-0-M-261	TD_180	TD_181
x4.natA.F-Cph	xM4	F-Cph	RaBit 12-0-M-262	MF57-312-98	MF58-312-98
x6.zeoA.F-Cph	xM6	F-Cph	pAM1800	TD_176	TD_177

6.1.5. 엔도뉴클레아제 발현 플라스미드 구축

아래 표 9는 엔도뉴클레아제 유전자들, I-SceI, F-CphI, PI-MtuII (pps1), PI-MgaI (pps1) 및 VDE를 포함하는 플라스미드들을 나타낸다. 이들 엔도뉴클레아제 유전자들은 화학 합성하거나 (I-SceI, F-CphI, PI-MtuII (pps1), PI-MgaI (pps1)) 또는 사카로마이세스 세레비지애 게놈 DNA (VDE)로부터 PCR에 의해 증폭하였다.

표 9: 엔도뉴클레아제 유전자를 포함하는 플라스미드들

플라스미드	벡본	효모 마커	엔도뉴클레아제	프로모터	종결인자
pAM1592	pRS416	URA3	I-SceI	GAL1	TDH3
pAM1593	pAM1110	kanA	I-SceI	GAL1	TDH3
pAM1594	pAM1111	natA	I-SceI	GAL1	TDH3
pAM1595	pAM1112	hphA	I-SceI	GAL1	TDH3
pAM1677	pAM1112	hphA	VDE + N-말단 SV40 NLS	ACS2	ADE6
pAM1678	pUC19	없음	PI-MgaI (pps1) + N-말단 SV40 NLS	없음	없음
pAM1679	pUC19	없음	PI-MtuII (pps1) + N-말단 SV40 NLS	없음	없음
pAM1680	pUC19	없음	F-CphI	없음	없음
pAM1749	pAM1112	hphA	F-CphI	ACS2	ADE6
pAM1750	pAM1112	hphA	PI-MgaI (pps1) + N-말단 SV40 NLS	ACS2	ADE6
pAM1751	pAM1112	hphA	PI-MtuII (pps1) + N-말단 SV40 NLS	ACS2	ADE6
pAM1799	pAM1112	hphA	F-CphI	GAL1	TDH3
pAM1800	pAM1801/ pAM1799	zeoA	F-CphI	GAL1	TDH3
pAM1862	pAM64 = pRS416	URA3	F-CphI	GAL1	TDH3
pAM1863	pAM1110	kanA	F-CphI	GAL1	TDH3
pAM1864	pAM1111	natA	F-CphI	GAL1	TDH3
pAM1865	pAM1112	hphA	PI-MtuII (pps1) + N-말단 SV40 NLS	GAL1	TDH3
pAM1866	pAM1112	hphA	PI-MgaI (pps1) + N-말단 SV40 NLS	GAL1	TDH3
pAM1867	pAM1112	hphA	VDE + N-말단 SV40 NLS	GAL1	TDH3

엔도뉴클레아제들 중 3종 (F-CphI 및 I-SceI은 제외)은 크기가 커 세포내 합성부 (세포질)에서 핵공(nuclear pore)을 통한 작용 부위 (핵)로의 이동이 자유롭지 않으므로, 단백질의 아미노-말단에 SV40 핵 국지화 서열 (NLS)을 부가하기 위해 코딩 서열의 5' 말단에 DNA 서열을 추가하였다. 천연 효모 효소는 선천적으로 감수분열시에만 핵으로 유입되기 때문에, NLS는 사카로마이세스 세레비지애가 유사분열 (정상적인 증식) 생장하는 동안의 VDE 활성에는 필수적인 것으로 알려져 있었다. 예를 들어, Mol Cell Biol 2003;23:1726-36을 참조한다. SV40 NLS의 코딩 서열을 포함하는 꼬리가 부가된 올리고뉴클레오티드를 이용하여 VDE에 NLS를 추가하였고; NLS를 전체 유전자의 화학 합성 공정의 일부분으로서 PI-MtuII 및 PI-MgaI에 추가하였다. PCR-기반의 "스티칭" 또는 "오버랩 연장"을 이용하여, 엔도뉴클레아제 코딩 서열을, NLS를 추가하거나 추가하지 않으면서, 프로모터와 종결인자와 연결시켰다. 사카로마이세스 세레비지애 ACS2의 프로모터와 ADE6의 종결인자를 이용하여, RYSE 링커를 사용하지 않고, 제1 구조체 세트를 제조하였다. 이 제1 세트에서, 프로모터-유전자-종결인자 PCR 스티칭 산물을, 각 조각을 PCR 반응시키는데 사용되는 올리고뉴클레오티드 상에 꼬리에 의해 도입되어진 고유한 제한 효소 사이트가 존재하는 SacI 및 XhoI으로 절단한 다음; 구조체를 SacI/XhoI로 자르고 포스파타제를 처리한 수여 플라스미드와 라이게이션하였다. 제2 세트에는 사카로마이세스 세레비지애의 GAL1 프로모터와 TDH3 종결인자를 사용하였으며; 프로모터 (23-0-P-39) 및 종결인자 (45-0-T-64)에 대해 RYSE 링커와 RYSE RaBit를 사용하였다. 이 제2 플라스미드 세트의 경우, 블런트-엔드 연결된 산물이, 블런트 엔드 이중 가닥 브레이크를 만드는 제한 효소에 의해 선형화된, 효모 마커를 구비한 CEN.ARS 플라스미드에 효과적으로 라이게이션될 수 있도록, 폴리뉴클레오티드 키나제 (PNK)를 이용하여 이미 인산화시킨 RYSE 프라이머들 RYSE4 및 RYSE11로, 프로모터-유전자-종결인자 구조체를 연결하였다. 마지막으로, 라이게이션된 플라스미드의 개개 분리체를 회수하여, 바람직한 플라스미드를 플라스미드내 "프로모터-유전자-종결인자"를 DNA 서열분석하여 동정하였다. 플라스미드 구축에 대한 상세한 내용은 아래에 기술한다.

수여 플라스미드들은 모두 CEN.ARS 서열과 효모 선별 마커를 구비한 "pRS" 시리즈의 효모-E.coli 셔틀 벡터를 기반으로 하며, 예를 들어 URA3 마커가 존재하는 버전 (pRS416 및 pAM64)은 이미 개시되어 있다 (예, Gene 1992;110:119-22; and Genetics 1989;122:19-27). 영양 요구 마커를 약물 내성 마커 kanA (pAM1110), natA (pAM1111) 및 hphA (pAM1112)로 치환하여, pRS416 유도체들을 제작하였다. 제2 플라스미드 세트의 경우, pAM1112를 폴리링커/다중 클로닝 사이트내 고유한 블런트-엔드의 제한효소 사이트 (EcoRV)에서 절단한 다음, 포스파타제를 처리하였다. 선형화된 벡터를, 폴리뉴클레오티드 키나제 (PNK)를 처리하여 5' 말단을 인산화한 3개의 파트가 연결된 PCR 산물과 라이게이션하였다. 제1 플라스미드 세트의 경우, 3개의 파트가 연결된 PCR 산물과 pAM1112 수여 플라스미드를 둘다 XhoI과 SacI으로 자른 다음, 라이게이션하기 위해 혼합하였다.

오버행 형태의 말단을 가진 DNA 단편 3개를 연결하여, 엔도뉴클레아제 유전자 발현을 위한 "프로모터-유전자-종결인자" PCR 산물을 제작하였다. 3개의 단편 제작에 사용되는 올리고뉴클레오티드와 주형, 그리고 이들 3개의 단편을 연결하는데 사용되는 올리고뉴클레오티드를 표 10에 나타낸다.

표 10: 프로모터-엔도뉴클레아제-종결인자의 PCR 연결에 사용된 단편들

명명	프로모터 단편: 올리고스 및 주형 또는 RaBit	엔도뉴클레아제 단편: 올리고스 및 주형	종결인자 단편: 올리고스 및 주형 또는 RaBit	연결용 프라이밍 올리고스	라이게이션 수행 전 연결시킨 산물에 대한 처리
P_ACS2-VDE-T_ADE6	KB510, KB512, 게놈 DNA (KB512 꼬리는 NLS를 코딩함; KB510 꼬리는 SacI 사이트를 도입함)	KB513, KB515, 게놈 DNA (KB513 꼬리는 NLS를 코딩함)	KB514, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함)	KB510, KB511	XhoI/ SacI로 절단
P_ACS2-F-Cph-T_ADE6	KB510, KB540, 게놈 DNA (KB510 꼬리는 SacI 사이트를 도입함)	KB539, KB542, pAM1680	KB541, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함)	KB510, KB511	XhoI/ SacI로 절단
P_ACS2-PI-MgaI-T_ADE6	KB510, KB528, 게놈 DNA (KB510 꼬리는 SacI 사이트를 도입함)	KB527, KB530, pAM1678	KB529, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함)	KB510, KB511	XhoI/ SacI로 절단
P_ACS2-PI-MtuII-T_ADE6	KB510, KB534, 게놈 DNA (KB510 꼬리는 SacI 사이트를 도입함)	KB533, KB536, pAM1679	KB535, KB511, 게놈 DNA (KB511 꼬리는 XhoI 사이트를 도입함)	KB510, KB511	XhoI/ SacI로 절단
P_GAL1-VDE-T_TDH3	23-0-P-39	round 1: KB590, KB594, pAM1677; round 2: KB589, KB594, round 1 product	45-0-T-64	PNK-처리된 RYSE4, RYSE11	-
P_GAL1-F-Cph-T_TDH3	23-0-P-39	KB591, KB595, pAM1680	45-0-T-64	PNK-처리된 RYSE4, RYSE11	-
P_GAL1-PI-MgaI-T_TDH3	23-0-P-39	KB589, KB593, pAM1678	45-0-T-64	PNK-처리된 RYSE4, RYSE11	-
P_GAL1-PI-MtuII-T_TDH3	23-0-P-39	KB589, KB592, pAM1679	45-0-T-64	PNK-처리된 RYSE4, RYSE11	-

6.1.6. I-SceI 발현 플라스미드의 구축

I-SceI 유전자를 사카로마이세스 세레비지애 GAL1 프로모터의 통제 하에 있도록 배치한 다음, 이를 다양한 마커를 구비한 CEN.ARS 플라스미드 세트에 클로닝하였다. CEN.ARS 서열, LEU2 (pRS415 aka pAM63) 및 URA3 (pRS416 aka pAM63) 마커를 구비한 효모-E.coli 셔틀 벡터가 이미 개시되어 있다 (예, Gene 1992;110:119-22; Genetics 1989;122:19-27). 영양 요구성 마커를 약물 내성 마커들 kanA (pAM1110), natA (pAM1111) 및 hphA (pAM1112)로 치환하여, pRS416 유도체들을 제작하였다. 각각의 벡터를 EcoRV (약물 내성 마커) 또는 SmaI (URA3 및 LEU2)으로 폴리링커/다중 클로닝 사이트내 고유한 블런트-말단 제한 효소 사이트에서 절단한 다음, 포스파타제를 처리하였다. 선형화된 벡터를, 폴리뉴클레오티드 키나제 (PNK)를 처리하여 5' 말단을 인산화한 3개의 파트가 연결된 PCR 산물과, 라이게이션하였다. RYSE4 및RYSE11으로 지칭되는 올리고뉴클레오티드 프라이머를 이용하여 오버행 형태의 말단을 가진 3개의 DNA 단편을 연결하여, PCR 산물을 제작하였다: (1) RaBit 23-0-P-39 유래 Sap1-절단한 삽입체에 의해 제공되는, 사카로마이세사 세레비지애 GAL1 프로모터 + RYSE 링커 2 및 3, (2) 주형으로서 사용된 맞춤-합성한 유전자를 프라이머 00177-JD-75AN 및 00177-JD-75AO으로 제조한 PCR 산물에 의해 제공되는, I-SceI 코딩 서열과 RYSE 링커 3 및 4, 및 (3) RaBit 45-0-T-64 유래 Sap1-절단한 삽입체에 의해 제공되는, 사카로마이세스 세레비지애 TDH 종결인자와 RYSE 링커 4 및 5. 라이게이션한 각각의 플라스미드 분리체들을 회수하고, 플라스미드내 P_GAL1-I-SceI-T_TDH3 삽입체의 DNA를 서열분석함으로써 적정 플라스미드를 동정하였다. 발현 플라스미드를 pAM1592 (URA3), pAM1593 (kanA), pAM1594 (natA) 및 pAM1595 (hphA)로 지칭하였다. P_GAL1 프로모터는 세포를 갈락토스에서 생육시켰을 때 고도로 발현되며, 야생형 세포(GAL80+ GAL4)의 경우에는 글루코스에서 세포를 생육시켰을 때에는 발현되지 않는다. 그러나, GAL80 억제인자 (gal80Δ)가 결여된 돌연변이의 경우, P_GAL1은 갈락토스가 없는 조건에서도 발현되지만; P_GAL1의 글루코스 억제는 (오퍼레이터 구조의 경우) GAL4_OC로 지칭되는 프로모터 돌연변이가 있는 GAL4 돌연변이의 부가시 보다 약화된다.

엔도뉴클레아제의 발현은 일부 숙주 균주 유전자 백그라운드 (GAL80+)에서는 유도에 의해 발현되지만, 그외 경우들 (gal80Δ +/- GAL4_OC)에서는 구성적으로 발현되는, 강력한 프로모터의 통제 하에 배치되어 있다. 그외 여러가지 유도성 프로모터 또는 구성적인 프로모터들도 잘 작동할 것으로 예상된다. 프로모터가 구성적인 경우라도, 엔도뉴클레아제의 발현은 플라스미드를 상실하는 적정 시간이 경과한 이후에는 쉽게 없어질 수 있으며; 세포의 거의 절반이 비선택적인 배지(예, Gene 1992;110:119-22; 및 Genetics 1989;122:19-27)에서 10세대 계대 후에 이들 플라스미드를 상실하게 된다.

6.1.7. F-CphI 발현 플라스미드 구축

hphA 마커 (pAM1799)를 구비한 F-CphI 발현 플라스미드를 제작하여 테스트한 후, 수여 플라스미드 및 pAM1799내 고유 사이트를 각각 절단하는, 제한 효소 XhoI 및 XbaI을 이용하여, P_GAL1-F-CphI-T_TDH3 카세트를 여러가지 마커(pAM1110, pAM1111, pAM64)를 구비한 다른 CEN.ARS 플라스미드에 서브클로닝하였다. 플라스미드를 XhoI 및 XbaI으로 모두 자르고, 플라스미드 벡터에 포스파타제를 처리한 다음, P_GAL1-F-CphI-T_TDH3 카세트를 다른 벡본에 라이게이션하였다. 라이게이션한 후, 적정 플라스미드 분리체를 제한효소 절단을 통해 동정하였다.

다른 것으로부터 여러가지 방법으로 제오신-내성 플라스미드 (pAM1800)를 구축하였다. 구축은, P_GAL1-F-CphI-T_TDH3의 "프로모터-유전자-종결인자" PCR 산물을 연결한 다음 이를 제오신 내성 마커를 구비한 수여 플라스미드에 라이게이션하기 보다는, hphA 마커 (pAM1799)를 구비한 F-CphI 발현 플라스미드로 시작하여, 효모의 상동적인 재조합을 이용함으로써 마커를 치환함으로써, 히그로마이신 B 내성 유전자를 제오신 내성 유전자로 치환하였다. 먼저, pAM1799를 히그로마이신 B 내성 코딩 서열내 고유 사이트를 절단하는 제한 효소 NdeI으로 선형화하였다. 그런 후, hph 마커의 발현을 통제하는 pAM1799에서의 서열과 상동적인 P_TEF 프로모터 및 T_TEF 종결인자 유래 서열을 도입하는, 긴 꼬리를 구비한 올리고뉴클레오티드를 이용하여, 제오신 내성 유전자를 pAM1500 (또는 임의의 Topo 플라스미드)으로부터 PCR 증폭시켰다. 다음으로, DNA 2 조각을 겔 정제하여, 히그로마이신 B 내성 유전자가 제오신 내성 유전자로 정확하게 치환된 "갭 회복" 재조합을 위해 효모에 형질전환하였다. 적정한 플라스미드를 DNA 서열분석으로 검증하였다.

P_GAL1 프로모터는 세포를 갈락토스 존재 하에 배양하였을 때 고도로 발현되며, 야생형 세포 (GAL80+ GAL4)를 글루코스 존재 하에 배양하였을 때에는 발현되지 않는다. 그러나, GAL80 억제인자가 결핍된 돌연변이 (gal80Δ)의 경우, P_GAL1은 갈락토스가 존재하지 않는 경우에도 발현되며; P_GAL1의 글루코스 억제는 (오퍼레이터 구조의 경우) GAL4_OC로 지칭되는 프로모터 돌연변이인 GAL4 돌연변이 부여시 보다 완화된다. P_ACS2 프로모터는 모든 탄소원에서 적당히 발현된다.

6.2 실시예 2: 염색체 DNA로부터 선별 마커의 적출

본 실시예는 숙주 세포의 염색체 DNA로부터 선별 마커를 적출함에 있어 실시예 1에 기술된 xMarker 구조체들의 유용성을 입증한다. 후술되는 바와 같이, 구조체를 세포에 형질전환시키고, 세포를 xMarker에 선별적인 배지에 접종하고, 콜로니 PCR에 의해 병합이 바르게 이루어졌는지를 검증하였으며; 그러한 균주들을 표준 마커로 제조한 임의의 다른 균주에서와 같이 수행하였고, xMarker는 안정적으로 유지되었다. 그런 후, xMarker를 적출하는 것이 바람직한 경우, 아래 단락들에 기술되는 바와 같이, 균주에 자신의 마커와 호밍 엔도뉴클레아제 유전자에 대한 발현 구조체를 포함하는 단일-카피 (CEN.ARS) 플라스미드를 형질전환시킨다. 수 세대간 플라스미드 존재를 선별하고 호밍 엔도뉴클레아제 유전자의 발현을 유도하는 조건에서 배양한 후, 균주를 대상으로 xMarker 상실을 테스트한다. 마지막으로, 균주를 호밍 엔도뉴클레아제 발현 플라스미드가 상실될 수 있는 조건 하에 배양하고, 분리물들에서 플라스미드 상실을 테스트한다. 본 공정이 끝나면, 균주는 xMarker를 재-이용할 준비가 완료된다.

이러한 전략의 경우, 원하는 DNA 구조체가 정확하게 병합된 세포를 선별하고 검증할 만큼 충분한 시간 동안 xMarker가 안정적인 것이 좋다. 높은 안정성은 2차 형질전환에 의한 도입시까지 엔도뉴클레아제 유전자가 결여된 세포를 이용함으로써 보장할 수 있다. 그러나, 다른 방법은 유도성 프로모터의 통제 하에 안정적으로 병합된 엔도뉴클레아제 유전자를 구비한 숙주 균주를 이용한다. 이러한 다른 방법에서는, 조절된 프로모터로부터 엔도뉴클레아제의 발현이 유도되는 조건 하에 균주를 배양할 때까지, xMarker는 안정적일 것이다. 바람직한 특징을 구비한 프로모터를 이용할 수 있다면, 이러한 방법은 엔도뉴클레아제 플라스미드의 형질전환에 요구되는 시간과 노력을 절약할 수 있을 것이다.

6.2.1. I-SceI을 이용한 xMarker의 일차 테스트:

이러한 타겟 DNA의 정확한 적출 방법을 테스트하기 위해, 염색체 DNA로부터 선별 마커의 적출 효율과 충실도를 사카로마이세스 세레비지애에서 측정하였다. 첫번째로, 선정한 유전자(총칭하여, GOI = 목적 유전자)의 상류 및 하류 영역에 해당되는 2개의 >500 bp 서열 가닥 사이에 xMarker를 배치하여, 낫-아웃 구조체를 제조하였다. 2차로, 이 DNA 구조체를 효모 세포에 형질전환하여, 이중 크로스오버 현상을 수반하는 상동적인 재조합을 통해, 목적 유전자를 제거하고 이의 코딩 서열을 xMarker로 치환하였다. 3번째 단계로, 돌연변이를 I-SceI 발현 플라스미드로 형질전환시키고; 엔도뉴클레아제를 발현하여 DNA 절단 및 복원이 이루어지도록 플라스미드를 보유한 분리체들을 유지시켰다. 4번째 단계로, 마커-선별 조건에서 생육할 수 없는 콜로니들을 동정 및 계수하였다. 5번째 단계로, 예상한 바와 같이 마커가 적출되어 깔끔하게 복원되었지는지를 평가하기 위해 목적한 유전자가 제거된 유전자 좌의 염색체 DNA 서열 (goiΔ)을 확인하였다. 이들 일련의 단계들에 대한 상세한 내용은 아래 제1 세대 마커 단락에서 기술한다.

1차 단계로, 구조 GOI US/ xMarker/ GOI DS (GOI = 목적 유전자, US = 상류, DS = 하류)를 구비한 낫-아웃 구조체를 오버랩 연장 PCR을 이용하여 3개의 인자을 연결하였다. 먼저, I-SceI xMarker를 ndt80Δ 구조체에서 테스트하였는데, NDT80은 유사 분열에 의해 생장하는 세포에서의 이의 결손은 식별가능한 표현형을 나타내지 않기 때문에, 선택한 감수분열-특이 유전자이다. 각 PCR 반응에서는, SapI으로 절단하여 플라스미드 벡본으로부터 분리시킨 3종의 RaBit를 주형으로 사용하였다: (1) NDT80 상류 (01-0-U-30), (2) xMarker RaBit, 및 (3) NDT80 DS (29-0-D-23). PCR 프라이머는 RYSE0 및 RYSE19를 사용하였다. PCR 수행 후, 반응 혼합물을 아가로스 겔에 로딩하고, 적정한 전장 산물을 겔로부터 정제하였다.

2차 단계로, 효모 세포를 겔-정제한 PCR 산물로 형질전환하고, 선별 플레이트에 접종하였다. 제1 세대 xMarker에 대한 선별 플레이트는 CSM-Uracil이며; 약물 내성 마커에 대한 선별 플레이트는 YPD+drug (히그로마이신 B, 노르세오트리신, 또는 G418)이다. 모든 xMarker 테스트는 CEN.PK2 유래 균주와 S288c 균주 백그라운드에서 수행하였다. 제1 세대 xMarker에 대한 1차 테스트는, PCR 산물을 해당 유전자형으로 GAL80⁺ GAL4 gal1Δ을 가진 균주(Y1625)에 형질전환시키는 과정을 포함하는데; 이 유전자형은 P_GAL1으로부터 야생형의 유도성 발현과, 갈락토스가 "불필요한 유도제"가 되게 하는 갈락토스에 대한 식이 불능을 부여한다. 바람직한 형질전환체들은 돌연변이 유전자형 ndt80Δ::xURA3를 가지며, 표 2에 열거된 몇가지 xURA3 마커 버전을 가진다. CSM-U 플레이트에서 생육한 콜로니를 대상으로, 재조합에 의해 제조된 새로운 DNA 정션을 증폭하는 프라이머 쌍을 이용하여 세포의 비등 용혈물 유래 게놈 DNA를 PCR ("콜로니 PCR") 증폭함으로써, 원하는 염색체 유전자 좌의 존재를 조사하였다. 프라이머 RYSE3 및 AET0065-186-63-F-pNDT80을 이용하여 새로운 5' 정션을 증폭시켜 1024 bp 산물을 수득하였고, 프라이머 RYSE4 및 AET0072-186-63-R-tNDT80를 이용하여 새로운 3' 정션을 증폭시켜 1024 bp 산물을 수득하였다. 각 xMarker 변이체에 대한 2가지 분리체들을 이후 분석용으로 선별하였다.

3차 단계로, 유전자형 ndt80Δ::xMarker를 가진 분리주에 I-SceI 발현 플라스미드를 형절전환하였다. 제1 세대 ndt80Δ::xURA3 균주의 경우, natA-표지 플라스미드 (pAM1594)를 표준 형질전환 조건을 이용하여 형질전환시키고, 세포를 액체 YPD에서 3-6시간 동안 생장시키는 동안 새로운 마커 유전자를 발현하게 둔 다음, 이를 YPD+노르세오트리신 플레이트에 접종하였다. 각 형질전환물의 절반을 일반 YPD (2% 덱스트로스)에 도말하고, 절반은 YPDG (1% 덱스트로스 + 1% 갈락토스)에 도말하였다. 숙주 균주 표현형은 GAL80⁺ GAL4 gal1Δ이므로, I-SceI 유전자의 GAL1 프로모터는 덱스트로스 존재시 유도되지 않았으며; 덱스트로스와 갈락토스 혼성 조건에서는 GAL1 프로모터가 오프 상태로 유지될 것으로 예상되는 반면, 덱스트로스가 고갈되어 플레이트내 갈락토스가 효능을 나타냄에 따라 턴 온으로 전환된다.

4차 단계로, 마커가 적출된 분리체들을 동정하였다. xURA3 마커는 URA3가 결핍된 세포만 생육시키는 5-FOA 플레이트에서 역선별할 수 있는 이점이 있다. 이와는 대조적으로, 다른 xMarker가 적출된 분리체들은, 예컨대 모든 분리체들이 생장하는 비-선택 플레이트를 바람직한 분리체들이 생육하지 못하는 선별 플레이트에 리플리카 플레이팅하여 스크리닝함으로써 동정하여야 한다. 제1 세대 xMarker는 역선별 이점을 이용하기 위해 URA3를 사용하였다. 기대한 바와 같이, 전술한 플라스미드-보유 형질전환체를 YPD 플레이트에서 취하여 5-FOA에 스트리킹하였을 때, I-SceI가 YPD에서 발현되지 않기 때문에, 콜로니가 증식되지 않았다. 플라스미드-보유 형질전환체를 YPDG 플레이트에서 취하여 5-FOA에 스트리킹하였을 때, 다수의 콜로니들이 증식되었다. YPDG 플레이트는 갈락토스를 포함하며, I-SceI의 발현을 유도한다. 5-FOA 플레이트는 온전한 URA3를 보유한 세포에 대해 역선별한다. 대조군 ura3Δ 균주 대비 I-SecI 형질전환체를 다시 스트리킹하였을 때 증식하는 5-FOA 콜로니의 수를 기초로, 세포의 ≥30%가 I-SecI 2곳 사이에 위치한 URA3를 상실하는 것으로 추정되며; 그 빈도는 하나의 I-SceI 사이트를 구비한 xURA3에서 더 낮게 나타났다. URA3 xMarker는, I-SceI 발현없이는 거의 적출되지 않지만(세포의 <10^-6), I-SecI의 발현 유도 후에는 URA3가 빈번하게 적출되는 것으로 시사되었다. 이후 적출 빈도를 보다 직접적으로 테스트하였다.

5차 단계로, xMarker가 병합된 염색체 유전자 좌의 서열을 분석하여 I-SceI 절단 및 이후 DNA 이중-가닥 브레이크 복원 후에 생기는 scar를 확인하였다. 마커의 기능이 상실된 것으로 입증된 콜로니는, xMarker와 GOI 타겟팅 서열 사이 정션의 상류와 하류에 어닐링하는 프라이머로 콜로니 PCR한 다음, PCR 산물의 서열을 분석하였다. ndt80Δ::xMarker의 경우, 프라이머는 xMarker와 NDT80 서열 사이 정션부의 208 bp 상류 (JU-197-168-125-NDT80US-F) 및 234 bp 하류 (JU-198-168-125-NDT80DS-R)에 어닐링한다. 예상되는 PCR 산물 크기는, URA3가 깔끔하게 적출된 경우에는 462-522 bp이었고, URA3가 완전히 온전한 경우에는 2072 bp이었다. 콜로니 PCR에 사용된 5-FOA 내성 콜로니 총 27개에서는 적출된 것으로 예상되는 ~500 bp의 산물이 확인되었다. 이들 27개의 PCR 산물을 서열분석하였을 때 모두 도 1에 나타낸 예상되는 정확한 scar를 나타내었다 (표 11 참조). 표 11에 나타낸 바와 같이, 27개의 테스트한 콜로니들 모두 xMarker가 병합되고, 이후 I-SecI이 발현되어, xMarker가 적출되는 것으로 확인되었다.

표 11: 마커 적출 후 제1 세대 I-SceI xMarker scar의 서열분석을 통한 적출 충실도를 나타낸 결과

URA3 xMarker 명	DR 길이 (bp)	I-SceI 사이트(#)	서열 분석한 scar 수 (#)	scar 일치율 (%)
20mer-direct	20	2	8	100
40mer-direct	40	2	4	100
60mer-direct (aka s0x-URA3)	60	2	4	100
80mer-direct	80	2	8	100
60mer-single	60	1	3	100

또한, 제1 및 제2 세대 xMarker (표 2 및 4)를 GAL1 프로모터가 구성적인 여러가지 사카로마이세스 세레비지애 균주 (gal80Δ GAL4_OC)에서 테스트하였다. ndt80Δ::xMarker 구조체를 연결하여, 전술한 바와 같이 효모에 형질전환하였다. xURA3를 구비한 형질전환 혼합물을 직접 CSM-U 플레이트에 도말하고; 약물 내성 마커를 가진 균주를 먼저 교반 인큐베이터에서 액체 YPD 중에서 3-6시간 배양한 후, YPD + 약물 플레이트에 도말하였다. 콜로니 PCR을 통해 ndt80Δ::xMarker이 병합된 것으로 검증된 2종의 형질전환체에서 각각의 xMarker 변이체를 독립적으로 I-SceI 발현 플라스미드 중 하나에 형질전환시켜, 전술한 바와 같이 선별 플레이트에 도말하였다.

P_GAL1-I-SceI 발현은 구성적이므로, 플라스미드 형질전환 선별 플레이트에서의 콜로니들은 xMarker를 유지하거나 적출된 세포들의 혼성 집단인 것으로 예측되었다. 각 플레이트에서 수개의 콜로니를 취하여, 플라스미드 또는 마커 또는 둘다를 상실한 세포의 증식을 허용하는 비-선택적인 YPD 플레이트에 다시 스트리킹하였다. 이러한 다시 스트리킹한 플레이트에서 생장한 콜로니를 YPD 플레이트에 접종하여 밤새 배양한 후, YPD + 약물, CSM - 우라실 및 5-FOA 플레이트에 대해 리플리카를 제작하였다. 다수의 패치들이 5-FOA 및 CSM-우라실 둘다에서 증식하여, 패치내 세포 집단의 혼성인 것으로 확인되었고, 콜로니를 분리하기 전에 비-선별 조건에서 추가적으로 증식시키는 것이 분석을 위한 동종 집단을 수득하는데 필요한 것으로 생각되었다. 마커 적출 빈도는 일반적으로 혼성 패치로 인해 본 실험에서는 과소 평가되었지만, 일반적으로 패치의 18% 이상, 흔히 35-50%는 마커가 적출된 세포를 어느 정도 포함하고 있었다 (표 12). 대부분의 패치 (53-88%)는 리플리카 플레이트 제작 전에 I-SecI 발현 플라스미드를 완전히 상실하였다. 패칭 및 리플리카 플레이트 제작과 병행하여, YPD에 다시 스트리킹한 플레이트에서 2종의 독립적인 ndt80Δ::s1x-hphA 균주 유래의 콜로니 90개를 대상으로 콜로니 PCR로 마커 적출을 확인하였는데; 콜로니의 48% (43/90)가 hphA 마커의 완전한 적출시 예상되는 크기 밴드를 나타내었다.

표 12: 제2 세대 I-SceI xMarker의 적출 빈도와 엔도뉴클레아제 발현 플라스미드의 상실 빈도를 나타낸 결과

		하기 상태의 세포를 일부 세포를 함유한 패치 %
xMarker	플라스미드 마커	xMarker 온전	xMarker 적출됨	플라스미드 보유	플라스미드 상실
s1x-hphA	URA3	65	n/a	28	100
s5x-natA	URA3	98	n/a	48	100
s7x-URA3	hphA	58	46	13	n/a
s8x-URA3	hphA	79	40	19	n/a
20mer-URA3	hphA	92	19	15	n/a
60mer-URA3 (aka s0x-URA3)	hphA	35	75	15	n/a
80mer-direct	hphA	48	58	33	n/a

전술한 바와 유사한 실험을 이용하여 조사하기 위해 xMarker들을 추가로 구축하였다. 아울러, 동일 균주에서 여러가지 유전자 좌에 병합시킨 복수의 xMarker들이 성공적으로 동시 적출됨을 확인하였으며, 게놈 불안정성 징후는 나타나지 않았다 (예, 염색체 전위) (아래 실시예 6.2.4 참조).

6.2.2. 다른 엔도뉴클레아제를 이용한 xMarker 테스트:

다른 엔도뉴클레아제 4종을 6에 나타낸 xURA3 마커 세트를 이용하여 테스트하였다. 각 xMarker에는 2개의 엔도뉴클레아제 절단 사이트가 양측에 위치한 URA3 선별 마커 유전자가 포함되어 있으며, 상기 절단 사이트 옆에는 바로 50 bp의 리피트 서열이 위치되어 있다. 각각의 경우, GOI US/ xMarker/ GOI DS (GOI = 대상 유전자, US = 상류, DS = 하류) 구조의 낫-아웃 구조체는 3개의 인자를 오버랩 연장 PCR로 연결하였다. 먼저 새로운 엔도뉴클레아제 URA3 xMarker를 대상 유전자 (GOI)로서 HXT3와 함께 테스트하였다. 각 PCR 반응에서는 주형으로서 SapI으로 플라스미드 벡본에서 분리한 3개의 RaBit를 사용하였다: (1) HXT3 상류 (01-0-U-407), (2) xMarker RaBit (x0.URA.VDE, x0.URA.F-CphI, 12-0-x0.URA.PI-MtuII, 12-0-x0.URA.PI-MgaI), 및 (3) HXT3 DS (29-0-D-408). PCR 연결에 사용한 프라이머는 RYSE0와 RYSE19이다. PCR 반응 후, 반응 혼합물을 아가로스 겔에 로딩하고, 원하는 전장 크기의 산물을 겔에서 정제하였다. 겔-정제한 PCR 산물을 효모 세포에 형질전환한 다음, URA3(CSM-Uracil)에 선택적인 플레이트에 도말하였다. 바람직한 형질전환체는 돌연변이 유전자형 hxt3Δ::xURA3를 가지며, 표 6에 열거된 여러가지 버전의 xURA3 마커들을 포함한다. CSM-우라실 플레이트에서 증식시킨 콜로니를 대상으로, 재조합에 의해 제조된 새로운 DNA 정션을 증폭하는 프라이머 쌍을 이용하여 세포의 비등 용혈물 유래 게놈 DNA를 PCR ("콜로니 PCR") 증폭함으로써, 원하는 염색체 유전자 좌의 존재를 테스트하였다. 프라이머는 KB502, KB503 및 CPK904를 사용하였는데, 후자 2개는 hxt3Δ::xURA3에 대해 738 bp의 단편을 증폭하며, 전자 2개는 온전한 HXT3에 대해 538 bp 단편을 증폭하였다. 각 xMarker 변이체에 대한 2개 분리체를 이후 분석을 위해 선별하였다.

xURA3 마커는 URA3 결핍 세포만 생육하는 5-FOA 플레이트에서 역선별할 수 있는 이점이 있다. 이와는 대조적으로, 다른 xMarker가 적출된 분리체들은, 예컨대 모든 분리체들이 생장하는 비-선택 플레이트를 바람직한 분리체들이 생육하지 못하는 선별 플레이트에 리플리카 플레이팅하여 스크리닝함으로써 동정해야 한다. 제1 세대 xMarker는 드물에 발생하는 적출 현상을 정량화할 수 있는 역선별 이점을 위해 URA3를 사용하였다. 기대한 바에 따라, xURA3 마커를 포함하나 엔도뉴클레아제 발현 플라스미드는 결핍된 균주를 5-FOA에 스트리킹하여 도말하였을 때, 콜로니는 생기지 않았다. 이는, xMarker의 자발적인 적출이 엔도뉴클레아테-촉매화된 절단이 없는 경우에 매우 드물게 이루어짐을 의미한다. 이는, 엔도뉴클레아제를 발현시키지 않고는 URA3 xMarker의 적출이 거의 이루어지지 않음을 의미한다 (세포의 <10^-6).

유전자형 hxt3Δ::xURA3로 확인된 분리체들을 마커 유전자 hphA (pAM1799, pAM1865, pAM1866)로 표시된 엔도뉴클레아제에 대한 동계 발현 플라스미드로 형질전환하였다. 형질전환 혼합물에서 세포를 액체 YPD에서 3-6시간의 생장 기간 동안 새로운 마커 유전자를 발현하게 둔 다음, 이를 YPD+히그로마이신 B 플레이트에 접종하였다. 숙주의 유전자형은 gal80Δ GAL4oc이므로, 엔도뉴클레아제 유전자의 발현을 지시하는 GAL1 프로모터가 구성적으로 발현되어, 유도제가 필요하지 않았다. 3일간 배양한 후, 형질전환 콜로니를 YPD+히그로마이신 B 플레이트에 다시 스트리닝하여, 다시 3일간 배양하였다. 다시 스트리킹한 플레이트에서 콜로니를 취하여 (엔도뉴클레아제 당 콜로니 4개) YPD 3 ml에 현탁한 다음, 플라스미드 상실을 허용하는 비-선별 조건에서 밤새 배양하였다. 세포 밀도를 측정하고, 배양물을 희석한 후, 세포를 플레이트 당 세포 수 150, 15,000 또는 150,000의 밀도로 3가지의 다른 고체 배지에 접종하였다: YPD, YPD + 히그로마이신 B 및 5-FOA. 세포는 모두 YPD에서 콜로니를 형성할 것으로 예상되었고, 엔도뉴클레아제 발현 플라스미드를 유지한 세포만 히그로마이신 B에서 콜로니를 형성하고, xURA3 마커가 적출된 세포만 5-FOA에서 콜로니를 형성할 것으로 예상되었다.

표 13에 나타낸 결과는, F-CphI이 고도의 효율적인 xMarker 적출을 매개하며, PI-MtuII는 효율성이 낮은 xMarker 적출을 매개하며, PI-MgaI의 xMarker 적출 수준은 검출 불가한 수준임을 보여준다. CEN.ARS 엔도뉴클레아제 발현 플라스미드의 상실은 매우 흔히 발생되는 현상으로, 이는 새로운 xMarker로 형질전환하는 다음 단계를 수행하기 전에 엔도뉴클레아제를 상실한 세포를 쉽게 분리할 수 있다는 것을 의미한다.

표 13: 여러가지 엔도뉴클레아제의 xMarker 적출 효율과 수 세대의 비-선택적인 증식 후 발현 플라스미드 소실 빈도를 비교하여 나타낸 결과

엔도뉴클레아제	xURA3 xMarker가 소실된 세포의 %	hphA-표시된 엔도뉴클레아제 발현 플라스미드가 소실된 세포의 %
F-CphI	90.8%	31.9%
PI-MgaI	0.058%	76.5%
PI-MtuII	<0.0007%	ND
VDE	ND	ND

마커의 F-CphI 매개 적출로 "퍼펙트" scar가 남겨지는지를 확인하기 위해, 5-FOA 내성 (기능적으로 ura3^-) 콜로니를 대상으로 xURA3 마커의 병합부의 측면의 올리고뉴클레오티드 프라이머 (올리고뉴클레오티드 KB503 및 KB604)를 이용하여 콜로니 PCR을 수행하였고; 533 bp의 PCR 산물을 의뢰하여, 올리고뉴클레오티드 프라이머 KB503로 DNA 서열을 분석하였다. 테스트한 16개의 콜로니들은 모두 xMarker 유래의 DNA 서열 50 bp 단일 카피만 남아있는 "퍼펙트" scar를 가지고 있었다.

6.2.3. F-Cph xMarker 적출 빈도 및 충실도에 대한 추가적인 테스트

F-CphI 절단부와 다양한 선별 마커를 구비한 추가적인 xMarker들을 제작하여, 테스트하였다 (natA, kanA, hphA, zeoA). 이들 마커의 적출 빈도와 적출 충실도를 사카로마이세스 세레비지애 반수체 및 이배체 균주에서 단독으로 그리고 조합하여 테스트하였다. 적출 빈도는 테스트한 콜로니들에서 거의 100%였으며, 늘 > 80%이었다. 적출 충실도도 거의 100%였다. 다수의 개별 배양물에서의 적출 현상들에서는 모두 예상된 scar이 발생되었으며; 적출을 통해 xMarker에 동향 리피트로서 도입된 50 pb 서열 한 카피가 남겨졌으며, 마커 자체는 없었다 (표 14).

표 14 - 여러가지 엔도뉴클레아제와 50 bp 길이 이상의 DR에서의 xMarker 적출 빈도

엔도뉴클레아제	DR의 길이 (bp)	ES의 수	xMarker 표적 구조체	엔도뉴클레아제 발현 플라스미드	xMarker 적출			적출 정확도
엔도뉴클레아제	DR의 길이 (bp)	ES의 수	xMarker 표적 구조체	엔도뉴클레아제 발현 플라스미드	테스트 세포 수 ^a)	xMarker 적출된 세포 수	적출 빈도	테스트 세포 수	퍼펙트 scar 함유 세포 수 ^b)
F-CphI	50	2	HXT3-US_ xM0.URA.F-CphI _ HXT3-DS	pAM1799	402	365	0.91	ND	ND
	50	2	GAL80-US_xM0.URA.F-CphI_GAL80-DS	pAM1800	8	8	1	8	8
	50	2	GAL80-US_xM1.nat.F-CphI_GAL80-DS	pAM1800	16	16	1	8	8
	50	2	GAL80-US_xM3.kan.F-CphI_GAL80-DS	pAM1800	8	8	1	8	8
	50	2	GAL80-US_xM4.nat.F-CphI_GAL80-DS	pAM1800	8	8	1	8	8
	50	2	GAL80-US_xM6.zeo.F-CphI_GAL80-DS	pAM1862/ pAM1864	16	16	1	16	16
PI-MgaI	50	2	HXT3-US_ xM0.URA.PI-MgaI _ HXT3-DS	pAM1866	~6.6 x 10⁵	0	<1.5 x 10^-6	ND	ND
PI-MtuII	50	2	HXT3-US_ xM0.URA.PI-MtuII _ HXT3-DS	pAM1865	~6.6 x 10⁵	419	6.3 x 10^-4	ND	ND
VDE	50	2	HXT3-US_ xM0.URA.VDE _ HXT3-DS	pAM1677	535	9	1.7 x 10^-2	ND	ND
I-SceI	60	2	NDT80-US_ s60M.URA.I-SceI_NDT80-DS	pAM1595	288	155	0.54	4	4
I-SceI	80	2	NDT80-US_ s80M.URA.I-SceI_NDT80-DS	pAM1595	237	76	0.32	8	8
^a)YPD 플레이트에서의 콜로니의 수, 희석 인자로 조정됨. ^b)퍼펙트 scar = 적출 후, xMarker로부터 남겨지는 DNA 서열은 DR 서열의 단일 카피임. ND = 검출 안됨.

NDT80 유전자 좌에 xMarker를 포함하는 (NDT80 유전자 결손) 균주를 다음과 같이 제작하였다. 세포의 형질전환에 사용되는 연결된 PCR 산물을 RYSE0 및 RYSE19로 지칭되는 올리고뉴클레오티드를 이용하여 (12 RaBit와 같이) xMarker를 01-0-U-97 및 29-0-U-23 RaBit와 연결함으로써, 제조하였다. 이를 형질전환한 후, 하나(CPK650)는 형질전환된 DNA의 외측에 존재하고, 다른 하나(예, URA3의 경우 KB561 및 KB562; natA, kanA 및 hygA의 경우 KB563 및 KB564)는 마커의 내부에 존재하여 ~1.1 kb의 PCR 산물을 증폭시키는, 한쌍의 올리고뉴클레오티드 프라이머를 이용하여 콜로니 PCR을 수행함으로써, 동정한 적정 분리체를 검증하였다. 천연 NDT80 서열의 제거는, 온전한 NDT80 유전자 좌를 구비한 모체 균주로부터 442 bp의 PCR 산물을 증폭하는, 올리고뉴클레오티드 AET83 및 AET84를 이용한 콜로니 PCR 수행시, PCR 산물의 부재로 검증하였다. F-CphI 발현 플라스미드 (pAM1800)로 형질전환한 후, 개개 콜로니들을, 단지 50 bp scar 서열 한 카피만 남기는 퍼펙트 적출로 인해 492 bp를 증폭하는, JU197 및 JU198을 이용한 콜로니 PCR을 이용하여 의도한 적출에 대해 조사하였으며; 이 밴드를 가시화하고 임의의 다른 DNA로부터 분리하기 위해 겔에서 전개시킨 다음, 겔에서 추출하여 PCR 반응에 사용한 동일한 올리고뉴클레오티드를 이용하여 DNA 서열 분석을 의뢰하였다.

GAL80 유전자 좌에 xMarker를 포함하는 균주 (GAL80 유전자 결손)를 다음과 같이 제작하였다. 세포의 형질전환에 사용한 연결된 PCR 산물은, RYSE0 및 RYSE19로 지칭되는 올리고뉴클레오티드를 이용하여 xMarker (12 RaBit로서)를 01-0-U-270 및 29-0-U-95 RaBit와 연결시켜 제조하였다. 형질전환 후, 적정 분리체의 실체를 콜로니 PCR로 검증하였다. 올리고뉴클레오티드 JU436 및 RYSE3는 형질전환된 DNA가 GAL80 상류 서열내에 병합되어 있는 5' 정션 주변부를 증폭하여, 572 bp의 PCR 산물을 만들며 (다른 예로, JU210 및 RYSE3를 이용하여 182 bp의 PCR 산물을 수득함); JU221 및 RYSE4는 GAL80 하류 서열 bp를 구비한 마커의 3' 정션을 증폭하여 386 bp의 산물을 만들며 (다른 예로, JU439와 RYSE4를 이용하여 531 bp의 PCR 산물을 수득함); 음성 대조군은 프라이머 JU212 및 JU210로 콜로니 PCR하면, 온전한 GAL80 유전자 좌에 대해 290 bp의 산물을 만들어내지만 원하는 유전자 좌에 대해서는 산물이 제조되지 않는다. F-CphI 발현 플라스미드 (pAM1800 또는 pAM1799)로 형질전환한 후, 개개 콜로니를 JU210 및 JU211으로 콜로니 PCR하여 의도한 적출을 평가하였으며, 퍼펙트 적출의 경우 단지 50 bp scar 서열 한 카피만 남겨져 277 bp가 제조되었으며; 이 밴드를 가시화하고 임의의 다른 DNA로부터 분리하기 위해 겔에서 전개시킨 다음, 추출하여 PCR 반응에 사용된 동일 올리고뉴클레오티드를 이용하여 DNA 서열 분석하였다.

F-CphI 발현 플라스미드로 형질전환한 후, 선별 플레이트에서 증식한 콜로니 8개를 랜덤 선택하여, 적출을 확인하기 위해 콜로니 PCR을 수행하였다. 아래 xMarker의 경우, 콜로니 8개 모두에서 예상되는 PCR 산물이 증폭되었으며, DNA 서열을 분석하여 퍼펙트 scar을 검증하였다: x0URA3, x1nat, x3kan, x4nat, 및 x6zeo. x2hph 마커에서는 비정상적인 결과가 나타났으며; scar 서열분석과 xMarker (12 RaBit) 서열분석을 통해, 동향 리피트가 의도한 바와 다른 것으로 확인되었는데, 19 bp만 마커 측면에 배치된 동향 리피트였으며, 인접한 서열들은 스크램블형으로 존재하였다. 작은 영역으로도 이중 가닥 브레이크의 복구가 제공되었음에도 불구하고, 적출 빈도와 충실도는 양호하였으며; 1차 실험에서, 콜로니 8개 중 6개에서 마커가 깔끔하게 적출되고 다양한 길이의 scar이 남겨졌으며; 2차 실험에서, 8개의 콜로니 모두 마커가 적출되었고 19 bp의 scar이 남겨졌다. 이는, 17-18 bp가 동향 리피트 길이로 충분하며, 50 bp가 F-CphI에 의한 절단 후 염색체의 복구를 유도하기에 충분함을 시사해준다.

xMarker의 높은 적출 빈도와 정확도는 여러가지 조건들에서도 관찰되었다. 가장 단순한 조건은 각 균주내 하나의 xMarker였다. 좀더 복잡한 조건은 온전한 GAL80 대립유전자 하나와 xMarker가 결손된 대립유전자 하나를 포함하는 이형 이배수체 균주에서의 xMarker 적출이었으며; 이 경우, GAL80 유전자 좌는 파괴된 대립유전자에서 xMarker의 적출 후 온전한 상태로 남겨진다. 이는, F-CphI의 작용 후, xMarker 근처 절단된 염색체 말단은 복구를 위한 주형으로서 염색체의 온전한 제2 카피를 이용하여, 제거된 염색체에서 온전한 GAL80 유전자 좌를 복원시키는 유전자 변환을 유도하는 현상이 이루어질 수도 있다는 점에서, 중요하다. 이러한 유전자 변환은 확인되지 않았으며, 대신 세포는 염색체내 단일 가닥 어닐링 기전을 통해 파괴된 염색체를 거의 바람직하게 복원한다.

6.2.4. 동시적인 다중 xMarker 적출

본 실시예는 숙주 세포의 염색체 DNA로부터 다중 선별 마커의 동시 적출을 매개하는데 있어서의 xMarker의 유용성을 입증하며, 이때 각 xMarker를 이용하여 고유한 유전자 좌로의 병합을 표시한다.

GAL80 및 GAL4 유전자 좌 양쪽에 xMarker를 구비한 균주를 다음과 같이 제작하였다. 히그로마이신 민감성 세포를 xMarker 타겟팅 구조체 GAL80-US_xM4.Hph.FCphI_GAL80-DS로 형질전환하였다. 형질전환주를 3 mL YPD 액체 배지에서 5시간 동안 배양한 다음, YPD + 히그로마이신 배지에 접종하였다. 형질전환주는 콜로니 PCR로 검증하였다. 올리고뉴클레오티드 HJ53와 HJ848은 GAL80 상류 서열내 형질전환된 DNA가 병합되어 있는 5' 정션 주변부를 증폭하여, 761 bp의 PCR 산물을 증폭시키며 (다른 예로, HJ53와 HJ253를 이용하여 PCR 산물 1 kb를 수득함); H727과 HJ258은 GAL80 하류 서열 bp와 함께 마커의 3' 정션을 증폭하여 1033 bp의 산물을 증폭시킨다 (다른 예로, HJ727과 HJ54를 이용하여 627 bp의 PCR 산물을 수득함). 그런 다음, 선별된 분리체에 xMarker 타겟팅 구조체 GAL4-US_xM0.Kan.FCphI_GAL4-DS를 형질전환하였다. 형질전환주를 3 mL YPD 액체 배지에서 5시간 동안 배양한 다음, YPD + G418 배지에 접종하였다. 형질전환주는 콜로니 PCR로 검증하였다. 올리고뉴클레오티드 HJ270과 HJ253은 GAL4 상류 서열내 형질전환된 DNA가 병합된 5' 정션 주변부를 증폭하여, 1.1 kp의 PCR 산물을 증폭시키며 (다른 예로, HJ270과 HJ54를 이용하여 PCR 산물 774 bp를 수득함); H239와 HJ706은 GAL4 하류 서열 bp와 함께 마커의 3' 정션을 증폭하여 793 bp의 산물이 수득된다 (다른 예로, HJ239와 HJ241을 이용하여 1038 bp의 PCR 산물을 수득함).

유전자형이 gal80Δ::xHph gal4Δ::xKan인 분리주를 natA-marked F-CphI 발현 플라스미드 (pAM1864)로 형질전환하였다. 형질전환주를 3 mL YPD 액체 배지에서 5시간 동안 배양한 다음, YPD + 노르세오트리신 배지에 접종하였다. 30℃에서 3일간 배양한 후, 형질전환주 4개를 신선한 YPD 배지에 스트리킹하여, pAM1864를 소실시켰다. xMarker 적출과 pAM1864의 소실을 테스트하기 위해, 콜로니 50개 (각 스트리크 당 콜로니 약 12-13개)를 YPD 플레이트에 패치한 다음, 24시간 후 YPD, YPD + 히그로마이신, G418 또는 노르세오트리신 플레이트에 리플리카를 찍었다. 리플리카 플레이팅 후 48시간 후에 플레이트를 시험하였다.

동시적인 다중 병합 빈도는 100%였으며, 즉, 50/50 콜로니들이 히그로마이신과 G418 둘다에 대한 내성을 상실하였는데, 이는, 테스트한 콜로니들 모두 xMarker를 둘다 소실했다는 것을 의미한다. 또한, 약 20% (10/50)의 콜로니가 노르세오트리신에 대한 내성을 상실하였는데, 이는 20%의 콜로니가 F-CphI 플라스미드를 소실했다는 것을 의미한다. 비슷한 빈도는 2개의 xMarker 구조체가 게놈에 병합된 2종의 다른 균주들에서도 관찰되었다. F-CphI을 발현하는 제2 gal80Δ::xHph gal4Δ::xKan 균주의 경우, 50/50개의 콜로니가 히그로마이신과 G418 둘다에 대한 내성을 상실하였으며, 10/50개의 콜로니가 노르세오트리신에 대한 내성을 상실하였다. F-CphI을 발현하는 제3의 gal80Δ::xHph gal4Δ::xKan 균주의 경우, 48/48개의 콜로니가 히그로마이신과 G418 둘다에 대한 내성을 상실하였으며, 5/50개의 콜로니가 노르세오트리신에 대한 내성을 상실하였다. 3가지 약물 모두에 대해 내성을 상실한 콜로니들을 또한 콜로니 PCR로 검증하였다. 예상된 바와 같이, 이들 모두 양쪽 xMarke가 F-CphI으로 적출되었다.

본 실시예는 단일 반수체 균주에서의 2개 마커가 고도의 빈도로 퍼펙트 적출됨을 입증해준다. 아울러, 본 실시예는, 염색체 전위 또는 게놈 불안정성에 대한 증거가 없음을 보여준다. 이러한 결과는, xMarker 구조체가 숙주 세포 게놈으로부터 타겟 DNA를 동시적으로 다중 적출하는 것을 매우 효과적으로 촉진함을 의미한다.

6.2.5. 다양한 길이의 DR을 포함하는 xMarker 구조체의 게놈 안정성

본 실시예는, 효모 게놈에 병합되었을 때, 엔도뉴클레아제의 발현 부재시, 다양한 길이의 동향 리피트 (DR)를 포함하는 xMarker 구조체의 안정성을 보여준다.

조건부 유전자 결손 시스템은 유도 및 비-유도 조건 전에는 현저한 적출이 이루어지 않도록 엄격하게 제어되는 것이 좋다. 게놈 조작 측면에서, 자발적인 상동 재조합 현상의 높은 발생율 게놈의 불안정화, 선별 마커의 부적절한 소실, 그리고 그 결과로서 바람직한 게놈형의 선별 능력 상실을 유도할 수 있다.

천연적이고, 내인성의, 자발적인 상동성 재조합 현상은 사이에 배치된 DNA를 결손시키는 동향 리피트 서열들 (일반적으로, > 300 bp) 간의 재조합 교차를 드물게 촉매할 수 있다. 공개된 보고서에 따르면, DR과 측면 서열 간의 자발적인 재조합 교차 ("루프-아웃")를 통해 효모 숙주 세포 게놈으로부터 서열이 적출될 수 있는 것으로 확인된 바 있다. 300 bp - 1.1 kb 길이의 DR들 간에 이러한 루프-아웃이 발생하는 비율은 세포 1000개 중 하나 (1 x 10^-3) 내지 10,000개 중 하나 (1 x 10^-4)인 것으로 보고되었다 (Alani et al. (1987) Genetics 116(4):541-5 (동향 리피트 길이 1100 bp의 경우, 10^-4); Wach et al. (1994) Yeast 10(13):1793-808 (동향 리피트 길이 430 bp의 경우, 10^-3- 10^-4); Erdeniz et al. (1997) Genome Res 7(12):1174-83) (동향 리피트 길이 ~300 - 3000 bp의 경우, 10^-3내지 10^-4). 다양한 길이의 동향 리피트를 가진 병합된 xMarker 구조체의 게놈 안정성을 확인하기 위해, 다양한 길이의 DR들 간의 자발적인 재조합 교차율을 엔도뉴클레아제 발현 부재 조건에서 분석하였다.

NDT80 유전자 좌에 xMarker가 병합되고 (NDT80 유전자 결손), 동향 리피트의 길이가 50, 60, 80 및 198 bp인 균주를 다음과 같이 제조하였다. 하기 URA3 xMarker 변이체를 01-0-U-30 및 29-0-D-23 RaBit와 프라이머로서 RYSE0 및 RYSE19 올리고뉴클레오티드를 이용하여 연결함으로써, 병합 벡터를 제작하였다.

표 15: 게놈 안정성에 대한 탠덤 반복체 길이의 효과를 분석하기 위해 사용한 xMarker 개개 인자들의 특징 리스트

URA3 xMarker 명칭	DR의 길이 (bp)	ES 사이트 (#)	ES 사이트의 상호 방향성	DR(scar) 서열
50mer-direct (aka xM0_URA3)	50	F-CphI (2)	동향	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCT (서열번호 23)
60mer-direct (aka s0x-URA3)	60	I-SceI (2)	동향	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCTGCGACGAGCT (SEQ ID NO:10)
80mer-direct	80	I-SceI (2)	동향	AAGATCCGATCGACCGAGAACTGAGAACGGTGCAATGATCAACATGATCTGCGACGAGCTTGAGGATGCAAATGGCTGAC (서열번호 85)
198mer-direct (aka Rabit 606)	198	0	동향	TCACTATTATTCCATAAGATGATCATTAGCATTACGTTCAAAACGAGTACAAATAACTTAAGTAATAACACGAGCCATATGACCATTAGCAAGATGACAAGCAAGTTAAGACCAATCAGCTTCCATCATAGCATCAGCTTAACGTTCACCATTAATAAGAGTAGAAATTTCACCTTCAAGACAATAACGATTTTCGTG (서열번호 145)

ura3- 균주로 형질전환한 후, 세포를 ura3- 플레이트에 접종한 다음, 콜로니 PCR로 병합이 바르게 이루어졌는지를 콜로니에서 검증하였다. 올리고뉴클레오티드 AET0065-186-63-F-pNDT80과 RYSE3은 형질전환 DNA가 NDT80 상류 서열내로 병합된 5' 정션 주변부를 증폭시켜, 1024 bp의 PCR 산물을 만들어내며; AET0072-186-63-R-tNDT80과 RYSE4는 NDT80 하류 서열과 함께 마커의 3' 정션을 증폭시켜 1024 bp의 산물을 만들었다. 이러한 결과는 xMarker의 병합 및 NDT80의 파괴를 의미한다. 각 xMarker 변이체에서 검증된 분리주 2종을 이후 분석을 위해 선별하였다.

콜로니를 우라실 결핍성 CSM 배지에 스트리킹한 다음, DR들 간의 URA3 마커의 자발적인 적출이 이루어지도록 하고, 세포를 YPD 액체 배지에서 2일간 배양하고, 12-24시간 마다 희석하였다 (대략 25회 배가). URA3+ 및 ura3- 콜로니는 이 배양 배지에서 잘 증식하기 때문에, 유전자 적출은 선별되지 않는다. 아울러, 천연 URA3, 즉 임의의 동향 리피트들이 측면에 존재하지 않는 URA3를 포함하는 세포를, URA3 코딩 서열의 루프-아웃 없이, (5-FOA에서의 숙주 세포를 생존시키는) URA3의 활성을 감소 또는 실활시키는 점 돌연변이(들)를 유도할 수 있는, 자발적인 돌연변이율을 평가하기 위한 대조군으로서 배양하였다.

배양물을 마지막으로 5-FOA가 함유된 고체 배지에 접종하여, 2.5일간 배양한 후, 콜로니의 수를 측정하였다. 각 유전자형에 대해 16개의 개개 ura3- (5-FOA 내성) 콜로니를 콜로니 PCR을 통해, URA3 유전자의 자발적인 루프-아웃에 대해 또는 다른 예로 온전한 URA3 유전자의 존재에 대해 검증하였다. xMarker와 NDT80 서열 사이의 정션의 208 bp 상류 (JU-197-168-125-NDT80US-F) 및 234 bp 하류 (JU-198-168-125-NDT80DS-R)에 어닐링하는 프라이머를 사용하였다. PCR 산물의 예상 크기는, URA3가 깔끔하게 적출된 경우 462-522 bp였고, URA3가 온전한 경우에는 2072 bp였다.

표 16에서 알 수 있는 바와 같이, 동향 리피트가 측면에 존재하지 않는 URA3를 포함하는 세포에서의 5-FOA 평균 내성 빈도는 대략 1.7 x 10^-6 세포였는데, 이는 URA3를 실활시키는 내적 자발적인 돌연변이 발생율이다. 50-80 bp 길이의 동향 리피트가 측면에 위치된 URA3를 포함하는 세포에서의 평균 5-FOA 내성 빈도는 대략 4.5 x 10^-6 내지 1.14 x 10^-5 세포이며, 198 bp 길이의 동향 리피트가 측면에 위치된 URA3를 포함하는 세포에서의 평균 5-FOA 내성 빈도는 대략 4.7 x 10^-5 세포였다.

콜로니 PCR (cPCR) 결과를 통해, 어느 정도의 5-FOA 내성 xMarker 콜로니가 URA3 마커의 루프-아웃과는 상반되게 URA3를 실활시키는 자발적인 돌연변이의 결과로서 생긴다는 것이 검증되었다. 특히, 50 bp 및 80 bp의 DR 길이를 가진 xMarker 구조체가 병합된 콜로니의 경우, cPCR에 의해 스크리닝된 5-FOA 내성 콜로니 12개 중 4개 (4/12)가 온전한 URA3 유전자를 가지고 있었는데, 이는 이들 콜로니에서의 5-FOA 내성이 URA3 루프-아웃 보다는 URA3에서의 자발적인 돌연변이 실활로 인해 생긴다는 것을 의미한다. 따라서, xMarker 균주에서의 DR-매개 자발적인 루프-아웃 빈도는 관찰되는 5-FOA 내성 빈도 보다 훨씬 낮을 것으로 예상된다. 5-FOA 내성을 대용체(proxy)로서 이용하는 경우에서의 이러한 한계는 알고 있지만, 이러한 결과들은, 약 50 - 200 bp 길이의 DR과 관련된 자발적인 루프-아웃 빈도가, 300 bp 내지 1.1 kb 길이의 DR에서 보고된 자발적인 루프-아웃 빈도 보다 1 내지 3배 낮은 것으로 나타났다 (전술한 바와 같이, 10^-6 내지 10^-5 대 10^-4 내지 10^-3).

이러한 결과들에서, 약 200 bp 길이의 DR이 자발적인 루프-아웃의 발생 빈도를 300 bp 이상 길이의 DR에 비해 1-2 log로 낮추는 것으로 확인되었다. 특히, 198 bp 길이의 DR에서의 자발적인 루프-아웃 발생 빈도는 1.7 x 10^-6 세포였으며, 동향 리피트가 존재하지 않는 경우의 세포에서의 빈도 약 4.7 x 10^-5 세포와 대비되었다.

더 짧은 길이의 DR의 경우 결과가 훨씬 더 극적이었다. 전술한 바와 같이, 50 - 80 bp 길이의 DR이 300 bp 이상 길이의 DR에 비해 자발적인 루프-아웃 발생 빈도를 2-3 log로 낮추는 것으로 확인되었다.

아울러, 이들 결과는, 자발적인 URA3 루프-아웃 발생 빈도가, DR 길이가 200 미만으로 짧아짐에 따라, 자발적인 URA3 돌연변이 발생율에 근접함을 보여준다. 50, 60 및 80 길이의 DR은 자발적인 돌연변이 실활과 비교하여 루프-아웃으로 인해 URA3 소실을 대략 2.7 내지 7배 증가시켰다.

이러한 결과는, 약 200 bp 이하 길이의 DR이 300 bp 이상 길이의 DR과 비교하여 게놈 안정성에 실질적인 이점을 제공함을 시사한다. 타겟 DNA의 적출은 엄격하게 통제되어, 호밍 엔도뉴클레아제로 유도하기 전에는 유의하게 적출되지 않는다. 따라서, 본원에 기술된 xMarker 방법 및 조성물은 비-유도성 조건에서 타겟 DNA, 예컨대 선별 마커의 체류성을 개선시켜, 게놈 안정성을 높이고, 균주 조작시 유전자형의 선별 효율을 높일 수 있다.

표 16. 다양한 길이의 동향 리피트 (DR)에 의해 매개되는 자발적인 재조합 현상

DR 길이	분리체	평균 콜로니 수	표준 편차	접종한 세포 수	5-FOA 내성 빈도	평균 5-FOA 내성	cPCR로 cPCR로 테스트한 콜로니 수	URA3 유전자가 결핍된 콜로니 수	URA3 유전자를 가진 콜로니 수
0	a	32.17	16.69	2.68E+07	1.20E-06		16	0	16
0	b	57.67	34.14	2.72E+07	2.12E-06	1.66E-06
50	a	240.83	157.67	2.76E+07	8.74E-06		16	12	4
50	b	164.67	68.95	2.74E+07	6.02E-06	7.38E-06
60	a	260.83	142.14	2.74E+07	9.52E-06		16	15	1
60	b	361.00	214.56	2.72E+07	1.33E-05	1.14E-05
80	a	113.83	53.15	2.58E+07	4.41E-06		16	12	4
80	b	116.33	22.91	2.49E+07	4.67E-06	4.54E-06
198	a	1212.00	343.09	2.52E+07	4.81E-05		16	16	0
198	b	1118.67	132.32	2.44E+07	4.58E-05	4.69E-05

이들 결과는, 특별한 선별 마커 변이체를 제작 및 적출하기 위한, 본원에 기술된 조성물 및 방법이, 높은 빈도, 효율, 충실도 및 안정성으로 구현됨을 입증해준다. I-SceI 및 F-CphI 엔도뉴클레아제는 이러한 방식으로 유효하게 작동하며, F-CphI의 경우 사카로마이세스 세레비지애 세포에서 예측치 못한 우수한 적출 빈도와 충실도가 확인되었다. 적출 현상 자체는 이배체 세포에서도, 그리고 2 이상의 xMarker를 구비한 세포에서도 게놈 불안정성을 야기하지 않는다. 이 방법의 장점은 한번에 다수의 xMarker를 동시에 적출할 수 있는 역량, 그리고 동일한 균주에서 xMarker의 반복 사용 및 재이용시 각 scar가 독특하게 설계될 수 있는, 매우 다양한 고유한 scar 서열들을 선택할 수 있다는 것이다. 이는, 부위-특이적인 재조합효소에 대한 결합 사이트와 절단 사이트를 복수 카피로 필연적으로 남기게 되고, 이것이 게놈 전체에 산재되어, 염색체 단편의 전위와 적출을 일으킬 수 있는 재조합효소가 재-도입되어 재절단될 때까지 대기하는 Flp/FRT 또는 Cre/lox 시스템에 비해 유익하다. 다른 이점은, 적출 빈도가 대부분 50% 보다 높아, 이러한 방법을 이용하여, 성공적으로 적출된 생산 분리주들만 증식시킬 수 있는 이용가능한 선별 방법이 없는 경우에라도, 바람직한 생산 균주를 동정하기 위한 스크리닝 방법을 이용하여, 임의의 바람직한 타겟 DNA를 적출할 수 있다는 것이다.

본 명세서에서 인용된 모든 간행물, 특허 및 특허 출원들은 그 각각의 간행물 또는 특허 출원이 구체적이고 개별적으로 원용에 의해 본 명세서에 포함되는 것으로 명시된 바와 같이 원용에 의해 본 명세서에 포함된다. 상기 본 발명은 예로서 그리고 명확한 이해를 돕기 위해 일부 상세하게 기술되어 있지만, 본 발명의 내용에 비추어 당해 기술 분야의 당업자라면 첨부된 청구항의 사상 및 범위로부터 이탈되지 않으면서 본 발명에 대한 일부 변화 및 수정을 가할 수 있음은 자명할 것이다.

SEQUENCE LISTING <110> AMYRIS INC. Benjamin, Kirsten R. <120> NUCLEIC ACIDS, COMPOSITIONS AND METHODS FOR THE EXCISION OF TARGET NUCLEIC ACIDS <130> 107345.00067 <140> PCT/US2011/049615 <141> 2011-08-29 <150> 61/378,350 <151> 2010-08-30 <160> 144 <170> PatentIn version 3.5 <210> 1 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Motif sequence for LAGLIDADG homing endonuclease <400> 1 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 2 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Motif sequence for GIY-YIG homing endonuclease <400> 2 Gly Ile Tyr Tyr Ile Gly 1 5 <210> 3 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Recognition sequence for I-SceI <400> 3 tagggataac agggtaat 18 <210> 4 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Recognition sequence for VDE (PI-SceI) <400> 4 tatgtcgggt gcggagaaag aggtaatgaa a 31 <210> 5 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Recognition sequence for F-Cph <400> 5 gatgcacgag cgcaacgctc acaa 24 <210> 6 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Recognition sequence for PI-MgaI (pps1) <400> 6 gcgtagctgc ccagtatgag tcag 24 <210> 7 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Recognition sequence for PI-MtuII (pps1) <400> 7 acgtgcacta cgtagagggt cgcaccgcac cgatctacaa 40 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) s20M <400> 8 aagatccgat cgaccgagaa 20 <210> 9 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) s40M <400> 9 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc 40 <210> 10 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) s60M <400> 10 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60 <210> 11 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) s80M <400> 11 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60 tgaggatgca aatggctgac 80 <210> 12 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Single sequence s60M <400> 12 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60 <210> 13 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s1x_hphA repeat sequence <400> 13 cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa cttgcgactt 60 <210> 14 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s2x_hphA repeat sequence <400> 14 gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc tattagcccg 60 <210> 15 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s3x_kanA repeat sequence <400> 15 cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga gtgtgaccca 60 <210> 16 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s4x_kanA repeat sequence <400> 16 ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac actgccagac 60 <210> 17 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s5x_natA repeat sequence <400> 17 atggaatcac ggggctattc cacttgctaa taacgaggcg cttatcaacg gcgagcacat 60 <210> 18 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s6x_natA repeat sequence <400> 18 agtcaaagcg cgattcgcta ggaatgagag cgagaacgaa ccggagtata tcacaatcgc 60 <210> 19 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s7x_URA3 repeat sequence <400> 19 actagagcga aatggagagg tacgtgatcc tactagagcc cacgctatca tacagttggc 60 <210> 20 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> s8x_URA3 repeat sequence <400> 20 gtacgtccgt acttatgctg agcgctccta cacgaaaaac tcaccgtgac tagcataacg 60 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> I-SceI primer sequence <400> 21 gctagggata acagggtaat 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> I-SceI primer sequence <400> 22 actagggata acaggtttat 20 <210> 23 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM0 <400> 23 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct 50 <210> 24 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM1 <400> 24 cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa 50 <210> 25 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM2 <400> 25 gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc 50 <210> 26 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM3 <400> 26 cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga 50 <210> 27 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM4 <400> 27 ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac 50 <210> 28 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM5 <400> 28 gaatcacggg gctattccac ttgctaataa cgaggcgctt atcaacggcg 50 <210> 29 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM6 <400> 29 gtcaaagcgc gattcgctag gaatgagagc gagaacgaac cggagtatat 50 <210> 30 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM7 <400> 30 actagagcga aatggagagg tacgtgatcc tactagagcc cacgctatca 50 <210> 31 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM8 <400> 31 gtacgtccgt acttatgctg agcgctccta cacgaaaaac tcaccgtgac 50 <210> 32 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Directly repeated sequence (DR) xM9 <400> 32 gcattaagtc gtagctagcg gattctctct tcgtgcatcc tagcaaatgg 50 <210> 33 <211> 2733 <212> DNA <213> Artificial Sequence <220> <223> RYSE 12 entry vector <400> 33 gtaaaacgac ggccagtatt aaccctcact aaagggaact cgaggctctt cagctcacac 60 gcggccaggg ggagcctggc agactccata tgctatgcgg catcagagca gattgtactg 120 agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc 180 aggcgccatt cgccattcag gctgcgcaac tgttgggaag ggcgatcggt gcgggcctct 240 tcgctattac gccagctggc gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg 300 ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtgaattcga gctcggtacc 360 cggggatcct ctagcgtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct 420 gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 480 aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgcgc 540 tagcgagtca tccacgctcg tccaacgccg gcggaccttg aagagcgagc tcccgctgag 600 caataactag cgtcatagct gtttcctggg tcgttcggct gcggcgagcg gtatcagctc 660 actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 720 gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 780 ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 840 acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 900 ctgttccgac cctgccgctt acccgatacc tgtccgcctt tctcccttcg ggaagcgtgg 960 cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 1020 tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 1080 gtcttgattc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 1140 ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 1200 acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 1260 gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1320 ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1380 tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1440 gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1500 tctaaagtat atatgagtaa cttggtcgca tgcttaccaa tgcttaatca gtgaggcacc 1560 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactgcccg tcgtgtagat 1620 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 1680 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 1740 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 1800 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 1860 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 1920 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 1980 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 2040 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 2100 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 2160 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 2220 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 2280 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 2340 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatcaattg 2400 cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gttacatatt 2460 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 2520 acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac 2580 gaggcccttt catctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct 2640 cccggagaca gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg 2700 cgcgtcagcg ggtgttggcg ggtgtcgggg ctg 2733 <210> 34 <211> 1692 <212> DNA <213> Artificial Sequence <220> <223> xMarker ss60M.URA.I-SceI <400> 34 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60 tagggataac agggtaatat gcgtccatct ttacagtcct gtcttattgt tcttgatttg 120 tgccccgtaa aatactgtta cttggttctg gcgaggtatt ggatagttcc tttttataaa 180 ggccatgaag ctttttcttt ccaatttttt ttttttcgtc attatagaaa tcattacgac 240 cgagattccc gggtaataac tgatataatt aaattgaagc tctaatttgt gagtttagta 300 tacatgcatt tacttataat acagtttttt agttttgctg gccgcatctt ctcaaatatg 360 cttcccagcc tgcttttctg taacgttcac cctctacctt agcatccctt ccctttgcaa 420 atagtcctct tccaacaata ataatgtcag atcctgtaga gaccacatca tccacggttc 480 tatactgttg acccaatgcg tctcccttgt catctaaacc cacaccgggt gtcataatca 540 accaatcgta accttcatct cttccaccca tgtctctttg agcaataaag ccgataacaa 600 aatctttgtc actcttcgca atgtcaacag tacccttagt atattctcca gtagataggg 660 agcccttgca tgacaattct gctaacatca aaaggcctct aggttccttt gttacttctt 720 ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac cacaccgtgt gcattcgtaa 780 tgtctgccca ttctgctatt ctgtatacac ccgcagagta ctgcaatttg actgtattac 840 caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt gtacttggcg gataatgcct 900 ttagcggctt aactgtgccc tccatggaaa aatcagtcaa gatatccaca tgtgttttta 960 gtaaacaaat tttgggacct aatgcttcaa ctaactccag taattccttg gtggtacgaa 1020 catccaatga agcacacaag tttgtttgct tttcgtgcat gatattaaat agcttggcag 1080 caacaggact aggatgagta gcagcacgtt ccttatatgt agctttcgac atgatttatc 1140 ttcgtttcct gcaggttttt gttctgtgca gttgggttaa gaatactggg caatttcatg 1200 tttcttcaac accacatatg cgtatatata ccaatctaag tctgtgctcc ttccttcgtt 1260 cttccttctg ctcggagatt accgaatcaa aaaaatttca aagaaaccgg aatcaaaaaa 1320 aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg accctgaaac cacagccaca 1380 ttaaccttct ttgatggtca aaacttatcc ttcaccataa atatgcctcg caaaaaaggt 1440 aattaacata tatagaatta cattatttat gaaatatcat cactatctct tagcatcttt 1500 aatccttttc tacatcagat aacttcggtt tgttatcatc gtctgtattg tcatcaattg 1560 gcgcagtagc ctcaatttca acgtcgtttg actctggtgt ttgttcatgt gcagatccat 1620 gagatgatga acaagatccg atcgaccgag aactgagaac ggtgcaatga tcaacatgat 1680 ctgcgacgag ct 1692 <210> 35 <211> 1602 <212> DNA <213> Artificial Sequence <220> <223> RaBit12-0-M-555 <400> 35 gctcacacgc ggccaggggg agccgttcat catctcatgg atctgcacat gaacaaacac 60 cagagtcaaa cgacgttgaa attgaggcta ctgcgccaat tgatgacaat acagacgatg 120 ataacaaacc gaagttatct gatgtagaaa aggattaaag atgctaagag atagtgatga 180 tatttcataa ataatgtaat tctatatatg ttaattacct tttttgcgag gcatatttat 240 ggtgaaggat aagttttgac catcaaagaa ggttaatgtg gctgtggttt cagggtccat 300 aaagcttttc aattcatctt tttttttttt gttctttttt ttgattccgg tttctttgaa 360 atttttttga ttcggtaatc tccgagcaga aggaagaacg aaggaaggag cacagactta 420 gattggtata tatacgcata tgtggtgttg aagaaacatg aaattgccca gtattcttaa 480 cccaactgca cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat 540 ataaggaacg tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc 600 acgaaaagca aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg 660 agttagttga agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga 720 ctgatttttc catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt 780 ttttactctt cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact 840 ctgcgggtgt atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg 900 gcccaggtat tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag 960 gccttttgat gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta 1020 agggtactgt tgacattgcg aagagtgaca aagattttgt tatcggcttt attgctcaaa 1080 gagacatggg tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt 1140 tagatgacaa gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta 1200 caggatctga cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg 1260 tagagggtga acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc 1320 aaaactaaaa aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt 1380 caatttaatt atatcagtta ttacccggga atctcggtcg taatgatttc tataatgacg 1440 aaaaaaaaaa aattggaaag aaaaagcttc atggccttta taaaaaggaa ctatccaata 1500 cctcgccaga accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga 1560 ctgtaaagat ggacgcatcg ctcgtccaac gccggcggac ct 1602 <210> 36 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Primer KB520-266-136 <400> 36 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gatgcacgag 60 cgcaacgctc acaagttcat catctcatgg atctg 95 <210> 37 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Primer KB521-266-136 <400> 37 agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt gtgagcgttg 60 cgctcgtgca tcatgcgtcc atctttacag tcc 93 <210> 38 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Primer KB522-266-136 <400> 38 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgtagctgc 60 ccagtatgag tcaggttcat catctcatgg atctg 95 <210> 39 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Primer KB523-266-136 <400> 39 agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt ctgactcata 60 ctgggcagct acgcatgcgt ccatctttac agtcc 95 <210> 40 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Primer KB524-266-136 <400> 40 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct acgtgcacta 60 cgtagagggt cgcaccgcac cgatctacaa gttcatcatc tcatggatct g 111 <210> 41 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> Primer KB525-266-136 <400> 41 agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt gtagatcggt 60 gcggtgcgac cctctacgta gtgcacgtat gcgtccatct ttacagtcc 109 <210> 42 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Primer KB518-266-135 <400> 42 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct tatgtcgggt 60 gcggagaaag aggtaatgaa agttcatcat ctcatggatc tg 102 <210> 43 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Primer KB519-266-135 <400> 43 agatcatgtt gatcattgca ccgttctcag ttctcggtcg atcggatctt tttcattacc 60 tctttctccg cacccgacat aatgcgtcca tctttacagt c 101 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer KB496-266-100 <400> 44 ccaacaataa taatgtcaga tcc 23 <210> 45 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer KB495-266-100 <400> 45 ccgagcagaa ggaagaacg 19 <210> 46 <211> 1504 <212> DNA <213> Artificial Sequence <220> <223> RaBit12-0-M-262 <400> 46 gctcacacgc ggccaggggg agcctcgaca ctagtaatac acatcatcgt cctacaagtt 60 catcaaagtg ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc 120 ccgctctctc gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag 180 tagcgtttat acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa 240 aaaaaagaaa aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat 300 ttggtgattt tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc 360 gaaaaaattt ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta 420 ttattatgga ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt 480 ttgtttaatc ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa 540 aaatgaccac tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg 600 aggccatcga ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca 660 ccggggacgg cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc 720 ccgacgacga atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga 780 cgttcgtcgc gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg 840 gctggaaccg ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg 900 gggtcgggcg cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc 960 acctctggct ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg 1020 ggttcaccct ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc 1080 aggcgctcta catgagcatg ccctgcccct gagtttaact tgatactact agattttttc 1140 tcttcattta taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt 1200 ttttcattct ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa 1260 acctaacaaa agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct 1320 gttttcccat ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga 1380 tttagtttct ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag 1440 tatttagtta ttcatataat cttaacttct cgaggagctc cgctcgtcca acgccggcgg 1500 acct 1504 <210> 47 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Primer MF51-312-97 <400> 47 cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcat 97 <210> 48 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Primer MF52-312-97 <400> 48 ttctagcgtc gctatgtgtc tcgacgctaa ctagtgtgtg cttcgtaacg ttgtgagcgt 60 tgcgctcgtg catcgagctc ctcgagaagt taag 94 <210> 49 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Primer MF57-312-98 <400> 49 ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcat 97 <210> 50 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Primer MF58-312-98 <400> 50 gtgtgaacta cccgttgatc attcagtgct agtctctggg cgctgattaa ttgtgagcgt 60 tgcgctcgtg catcgagctc ctcgagaagt taag 94 <210> 51 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Primer KB479-266-81 <400> 51 cgtccgattc gtcgtcg 17 <210> 52 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Primer KB480-266-81 <400> 52 gaggtgccgg tggacc 16 <210> 53 <211> 1960 <212> DNA <213> Artificial Sequence <220> <223> RaBit12-0-M-21 <400> 53 gctcacacgc ggccaggggg agcctcgaca ctagtaatac acatcatcgt cctacaagtt 60 catcaaagtg ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc 120 ccgctctctc gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag 180 tagcgtttat acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa 240 aaaaaagaaa aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat 300 ttggtgattt tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc 360 gaaaaaattt ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta 420 ttattatgga ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt 480 ttgtttaatc ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa 540 aaatgaaaaa gcctgaactc accgcgacgt ctgtcgagaa gtttctgatc gaaaagttcg 600 acagcgtctc cgacctgatg cagctctcgg agggcgaaga atctcgtgct ttcagcttcg 660 atgtaggagg gcgtggatat gtcctgcggg taaatagctg cgccgatggt ttctacaaag 720 atcgttatgt ttatcggcac tttgcatcgg ccgcgctccc gattccggaa gtgcttgaca 780 ttggggaatt cagcgagagc ctgacctatt gcatctcccg ccgtgcacag ggtgtcacgt 840 tgcaagacct gcctgaaacc gaactgcccg ctgttctgca gccggtcgcg gaggccatgg 900 atgcgatcgc tgcggccgat cttagccaga cgagcgggtt cggcccattc ggaccgcaag 960 gaatcggtca atacactaca tggcgtgatt tcatatgcgc gattgctgat ccccatgtgt 1020 atcactggca aactgtgatg gacgacaccg tcagtgcgtc cgtcgcgcag gctctcgatg 1080 agctgatgct ttgggccgag gactgccccg aagtccggca cctcgtgcac gcggatttcg 1140 gctccaacaa tgtcctgacg gacaatggcc gcataacagc ggtcattgac tggagcgagg 1200 cgatgttcgg ggattcccaa tacgaggtcg ccaacatctt cttctggagg ccgtggttgg 1260 cttgtatgga gcagcagacg cgctacttcg agcggaggca tccggagctt gcaggatcgc 1320 cgcggctccg ggcgtatatg ctccgcattg gtcttgacca actctatcag agcttggttg 1380 acggcaattt cgatgatgca gcttgggcgc agggtcgatg cgacgcaatc gtccgatccg 1440 gagccgggac tgtcgggcgt acacaaatcg cccgcagaag cgcggccgtc tggaccgatg 1500 gctgtgtaga agtactcgcc gatagtggaa accgacgccc cagcactcgt ccgagggcaa 1560 aggaataggt ttaacttgat actactagat tttttctctt catttataaa atttttggtt 1620 ataattgaag ctttagaagt atgaaaaaat cctttttttt cattctttgc aaccaaaata 1680 agaagcttct tttattcatt gaaatgatga atataaacct aacaaaagaa aaagactcga 1740 atatcaaaca ttaaaaaaaa ataaaagagg ttatctgttt tcccatttag ttggagtttg 1800 cattttctaa tagatagaac tctcaattaa tgtggattta gtttctctgt tcgttttttt 1860 ttgttttgtt ctcactgtat ttacatttct atttagtatt tagttattca tataatctta 1920 acttctcgag gagctccgct cgtccaacgc cggcggacct 1960 <210> 54 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Primer MF53-312-98 <400> 54 gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcat 97 <210> 55 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Primer MF54-312-98 <400> 55 gataccaggt ggactctagt acgtggagat ccgtttctac taggcagtac ttgtgagcgt 60 tgcgctcgtg catcgagctc ctcgagaagt taag 94 <210> 56 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Primer KB492-266-100 <400> 56 gccgaaatcc gcgtgc 16 <210> 57 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer KB491-266-100 <400> 57 cggaagtgct tgacattgg 19 <210> 58 <211> 1744 <212> DNA <213> Artificial Sequence <220> <223> RaBit 12-0-M-261 <400> 58 gctcacacgc ggccaggggg agcctcgaca ctagtaatac acatcatcgt cctacaagtt 60 catcaaagtg ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc 120 ccgctctctc gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag 180 tagcgtttat acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa 240 aaaaaagaaa aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat 300 ttggtgattt tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc 360 gaaaaaattt ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta 420 ttattatgga ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt 480 ttgtttaatc ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa 540 aaatgggtaa ggaaaagact cacgtttcga ggccgcgatt aaattccaac atggatgctg 600 atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg acaatctatc 660 gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg 720 ccaatgatgt tacagatgag atggtcagac taaactggct gacggaattt atgcctcttc 780 cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc actgcgatcc 840 ccggcaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa aatattgttg 900 atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat tgtcctttta 960 acagcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac ggtttggttg 1020 atgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa 1080 tgcataagct tttgccattc tcaccggatt cagtcgtcac tcatggtgat ttctcacttg 1140 ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga cgagtcggaa 1200 tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag ttttctcctt 1260 cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg aataaattgc 1320 agtttcattt gatgctcgat gagtttttct aagtttaact tgatactact agattttttc 1380 tcttcattta taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt 1440 ttttcattct ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa 1500 acctaacaaa agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct 1560 gttttcccat ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga 1620 tttagtttct ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag 1680 tatttagtta ttcatataat cttaacttct cgaggagctc cgctcgtcca acgccggcgg 1740 acct 1744 <210> 59 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Primer TD_180 <400> 59 cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cc 102 <210> 60 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Primer TD_181 <400> 60 tctcttagga gatgcggtac atagcttagg gccttacacg ttaatcctcg ttgtgagcgt 60 tgcgctcgtg catcgagctc ctcgagaagt taagattata tg 102 <210> 61 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer KB494-266-100 <400> 61 tatctattag aaaatgcaaa ctcc 24 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer KB493-266-100 <400> 62 gttactcacc actgcgatcc 20 <210> 63 <211> 429 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for F-CphI <400> 63 atgactaagt tgtattctga cttgtacagg acctgcatga catgcggaga agaaaaattg 60 tcaaccgagt tctacgtcag gaacaagaag accggagtta gacattcatc atgcaaagag 120 tgtgacaagg tcagggtcaa atcaagacac aaggagaacc ctgaaaggac caaaaacaac 180 gacttgaaga gattgtacgg aatcaccttg gacgagcata cccaaatgta tgaggaacaa 240 aatggtgtat gtgcaatttg caagggagaa ggagatggaa agtggaagaa attgtgtgtt 300 gaccatgatc acgaaacagg aaaggtcagg cagttgttgt gtaggaactg caatatgatg 360 ttgggtcagg tcaacgacaa cgttaactta ttatcagaaa tgataaagta tttgaaaaga 420 tatcagtaa 429 <210> 64 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> Primer TD_176 <400> 64 gtcaaagcgc gattcgctag gaatgagagc gagaacgaac cggagtatat gatgcacgag 60 cgcaacgctc acaaaataca catcatcgtc ctacaagttc atc 103 <210> 65 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> Primer TD_177 <400> 65 atatactccg gttcgttctc gctctcattc ctagcgaatc gcgctttgac ttgtgagcgt 60 tgcgctcgtg catcaagtta agattatatg aataactaaa tac 103 <210> 66 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer TD_183 <400> 66 tcggccacga agtgcacgca gttg 24 <210> 67 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer TD_182 <400> 67 tcgagttctg gaccgaccgg ctcg 24 <210> 68 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer RYSE0 <400> 68 gacggcacgg ccacgcgttt aaaccgcc 28 <210> 69 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer RYSE19 <400> 69 cggtgtttaa accccagcgc ctggcggg 28 <210> 70 <211> 598 <212> DNA <213> Artificial Sequence <220> <223> RaBit01-0-U-407 <400> 70 gacggcacgg ccacgcgttt aaaccgccga gctattcgcg gaacattcta gctcgtttgc 60 atcttcttgc atttggtagg ttttcaatag ttcggtaata ttaacggata cctactatta 120 tcccctagta ggctcttttc acggagaaat tcgggagtgt tttttttccg tgcgcatttt 180 cttagctata ttcttccagc ttcgcctgct gcccggtcat cgttcctgtc acgtagtttt 240 tccggattcg tccggctcat ataataccgc aataaacacg gaatatctcg ttccgcggat 300 tcggttaaac tctcggtcgc ggattatcac agagaaagct tcgtggagaa tttttccaga 360 ttttccgctt tccccgatgt tggtatttcc ggaggtcatt atactgaccg ccattataat 420 gactgtacaa cgaccttctg gagaaagaaa caactcaata acgatgtggg acattggggg 480 cccactcaaa aaatctgggg actatatccc cagagaattt ctccagaaga gaagaaaagt 540 caaagttttt tttcgcttgg gggttgcata taaagctcac acgcggccag ggggagcc 598 <210> 71 <211> 574 <212> DNA <213> Artificial Sequence <220> <223> RaBit29-0-D-408 <400> 71 cgctcgtcca acgccggcgg acctaataaa agacattggt acatgatatc aaacagaatt 60 ttaacatttc ttgatccagt ttgtaaacaa aacaaacaat ttttctacca tttaacttca 120 taccatcggc gagagccgaa caggaaaaaa aagaagtctc cggttatcgt aagcagtatc 180 aaataataag aatgtatgtg tgtgcaattt gttataccca cgaagaagtg cgcagtagag 240 ttagaaaacc aactgagtaa tctttactcc cgacaatcgt ccaataatcc tcttgttgct 300 aggaacgtga tgatggattt cgtttgaaat ccggacggaa aactcaaaag aagtccaacc 360 accaaccatt ttcgagcctc aagaatctct aagcaggttt ctttactaag gggatggcct 420 ttctgtcctg gacatttttt ccttcctttt ttcatttcct tgaaaggaac agattttttt 480 tgacttttgc cacacagctg cactatctca acccctttta cattttaagt tttcgggttg 540 aatggccggt gtttaaaccc cagcgcctgg cggg 574 <210> 72 <211> 668 <212> DNA <213> Artificial Sequence <220> <223> RaBit23-0-P-39 <400> 72 cgctcgtcca acgccggcgg accttacttt ttttttggat ggacgcaaag aagtttaata 60 atcatattac atggcattac caccatatac atatccatat ctaatcttac ttatatgttg 120 tggaaatgta aagagcccca ttatcttagc ctaaaaaaac cttctctttg gaactttcag 180 taatacgctt aactgctcat tgctatattg aagtacggat tagaagccgc cgagcgggcg 240 acagccctcc gacggaagac tctcctccgt gcgtcctcgt cttcaccggt cgcgttcctg 300 aaacgcagat gtgcctcgcg ccgcactgct ccgaacaata aagattctac aatactagct 360 tttatggtta tgaagaggaa aaattggcag taacctggcc ccacaaacct tcaaattaac 420 gaatcaaatt aacaaccata ggatgataat gcgattagtt ttttagcctt atttctgggg 480 taattaatca gcgaagcgat gatttttgat ctattaacag atatataaat ggaaaagctg 540 cataaccact ttaactaata ctttcaacat tttcagtttg tattacttct tattcaaatg 600 tcataaaagt atcaacaaaa aattgttaat atacctctat acttatcccc gcgtgcttgg 660 ccggccgt 668 <210> 73 <211> 311 <212> DNA <213> Artificial Sequence <220> <223> RaBit45-0-T-64 <400> 73 aacctgcagg ccgcgagcgc cgattaagtg aatttacttt aaatcttgca tttaaataaa 60 ttttcttttt atagctttat gacttagttt caatttatat actattttaa tgacattttc 120 gattcattga ttgaaagctt tgtgtttttt cttgatgcgc tattgcattg ttcttgtctt 180 tttcgccaca tgtaatatct gtagtagata cctgatacat tgtggatgct gagtgaaatt 240 ttagttaata atggaggcgc tcttaataat tttggggata ttggcttaac gcgatcgccg 300 acgccgccga t 311 <210> 74 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer RYSE4 <400> 74 cgctcgtcca acgccggcgg acct 24 <210> 75 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer RYSE11 <400> 75 atcggcggcg tcggcgatcg cgtt 24 <210> 76 <211> 547 <212> DNA <213> Artificial Sequence <220> <223> RaBit01-0-U-97 <400> 76 gacggcacgg ccacgcgttt aaaccgccct ccaagctgac ataaatcgca ctttgtatct 60 actttttttt attcgaaaac aaggcacaac aatgaatcta tcgccctgtg agattttcaa 120 tctcaagttt gtgtaataga tagcgttata ttatagaact ataaaggtcc ttgaatatac 180 atagtgtttc attcctatta ctgtatatgt gactttacat tgttacttcc gcggctattt 240 gacgttttct gcttcaggtg cggcttggag ggcaaagtgt cagaaaatcg gccaggccgt 300 atgacacaaa agagtagaaa acgagatctc aaatatctcg aggcctgtcc tctatacaac 360 cgcccagctc tctgacaaag ctccagaacg gttgtctttt gtttcgaaaa gccaaggtcc 420 cttataattg ccctccattt tgtgtcacct atttaagcaa aaaattgaaa gtttactaac 480 ctttcattaa agagaaataa caatattata aaaagcgctt aaagctcaca cgcggccagg 540 gggagcc 547 <210> 77 <211> 568 <212> DNA <213> Artificial Sequence <220> <223> RaBit29-0-D-23 <400> 77 cgctcgtcca acgccggcgg acctataaac taatgatttt aaatcgttaa aaaaatatgc 60 gaattctgtg gatcgaacac aggacctcca gataacttga ccgaagtttt ttcttcagtc 120 tggcgctctc ccaactgagc taaatccgct tactatttgt tatcagttcc cttcatatct 180 acatagaata ggttaagtat tttattagtt gccagaagaa ctactgatag ttgggaatat 240 ttggtgaata atgaagattg ggtgaataat ttgataattt tgagattcaa ttgttaatca 300 atgttacaat attatgtata cagagtatac tagaagttct cttcggagat cttgaagttc 360 acaaaaggga atcgatattt ctacataata ttatcattac ttcttcccca tcttatattt 420 gtcattcatt attgattatg atcaatgcaa taatgattgg tagttgccaa acatttaata 480 cgatcctctg taatatttct atgaataatt atcacagcaa cgttcaatta tcttcaattc 540 cggtgtttaa accccagcgc ctggcggg 568 <210> 78 <211> 552 <212> DNA <213> Artificial Sequence <220> <223> RaBit01-0-U-270 <400> 78 gacggcacgg ccacgcgttt aaaccgccca gatggaatcc cttccataga gagaaggagc 60 aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 120 tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 180 ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 240 tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 300 tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 360 gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 420 actttttttt ttgaacctga atatatatac atcacatatc actgctggtc cttgccgacc 480 agcgtataca atctcgatag ttggtttccc gttctttcca ctcccgtcgc tcacacgcgg 540 ccagggggag cc 552 <210> 79 <211> 561 <212> DNA <213> Artificial Sequence <220> <223> RaBit29-0-D-95 <400> 79 cgctcgtcca acgccggcgg acctcgtgca tgcgggtgtt cttatttatt agcatactac 60 atttgaaata tcaaatttcc ttagtagaaa agtgagagaa ggtgcactga cacaaaaaat 120 aaaatgctac gtataactgt caaaactttg cagcagcggg catccttcca tcatagcttc 180 aaacatatta gcgttcctga tcttcatacc cgtgctcaaa atgatcaaac aaactgttat 240 tgccaagaaa taaacgcaag gctgccttca aaaactgatc cattagatcc tcatatcaag 300 cttcctcata gaacgcccaa ttacaataag catgttttgc tgttatcacc gggtgatagg 360 tttgctcaac catggaaggt agcatggaat cataatttgg atactaatac aaatcggcca 420 tataatgcca ttagtaaatt gcgctcccat ttaggtggtt ctccaggaat actaataaat 480 gcggtgcatt tgcaaaatga atttattcca aggccaaaac aacacgatga atgcggtgtt 540 taaaccccag cgcctggcgg g 561 <210> 80 <211> 1179 <212> DNA <213> Artificial Sequence <220> <223> Coding sequence for PI-MgaI(pps1) with N-terminal SV40 NLS <400> 80 atgttaattt ctccaaagaa gaagaggaag gtcgagttgg gatgtttagc aggtgatacc 60 ttggtttgga ccgccaatag aggacaggtc ccaatcaagg agatagagtt cggtgacagg 120 gtcttctctt acgacgaatc agcagagaga ttcgtagttg ccccagtaaa agcatctgct 180 caaacagaca ccaggttaac ctacgaggta aagactacca gaaggtcagt tagggctact 240 gacaaccacc caatgttggt cttgagggat gaaaggaagg agggtagaca aagagccagg 300 tatgctagga gatgggtaac agtaggacag ataaagcctg gtgactttat cgctgttcca 360 agagctgtac caaacttcgg agtcgctgag cagttgcctt cagtcgccgg tttgaccaca 420 ccagccacct catcagcaga tttgatgtgg ttattgggat tgtacgtcgg agacggaaac 480 ttgcacttgt caaccaagac ctatagggta caatttgcta tacctgcaac cgatagagag 540 ttaagggccg agttgactag agttatcaag gacttgttcg gattgaggtg cattgaggca 600 gatgagtaca gggttgtcgt caattcaaag gcattaaccg aatggatcgc agctttgggt 660 tttggaggtt tgtcattgac aaaaagagtc ccagactggg tttatggatt gccagtcgat 720 caaagattgg cattcttagg tggatgggta gatgccgatg gttatgtctc tccagacaaa 780 tcaggttcaa ttttattgac atgtgccaat caggccttga taggtcaggc cagggaatta 840 gctgagttag ctggtttgag ggctggaggt ccttggtcat tcactcaacc ttacagacat 900 gcaccagaca ggatgcaaat tgcatggagg ttgggtatct ctggtgattt cgagagattg 960 ggttgtagga acccaaagag aaccgacagg ttcggtagga gaaggtacat gcattcatct 1020 tcaggtgccc acggaaccac cattagggcc cactgcaacg attggttggg atttgagagg 1080 gtcaaagcag tcgagccata tgcagttgag cctgtatacg acatcgaggt tgacggtcca 1140 cacaacttcg tcgcagaggg attagtagtt cataactaa 1179 <210> 81 <211> 1122 <212> DNA <213> Artificial Sequence <220> <223> Coding sequence for PI-MtuII(pps1) with N-terminal SV40 NLS <400> 81 atgttgatct caccaaagaa gaagagaaaa gtcgagttgg gttgcttacc tgctggagag 60 ttaataacta cagccgacgg tgacttgagg cctatcgagt ctataagggt aggagacttc 120 gttacaggtc acgatggtag gccacacaga gtcacagcag ttcaggtcag agatttagat 180 ggagaattgt tcactttcac ccctatgtct cctgctaacg cattttctgt taccgccgaa 240 catcctttat tagcaatccc tagggacgaa gtcagggtta tgaggaagga gaggaatggt 300 tggaaggctg aagtcaactc taccaaatta agatctgcag agccaaggtg gatcgcagct 360 aaagatgttg ccgagggtga tttcttgatc taccctaaac caaagcctat ccctcacagg 420 accgtattgc cattggagtt cgctaggttg gctggatact acttagcaga aggtcatgct 480 tgtttaacca acggatgcga gtctttaatc ttctcattcc actctgatga atttgaatac 540 gtagaggacg ttaggcaagc ctgtaaatca ttatacgaaa agtctggatc agtcttgatc 600 gaggagcata aacactcagc aagggtaacc gtctacacta aagctggata tgctgccatg 660 agggacaacg tcggtatagg ttcttcaaat aaaaagttat cagacttgtt aatgaggcag 720 gacgaaacct ttttgaggga gttggttgac gcatatgtta acggagatgg aaacgtaacc 780 agaaggaatg gagcagtttg gaaaagggtc cacacaacat caaggttgtg ggcatttcaa 840 ttacagtcaa ttttggcaag attgggtcat tacgcaaccg tagaattaag gagaccaggt 900 ggtccaggtg taataatggg taggaacgtt gttaggaaag acatctacca ggtacagtgg 960 accgagggag gtaggggtcc aaagcaggca agggactgcg gagattactt cgcagttcca 1020 atcaagaaga gagctgttag ggaagcccac gagccagtct acaacttgga cgtcgaaaac 1080 ccagactcat acttggccta tggttttgca gtccataact aa 1122 <210> 82 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> Coding sequence for I-SceI <400> 82 atgaagaaca tcaagaagaa ccaggtcatg aatctgggtc ctaactctaa attattgaaa 60 gaatataaga gccaacttat cgaactaaac attgaacaat ttgaggctgg aataggttta 120 attttaggtg atgcgtacat taggtccaga gatgagggta aaacatactg tatgcagttt 180 gagtggaaaa ataaagccta tatggatcat gtttgtttgc tgtatgatca atgggtatta 240 tctcctcctc ataagaaaga aagagttaat cacctaggga atttagtgat aacgtgggga 300 gcacagactt ttaagcacca agcgttcaac aaattagcaa atttgtttat tgtcaataat 360 aagaaaacaa ttcctaataa tttggtggaa aactacctaa ctccaatgtc tttagcatat 420 tggttcatgg atgacggtgg aaaatgggat tacaacaaaa acagcacaaa caaatctata 480 gtgctaaata cgcaaagttt tacttttgaa gaagtagaat acttagttaa aggattgcgt 540 aacaagtttc aacttaattg ttatgttaag attaataaaa ataaaccgat catttacata 600 gattctatgt catatttaat attctacaat cttattaaac cttatttaat tccgcaaatg 660 atgtataaac tgccaaatac catatcttcc gagacgttcc tcaagtag 708 <210> 83 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer KB510-266-134 <400> 83 ctgagctcta aatataaaca ttaaatacat tacacg 36 <210> 84 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer KB511-266-134 <400> 84 gactcgaggc tcaaaagaag actaactaag ag 32 <210> 85 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer KB512-266-134 <400> 85 aattcgacct ttctcttctt ttttggagag attgtcatat tttattattg tattg 55 <210> 86 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer KB513-266-134 <400> 86 caaaaaagaa gagaaaggtc gaattaggtt ttgccaaggg taccaatg 48 <210> 87 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer KB514-266-134 <400> 87 ggttgtcgtc cataattgct gaaagatttt tgtagttttt gtat 44 <210> 88 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer KB515-266-134 <400> 88 atacaaaaac tacaaaaatc tttcagcaat tatggacgac aacc 44 <210> 89 <211> 1700 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM0.URA.F-CphI <400> 89 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gatgcacgag 60 cgcaacgctc acaagttcat catctcatgg atctgcacat gaacaaacac cagagtcaaa 120 cgacgttgaa attgaggcta ctgcgccaat tgatgacaat acagacgatg ataacaaacc 180 gaagttatct gatgtagaaa aggattaaag atgctaagag atagtgatga tatttcataa 240 ataatgtaat tctatatatg ttaattacct tttttgcgag gcatatttat ggtgaaggat 300 aagttttgac catcaaagaa ggttaatgtg gctgtggttt cagggtccat aaagcttttc 360 aattcatctt tttttttttt gttctttttt ttgattccgg tttctttgaa atttttttga 420 ttcggtaatc tccgagcaga aggaagaacg aaggaaggag cacagactta gattggtata 480 tatacgcata tgtggtgttg aagaaacatg aaattgccca gtattcttaa cccaactgca 540 cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat ataaggaacg 600 tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc acgaaaagca 660 aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg agttagttga 720 agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga ctgatttttc 780 catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt ttttactctt 840 cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt 900 atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg gcccaggtat 960 tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag gccttttgat 1020 gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta agggtactgt 1080 tgacattgcg aagagtgaca aagattttgt tatcggcttt attgctcaaa gagacatggg 1140 tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt tagatgacaa 1200 gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta caggatctga 1260 cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg tagagggtga 1320 acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc aaaactaaaa 1380 aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt caatttaatt 1440 atatcagtta ttacccggga atctcggtcg taatgatttc tataatgacg aaaaaaaaaa 1500 aattggaaag aaaaagcttc atggccttta taaaaaggaa ctatccaata cctcgccaga 1560 accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga ctgtaaagat 1620 ggacgcatga tgcacgagcg caacgctcac aagatccgat cgaccgagaa ctgagaacgg 1680 tgcaatgatc aacatgatct 1700 <210> 90 <211> 1702 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM0.URA.PI-MgaI <400> 90 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgtagctgc 60 ccagtatgag tcaggttcat catctcatgg atctgcacat gaacaaacac cagagtcaaa 120 cgacgttgaa attgaggcta ctgcgccaat tgatgacaat acagacgatg ataacaaacc 180 gaagttatct gatgtagaaa aggattaaag atgctaagag atagtgatga tatttcataa 240 ataatgtaat tctatatatg ttaattacct tttttgcgag gcatatttat ggtgaaggat 300 aagttttgac catcaaagaa ggttaatgtg gctgtggttt cagggtccat aaagcttttc 360 aattcatctt tttttttttt gttctttttt ttgattccgg tttctttgaa atttttttga 420 ttcggtaatc tccgagcaga aggaagaacg aaggaaggag cacagactta gattggtata 480 tatacgcata tgtggtgttg aagaaacatg aaattgccca gtattcttaa cccaactgca 540 cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat ataaggaacg 600 tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc acgaaaagca 660 aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg agttagttga 720 agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga ctgatttttc 780 catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt ttttactctt 840 cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt 900 atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg gcccaggtat 960 tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag gccttttgat 1020 gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta agggtactgt 1080 tgacattgcg aagagtgaca aagattttgt tatcggcttt attgctcaaa gagacatggg 1140 tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt tagatgacaa 1200 gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta caggatctga 1260 cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg tagagggtga 1320 acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc aaaactaaaa 1380 aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt caatttaatt 1440 atatcagtta ttacccggga atctcggtcg taatgatttc tataatgacg aaaaaaaaaa 1500 aattggaaag aaaaagcttc atggccttta taaaaaggaa ctatccaata cctcgccaga 1560 accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga ctgtaaagat 1620 ggacgcatgc gtagctgccc agtatgagtc agaagatccg atcgaccgag aactgagaac 1680 ggtgcaatga tcaacatgat ct 1702 <210> 91 <211> 1732 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM0.URA.PI-MtuII <400> 91 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct acgtgcacta 60 cgtagagggt cgcaccgcac cgatctacaa gttcatcatc tcatggatct gcacatgaac 120 aaacaccaga gtcaaacgac gttgaaattg aggctactgc gccaattgat gacaatacag 180 acgatgataa caaaccgaag ttatctgatg tagaaaagga ttaaagatgc taagagatag 240 tgatgatatt tcataaataa tgtaattcta tatatgttaa ttaccttttt tgcgaggcat 300 atttatggtg aaggataagt tttgaccatc aaagaaggtt aatgtggctg tggtttcagg 360 gtccataaag cttttcaatt catctttttt ttttttgttc ttttttttga ttccggtttc 420 tttgaaattt ttttgattcg gtaatctccg agcagaagga agaacgaagg aaggagcaca 480 gacttagatt ggtatatata cgcatatgtg gtgttgaaga aacatgaaat tgcccagtat 540 tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 600 ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 660 tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 720 tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 780 tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 840 acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 900 agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 960 tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 1020 ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 1080 atactaaggg tactgttgac attgcgaaga gtgacaaaga ttttgttatc ggctttattg 1140 ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1200 tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1260 tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1320 ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1380 gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1440 gagcttcaat ttaattatat cagttattac ccgggaatct cggtcgtaat gatttctata 1500 atgacgaaaa aaaaaaaatt ggaaagaaaa agcttcatgg cctttataaa aaggaactat 1560 ccaatacctc gccagaacca agtaacagta ttttacgggg cacaaatcaa gaacaataag 1620 acaggactgt aaagatggac gcatacgtgc actacgtaga gggtcgcacc gcaccgatct 1680 acaagatccg atcgaccgag aactgagaac ggtgcaatga tcaacatgat ct 1732 <210> 92 <211> 1716 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM0.URA.VDE <400> 92 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct tatgtcgggt 60 gcggagaaag aggtaatgaa agttcatcat ctcatggatc tgcacatgaa caaacaccag 120 agtcaaacga cgttgaaatt gaggctactg cgccaattga tgacaataca gacgatgata 180 acaaaccgaa gttatctgat gtagaaaagg attaaagatg ctaagagata gtgatgatat 240 ttcataaata atgtaattct atatatgtta attacctttt ttgcgaggca tatttatggt 300 gaaggataag ttttgaccat caaagaaggt taatgtggct gtggtttcag ggtccataaa 360 gcttttcaat tcatcttttt tttttttgtt cttttttttg attccggttt ctttgaaatt 420 tttttgattc ggtaatctcc gagcagaagg aagaacgaag gaaggagcac agacttagat 480 tggtatatat acgcatatgt ggtgttgaag aaacatgaaa ttgcccagta ttcttaaccc 540 aactgcacag aacaaaaacc tgcaggaaac gaagataaat catgtcgaaa gctacatata 600 aggaacgtgc tgctactcat cctagtcctg ttgctgccaa gctatttaat atcatgcacg 660 aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac caccaaggaa ttactggagt 720 tagttgaagc attaggtccc aaaatttgtt tactaaaaac acatgtggat atcttgactg 780 atttttccat ggagggcaca gttaagccgc taaaggcatt atccgccaag tacaattttt 840 tactcttcga agacagaaaa tttgctgaca ttggtaatac agtcaaattg cagtactctg 900 cgggtgtata cagaatagca gaatgggcag acattacgaa tgcacacggt gtggtgggcc 960 caggtattgt tagcggtttg aagcaggcgg cagaagaagt aacaaaggaa cctagaggcc 1020 ttttgatgtt agcagaattg tcatgcaagg gctccctatc tactggagaa tatactaagg 1080 gtactgttga cattgcgaag agtgacaaag attttgttat cggctttatt gctcaaagag 1140 acatgggtgg aagagatgaa ggttacgatt ggttgattat gacacccggt gtgggtttag 1200 atgacaaggg agacgcattg ggtcaacagt atagaaccgt ggatgatgtg gtctctacag 1260 gatctgacat tattattgtt ggaagaggac tatttgcaaa gggaagggat gctaaggtag 1320 agggtgaacg ttacagaaaa gcaggctggg aagcatattt gagaagatgc ggccagcaaa 1380 actaaaaaac tgtattataa gtaaatgcat gtatactaaa ctcacaaatt agagcttcaa 1440 tttaattata tcagttatta cccgggaatc tcggtcgtaa tgatttctat aatgacgaaa 1500 aaaaaaaaat tggaaagaaa aagcttcatg gcctttataa aaaggaacta tccaatacct 1560 cgccagaacc aagtaacagt attttacggg gcacaaatca agaacaataa gacaggactg 1620 taaagatgga cgcattatgt cgggtgcgga gaaagaggta atgaaaaaga tccgatcgac 1680 cgagaactga gaacggtgca atgatcaaca tgatct 1716 <210> 93 <211> 1604 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM1.nat.F-CphI <400> 93 cgttacgaag cacacactag ttagcgtcga gacacatagc gacgctagaa gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120 ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180 gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240 acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300 aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360 tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420 ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480 ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540 ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgaccac 600 tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg aggccatcga 660 ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca ccggggacgg 720 cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc ccgacgacga 780 atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga cgttcgtcgc 840 gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg gctggaaccg 900 ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg gggtcgggcg 960 cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc acctctggct 1020 ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg ggttcaccct 1080 ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc aggcgctcta 1140 catgagcatg ccctgcccct gagtttaact tgatactact agattttttc tcttcattta 1200 taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt ttttcattct 1260 ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa acctaacaaa 1320 agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct gttttcccat 1380 ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga tttagtttct 1440 ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag tatttagtta 1500 ttcatataat cttaacttct cgaggagctc gatgcacgag cgcaacgctc acaacgttac 1560 gaagcacaca ctagttagcg tcgagacaca tagcgacgct agaa 1604 <210> 94 <211> 1604 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM4.nat.F-CphI <400> 94 ttaatcagcg cccagagact agcactgaat gatcaacggg tagttcacac gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120 ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180 gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240 acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300 aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360 tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420 ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480 ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540 ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgaccac 600 tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg aggccatcga 660 ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca ccggggacgg 720 cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc ccgacgacga 780 atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga cgttcgtcgc 840 gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg gctggaaccg 900 ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg gggtcgggcg 960 cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc acctctggct 1020 ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg ggttcaccct 1080 ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc aggcgctcta 1140 catgagcatg ccctgcccct gagtttaact tgatactact agattttttc tcttcattta 1200 taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt ttttcattct 1260 ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa acctaacaaa 1320 agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct gttttcccat 1380 ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga tttagtttct 1440 ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag tatttagtta 1500 ttcatataat cttaacttct cgaggagctc gatgcacgag cgcaacgctc acaattaatc 1560 agcgcccaga gactagcact gaatgatcaa cgggtagttc acac 1604 <210> 95 <211> 2060 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM2.hph.F-CphI <400> 95 gtactgccta gtagaaacgg atctccacgt actagagtcc acctggtatc gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120 ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180 gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240 acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300 aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360 tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420 ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480 ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540 ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgaaaaa 600 gcctgaactc accgcgacgt ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc 660 cgacctgatg cagctctcgg agggcgaaga atctcgtgct ttcagcttcg atgtaggagg 720 gcgtggatat gtcctgcggg taaatagctg cgccgatggt ttctacaaag atcgttatgt 780 ttatcggcac tttgcatcgg ccgcgctccc gattccggaa gtgcttgaca ttggggaatt 840 cagcgagagc ctgacctatt gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct 900 gcctgaaacc gaactgcccg ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc 960 tgcggccgat cttagccaga cgagcgggtt cggcccattc ggaccgcaag gaatcggtca 1020 atacactaca tggcgtgatt tcatatgcgc gattgctgat ccccatgtgt atcactggca 1080 aactgtgatg gacgacaccg tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct 1140 ttgggccgag gactgccccg aagtccggca cctcgtgcac gcggatttcg gctccaacaa 1200 tgtcctgacg gacaatggcc gcataacagc ggtcattgac tggagcgagg cgatgttcgg 1260 ggattcccaa tacgaggtcg ccaacatctt cttctggagg ccgtggttgg cttgtatgga 1320 gcagcagacg cgctacttcg agcggaggca tccggagctt gcaggatcgc cgcggctccg 1380 ggcgtatatg ctccgcattg gtcttgacca actctatcag agcttggttg acggcaattt 1440 cgatgatgca gcttgggcgc agggtcgatg cgacgcaatc gtccgatccg gagccgggac 1500 tgtcgggcgt acacaaatcg cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga 1560 agtactcgcc gatagtggaa accgacgccc cagcactcgt ccgagggcaa aggaataggt 1620 ttaacttgat actactagat tttttctctt catttataaa atttttggtt ataattgaag 1680 ctttagaagt atgaaaaaat cctttttttt cattctttgc aaccaaaata agaagcttct 1740 tttattcatt gaaatgatga atataaacct aacaaaagaa aaagactcga atatcaaaca 1800 ttaaaaaaaa ataaaagagg ttatctgttt tcccatttag ttggagtttg cattttctaa 1860 tagatagaac tctcaattaa tgtggattta gtttctctgt tcgttttttt ttgttttgtt 1920 ctcactgtat ttacatttct atttagtatt tagttattca tataatctta acttctcgag 1980 gagctcgatg cacgagcgca acgctcacaa gtactgccta gtagaaacgg atctccacgt 2040 actagagtcc acctggtatc 2060 <210> 96 <211> 1844 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM3.kan.F-CphI <400> 96 cgaggattaa cgtgtaaggc cctaagctat gtaccgcatc tcctaagaga gatgcacgag 60 cgcaacgctc acaatcgaca ctagtaatac acatcatcgt cctacaagtt catcaaagtg 120 ttggacagac aactatacca gcatggatct cttgtatcgg ttcttttctc ccgctctctc 180 gcaataacaa tgaacactgg gtcaatcata gcctacacag gtgaacagag tagcgtttat 240 acagggttta tacggtgatt cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa 300 aatttttctt tccaacgcta gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt 360 tctgagagtt ccctttttca tatatcgaat tttgaatata aaaggagatc gaaaaaattt 420 ttctattcaa tctgttttct ggttttattt gatagttttt ttgtgtatta ttattatgga 480 ttagtactgg tttatatggg tttttctgta taacttcttt ttattttagt ttgtttaatc 540 ttattttgag ttacattata gttccctaac tgcaagagaa gtaacattaa aaatgggtaa 600 ggaaaagact cacgtttcga ggccgcgatt aaattccaac atggatgctg atttatatgg 660 gtataaatgg gctcgcgata atgtcgggca atcaggtgcg acaatctatc gattgtatgg 720 gaagcccgat gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt 780 tacagatgag atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa 840 gcattttatc cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggcaaaac 900 agcattccag gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc 960 agtgttcctg cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg 1020 cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga 1080 ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataagct 1140 tttgccattc tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat 1200 ttttgacgag gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg 1260 ataccaggat cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa 1320 acggcttttt caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt 1380 gatgctcgat gagtttttct aagtttaact tgatactact agattttttc tcttcattta 1440 taaaattttt ggttataatt gaagctttag aagtatgaaa aaatcctttt ttttcattct 1500 ttgcaaccaa aataagaagc ttcttttatt cattgaaatg atgaatataa acctaacaaa 1560 agaaaaagac tcgaatatca aacattaaaa aaaaataaaa gaggttatct gttttcccat 1620 ttagttggag tttgcatttt ctaatagata gaactctcaa ttaatgtgga tttagtttct 1680 ctgttcgttt ttttttgttt tgttctcact gtatttacat ttctatttag tatttagtta 1740 ttcatataat cttaacttct cgaggagctc gatgcacgag cgcaacgctc acaacgagga 1800 ttaacgtgta aggccctaag ctatgtaccg catctcctaa gaga 1844 <210> 97 <211> 1386 <212> DNA <213> Artificial Sequence <220> <223> xMarker xM6.zeo.F-CphI <400> 97 gtcaaagcgc gattcgctag gaatgagagc gagaacgaac cggagtatat gatgcacgag 60 cgcaacgctc acaaaataca catcatcgtc ctacaagttc atcaaagtgt tggacagaca 120 actataccag catggatctc ttgtatcggt tcttttctcc cgctctctcg caataacaat 180 gaacactggg tcaatcatag cctacacagg tgaacagagt agcgtttata cagggtttat 240 acggtgattc ctacggcaaa aatttttcat ttctaaaaaa aaaaagaaaa atttttcttt 300 ccaacgctag aaggaaaaga aaaatctaat taaattgatt tggtgatttt ctgagagttc 360 cctttttcat atatcgaatt ttgaatataa aaggagatcg aaaaaatttt tctattcaat 420 ctgttttctg gttttatttg atagtttttt tgtgtattat tattatggat tagtactggt 480 ttatatgggt ttttctgtat aacttctttt tattttagtt tgtttaatct tattttgagt 540 tacattatag ttccctaact gcaagagaag taacattaaa aatggccaag ttgaccagtg 600 ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg accgaccggc 660 tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg gacgacgtga 720 ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg gcctgggtgt 780 gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc 840 gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg cgggagttcg 900 ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag gactgagttt 960 aacttgatac tactagattt tttctcttca tttataaaat ttttggttat aattgaagct 1020 ttagaagtat gaaaaaatcc ttttttttca ttctttgcaa ccaaaataag aagcttcttt 1080 tattcattga aatgatgaat ataaacctaa caaaagaaaa agactcgaat atcaaacatt 1140 aaaaaaaaat aaaagaggtt atctgttttc ccatttagtt ggagtttgca ttttctaata 1200 gatagaactc tcaattaatg tggatttagt ttctctgttc gttttttttt gttttgttct 1260 cactgtattt acatttctat ttagtattta gttattcata taatcttaac ttgatgcacg 1320 agcgcaacgc tcacaagtca aagcgcgatt cgctaggaat gagagcgaga acgaaccgga 1380 gtatat 1386 <210> 98 <211> 1630 <212> DNA <213> Artificial Sequence <220> <223> xMarker s20M.URA.I-SceI <400> 98 aagatccgat cgaccgagaa tagggataac agggtaatat gcgtccatct ttacagtcct 60 gtcttattgt tcttgatttg tgccccgtaa aatactgtta cttggttctg gcgaggtatt 120 ggatagttcc tttttataaa ggccatgaag ctttttcttt ccaatttttt ttttttcgtc 180 attatagaaa tcattacgac cgagattccc gggtaataac tgatataatt aaattgaagc 240 tctaatttgt gagtttagta tacatgcatt tacttataat acagtttttt agttttgctg 300 gccgcatctt ctcaaatatg cttcccagcc tgcttttctg taacgttcac cctctacctt 360 agcatccctt ccctttgcaa atagtcctct tccaacaata ataatgtcag atcctgtaga 420 gaccacatca tccacggttc tatactgttg acccaatgcg tctcccttgt catctaaacc 480 cacaccgggt gtcataatca accaatcgta accttcatct cttccaccca tgtctctttg 540 agcaataaag ccgataacaa aatctttgtc actcttcgca atgtcaacag tacccttagt 600 atattctcca gtagataggg agcccttgca tgacaattct gctaacatca aaaggcctct 660 aggttccttt gttacttctt ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac 720 cacaccgtgt gcattcgtaa tgtctgccca ttctgctatt ctgtatacac ccgcagagta 780 ctgcaatttg actgtattac caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt 840 gtacttggcg gataatgcct ttagcggctt aactgtgccc tccatggaaa aatcagtcaa 900 gatatccaca tgtgttttta gtaaacaaat tttgggacct aatgcttcaa ctaactccag 960 taattccttg gtggtacgaa catccaatga agcacacaag tttgtttgct tttcgtgcat 1020 gatattaaat agcttggcag caacaggact aggatgagta gcagcacgtt ccttatatgt 1080 agctttcgac atgatttatc ttcgtttcct gcaggttttt gttctgtgca gttgggttaa 1140 gaatactggg caatttcatg tttcttcaac accacatatg cgtatatata ccaatctaag 1200 tctgtgctcc ttccttcgtt cttccttctg ctcggagatt accgaatcaa aaaaatttca 1260 aagaaaccgg aatcaaaaaa aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg 1320 accctgaaac cacagccaca ttaaccttct ttgatggtca aaacttatcc ttcaccataa 1380 atatgcctcg caaaaaaggt aattaacata tatagaatta cattatttat gaaatatcat 1440 cactatctct tagcatcttt aatccttttc tacatcagat aacttcggtt tgttatcatc 1500 gtctgtattg tcatcaattg gcgcagtagc ctcaatttca acgtcgtttg actctggtgt 1560 ttgttcatgt gcagatccat gagatgatga actagggata acagggtaat aagatccgat 1620 cgaccgagaa 1630 <210> 99 <211> 1670 <212> DNA <213> Artificial Sequence <220> <223> xMarker s40M.URA.I-SceI <400> 99 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc tagggataac agggtaatat 60 gcgtccatct ttacagtcct gtcttattgt tcttgatttg tgccccgtaa aatactgtta 120 cttggttctg gcgaggtatt ggatagttcc tttttataaa ggccatgaag ctttttcttt 180 ccaatttttt ttttttcgtc attatagaaa tcattacgac cgagattccc gggtaataac 240 tgatataatt aaattgaagc tctaatttgt gagtttagta tacatgcatt tacttataat 300 acagtttttt agttttgctg gccgcatctt ctcaaatatg cttcccagcc tgcttttctg 360 taacgttcac cctctacctt agcatccctt ccctttgcaa atagtcctct tccaacaata 420 ataatgtcag atcctgtaga gaccacatca tccacggttc tatactgttg acccaatgcg 480 tctcccttgt catctaaacc cacaccgggt gtcataatca accaatcgta accttcatct 540 cttccaccca tgtctctttg agcaataaag ccgataacaa aatctttgtc actcttcgca 600 atgtcaacag tacccttagt atattctcca gtagataggg agcccttgca tgacaattct 660 gctaacatca aaaggcctct aggttccttt gttacttctt ctgccgcctg cttcaaaccg 720 ctaacaatac ctgggcccac cacaccgtgt gcattcgtaa tgtctgccca ttctgctatt 780 ctgtatacac ccgcagagta ctgcaatttg actgtattac caatgtcagc aaattttctg 840 tcttcgaaga gtaaaaaatt gtacttggcg gataatgcct ttagcggctt aactgtgccc 900 tccatggaaa aatcagtcaa gatatccaca tgtgttttta gtaaacaaat tttgggacct 960 aatgcttcaa ctaactccag taattccttg gtggtacgaa catccaatga agcacacaag 1020 tttgtttgct tttcgtgcat gatattaaat agcttggcag caacaggact aggatgagta 1080 gcagcacgtt ccttatatgt agctttcgac atgatttatc ttcgtttcct gcaggttttt 1140 gttctgtgca gttgggttaa gaatactggg caatttcatg tttcttcaac accacatatg 1200 cgtatatata ccaatctaag tctgtgctcc ttccttcgtt cttccttctg ctcggagatt 1260 accgaatcaa aaaaatttca aagaaaccgg aatcaaaaaa aagaacaaaa aaaaaaaaga 1320 tgaattgaaa agctttatgg accctgaaac cacagccaca ttaaccttct ttgatggtca 1380 aaacttatcc ttcaccataa atatgcctcg caaaaaaggt aattaacata tatagaatta 1440 cattatttat gaaatatcat cactatctct tagcatcttt aatccttttc tacatcagat 1500 aacttcggtt tgttatcatc gtctgtattg tcatcaattg gcgcagtagc ctcaatttca 1560 acgtcgtttg actctggtgt ttgttcatgt gcagatccat gagatgatga actagggata 1620 acagggtaat aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc 1670 <210> 100 <211> 1710 <212> DNA <213> Artificial Sequence <220> <223> xMarker s60M.URA.I-SceI <400> 100 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60 tagggataac agggtaatat gcgtccatct ttacagtcct gtcttattgt tcttgatttg 120 tgccccgtaa aatactgtta cttggttctg gcgaggtatt ggatagttcc tttttataaa 180 ggccatgaag ctttttcttt ccaatttttt ttttttcgtc attatagaaa tcattacgac 240 cgagattccc gggtaataac tgatataatt aaattgaagc tctaatttgt gagtttagta 300 tacatgcatt tacttataat acagtttttt agttttgctg gccgcatctt ctcaaatatg 360 cttcccagcc tgcttttctg taacgttcac cctctacctt agcatccctt ccctttgcaa 420 atagtcctct tccaacaata ataatgtcag atcctgtaga gaccacatca tccacggttc 480 tatactgttg acccaatgcg tctcccttgt catctaaacc cacaccgggt gtcataatca 540 accaatcgta accttcatct cttccaccca tgtctctttg agcaataaag ccgataacaa 600 aatctttgtc actcttcgca atgtcaacag tacccttagt atattctcca gtagataggg 660 agcccttgca tgacaattct gctaacatca aaaggcctct aggttccttt gttacttctt 720 ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac cacaccgtgt gcattcgtaa 780 tgtctgccca ttctgctatt ctgtatacac ccgcagagta ctgcaatttg actgtattac 840 caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt gtacttggcg gataatgcct 900 ttagcggctt aactgtgccc tccatggaaa aatcagtcaa gatatccaca tgtgttttta 960 gtaaacaaat tttgggacct aatgcttcaa ctaactccag taattccttg gtggtacgaa 1020 catccaatga agcacacaag tttgtttgct tttcgtgcat gatattaaat agcttggcag 1080 caacaggact aggatgagta gcagcacgtt ccttatatgt agctttcgac atgatttatc 1140 ttcgtttcct gcaggttttt gttctgtgca gttgggttaa gaatactggg caatttcatg 1200 tttcttcaac accacatatg cgtatatata ccaatctaag tctgtgctcc ttccttcgtt 1260 cttccttctg ctcggagatt accgaatcaa aaaaatttca aagaaaccgg aatcaaaaaa 1320 aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg accctgaaac cacagccaca 1380 ttaaccttct ttgatggtca aaacttatcc ttcaccataa atatgcctcg caaaaaaggt 1440 aattaacata tatagaatta cattatttat gaaatatcat cactatctct tagcatcttt 1500 aatccttttc tacatcagat aacttcggtt tgttatcatc gtctgtattg tcatcaattg 1560 gcgcagtagc ctcaatttca acgtcgtttg actctggtgt ttgttcatgt gcagatccat 1620 gagatgatga actagggata acagggtaat aagatccgat cgaccgagaa ctgagaacgg 1680 tgcaatgatc aacatgatct gcgacgagct 1710 <210> 101 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer KB589-324-35 <400> 101 atccccgcgt gcttggccgg ccgtatgttg atcccaaaga agaagagaaa ggtcgagttg 60 gg 62 <210> 102 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer 00177-JD-75AN <400> 102 atccccgcgt gcttggccgg ccgtatgaag aacatcaaga agaaccaggt c 51 <210> 103 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer KB591-324-36 <400> 103 atccccgcgt gcttggccgg ccgtatgact aagttgtatt ctgacttgta c 51 <210> 104 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer KB592-324-36 <400> 104 atcggcgctc gcggcctgca ggttttagtt atggactgca aaacc 45 <210> 105 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer KB593-324-36 <400> 105 atcggcgctc gcggcctgca ggttttagtt atgaactact aatccctc 48 <210> 106 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer 00177-JD-75AO <400> 106 atcggcgctc gcggcctgca ggttctactt gaggaacgtc tcggaag 47 <210> 107 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer KB595-324-36 <400> 107 atcggcgctc gcggcctgca ggttttactg atatcttttc aaatacttta tc 52 <210> 108 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Endonuclease recognition/cleavage site (ES) VDE (PI-SceI) <400> 108 tatgtcgggt gcggagaaag aggtaatgaa a 31 <210> 109 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Endonuclease recognition/cleavage site (ES) F-CphI <400> 109 gatgcacgag cgcaacgctc acaa 24 <210> 110 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Endonuclease recognition/cleavage site (ES) PI-MgaI (pps1) <400> 110 gcgtagctgc ccagtatgag tcag 24 <210> 111 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Endonuclease recognition/cleavage site (ES) PI-MtuII (pps1) <400> 111 acgtgcacta cgtagagggt cgcaccgcac cgatctacaa 40 <210> 112 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Endonuclease recognition/cleavage site (ES) I-SceI <400> 112 tagggataac agggtaat 18 <210> 113 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB411-266-26 <400> 113 aagatccgat cgaccgagaa tagggataac agggtaatcg actctagac 49 <210> 114 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB412-266-26 <400> 114 gagtcgatta ccctgttatc cctattctcg gtcgatcgga tctt 44 <210> 115 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB415-266-26 <400> 115 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc tagggataac agggtaatcg 60 actctagac 69 <210> 116 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB416-266-26 <400> 116 gagtcgatta ccctgttatc cctagatcat tgcaccgttc tcagttctcg gtcgatcgga 60 tctt 64 <210> 117 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB419-266-27 <400> 117 gagtcgtagg gataacaggg taataagatc cgatcgaccg agaactgaga acggtgcaat 60 gatc 64 <210> 118 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB420-266-27 <400> 118 gatcattgca ccgttctcag ttctcggtcg atcggatctt attaccctgt tatccctacg 60 actcgtcta 69 <210> 119 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB421-266-27 <400> 119 gagtcgaaga tccgatcgac cgagaactga gaacggtgca atgatc 46 <210> 120 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB423-266-27 <400> 120 agctcgtcgc agatcatgtt gatcattgca ccgttctcag 40 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB424-266-27 <400> 121 aacatgatct gcgacgagct 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB425-266-27 <400> 122 ttctcggtcg atcggatctt 20 <210> 123 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB426-266-27 <400> 123 gagtcgatta ccctgttatc ccta 24 <210> 124 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB427-266-27 <400> 124 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc 40 <210> 125 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB428-266-27 <400> 125 aacatgatct gcgacgagct tagggataac agggtaatcg actctagac 49 <210> 126 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB429-266-27 <400> 126 ttctcggtcg atcggatctt attaccctgt tatccctacg actcgtcta 49 <210> 127 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB430-266-28 <400> 127 ttctcggtcg atcggatctt cgactcgtct a 31 <210> 128 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB431-266-28 <400> 128 gagtcgatta ccctgttatc cctagtcagc catttgcatc ctca 44 <210> 129 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB432-266-28 <400> 129 aacatgatct gcgacgagct tgaggatgca aatggctgac 40 <210> 130 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB433-266-28 <400> 130 tagggataac agggtaatcg actctagac 29 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB434-266-28 <400> 131 gtcagccatt tgcatcctca 20 <210> 132 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB439-266-34 <400> 132 taatatgcgt ccatctttac agtcc 25 <210> 133 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB440-266-34 <400> 133 cctagttcat catctcatgg atctgc 26 <210> 134 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB441-266-34 <400> 134 tcttgttcat catctcatgg atctgc 26 <210> 135 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide KB464-266-58 <400> 135 gagtcgtagg gataacaggg taataagatc cgatcgaccg agaa 44 <210> 136 <211> 1750 <212> DNA <213> Artificial Sequence <220> <223> xMarker s80M.URA.I-SceI <400> 136 aagatccgat cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct 60 tgaggatgca aatggctgac tagggataac agggtaatat gcgtccatct ttacagtcct 120 gtcttattgt tcttgatttg tgccccgtaa aatactgtta cttggttctg gcgaggtatt 180 ggatagttcc tttttataaa ggccatgaag ctttttcttt ccaatttttt ttttttcgtc 240 attatagaaa tcattacgac cgagattccc gggtaataac tgatataatt aaattgaagc 300 tctaatttgt gagtttagta tacatgcatt tacttataat acagtttttt agttttgctg 360 gccgcatctt ctcaaatatg cttcccagcc tgcttttctg taacgttcac cctctacctt 420 agcatccctt ccctttgcaa atagtcctct tccaacaata ataatgtcag atcctgtaga 480 gaccacatca tccacggttc tatactgttg acccaatgcg tctcccttgt catctaaacc 540 cacaccgggt gtcataatca accaatcgta accttcatct cttccaccca tgtctctttg 600 agcaataaag ccgataacaa aatctttgtc actcttcgca atgtcaacag tacccttagt 660 atattctcca gtagataggg agcccttgca tgacaattct gctaacatca aaaggcctct 720 aggttccttt gttacttctt ctgccgcctg cttcaaaccg ctaacaatac ctgggcccac 780 cacaccgtgt gcattcgtaa tgtctgccca ttctgctatt ctgtatacac ccgcagagta 840 ctgcaatttg actgtattac caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt 900 gtacttggcg gataatgcct ttagcggctt aactgtgccc tccatggaaa aatcagtcaa 960 gatatccaca tgtgttttta gtaaacaaat tttgggacct aatgcttcaa ctaactccag 1020 taattccttg gtggtacgaa catccaatga agcacacaag tttgtttgct tttcgtgcat 1080 gatattaaat agcttggcag caacaggact aggatgagta gcagcacgtt ccttatatgt 1140 agctttcgac atgatttatc ttcgtttcct gcaggttttt gttctgtgca gttgggttaa 1200 gaatactggg caatttcatg tttcttcaac accacatatg cgtatatata ccaatctaag 1260 tctgtgctcc ttccttcgtt cttccttctg ctcggagatt accgaatcaa aaaaatttca 1320 aagaaaccgg aatcaaaaaa aagaacaaaa aaaaaaaaga tgaattgaaa agctttatgg 1380 accctgaaac cacagccaca ttaaccttct ttgatggtca aaacttatcc ttcaccataa 1440 atatgcctcg caaaaaaggt aattaacata tatagaatta cattatttat gaaatatcat 1500 cactatctct tagcatcttt aatccttttc tacatcagat aacttcggtt tgttatcatc 1560 gtctgtattg tcatcaattg gcgcagtagc ctcaatttca acgtcgtttg actctggtgt 1620 ttgttcatgt gcagatccat gagatgatga actagggata acagggtaat aagatccgat 1680 cgaccgagaa ctgagaacgg tgcaatgatc aacatgatct gcgacgagct tgaggatgca 1740 aatggctgac 1750 <210> 137 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <220> <221> misc_feature <222> (28)..(35) <223> n is a, c, g, or t <400> 137 accgatagtt acgatcgagg tactcatnnn nnnnn 35 <210> 138 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <220> <221> misc_feature <222> (28)..(34) <223> n is a, c, g, or t <400> 138 agtagtacct cgatcgtaac tatcggtnnn nnnn 34 <210> 139 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <220> <221> misc_feature <222> (28)..(35) <223> n is a, c, g, or t <400> 139 accgatagtt acgatcgagg tactactnnn nnnnn 35 <210> 140 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <220> <221> misc_feature <222> (28)..(34) <223> n is a, c, g, or t <400> 140 agtagtacct cgatcgtaac tatcggtnnn nnnn 34 <210> 141 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 141 accgatagtt acgatcgagg tactcattag ggataa 36 <210> 142 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 142 agtagtacct cgatcgtaac tatcggttat taccctgtta t 41 <210> 143 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 143 accgatagtt acgatcgagg tactcat 27 <210> 144 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 144 atgagtacct cgatcgtaac tatcggt 27

Claims

적출성 핵산 구조체(excisable nucleic acid construct)로서,
5' → 3' 방향으로,
(a) 제1 탠덤 리피트 핵산(tandem repeat nucleic acid);
(b) 제1 F-CphI 엔도뉴클레아제 인지부;
(c) 타겟 핵산;
(d) 제2 F-CphI 엔도뉴클레아제 인지부; 및
(e) 제2 탠덤 리피트 핵산을 포함하는 것을 특징으로 하는, 적출성 핵산 구조체.
제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 20 bp(base pair)로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제1항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제1항 내지 제5항 중 어느 한항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 적출성 핵산 구조체.
제6항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신(zeocin) 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 적출성 핵산 구조체.
제1항 내지 제7항 중 어느 한항에 있어서, 상기 제1 탠덤 리피트 핵산의 5'에 연결되는 제1 게놈 병합부(integration site)와 상기 제2 탠덤 리피트 핵산의 3'에 연결되는 제2 게놈 병합부를 더 포함하는 것을 특징으로 하는 적출성 핵산 구조체.
제1항 내지 제8항 중 어느 한항에 있어서, 상기 타겟 핵산이 F-CphI 엔도뉴클레아제를 코딩하는 핵산에 작동가능하게 연결되는 프로모터 인자를 포함하는 것을 특징으로 하는 적출성 핵산 구조체.
제1항 내지 제7항 중 어느 한항에 따른 적출성 핵산 구조체를 포함하는 숙주 세포.
제10항에 있어서, F-CphI 엔도뉴클레아제를 코딩하는 핵산을 포함하는 벡터를 더 포함하는 것을 특징으로 하는 숙주 세포.
제11항에 있어서, 상기 벡터가 F-CphI 엔도뉴클레아제를 코딩하는 핵산의 발현을 제어하는 프로모터 인자를 포함하는 것을 특징으로 하는 숙주 세포.
제12항에 있어서, 상기 프로모터 인자가 유도성 프로모터인 것을 특징으로 하는 숙주 세포.
제10항 내지 제13항 중 어느 한항에 있어서, 효모 세포인 것을 특징으로 하는 숙주 세포.
제14항에 있어서, 반수체 효모 세포인 것을 특징으로 하는 숙주 세포.
제14항에 있어서, 이배체 효모 세포인 것을 특징으로 하는 숙주 세포.
제14항에 있어서, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 숙주 세포.
제10항 내지 제17항 중 어느 한항에 있어서, 상기 적출성 핵산 구조체가 숙주 세포의 게놈에 병합된 것을 특징으로 하는 숙주 세포.
제1항에 따른 적출성 핵산 구조체를 포함하는 숙주 세포에서 적출성 핵산 구조체를 F-CphI와 접촉시키는 단계를 포함하는, 제 1항의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 하나 이상의 타겟 핵산을 적출하는 방법.
제19항에 있어서, 상기 적출시 프로모터 인자가 대상 유전자에 작동가능하게 연결되는 것을 특징으로 하는 방법.
제19항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 방법.
제21항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제19항 내지 제22항 중 어느 한항에 있어서, 상기 숙주 세포는 효모 세포인 것을 특징으로 하는 방법.
제23항에 있어서, 상기 숙주 세포는 반수체 효모 세포인 것을 특징으로 하는 방법.
제23항에 있어서, 상기 숙주 세포는 이배체 효모 세포인 것을 특징으로 하는 방법.
제23항에 있어서, 상기 숙주 세포는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 방법.
적출성 핵산 구조체로서,
5' → 3' 방향으로,
(a) 제1 게놈 병합 서열;
(b) 뉴클레오티드 18 - 200 bp로 구성된 제1 탠덤 리피트 핵산;
(c) 제1 호밍 엔도뉴클레아제 인지부;
(d) 타겟 핵산;
(e) 제2 호밍 엔도뉴클레아제 인지부;
(f) 뉴클레오티드 18 - 200 bp로 구성된 제2 탠덤 리피트 핵산; 및
(g) 제2 게놈 병합 서열을 포함하며,
상기 제1 및 제2 게놈 병합 서열은 각각 효모 게놈 유전자 좌(loci)와 상동적인 재조합을 개시하기에 충분한 길이와 동일성(identity)을 가지는 것을 특징으로 하는 적출성 핵산 구조체.
제27항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제27항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제27항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 적어도 하나가 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 적어도 하나가 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부는 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 적어도 하나가 I-SceI에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제30항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 적어도 하나가 F-CphI에 대한 인지부인 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제36항 중 어느 한항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 적출성 핵산 구조체.
제37항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제38항 중 어느 한항에 있어서, 상기 제1 및 제2 게놈 병합 서열이 각각 독립적으로 뉴클레오티드 약 50 - 5000 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제38항 중 어느 한항에 있어서, 상기 제1 및 제2 게놈 병합 서열이 각각 독립적으로 뉴클레오티드 약 500 bp로 구성된 것을 특징으로 하는 적출성 핵산 구조체.
제27항 내지 제40항 중 어느 한항에 따른 적출성 핵산 구조체를 포함하는 효모 세포.
제41항에 있어서, 반수체 효모 세포인 것을 특징으로 하는 숙주 세포.
제41항에 있어서, 이배체 효모 세포인 것을 특징으로 하는 숙주 세포.
제41항에 있어서, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 숙주 세포.
효모 세포로서,
(a) 5' → 3' 방향으로,
(i) 뉴클레오티드 18 - 200 bp로 구성된 제1 탠덤 리피트 핵산;
(ii) 제1 호밍 엔도뉴클레아제 인지부;
(iii) 타겟 핵산;
(iv) 제2 호밍 엔도뉴클레아제 인지부; 및
(v) 뉴클레오티드 18 - 200 bp로 구성된 제2 탠덤 리피트 핵산을 포함하는, 적출성 핵산 구조체와,
(b) 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터,
를 포함하는 것을 특징으로 하는 효모 세포.
제45항에 있어서, 상기 호밍 엔도뉴클레아제가 제1 및 제2 호밍 엔도뉴클레아제 인지부들 각각에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 효모 세포.
제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, an His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 효모 세포.
제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 효모 세포.
제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-SceI을 코딩하는 것을 특징으로 하는 효모 세포.
제45항 또는 제46항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 F-CphI을 코딩하는 것을 특징으로 하는 효모 세포.
제45항 내지 제50항 중 어느 한항에 있어서, 상기 벡터가 상기 호밍 엔도뉴클레아제 핵산의 발현을 제어하는 프로모터 인자를 포함하는 것을 특징으로 하는 효모 세포.
제51항에 있어서, 상기 프로모터 인자가 유도성 프로모터인 것을 특징으로 하는 효모 세포.
제51항에 있어서, 상기 프로모터 인자가 구성적인 프로모터(constitutive promoter)인 것을 특징으로 하는 효모 세포.
제45항 내지 제53항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 효모 세포.
제45항 내지 제53항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 효모 세포.
제45항 내지 제53항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 효모 세포.
제454항 내지 제56항 중 어느 한항에 있어서, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 효모 세포.
제454항 내지 제57항 중 어느 한항에 있어서, 상기 적출성 핵산 구조체가 효모 세포 게놈으로 병합되는 것을 특징으로 하는 효모 세포.
키트로서,
(a) 제27항에 따른 적출성 핵산 구조체와,
(b) 제1또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제 핵산을 포함하는 벡터를 포함하는 것을 특징으로 하는 키트.
제59항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각에 결합하여 이를 또는 이에 인접하여 절단할 수 있는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 키트.
제59항 또는 제60항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, an His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 키트.
제59항 또는 제60항 중 어느 한항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제를 코딩하는 것을 특징으로 하는 키트.
제59항 또는 제60항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 I-SceI을 코딩하는 것을 특징으로 하는 키트.
제59항 또는 제60항에 있어서, 상기 호밍 엔도뉴클레아제 핵산이 F-CphI을 코딩하는 것을 특징으로 하는 키트.
제59항 내지 제64항 중 어느 한항에 있어서, 상기 벡터가 호밍 엔도뉴클레아제 핵산의 발현을 제어하는 프로모터 인자를 포함하는 것을 특징으로 하는 키트.
제65항에 있어서, 상기 프로모터 인자가 유도성 프로모터인 것을 특징으로 하는 키트.
제65항에 있어서, 상기 프로모터 인자가 구성적인 프로모터인 것을 특징으로 하는 키트.
제59항 내지 제67항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 키트.
제59항 내지 제67항 중 어느 한항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 키트.
제59항 내지 제67항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 키트.
적출성 핵산 구조체를 포함하는 효모 세포의 게놈으로부터 하나 이상의 타겟 핵산을 적출하는 방법으로서,
상기 적출성 핵산 구조체는, 5' → 3' 방향으로
(a) 뉴클레오티드 18 - 200 bp로 구성된 제1 탠덤 리피트 핵산;
(b) 제1 호밍 엔도뉴클레아제 인지부;
(c) 타겟 핵산;
(d) 제2 호밍 엔도뉴클레아제 인지부; 및
(e) 뉴클레오티드 18 - 200 bp로 구성된 제2 탠덤 리피트 핵산을 포함하며,
상기 방법이, 호밍 엔도뉴클레아제가 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상을 절단하거나 이에 인접하여 절단할 수 있도록, 효모 세포에서 상기 적출성 핵산 구조체를 상기 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함하는 것을 특징으로 하는 방법.
제71항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 방법.
제71항에 있어서, 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 방법.
제71항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 방법.
제71항 내지 제74항 중 어느 한항에 있어서, 상기 호밍 엔도뉴클레아제가 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 각각을 절단하거나 이에 인접하여 절단하는 것을 특징으로 하는 방법.
제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, an His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상이 I-SceI에 대한 인지부인 것을 특징으로 하는 방법.
제71항 내지 제75항 중 어느 한항에 있어서, 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부들 중 하나 이상이 F-CphI에 대한 인지부인 것을 특징으로 하는 방법.
제71항 내지 제81항 중 어느 한항에 있어서, 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 방법.
제82항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제71항 내지 제83항 중 어느 한항에 있어서, 상기 효모 세포가 반수체 효모 세포인 것을 특징으로 하는 방법.
제71항 내지 제83항 중 어느 한항에 있어서, 상기 효모 세포가 이배체 효모 세포인 것을 특징으로 하는 방법.
제71항 내지 제83항 중 어느 한항에 있어서, 상기 효모 세포가 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 방법.
제71항 내지 제86항 중 어느 한항에 있어서, 상기 효모 세포의 게놈으로부터 하나 이상의 타겟 핵산의 적출에 의해 원하는 유전자의 발현이 활성화되는 것을 특징으로 하는 방법.
제45항에 있어서, 상기 효모 세포의 게놈으로부터 하나 이상의 타겟 핵산의 적출에 의해 원하는 유전자의 발현이 억제되는 것을 특징으로 하는 방법.
2 이상의 적출성 핵산 구조체를 포함하는 숙주 세포의 게놈으로부터 2 이상의 타겟 핵산을 동시에 적출하는 방법으로서,
상기 적출성 핵산 구조체가 각각 독립적으로 5' → 3' 방향으로,
(a) 제1 탠덤 리피트 핵산;
(b) 제1 호밍 엔도뉴클레아제 인지부;
(c) 타겟 핵산;
(d) 제2 호밍 엔도뉴클레아제 인지부; 및
(e) 제2 탠덤 리피트 핵산을 포함하며,
상기 방법이, 하나 이상의 호밍 엔도뉴클레아제가 각각의 상기 적출성 핵산 구조체의 상기 제1 또는 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상을 절단하거나 이에 인접하여 절단할 수 있도록, 효모 세포에서 상기 2 이상의 적출성 핵산 구조체를 상기 하나 이상의 호밍 엔도뉴클레아제와 접촉시키는 단계를 포함하는 것을 특징으로 하는 방법.
제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 200 bp로 구성된 것을 특징으로 하는 방법.
제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 150 bp로 구성된 것을 특징으로 하는 방법.
제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 탠덤 리피트 핵산이 각각 독립적으로 뉴클레오티드 18 - 100 bp로 구성된 것을 특징으로 하는 방법.
제89항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 뉴클레오티드 18 - 80 bp로 구성된 것을 특징으로 하는 방법.
제89항 내지 제93항 중 어느 한항에 있어서, 상기 호밍 엔도뉴클레아제가 상기 각각의 적출성 핵산 구조체의 제1 및 제2 호밍 엔도뉴클레아제 인지부를 각각 절단하거나 또는 이에 인접하여 절단하는 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys 박스 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부가 각각 독립적으로 I-CreI, I-MsoI, I-SceI, I-SceIV, H-DreI, I-HmuI, I-PpoI, I-DirI, I-NjaI, I-NanI, I-NitI, I-TevI, I-TevII, I-TevIII, F-TevI, F-TevII, F-CphI, PI-MgaI, I-CsmI, I-CeuI, 및 PI-SceI으로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 하나 이상의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-SceI에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 하나 이상의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 F-CphI에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 I-SceI에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제94항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 제1 및 제2 호밍 엔도뉴클레아제 인지부 중 하나 이상이 F-CphI에 대한 인지부인 것을 특징으로 하는 방법.
제89항 내지 제102항 중 어느 한항에 있어서, 상기 각각의 적출성 핵산 구조체에서 상기 타겟 핵산이 선별 마커를 코딩하는 것을 특징으로 하는 방법.
제103항에 있어서, 상기 선별 마커가 URA3, 히그로마이신 B 포스포트랜스퍼라제, 아미노글리코사이드 포스포트랜스퍼라제, 제오신 내성 유전자 및 포스피노트리신 N-아세틸 트랜스퍼라제로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제89항 내지 제102항 중 어느 한항에 있어서, 상기 숙주 세포가 효모 세포인 것을 특징으로 하는 방법.
제105항에 있어서, 상기 효모 세포가 반수체 효모 세포인 것을 특징으로 하는 방법.
제105항에 있어서, 상기 효모 세포가 이배체 효모 세포인 것을 특징으로 하는 방법.
제105항에 있어서, 상기 효모 세포가 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 세포인 것을 특징으로 하는 방법.