KR102068107B1 - 게놈 변형 방법 - Google Patents

게놈 변형 방법 Download PDF

Info

Publication number
KR102068107B1
KR102068107B1 KR1020137031551A KR20137031551A KR102068107B1 KR 102068107 B1 KR102068107 B1 KR 102068107B1 KR 1020137031551 A KR1020137031551 A KR 1020137031551A KR 20137031551 A KR20137031551 A KR 20137031551A KR 102068107 B1 KR102068107 B1 KR 102068107B1
Authority
KR
South Korea
Prior art keywords
delete delete
host cell
nucleic acid
exogenous nucleic
nuclease
Prior art date
Application number
KR1020137031551A
Other languages
English (en)
Other versions
KR20140027354A (ko
Inventor
잭 서버
앤드류 호위츠
Original Assignee
아미리스 인코퍼레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아미리스 인코퍼레이티드 filed Critical 아미리스 인코퍼레이티드
Publication of KR20140027354A publication Critical patent/KR20140027354A/ko
Application granted granted Critical
Publication of KR102068107B1 publication Critical patent/KR102068107B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본원에서, 1종 이상의 외인성 핵산을 숙주 세포 게놈의 1종 이상의 선별된 표적 부위에 삽입하는 방법을 제공한다. 소정의 실시 양태에서, 상기 방법은 숙주 세포 게놈을, 게놈 표적 부위에 삽입될 외인성 핵산을 포함하는 1종 이상의 삽입 폴리뉴클레오타이드, 및 상기 게놈 표적 부위 근처 또는 내부에서 이중-가닥 절단을 유도할 수 있는 뉴클레아제와 접촉시키는 단계를 포함한다.

Description

게놈 변형 방법{METHODS FOR GENOMIC MODIFICATION}
본 출원은 2011년 4월 27일에 출원된 미국 가출원 제61/479,821 호; 2011년 6월 24일에 출원된 미국 가출원 제61/500,741 호; 및 2011년 9월 26일에 출원된 미국 가출원 제61/539,389 호를 우선권으로 주장하며, 이들의 내용은 원용에 의해 참조로서 본원에 포함된다.
본원에서 제공하는 방법 및 조성물은 분자생물학 및 유전자 조작 분야에 관한 것이다.
외인성 핵산을 숙주 세포 게놈으로 도입 및 삽입하기 위한 유전자 조작 기술은 다양한 분야에서 요구되고 있다. 예를 들어, 합성 생물학 분야에서, 유전적으로 변형된 균주의 제조 시, 맞춤형(customized) DNA 서열을 숙주 세포의 염색체로 삽입하여야 하며, 보편적으로 산업적인 규모의 제조에서는 수십 개의 유전자를 숙주 유기체에 도입하여야 한다. 최적화된 산업용 균주 설계는 실험을 통해 완성되며, 다수 DNA 어셈블리들을 단독으로 및/또는 다른 생합성 경로의 구성성분들과 더불어 구축하고 생체내에서 시험하는 과정이 요구된다.
유전자 조작은, 공여체 주형 DNA의 염색체외 절편을 이용하여, 염색체 서열을 외인성 공여체 서열로 치환하기 위해 세포의 상동성 재조합 (HR) 시스템을 적용하는, 유전자 표적화에 크게 의존한다. 예를 들어, Capecchi, Science 244:1288-1292 (1989)를 참조한다. 유전자 표적화는 그 효능 면에서 한정적이며; 식물 및 포유류 세포에서, 과량의 주형 서열을 제공받은 세포 106개 중에서 단지 약 1개만 원하는 유전자 변형이 이루어진다. 효모는 증가된 상동성 재조합력을 나타낸다. 그러나, 외인성 DNA를 효모 게놈으로 성공적으로 혼입하는 것은 여전히 비교적 드문 현상이므로 (약 1/105), 통상 단일 게놈 변형만을 포함하는 재조합 세포를 스크리닝하기 위한 선별 마커의 사용이 요구된다. 또한, 효모에서는 선별 마커를 한정된 캐시(limited cache)로만 이용가능하므로, 선별 마커(들)는, 동일한 마커들을 사용하여 추가로 게놈 변형을 할 수 있도록 일부 경우에는 제조 환경 또는 자연 환경에 숙주 세포를 방출시키기 전에, 재조합 균주로부터 제거되어야 한다. 따라서, 임의의 단일 위치에서 삽입이 이루어질 수 있는 효율성과는 무관하게, 한번에 하나씩(one-at-a-time) 이루어지는 게놈 조작의 속성으로 인해, 복수의 유전자 좌에 변화를 야기하는 데에는 변형시킬 유전자 좌의 수만큼 조작 사이클이 요구된다.
유전자 표적 효율은, 표적화된 게놈 이중-가닥 절단(DSB)이 원하는 삽입 부위 근처에 도입되는 경우, 개선될 수 있다. 예를 들어, Jasin, M., Trends Genet 12(6):224-228 (1996); and Urnov et al ., Nature 435(7042):646-651 (2005)를 참조한다. 소위 "설계자(designer) 뉴클레아제"는 생체내에서 DNA의 특정 "표적" 서열에 결합하여 그 자리에 이중-가닥 절단을 형성하는 데 적합할 수 있는 효소이다. 이러한 표적화된 이중-가닥 절단은 예를 들어, 숙주 세포를 설계자 뉴클레아제를 코딩하는 유전자를 함유하는 플라스미드로 형질전환시킴으로써 수행될 수 있다. 상기 숙주 세포는 상동성-기반의 DNA 복구 또는 비-상동성 말단 접합에 의해 이들 이중-가닥 절단을 복구한다. 복구 시에, 어떤 한 가지 기전을 이용하여, 표적 부위에 외인성 공여체 DNA를 도입할 수 있다. 공여체 DNA의 도입과 동시에, 뉴클레아제를 세포 내로 도입하는 경우, 세포는 표적 유전자 좌에서 공여체 DNA를 삽입할 수 있다.
설계자(designer) 뉴클레아제의 출현으로 작물의 특정 표적 유전자 좌에 이식유전자(transgene)를 도입함으로써 (Wright et al ., Plant J 44:693-705 (2005)), 치료용 항체를 발현하는 포유류 배양 세포주를 개선하고 (Malphettes et al., Biotechnol Bioeng 106(5):774-783 (2010)), 심지어 HIV에 대해 내성을 나타내도록 인간 게놈 DNA를 수정할 수 있게 되었다 (Urnov et al ., Nat Rev Genet 11(9):636-646 (2010)). 효과적이긴 하지만, 다중 DNA 어셈블리를 예를 들어, 산업용 미생물에서 기능성 대사 경로를 구축하는 방향으로 삽입하는 데 필요한 여러 번의 조작 회차를 단축하기 위해서는, DSB-매개 HR이 좀 더 개발되어야 한다.
따라서, 복수의 외인성 핵산을 숙주 게놈 세포의 특정 영역으로 동시에 삽입할 수 있는 방법 및 조성물이 여전히 요구된다.
숙주 세포의 특정한 게놈 유전자 좌에 1종 이상의 외인성 핵산을 삽입하기 위한 방법 및 조성물을 제공한다. 일부 실시 양태에서, 복수의 외인성 핵산은 한번의 형질전환 반응으로 동시에 삽입된다. 일부 실시 양태에서, 상기 방법은 1종 이상의 뉴클레아제 및 1종 이상의 공여체 DNA 어셈블리를 세포로 도입하여, 게놈의 특정 위치에 공여체 DNA를 용이하게 삽입하는 단계를 포함한다. 상기 방법 및 상기 조성물은 숙주 세포의 고유한 상동성 재조합 시스템을 이용하며, 재조합은 숙주 세포의 게놈 내 원하는 삽입 부위에 표적화된 이중-가닥 절단 유도에 의해 더욱 강화된다.
따라서, 일 측면에서,
(a) 숙주 세포를,
(i) 각각의 외인성 핵산 (ES)x이 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하되, 상기 (HR1)x 및 (HR2)x가 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있는, 복수의 외인성 핵산; 및
(ii) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있으며, 절단 시, (TS)x에서 (ES)x의 상동성 재조합이 이루어지는 뉴클레아제 (N)x와 접촉시키는 단계,
(b) 각각의 선별된 (ES)x가 각각의 선별된 표적 서열 (TS)x에 삽입된, 숙주 세포를 회수하는 단계를 포함하는, 복수의 외인성 핵산을 숙주 세포 게놈에 삽입하는 방법을 제공하며,
여기서, x는 1 내지 n의 정수이며, n은 2 이상이다.
일부 실시 양태에서, (HR1)x는 (TS)x의 5' 영역과 상동성이며, (HR2)x는 (TS)x의 3' 영역과 상동성이다.
일부 실시 양태에서, (N)x는 (TS)x의 상기 5'과 3' 영역 사이에 위치한 영역에서 절단할 수 있다.
일부 실시 양태에서, 단일 뉴클레아제는 각각의 (TS)x를 절단할 수 있다.
일부 실시 양태에서, n은 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시 양태에서, n>10이다.
일부 실시 양태에서, 상기 회수에는 선별 마커의 삽입을 필요로 하지 않는다. 일부 실시 양태에서, 상기 회수는, 숙주 세포를 상기 표적 부위에서 절단할 수 있는 뉴클레아제와 접촉시키지 않는 경우와 비교해 더 높은 회수율로 달성된다. 일부 실시 양태에서, 상기 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 10, 9, 8, 7, 6, 5, 4, 3, 또는 2건 당 1건의 비율로 이루어진다. 일부 실시 양태에서, 상기 회수는 PCR, 서던 블롯(Southern blot), 제한효소 맴핑(restriction mapping), 및 DNA 서열분석(DNA sequencing)으로 이루어진 군으로부터 선택되는 하나 이상의 방법에 의해 상기 삽입을 동정하는 단계를 포함한다.
일부 실시 양태에서, (N)x는 내인성 숙주 게놈 서열, 예를 들어, (TS)x의 내부 고유 유전자 좌를 절단할 수 있다. 일부 실시 양태에서, (N)x는 외인성 숙주 게놈 서열, 예를 들어, (TS)x에 도입된 유전자 좌를 절단할 수 있다.
일부 실시 양태에서, (ES)x는 (HR1)x의 3' 및 (HR2)x의 5'에 위치한 대상 핵산 (D)x를 추가로 포함한다. 일부 실시 양태에서, (D)x는 선별 마커, 프로모터, 에피토프 테그(epitope tag)를 코딩하는 핵산 서열, 대상 유전자, 리포터 유전자, 및 종결 코돈을 코딩하는 핵산 서열로 이루어진 군으로부터 선택된다.
일부 실시 양태에서, (ES)x는 선형이다. 일부 실시 양태에서, (N)x는 (N)x를 코딩하는 핵산 서열을 포함하는 발현 벡터로서 제공된다. 일부 실시 양태에서, (N)x는 정제된 단백질로서 숙주 세포에 형질전환된다. 일부 실시 양태에서, (N)x는 정제된 RNA로서 숙주 세포에 형질전환된다.
일부 실시 양태에서, 상기 숙주 세포는 생합성 경로의 1종 이상의 효소를 코딩하는 1종 이상의 이종성 뉴클레오타이드 서열을 포함한다. 일부 실시 양태에서, 생합성 경로의 1종 이상의 효소를 코딩하는 상기 1종 이상의 이종성 뉴클레오타이드 서열이 게놈에 삽입된다. 일부 실시 양태에서, 각각의 상기 외인성 핵산 (ES)x는, 생합성 경로의 효소를 코딩하는 대상 핵산 (D)x를, (HR1)x의 3' 및 (HR2)x의 5'의 위치에 포함한다. 일부 실시 양태에서, (D)x는 생합성 경로 효소의 변이체를 코딩하는 복수의 핵산 분자를 포함하는 라이브러리 (L)x의 구성원(member)이다.
일부 실시 양태에서, 상기 숙주 세포는 아이소펜테닐 파이로포스페이트를 제조하는 메발로네이트 (MEV) 경로의 1종 이상의 효소를 코딩하는 1종 이상의 이종성 뉴클레오타이드 서열을 포함한다. 일부 실시 양태에서, 상기 메발로네이트 경로의 상기 1종 이상의 효소는 아세틸-CoA 티올라제, HMG-CoA 신타제, HMG-CoA 리덕타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 파이로포스페이트 데카르복실라제로부터 선택된다. 일부 실시 양태에서, 상기 숙주 세포는 MEV 경로의 모든 효소를 각각 코딩하는 복수의 이종성 핵산을 포함한다. 즉, 복수의 이종성 핵산은, 함께, 전술한 MEV 경로의 각 효소 클래스(class)에 속하는 하나 이상의 효소를 코딩한다. 일부 실시 양태에서, 각각의 외인성 핵산 (ES)x는, 테르펜 신타제를 코딩하는 대상 핵산 (D)x를 (HR1)x의 3' 및 (HR2)x의 5'의 위치에 포함한다. 일부 실시 양태에서, 상기 테르펜 신타제는 모노테르펜 신타제, 다이테르펜 신타제, 세스퀴테르펜 신타제, 세스터테르펜 신타제, 트리테르펜 신타제, 테트라테르펜 신타제, 및 폴리테르펜 신타제로 이루어진 군으로부터 선택된다.
일부 실시 양태에서, (N)x는 엔도뉴클레아제, 예를 들어, 메가뉴클레아제, 징크 핑거 뉴클레아제, TAL-작동자(effector) DNA 결합 도메인-뉴클레아제 융합 단백질 (TALEN), 트랜스포자제(transposase), 및 부위-특이적인 재조합효소로 이루어진 군으로부터 선택되며, x는 1, 또는 1 내지 n의 임의의 정수이다. 일부 실시 양태에서, 상기 징크 핑거 뉴클레아제는, 조작된 징크 핑거 결합 도메인이 융합된 IIS형 제한효소 엔도뉴클레아제의 절단 도메인을 포함하는 융합 단백질이다. 일부 실시 양태에서, 상기 IIS형 제한효소 엔도뉴클레아제는 HO 엔도뉴클레아제 및 Fok I 엔도뉴클레아제로 이루어진 군으로부터 선택된다. 일부 실시 양태에서, 상기 징크 핑거 결합 도메인은 3, 5 또는 6개의 징크 핑거를 포함한다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys box 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제이다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 H-DreI, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, Pi-PspI, F-SceI, F-SceII, F-SuvI, F-CphI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NclIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MgaI, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, 또는 PI-TliII로 이루어진 군으로부터 선택된다. 특정 실시 양태에서, 상기 엔도뉴클레아제는 Fcph-I이다.
일부 실시 양태에서, 엔도뉴클레아제는 내인성 게놈 서열에 특이적으로 결합하도록 변형되며, 상기 변형된 엔도뉴클레아제는 더이상 이의 야생형 엔도뉴클레아제 인지 서열에 결합하지 않는다. 일부 실시 양태에서, 상기 변형된 엔도뉴클레아제는 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys box 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제로부터 유래된다. 일부 실시 양태에서, 상기 변형된 엔도뉴클레아제는, H-DreI, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, Pi-PspI, F-SceI, F-SceII, F-SuvI, F-CphI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NclIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MgaI, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, 또는 PI-TliII로 이루어진 군으로부터 선택되는 엔도뉴클레아제로부터 유래한다.
일부 실시 양태에서, 숙주 세포는 진균 세포, 박테리아 세포, 식물 세포, 동물 세포, 또는 인간 세포이다. 특정 실시 양태에서, 상기 숙주 세포는 효모 세포이다. 일부 실시 양태에서, 상기 효모 세포는 반수체 효모 세포이다. 일부 실시 양태에서, 상기 효모 세포는 사카로마이세스 세래비지애 ( Saccharomyces cerevisiae ) 세포이다. 일부 실시 양태에서, 상기 사카로마이세스 세래비지애 세포는 빵 효모, Mauri, Santa Fe, IZ-1904, TA, BG-1 , CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1 또는 AL-1 균주의 세포이다.
다른 측면에서,
(a) 숙주 세포를,
(i) 제1 상동성 영역 (HR1) 및 제2 상동성 영역 (HR2)를 포함하는 복수의 외인성 핵산 (ES) (여기서, 상기 (HR1) 및 (HR2)는 상기 표적 부위 (TS)에서 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(ii) (TS)에서 절단할 수 있는 뉴클레아제 (N) (이때, 상기 절단으로 (TS)에서 (ES)의 상동성 재조합이 이루어짐)와 접촉시키는 단계,
(b) (TS)에 (ES)가 삽입된 효모 세포를 회수하는 단계 (여기서, 상기 회수를 위해 선별 마커의 삽입이 필요하지 않음)를 포함하는, 외인성 핵산을 효모 세포 게놈의 표적 부위에 마커를 사용하지 않고(markerless) 삽입하는 방법을 제공한다.
다른 측면에서, 본원에서 기술한 하나 이상의 외인성 핵산을 게놈에 삽입하는 임의의 방법에 의해 생성되는 변형된 숙주 세포를 제공하며, 상기 변형된 숙주 세포는,
(a) 복수의 외인성 핵산 (여기서, 상기 각각의 외인성 핵산 (ES)x는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(b) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x (이때, 상기 절단으로 (TS)x에서 (ES)x의 상동성 재조합이 이루어짐)를 포함하며,
x는 1 내지 n의 정수이며, n은 2 이상이다.
일부 실시 양태에서, 상기 변형된 숙주 세포는 효모 세포이며,
(a) 제1 상동성 영역 (HR1) 및 제2 상동성 영역 (HR2)를 포함하는 외인성 핵산 (ES) (여기서, 상기 (HR1) 및 (HR2)는 상기 숙주 세포 게놈의 표적 부위 (TS)에서 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(b) (TS)에서 절단할 수 있는 뉴클레아제 (N) (이때, 상기 절단으로 (TS)에서 (ES)의 상동성 재조합이 이루어짐)를 포함하며,
상기 (ES)는 선별 마커를 포함하지 않는다.
다른 측면에서,
(a) 효모 세포;
(b) 복수의 외인성 핵산으로서, 각각의 외인성 핵산 (ES)x가,
(i) 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x (여기서, 상기 (HR1)x 및 (HR2)x는 효모 세포 게놈의 선별된 표적 부위 (TS)x에서 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(ii) (HR1)x의 3' 및 (HR2)x의 5'에 위치한 대상 핵산 (D)x를 포함하는, 복수의 외인성 핵산; 및
(c) 복수의 뉴클레아제 (여기서, 상기 각각의 뉴클레아제 (N)x는 (TS)x에서 절단할 수 있으며, 이때 상기 절단으로 (TS)x에서 (ES)x의 상동성 재조합이 이루어짐)를 포함하는, 조성물을 제공하며,
x는 1 내지 n의 정수이며, n은 2 이상이다.
다른 측면에서, 본원에서 기술한 1종 이상의 외인성 핵산을 게놈에 삽입하기 위한 방법을 수행하는 데 유용한 키트를 제공한다. 일부 실시 양태에서, 상기 키트는,
(a) 복수의 외인성 핵산으로서, 상기 각각의 외인성 핵산 (ES)x이,
(i) 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x (여기서, 상기 (HR1)x 및 (HR2)x는 효모 세포 게놈의 선별된 표적 부위 (TS)x에서 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(ii) (HR1)x의 3' 및 (HR2)x의 5'에 위치한 대상 핵산 (D)x를 포함하는, 복수의 외인성 핵산; 및
(b) 복수의 뉴클레아제 (여기서, 상기 각각의 뉴클레아제 (N)x는 (TS)x에서 절단할 수 있으며, 이때 상기 절단으로 (TS)x에서 (ES)x의 상동성 재조합이 이루어짐)를 포함한다.
일부 실시 양태에서, (D)x는 선별 마커, 프로모터, 에피토프 테그를 코딩하는 핵산 서열, 대상 유전자, 리포터 유전자, 및 종결 코돈을 코딩하는 핵산 서열로 이루어진 군으로부터 선택된다. 일부 실시 양태에서, 상기 키트는 복수의 프라이머 쌍 (P)x을 추가로 포함하며, 상기 프라이머 쌍은 각각 PCR에 의해 (TS)x에서 (ES)x의 삽입을 동정할 수 있다. 일부 실시 양태에서, (ES)x는 선형이다. 일부 실시 양태에서, (ES)x는 원형이다.
특정 실시 양태에서, 상기 키트는 상기 효모 게놈의 대략 6000개의 유전자 좌 중 임의의 유전자 좌 내에 고유 표적 부위에서 외인성 핵산의 부위-특이적인 삽입을 구현할 수 있다. 이들 실시 양태에서, n은 ≥6000이며, 각각의 (TS)x는 효모 세포 게놈의 특정 유전자 좌에 대해 특이적이다.
도 1은 부위-특이적인 뉴클레아제를 이용한, 외인성 핵산의, 마커리스 게놈 삽입에 대한 예시적인 실시 양태를 제공한다.
도 2는 복수의 부위-특이적인 뉴클레아제를 이용한, 복수의 외인성 핵산의 동시적인 게놈 삽입에 대한 예시적인 실시 양태를 제공한다. HR1 - 상류 상동성 영역; HR2 - 하류 상동성 영역; TS - 표적 부위; N - 부위-특이적인 뉴클레아제; D - 대상 핵산.
도 3은 아이소프레노이드를 제조하는 MEV 경로의 도식 대표도를 제공한다.
도 4는 본원에서 제공한 조합적인 삽입 라이브러리의 제조 방법에 대한 예시적인 실시 양태를 제공한다. 해치 마크(hatch mark)는 각각의 라이브러리 (L)x의 개별 외인성 핵산 구성원을 나타낸다.
도 5는 빈(empty) 벡터 DNA, 및 기능성 EmGFP를 코딩하는 선형 "공여체" DNA로 형질전환된 효모 세포 콜로니 96개에 대한 콜로니 PCR 결과를 제공한다. 상기 효모 세포는, HO, YGR250c, 및 NDT80 유전자 좌 각각으로 게놈 삽입한 단축된(truncated), 비-기능성 EmGFP을 코딩하는 "표적" 핵산의 카피(copy)를 포함한다. 개별 PCR 반응을 수행하여, 기능성 EmGFP를 코딩하는 핵산에 특이적인 프라이머로 HO, YGR250c, 및 NDT80 유전자 좌를 탐침하였다. PCR 산물이 관찰되지 않았는데, 이는 비-기능성 EmGFP를 코딩하는 표적 핵산이 기능성 EmGFP를 코딩하는 공여체 핵산으로 대체되지 않았음을 의미한다.
도 6은 pZFN.gfp DNA, 및 기능성 EmGFP를 코딩하는 선형 "공여체" DNA로 형질전환된 효모 세포의 콜로니 96개에 대한 콜로니 PCR 결과를 제공한다. 상기 효모 세포는, HO, YGR250c, 및 NDT80 유전자 좌 각각으로 게놈 삽입한 단축된, 비-기능성 EmGFP을 코딩하는 "표적" 핵산의 카피를 포함하였다. pZFN.gfp는, 비-기능성 EmGFP 코딩 서열에 특이적인 핵산 서열을 인지하여 절단하는 징크 핑거 뉴클레아제를 코딩한다. 개별 PCR 반응을 수행하여, 기능성 EmGFP를 코딩하는 핵산에 특이적인 프라이머로 HO, YGR250c, 및 NDT80 유전자 좌를 탐침하였다. PCR 산물들이 다수 관찰되었는데, 이는 비-기능성 EmGFP 삽입체가 기능성 EmGFP를 코딩하는 DNA로 성공적으로 대체되었음을 의미한다.
도 7은, 메발로네이트 경로의 효소 및 파르네센 신타제 (farnesene synthase, FS)를 코딩하는 플라스미드를 포함하는 파르네센-생성 효모 모 균주인 균주 B; 아모파다이엔 신타제 (amorphadiene synthase, ADS)가 4 카피로 게놈에 삽입된, 균주 B의 유도체 균주인 균주 D; 및 FS를 코딩하는 플라스미드가 소실된, 균주 D의 유도체 균주인 균주 E의 세스퀴테르펜 역가(titer)를 제공한다. 모 균주 B의 세스퀴테르펜 생산력(capacity) 중 거의 100%가 균주 D 및 E에서 유지되었고, 단지 ADS를 다수 카피로 포함하고 있다.
도 8은, SFC1 (GFP 공여체 DNA) 및 YJR030c (ADE2 공여체 DNA) 유전자 좌에 대한 선형 공여체 DNA, YJR030c 엔도뉴클레아제 플라스미드 (pCUT006) 및 SFC1 엔도뉴클레아제 플라스미드 (pCUT058)로 공동-형질전환한 세포에 대한 결과를 제공한다. URA 드롭아웃(dropout) + Kan 한천 플레이트(agar plate)에서 선별한 콜로니 중 80%는 GFP 양성이었다. 이들 콜로니 중에서, 91%는 ADE2 삽입에 대해 양성이었다. 전체적으로, 콜로니 중 72.8%로 모든 유전자 좌에 마커리스 공여체 DNA가 성공적으로 삽입되었다.
6.1 정의
본원에서, 뉴클레아제, 예를 들어, 호밍 엔도뉴클레아제, 징크-핑거 뉴클레아제 또는 TAL-작동자 뉴클레아제에 관해 용어 "절단하다", "절단", 및/또는 "절단하는"은 특정 핵산에서 이중-가닥 절단(DSB)을 만드는 작용을 지칭한다. DSB는 당해 기술분야의 당업자가 이해하는 바와 같이, 블런트 말단(blunt end) 또는 스티키 말단(sticky end) (즉, 5' 또는 3' 오버행(오버행))을 남길 수 있다.
본원에서, 용어 "조작된 숙주 세포"는 유전자 조작 기술 (즉, 재조합 기술)을 이용해 모 세포를 유전적으로 변형함으로써 생성되는 숙주 세포를 지칭한다. 변형된 숙주 세포는 모 세포의 게놈에의 뉴클레오타이드 서열의 첨가, 결실, 및/또는 변형을 포함할 수 있다.
본원에서, 용어 "이종성"은 자연상에서 보통 발견되지 않는 것들을 지칭한다. 용어 "이종성 뉴클레오타이드 서열"은 자연상에서 주어진 세포에서 보통 발견되지 않는 뉴클레오타이드 서열을 지칭한다. 이와 같이, 이종성 뉴클레오타이드 서열은, (a) 이의 숙주 세포에 대해 외래성 (즉, 세포에 대해 "외인성")이거나; (b) 숙주 세포에서 자연적으로 발견되지만 (즉, "내인성"), 상기 세포에서 비자연적인 양으로 존재하거나 (즉, 숙주 세포에서 자연적으로 발견되는 양보다 더 많거나 더 적음); 또는 (c) 숙주 세포에서 자연적으로 발견되지만 이의 자연적인 유전자 좌의 외부에 위치할 수 있다.
본원에서, 용어 "상동성"은 2개 이상의 핵산 서열, 또는 2개 이상의 아미노산 서열 간의 동일성을 지칭한다. 서열 동일성은 동일성 (또는 유사성 또는 상동성) %로 측정할 수 있으며; %가 높을수록, 상기 서열은 서로 동일성이 더 높다. 핵산 또는 아미노산 서열의 호모로그 또는 오르소로그(ortholog)는 표준 방법을 이용해 정렬하였을 때, 서열 동일성이 상대적으로 높다. 비교를 위해 서열을 정렬하는 방법은 당해 기술분야에 잘 알려져 있다. 여러 가지 프로그램 및 정렬 알고리즘이 Smith & Waterman, Adv . Appl . Math. 2:482, 1981; Needleman & Wunsch, J. Mol. Biol. 48:443, 1970; Pearson & Lipman, Proc . Natl . Acad . Sci . USA 85:2444, 1988; Higgins & Sharp, Gene, 73:237-44, 1988; Higgins & Sharp, CABIOS 5:151-3, 1989; Corpet et al., Nuc . Acids Res. 16:10881-90, 1988; Huang et al. Computer Appls . Biosc. 8, 155-65, 1992; 및 Pearson et al., Meth . Mol . Bio. 24:307-31, 1994. Altschul et al., J. Mol . Biol. 215:403-10, 1990에 기술되어 있으며, 서열 정렬 방법 및 상동성 계산법에 관한 상세 사항이 기술되어 있다. NCBI Basic Local Alignment Search Tool (BLAST) (Altschul et al., J. Mol . Biol. 215:403-10, 1990)은 서열 분석 프로그램인 blastp, blastn, blastx, tblastn 및 tblastx와 함께 사용하기 위해 미국 생물학 정보 센터(National Center for Biological Information) (NCBI, National Library of Medicine, Building 38A, Room 8N805, Bethesda, Md. 20894) 및 인터넷을 비롯해 다양한 소스에서 이용가능하다. 부가적인 정보는 NCBI 웹 사이트에서 찾을 수 있다.
본원에서, 용어 "마커를 사용하지 않고(마커리스 (markerless))"는 선별 마커의 삽입 없이, 숙주 세포 내 표적 부위로 공여체 DNA를 삽입하는 것을 지칭한다. 일부 실시 양태에서, 상기 용어는 또한, 선별 마커를 숙주 세포 게놈에 삽입하는 것에 좌우되는 선별 방식을 이용하고, 이러한 숙주 세포를 회수하는 것을 지칭한다. 예를 들어, 소정의 실시 양태에서, 에피좀(episomal) 또는 염색체외 선별 마커를 이용해, 게놈 표적 부위를 절단할 수 있는 뉴클레아제를 코딩하는 플라스미드를 포함하는 세포를 선별할 수 있다. 이러한 용도는 선별 마커가 숙주 세포 게놈에 삽입되지 않는 한, "마커를 사용하지 않는 것"으로 간주될 것이다.
본원에서, 용어 "폴리뉴클레오타이드"는 당해 기술분야의 당업자가 이해하듯이, 뉴클레오타이드 단위로 이루어진 중합체를 지칭한다. 바람직한 뉴클레오타이드 단위로는, 아데닌 (A), 구아닌 (G), 시토신 (C), 티미딘 (T), 및 우라실 (U)을 포함하는 것들을 포함하나, 이로 한정되지 않는다. 유용한 변형된 뉴클레오타이드 단위로는, 4-아세틸시스티딘, 5-(카르복시하이드록실메틸)우리딘, 2-O-메틸시스티딘, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노-메틸우리딘, 다이하이드로우리딘, 2-O-메틸슈도우리딘, 2-O-메틸구아노신, 이노신, N6-아이소펜틸아데노신, 1-메틸아데노신, 1-메틸슈도우리딘, 1-메틸구아노신, 1-메틸이노신, 2,2-다이메틸구아노신, 2-메틸아데노신, 2-메틸구아노신, 3-메틸시스티딘, 5-메틸시스티딘, N6-메틸아데노신, 7-메틸구아노신, 5-메틸아미노메틸우리딘, 5-메톡시아미노메틸-2-티오우리딘, 5-메톡시우리딘, 5-메톡시카르보닐메틸-2-티오우리딘, 5-메톡시카르보닐메틸우리딘, 2-메틸티오-N6-아이소펜틸아데노신, 우리딘-5-옥시아세트산-메틸에스테르, 우리딘-5-옥시아세트산, 바이부톡소신(wybutoxosine), 바이부토신(wybutosine), 슈도우리딘, 퀴노신(queuosine), 2-티오시스티딘, 5-메틸-2-티오우리딘, 2-티오우리딘, 4-티오우리딘, 5-메틸우리딘, 2-O-메틸-5-메틸우리딘, 2-O-메틸우리딘 등으로 포함하나, 이로 한정되지 않는다. 폴리뉴클레오타이드는 데옥시리보핵산 ("DNA") 및 리보핵산 ("RNA")과 같은 천연(naturally occurring) 핵산, 뿐만 아니라 핵산 유사체를 포함한다. 핵산 유사체는 비-천연 염기, 천연 포스포다이에스테르 결합이 아닌 결합으로 다른 뉴클레오타이드와 연계되거나 또는 포스포다이에스테르 결합이 아닌 연결을 통해 결합되는 염기를 포함하는 뉴클레오타이드를 포함하는 것들을 포함한다. 따라서, 뉴클레오타이드 유사체는, 예를 들어, 한정 없이, 포스포로티오에이트, 포스포로다이티오에이트, 포스포로트리에스테르, 포스포라미데이트, 보라노포스페이트, 메틸포스포네이트, 키랄-메틸 포스포네이트, 2-O-메틸 리보뉴클레오타이드, 펩타이드-핵산 (PNA) 등을 포함한다.
폴리뉴클레오타이드 서열을 기술하는 통상적인 명칭을 본원에서 사용한다: 단일-가닥 폴리뉴클레오타이드 서열의 좌측 말단은 5'-말단이며; 이중-가닥 폴리뉴클레오타이드 서열의 좌측 방향은 5'-방향이라고 지칭한다.
본원에서, 다중 삽입과 관련하여, 용어 "동시적인"은, 숙주 세포가 뉴클레아제, 예를 들어, 뉴클레아제를 코딩하는 플라스미드,및 숙주 세포 게놈에 삽입될 하나 이상의 공여체 DNA로 공동-형질전환되는 시점에서 시작하여, 각각의 표적 유전자 좌에 상기 공여체 DNA가 성공적으로 삽입되었는지에 대해 상기 형질전환된 숙주 세포, 또는 이의 클론 개체군을 스크리닝하는 시점으로 종결되는 기간을 포함한다. 일부 실시 양태에서, "동시적인"에 포함되는 기간은 적어도, 표적 서열 뉴클레아제가 숙주 세포의 염색체(들) 내 이의 표적 서열에 결합하여 절단하는 데 필요한 시간이다. 일부 실시 양태에서, "동시적인"에 포함되는 기간은, 숙주 세포가 뉴클레아제, 예를 들어, 뉴클레아제를 코딩하는 플라스미드 및 하나 이상의 공여체 DNA를 공동-형질전환하는 시점에서 시작하여, 적어도 6, 12, 24, 36, 48, 60, 72, 96시간, 또는 96시간 이상이다.
6.2 외인성 핵산을 삽입하는 방법
본원은, 1종 이상의 외인성 핵산을 숙주 세포 게놈의 1종 이상의 선별된 표적 부위로 삽입하는 방법을 제공한다. 소정의 실시 양태에서, 상기 방법은 숙주 세포를, 게놈 표적 부위에 삽입될 외인성 핵산을 포함하는 1종 이상의 삽입 폴리뉴클레오타이드, 즉, 공여체 DNA, 및 게놈 표적 부위 근처 또는 그 내부에서 이중-가닥 절단을 야기할 수 있는 1종 이상의 뉴클레아제와 접촉시키는 단계를 포함한다. 게놈 표적 부위 근처 또는 그 내부에서의 절단은 상기 절단 자리에 또는 그 근처에서 상동성 재조합의 빈도를 크게 증가시킨다.
특정 측면에서,
(a) 숙주 세포를,
(i) 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하는 외인성 핵산 (ES) (여기서, 상기 (HR1) 및 (HR2)는 상기 표적 부위 (TS)에서 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(ii) (TS)에서 절단할 수 있는 뉴클레아제 (N) (이때, 상기 절단으로 (TS)에서 (ES)의 상동성 재조합이 이루어짐)와 접촉시키는 단계,
(b) (TS)에 (ES)가 삽입된 숙주 세포를 회수하는 단계 (여기서, 상기 회수를 위해 선별 마커의 삽입이 필요하지 않음)를 포함하는, 외인성 핵산을 숙주 세포 게놈의 표적 부위로 마커를 사용하지 않고 삽입하는 방법을 제공한다.
도 1은, 부위-특이적인 뉴클레아제를 사용해 외인성 핵산을, 마커리스로 게놈에 삽입하는 예시적인 실시 양태를 제공한다. 공여체 폴리뉴클레오타이드는 숙주 세포로 도입되며, 상기 폴리뉴클레오타이드는 제1 상동성 영역 (HR1) 및 제2 상동성 영역 (HR2)의 측면에 대상 핵산 (D)을 포함한다. HR1 및 HR2는 게놈 표적 부위 (TS)의 5' 및 3' 영역과 각각 상동성을 공유한다. 부위-특이적인 뉴클레아제 (N)가 또한, 숙주 세포에 도입되며, 상기 뉴클레아제는 상기 표적 부위 내 고유 서열을 인지 및 절단할 수 있다. 부위-특이적인 뉴클레아제에 의해 표적 부위 내 이중-가닥 절단을 유도하면, 내인성 상동성 재조합 시스템은, 이중-가닥 절단을 포함하지 않는 표적 부위와 비교해, 상기 절단된 표적 부위에 대상 핵산을 더 높은 빈도로 삽입한다. 이러한 삽입률의 증가는, 재조합이 이루어지는 형질전환체를 선별하기 위한, 선별 마커의 공동-삽입 필요성을 상실시킨다. 선별 마커 필요성을 없앰으로써, 예를 들어, 변형된 미생물의 구축 시, 완전한, 기능성 생합성 경로를 포함하는 균주를 구축하는 데 걸리는 시간이 크게 감소된다. 또한, 조작 전략은 더 이상, 해당 숙주 유기체에 이용가능한 마커의 한정된 캐시로 인한 선별 마커의 재활용 필요성에 제약을 받지 않게 된다.
일부 실시 양태에서, 성공적으로 삽입된 외인성 핵산을 포함하는 형질전환된 세포의 마커리스 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 1000, 900, 800, 700, 600, 500, 400, 300, 200 또는 100건 당 약 1건의 비율로 이루어진다. 특정 실시 양태에서, 성공적으로 삽입된 외인성 핵산을 포함하는 형질전환된 세포의 마커리스 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 90, 80, 70, 60, 50, 40, 30, 20, 또는 10건 당 약 1건의 비율로 이루어진다. 보다 특정한 실시 양태에서, 성공적으로 삽입된 외인성 핵산을 포함하는 형질전환된 세포의 마커리스 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 9, 8, 7, 6, 5, 4, 3, 또는 2건 당 약 1건의 비율로 이루어진다. 보다 특정한 실시 양태에서, 상기숙주 세포는 효모 세포이며, 삽입률의 증가는 다른 숙주 세포 유형과 비교해, 효모에서의 상동성 재조합의 능력 증가가 이유이다.
선별 마커의 사용 없이, 변형된 게놈을 표적 부위에서 또는 그 근처에 가지는 세포를 동정하기 위해 여러 가지 방법을 이용할 수 있다. 일부 실시 양태에서, 이러한 방법은 표적 부위에서의 변화를 검출하고자 하며, 이로는 PCR 방법, 서열분석 방법, 뉴클레아제 분해, 예를 들어, 제한효소 맴핑, 서던 블롯, 및 이의 조합들을 포함하나, 이로 한정되지 않는다.
다른 측면에서,
(a) 숙주 세포를,
(i) 복수의 외인성 핵산 (여기서, 상기 각각의 외인성 핵산 (ES)x는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(ii) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x (이때, 상기 절단으로 (TS)x에서 (ES)x의 상동성 재조합이 이루어짐)와 접촉시키는 단계,
(b) 숙주 세포를 회수하는 단계 (여기서, 상기 각각의 선별된 외인성 핵산 (ES)x은 각각의 선별된 표적 서열 (TS)x에서 삽입됨)를 포함하는, 복수의 외인성 핵산을 숙주 세포 게놈에 삽입하는 방법을 제공하며,
여기서, x는 1 내지 n의 정수이며, n은 2 이상이다.
도 2는 복수의 부위-특이적인 뉴클레아제를 사용해 복수의 외인성 핵산을 동시적으로 게놈 삽입하는 것에 관한 예시적인 실시 양태를 제공한다. 이 실시 양태에서, 3가지의 폴리뉴클레오타이드가 숙주 세포에 도입되며, 상기 각각의 폴리뉴클레오타이드는 대상 핵산 (D)x을 포함하는 외인성 핵산 (ES)x (x=1, 2 또는 3임)이다. 각각의 (D)x는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x의 측면에 존재한다. (HR1)x 및 (HR2)x는 상기 게놈의 총 3가지의 고유 표적 부위 중 선별된 표적 부위 (TS)x의 5' 및 3' 영역과 각각 상동성을 공유한다. 복수의 부위-특이적인 뉴클레아제 (N)x가 또한 상기 숙주 세포에 도입되며, 상기 각각의 (N)x는 이의 상응하는 표적 부위, (TS)x 내 고유 서열을 인지 및 절단할 수 있다. 이의 상응하는 부위-특이적인 뉴클레아제 (N)x에 의해 표적 부위 (TS)x를 절단할 때, 내인성 상동성 재조합 시스템는 (TS)x에서 상응하는 대상 핵산 (D)x의 삽입을 촉진한다.
특정 실시 양태에서, 대상 핵산 (D)x를 선택적으로 포함하는 각각의 외인성 핵산 (ES)x는 이의 각각의 게놈 표적 부위 (TS)x로 동시에 삽입되는데, 즉 복수의 삽입 폴리뉴클레오타이드 및 복수의 뉴클레아제로 숙주 세포가 한번의 형질전환된다. 일부 실시 양태에서, 상기 방법은 전술한 방법에 언급한 변형에 따라, 복수의 외인성 핵산 (ES)x (즉, x는 1 내지 n의 정수이며, n은 2 이상임)을 동시에 삽입하는 데 유용하다. 일부 실시 양태에서, 본원에서 제공하는 동시 삽입 방법은 10개 이하의 외인성 핵산 (ES)x를 10개의 선별된 표적 부위 (TS)x (즉, x는 1 내지 n의 정수이며, n은 2, 3, 4, 5, 6, 7, 8, 9, 또는 10임)로 동시 삽입하는 데 유용하다. 일부 실시 양태에서, 본원에서 제공하는 동시 삽입 방법은 20개 이하의 외인성 핵산 (ES)x를 20개의 선별된 표적 부위 (TS)x (즉, x는 1 내지 n의 정수이며, n은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20임)로 동시 삽입하는 데 유용하다. 일부 실시 양태에서, n은 2이다. 일부 실시 양태에서, n은 3이다. 일부 실시 양태에서, n은 4이다. 일부 실시 양태에서, n은 5이다. 일부 실시 양태에서, n은 6이다. 일부 실시 양태에서, n은 7이다. 일부 실시 양태에서, n은 8이다. 일부 실시 양태에서, n은 9이다. 일부 실시 양태에서, n은 10이다. 일부 실시 양태에서, n은 11이다. 일부 실시 양태에서, n은 12이다. 일부 실시 양태에서, n은 13이다. 일부 실시 양태에서, n은 14이다. 일부 실시 양태에서, n은 15이다. 일부 실시 양태에서, n은 16이다. 일부 실시 양태에서, n은 17이다. 일부 실시 양태에서, n은 18이다. 일부 실시 양태에서, n은 19이다. 일부 실시 양태에서, n은 20이다. 일부 실시 양태에서, 본원에서 제공하는 동시 삽입 방법은 20개 초과의 외인성 핵산을 동시 삽입하는 데 유용하다.
단일 표적 부위에서의 단일 외인성 핵산의 삽입과 같이, 복수의 외인성 핵산의 동시 다중 삽입은, 표적 부위와 이중-가닥 절단을 유도할 수 있는 뉴클레아제와의 접촉이 없는 경우와 비교해, 상당히 높은 빈도로 발생한다 . 일부 실시 양태에서, 다중 유전자 좌에서의 복수의 외인성 핵산의 동시 삽입, 즉, 다중 뉴클레아제의 존재 하에서의 삽입 동안에, 단일 유전자 좌의 삽입률은 단일 삽입 현상, 즉, 단일 뉴클레아제의 존재 하에서의 삽입 동안 동일한 유전자 좌에서의 삽입률과 비교해 상당히 높다. 이러한 이점은 하기 실시예 6 (섹션 7.5.2)에 나타나 있다. 이론으로 결부시키고자 하는 것은 아니지만, 복수의 표적 부위에서 이중-가닥 절단 (DSB)을 만드는 다중 뉴클레아제의 존재 및 활성이, 절단 자리에 공여체 DNA(들)를 삽입함으로써 DSB를 성공적으로 복구하는 형질전환체 및/또는 DSB를 복구할 수 없는 형질전환체와 비교해 선별되는, 형질전환체를 농화하는 것으로 여겨진다. DSB가 세포에 유해하기 때문에, 뉴클레아제의 수적 증가는 더 많은 DSB를 생성하게 되며, 따라서 공여체 DNA(들)의 HR-매개의 삽입을 통해 DSB를 복구할 수 있는 세포의 농화가 이루어지는 것으로 여겨진다.
일부 실시 양태에서, 이러한 삽입률의 증가는 복수의 재조합 현상을 동정하기 위해 1종 이상의 선별 마커를 공동-삽입할 필요성을 없앤다. 일부 실시 양태에서, 복수의 성공적으로 삽입된 외인성 핵산을 포함하는 형질전환된 세포의 마커리스 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 1000, 900, 800, 700, 600, 500, 400, 300, 200 또는 100건 당 약 1건의 비율로 이루어진다. 특정 실시 양태에서, 성공적으로 삽입된 외인성 핵산을 포함하는 형질전환된 세포의 마커리스 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 90, 80, 70, 60, 50, 40, 30, 20, 또는 10건 당 약 1건의 비율로 이루어진다. 보다 특정한 실시 양태에서, 성공적으로 삽입된 외인성 핵산을 포함하는 형질전환된 세포의 마커리스 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 9, 8, 7, 6, 5, 4, 3, 또는 2건 당 약 1건의 비율로 이루어진다. 보다 특정한 실시 양태에서, 상기 숙주 세포는 효모 세포이며, 삽입률 증가는 다른 숙주 세포 유형과 비교해, 효모에서의 상동성 재조합 능력 증가로 인한 것이다.
6.2.1. 대사 경로 조작 방법
본원에서 기술하는 방법 및 조성물은 최적화된 생합성 경로, 예를 들어, 바이오매스를 바이오연료, 약제 또는 생체적합물질로 전환하는 경로를 포함하는 재조합 유기체를 구축하는 특정 이점들을 제공한다. 기능성이면서 비-천연적인 생물학적 경로는 항말라리아 약물인 아르테미시닌(artemisinin)으로의 전구체 (예를 들어, Martin et al., Nat Biotechnol 21:796-802 (2003) 참조); 지방산 유래의 연료 및 화학물질 (예를 들어, 지방산 에스테르, 지방 알코올 및 왁스; 예를 들어, Steen et al., Nature 463:559-562 (2010) 참조); 메틸 할라이드-유래의 연료 및 화학물질 (예를 들어, Bayer et al., J Am Chem Soc 131:6508-6515 (2009) 참조); 콜레스테롤 저하 약물을 제조하는 폴리케타이드 신타제 (예를 들어, Ma et al., Science 326:589-592 (2009) 참조); 및 폴리케타이드 (예를 들어, Kodumal, Proc Natl Acad Sci USA 101:15573-15578 (2004) 참조)를 제조하기 위한 미생물 숙주에서 성공적으로 구축된 바 있다.
전형적으로, 대사 조작, 및 특히 생합성 경로의 구축은, 경로 구성분이 한번에 하나의 단일 유전자 좌로 숙주 세포 게놈에 삽입되는 한번에 한 단계식의 방법으로 진행된다. 본원에서 제공하는 삽입 방법은, 신규 대사 경로, 즉, 숙주 세포에 의해 내인성으로 생성되지 않는 대사물질을 생성하는 대사 경로의 효소를 코딩하는 1종 이상의 이종성 뉴클레오타이드 서열을 포함하도록 숙주 세포, 예를 들어, 미생물 세포를 조작하는 데 전형적으로 필요한 시간을 줄이는 데 이용할 수 있다. 다른 특정 실시 양태에서, 본원에서 제공하는 삽입 방법은 숙주 세포에 내인성인 대사 경로, 즉, 숙주 세포에 의해 내인성으로 생성되는 대사물질을 생성하는 대사 경로의 효소를 코딩하는 1종 이상의 이종성 뉴클레오타이드 서열을 포함하도록 숙주 세포를 효율적으로 조작하는 데 사용할 수 있다. 일 실시 양태에서, 설계 전략은 숙주 세포의 3가지의 고유 유전자를 상보적인 외인성 경로로 대체하고자 할 수 있다. 현재의 당해 기술분야를 이용하는 이들 3가지 내인성 유전자 좌는 3가지 분리된 형질전환을 필요로 한다. 이와는 달리, 본원에서 제공하는 동시 다중 삽입 방법은 3가지 삽입 모두가 한번의 형질전환에서 수행될 수 있도록 하여, 필요한 조작 주기를 1/3로 줄일 수 있다. 더욱이, 상기 방법은 숙주 세포 캐시의 다중 자리에서 삽입된 최적화된 경로 구성분을 포함하는 DNA 어셈블리를 제2 숙주 세포 캐시의 유사한 자리로 포팅(porting)될 수 있게 한다. 원하는 유전자형을 조작하는 데 필요한 주기의 횟수를 줄임으로써, 대사 경로의 구축의 속도를 상당히 증가시킨다.
6.2.1.1 아이소프레노이드 경로 조작
일부 실시 양태에서, 본원에서 제공하는 방법은, 변형된 숙주 세포의 산물 프로파일을 변형시키기 위해 생합성 경로 중 1종 이상의 구성분을 동시에 도입 또는 대체하는 데 이용할 수 있다. 일부 실시 양태에서, 상기 생합성 경로는 아이소프레노이드 경로이다.
테르펜은 많은 유기체에서 생성되는 탄화수소의 큰 클래스이다. 테르펜이 (예를 들어, 산화 또는 탄소 골격의 재배열을 통해) 화학적으로 개질되는 경우, 생성되는 화합물은 일반적으로 테르페노이드로 지칭되며, 이는 아이소프레노이드로도 알려져 있다. 아이소프레노이드는 많은 중요한 생물학적 역할을 하는데, 예를 들어, 전자 수송 연쇄반응에서 퀴논으로서, 막 구성분으로서, 단백질 프레닐화를 통한 조절 및 아세포성 표적화에서, 카로테노이드, 클로로필을 비롯하여 광합성 색소로서, 호르몬 및 보조인자로서, 및 모노테르펜, 세스퀴테르펜, 및 다이테르펜과 함께 식물 방어 화합물로서 작용한다. 이들은 항생제, 호르몬, 항암 약물, 살충제, 및 화학물질로서 산업적으로 유용하다.
테르펜은 아이소프렌 (C5H8)의 연결 단위에 의해 유래되며, 아이소프렌 단위 존재수에 의해 분류된다. 헤미테르펜은 단일 아이소프렌 단위로 이루어진다. 아이소프렌 자체는 유일한 헤미테르펜으로 간주된다. 모노테르펜은 2개의 아이소프렌 단위로 이루어지며, 분자식 C10H16을 가진다. 모노테르펜의 예는 게라니올(geraniol), 리모넨(limonene), 및 테르피네올(terpineol)이다. 세스퀴테르펜은 3개의 아이소프렌 단위로 이루어지며, 분자식 C15H24을 가진다. 세스퀴테르펜의 예는 파르네센 및 파르네솔(farnesol)이다. 다이테르펜은 4개의 아이소프렌 단위로 이루어지며, 분자식 C20H32을 가진다. 다이테르펜의 예는 카페스톨(cafestol), 카훼올(kahweol), 켐브렌(cembrene), 및 탁사다이엔(taxadiene)이다. 세스터테르펜은 5개의 아이소프렌 단위로 이루어지며, 분자식 C25H40을 가진다. 세스터테르펜의 예는 게라닐파르네솔(geranylfarnesol)이다. 트리테르펜은 6개의 아이소프렌 단위로 이루어지며, 분자식 C30H48을 가진다. 테트라테르펜은 8개의 아이소프렌 단위로 이루어지며, 분자식 C40H64을 가진다. 생물학적으로 중요한 테트라테르펜으로는, 아크릴릭 라이펜(acyclic lycopene), 모노사이클릭 감마-카로텐, 및 바이사이클릭 알파-카로텐 및 베타-카로텐을 포함한다. 폴리테르펜은 많은 아이소프렌 단위의 장쇄로 이루어진다. 천연 고무는, 이중 결합이 cis형인 폴리아이소프렌으로 이루어진다.
테르펜은 아이소펜테닐 파이로포스페이트 (아이소펜테닐 다이포스페이트 또는 IPP) 및 이의 이성질체인 다이메틸알릴 파이로포스페이트 (다이메틸알릴 다이포스페이트 또는 DMAPP)의 축합을 통해 생합성된다. IPP 및 DMAPP를 생성하는 2가지 경로, 즉 진핵생물의 메발로네이트-의존성 (MEV) 경로 (도 3), 및 원핵생물의 메발로네이트-비의존성 또는 데옥시크실룰로스-5-포스페이트 (DXP) 경로가 알려져 있다. 식물은 MEV 경로와 DXP 경로 둘 다를 이용한다. 즉, IPP 및 DMAPP는 프레닐 디스포스페이트 신타제 (예를 들어, 각각 GPP 신타제, FPP 신타제, 및 GGPP 신타제)의 작용을 통해 폴리프레닐 다이포스페이트 (예를 들어, 게라닐 디스포스페이트 또는 GPP, 파네실 다이포스페이트 또는 FPP, 및 게라닐게라닐 다이포스페이트 또는 GGPP)로 축합된다. 폴리프레닐 다이포스페이트 중간산물은 테르펜 신타제에 의해 보다 복잡한 아이소프레노이드 구조로 전환된다.
테르펜 신타제는 다중 산물을 형성하는 큰 유전자 패밀리로 구성된다. 테르펜 신타제의 예로는, GPP를 모노테르펜으로 전환하는 모노테르펜 신타제; GGPP를 다이테르펜으로 전환하는 다이테르펜 신타제; 및 FPP를 세스퀴테르펜으로 전환하는 세스퀴테르펜 신타제를 포함하나, 이로 한정되지 않는다. 세스퀴테르펜 신타제의 예는 파르네센 신타제로, FPP를 파르네센으로 전환한다. 테르펜 신타제는, 이들이 대사 분지점에서 작동하여 세포에 의해 생성되는 아이소프레노이드의 유형을 지시하기 때문에, 아이소프레노이드로의 경로 흐름의 조절에 중요하다. 더욱이, 테르펜 신타제는 이러한 테르펜의 고수율 생성에 중요하다. 이와 같이, 이종성 아이소프레노이드 생성을 위해 변형된 숙주에서 경로 흐름을 개선하기 위한 하나의 전략은 테르펜 신타제를 코딩하는 핵산의 다중 카피를 도입하는 것이다. 예를 들어, 파르네센과 같은 세스퀴테르펜의 생성이 요구되는 MEV 경로를 포함하는 변형된 미생물에서, 세스퀴테르펜 신타제, 예를 들어, 파르네센 신타제를 상기 경로의 말단 효소로서 이용하고, 파르네센 신타제 유전자의 다중 카피를 파르네센 생성에 최적화된 균주의 생성을 위해 숙주 세포로 도입할 수 있다.
아이소프레노이드의 생합성은 프레닐 디스포스페이트 신타제 및 테르펜 신타제의 상류 구성분과 동일한 경로에 의존하기 때문에, 일단 숙주 "플랫폼(platform)" 균주로 변형된 이들 경로 구성분을 세스퀴테르펜의 생성에 이용할 수 있으며, 세스퀴테르펜의 동일성은 숙주 세포로 도입되는 특정 세스퀴테르펜 신타제에 의해 지시될 수 있다. 더욱이, 서로 다른 아이소프렌 단위를 가진 테르펜, 예를 들어 세스퀴테르펜 대신에 모노테르펜의 생성이 바람직한 경우, 프레닐 다이포스페이트 신타제 및 테르펜 신타제 둘 다는 상기 경로의 상류 구성분을 여전히 이용하면서 서로 다른 테르펜을 생성하도록 대체될 수 있다.
따라서, 본원에서 제공되는 방법 및 조성물을 이용하여, 아이소프레노이드 생성 경로, 예를 들어, 원하는 아이소프레노이드를 생성하는 MEV 경로를 포함하는 숙주 세포를 효율적으로 변형할 수 있다. 일부 실시 양태에서, 숙주 세포는 MEV 경로를 포함하며, 본원에서 제공되는 동시 다중 삽입 방법을 이용해, 프레닐 다이포스페이트 신타제 및/또는 테르펜 신타제의 다중 카피를 동시에 도입하여, 숙주 세포의 테르펜 산물 프로파일을 규명할 수 있다. 일부 실시 양태에서, 상기 프레닐 다이포스페이트 신타제는 GPP 신타제이며, 상기 테르펜 신타제는 모노테르펜 신타제이다. 일부 실시 양태에서, 상기 프레닐 다이포스페이트 신타제는 FPP 신타제이며, 상기 테르펜 신타제는 세스퀴테르펜 신타제이다. 일부 실시 양태에서, 상기 프레닐 다이포스페이트 신타제는 GGPP 신타제이며, 상기 테르펜 신타제는 다이테르펜 신타제이다. 다른 실시 양태에서, 숙주 세포는 MEV 경로 및 프레닐 다이포스페이트 신타제 및/또는 제1 형 테르펜, 예를 들어, 파르네센의 생성을 위한 테르펜 신타제를 포함하며, 본원에서 제공되는 동시 다중 삽입 방법은 프레닐 다이포스페이트 신타제 및/또는 제2 형 테르펜, 예를 들어, 아모파다이엔을 생성하기 위한 테르펜 신타제의 1종 이상의 카피를 동시에 대체할 수 있다. 이들 실시 양태는 하기 실시예 3 및 4에 예시되어 있다. 본원에서 제공하는 방법은 경로 구성분의 다중 카피를 이용하는 생합성 경로의 구축 및/또는 변형을 위해 유사하게 이용할 수 있으며, 산물 프로파일이 단일 경로 구성분의 다중 카피의 첨가 또는 교환으로 쉽게 변형될 수 있는 숙주 세포를 조작하는 데 특히 유용하다.
6.2.1.2 조합적인 삽입 라이브러리 생성 방법
생합성 경로가 일단 구축되면, 모든 구성분의 발현 수준은 대사 흐름을 최적화하고 산물 역가를 높게 달성하기 위해 조정될 필요가 있다. 흐름을 최적화하는 보편적인 방법으로는, 경로 구성분 유전자의 동일성에 변화를 주는 것, 유전자의 코돈 최적화, 가용성 테그의 사용, 단축 또는 공지된 돌연변이의 사용, 및 유전자의 발현 맥락(expression context)을 포함하나, 이로 한정되지 않는다. 전형적인 방법을 이용해 균주를 구축하는 도중에 이러한 다양성을 시도하는 것은, 균주를 비현실적으로 많은 수로 생성 및 보관할 것을 필요로 한다. 예를 들어, 균주 조작자(strain engineer)는 3가지 유전자 좌에서 구축물을 삽입하고, 각각의 유전자 좌에 대해 10개의 변이체를 고안하는 경우, 조합적인 다양성을 전체적으로 시도하기 위해서는 1,000개의 균주가 생성될 필요가 있을 것이다. 경로 유전자가 협력하여 작동하고, 모든 대사 중간산물이 쉽게 스크리닝될 수 있는 것은 아니기 때문에, 종종 각각의 삽입 주기 후에 경로 유전자의 개별적인 기여(contribution)를 평가하는 것이 불가능하다. 따라서, 균주 조작자는 통상적으로, 신규 대사 경로를 구축할 때 시도하는 설계 공간(design space)을 심각하게 한정하는 선택을 한다.
최적의 경로 디자인을 보다 잘 동정하기 위해, 본원에서 제공되는 게놈 변형 방법을, 합리적으로 설계된 삽입 구축물의 조합적인 라이브러리를 포함하는 균주를 생성하는 데 이용할 수 있다. 상기 방법은, 1종 이상의 뉴클레아제 및 1종 이상의 공여체 DNA 어셈블리를 세포로 도입하여, 게놈의 특정 위치에서의 공여체 DNA의 다중 동시 삽입을 촉진하는 데 의존한다. 그러나, 변형된 균주의 다양성을 창출하기 위해, 상기 방법은, 숙주 균주의 조합적인 삽입 라이브러리가 생성될 수 있도록, 공여체 DNA의 라이브러리, 즉, 각각의 표적화된 유전자 좌에 대한 삽입 구축물의 혼합물을 공동-형질전환하는 단계를 포함한다 (도 4). 고 빈도의 다중 삽입이 달성된 것은, 생성되는 균주가 광범위한 게놈 품질 조절 없이 산물에 대해 직접 합리적으로 스크리닝될 수 있으며, 상부 균주의 동일성은 스크리닝 후에 예를 들어 서열분석에 의해 측정될 수 있음을 의미한다. 이러한 방법은 개별 균주 생성, 품질 관리 및 보관의 부담을 덜어주며, 조작자가, 단일 튜브에서 다양한 삽입 조합을 생성하고 예를 들어, 경로의 최종 산물에 대한 스크리닝에 의해 수행력이 최상인 균주를 골라낼 수 있게 한다.
따라서, 일부 실시 양태에서, 복수의 외인성 핵산을 본원에서 제공되는 숙주 세포 게놈에 삽입하는 방법은,
(a) 숙주 세포를,
(i) 복수의 라이브러리 (여기서, 상기 각각의 라이브러리 (L)x는 복수의 외인성 핵산을 포함하며, 선별된 외인성 핵산은 5'에서 3' 방향으로, 제1 상동성 영역 (HR1)x, (D)x 군으로부터 선택되는 임의의 대상 핵산, 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 상기 선별된 외인성 핵산의 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(ii) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x (이때, 상기 절단으로 (TS)x에서 상기 선별된 외인성 핵산의 상동성 재조합이 이루어짐)와 접촉시키는 단계,
(b) 숙주 세포를 회수하는 단계 (여기서, 각각의 라이브러리 (L)x 유래의 외인성 핵산은 각각의 선별된 표적 서열 (TS)x에서 삽입됨)를 포함하며,
x는 1 내지 n의 정수이며, n은 2 이상이다.
상기 방법에 관한 도식적인 대표도는 도 4에 나타나 있다.
또한, 본원에서,
(a) 복수의 라이브러리 (여기서, 상기 각각의 라이브러리 (L)x는 복수의 외인성 핵산을 포함하며, 선별된 외인성 핵산은 5'에서 3' 방향으로, 제1 상동성 영역 (HR1)x, (D)x 군으로부터 선택되는 임의의 대상 핵산, 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 상기 선별된 외인성 핵산의 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(b) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x (이때, 상기 절단으로 (TS)x에서 상기 선별된 외인성 핵산의 상동성 재조합이 이루어짐)를 포함하는, 숙주 세포를 제공하며,
x는 1 내지 n의 정수이며, n은 2 이상이다.
일부 실시 양태에서, 각각의 라이브러리 (L)x는 보편적인 생합성 경로의 효소를 코딩하는 외인성 핵산을 포함한다. 일부 실시 양태에서, (D)x 군은 101, 102, 103, 104, 105, 106 이상, 또는 106 개 초과의 고유 대상 핵산을 포함한다. 일부 실시 양태에서, 각각의 라이브러리 (L)x는 생합성 경로의 효소의 변이체를 코딩하는 복수의 외인성 핵산을 포함한다. 본원에서, 용어 "변이체"는, 선별되는 효소와 비교해 상이한 뉴클레오타이드 또는 아미노산 서열을 가지는 생합성 경로의 효소를 지칭한다. 예를 들어, 일부 실시 양태에서, 라이브러리 (L)x는 세스퀴테르펜 신타제 변이체를 포함하며, 선별되는 세스퀴테르펜 신타제의 야생형 버전과 비교해, 상기 세스퀴테르펜 신타제 변이체는 상응하는 아미노산 서열에 변화를 주거나 또는 주지 않을 수 있는 뉴클레오타이드 첨가, 결실, 및/또는 치환을 포함할 수 있다. 다른 실시 양태에서, 효소 변이체는 대조군 효소, 예를 들어 야생형 버전에 비해 아미노산 첨가, 결실 및/또는 치환을 포함한다.
일부 실시 양태에서, 숙주 세포는, 상기 접촉 전에, 생합성 경로의 1종 이상의 효소를 코딩하는 1종 이상의 이종성 뉴클레오타이드 서열을 포함한다. 일부 실시 양태에서, 생합성 경로의 1종 이상의 효소를 코딩하는 상기 1종 이상의 이종성 뉴클레오타이드 서열은 게놈에 삽입된다.
6.3 삽입 폴리뉴클레오타이드
유리하게는, 삽입 폴리뉴클레오타이드, 즉, 공여체 DNA는 1종 이상의 외인성 핵산 구축물의, 숙주 세포 게놈의 선별된 표적 부위로의 삽입을 촉진한다. 바람직한 실시 양태에서, 삽입 폴리뉴클레오타이드는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x, 및 선택적으로는 (HR1)x와 (HR2)x 사이에 위치한 대상 핵산을 포함하는, 외인성 핵산 (ES)x이다. 일부 실시 양태에서, 상기 삽입 폴리뉴클레오타이드는 선형 DNA 분자이다. 다른 실시 양태에서, 상기 삽입 폴리뉴클레오타이드는 원형 DNA 분자이다.
삽입 폴리뉴클레오타이드는 당해 기술분야의 당업자가 알고 있는 기술에 의해 생성될 수 있다. 소정의 실시 양태에서, 상기 삽입 폴리뉴클레오타이드는 당해 기술분야에 잘 알려진 중합효소 연쇄반응 (PCR) 및 분자 클로닝 기술을 이용해 생성된다. 예를 들어, PCR Technology : Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); Sambrook et al ., 2001, Molecular Cloning - A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; PCR Technology : Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); 미국 특허 제8,110,360 호를 참조한다.
6.3.1. 게놈 삽입 서열
바람직한 실시 양태에서, 삽입 폴리뉴클레오타이드는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있는 외인성 핵산 (ES)x를 포함한다. 외인성 핵산을 상동성 재조합에 의해 게놈에 삽입하기 위해, 상기 삽입 폴리뉴클레오타이드는 바람직하게는 한쪽 말단에 (HR1)x, 및 다른쪽 말단에 (HR2)x를 포함한다. 일부 실시 양태에서, 상기 (HR1)x는 선별된 표적 부위 (TS)x의 5' 영역과 상동성이며, 상기 (HR2)x는 선별된 표적 부위 (TS)x의 3' 영역과 상동성이다. 일부 실시 양태에서, (HR1)x는 선별된 표적 부위 (TS)x의 5' 영역에 약 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 상동성이다. 일부 실시 양태에서, (HR2)x는 선별된 표적 부위 (TS)x의 3' 영역에 약 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 상동성이다.
소정의 실시 양태에서, (HR1)x는 대상 핵산 (D)x에 대해 5'에 위치한다. 일부 실시 양태에서, (HR1)x는 (D)x의 5' 말단에 바로 인접하여 위치한다. 일부 실시 양태에서, (HR1)x는 (D)x의 5'의 상류에 위치한다. 소정의 실시 양태에서, (HR2)x는 대상 핵산 (D)x에 대해 3'에 위치한다. 일부 실시 양태에서, (HR2)x의 3' 말단에 바로 인접하여 위치한다. 일부 실시 양태에서, (HR2)x(D)x의 3'의 하류에 위치한다
특정 게놈 유전자 좌에서 삽입 폴리뉴클레오타이드의 삽입에 영향을 줄 수 있는 특성으로는, 게놈 삽입 서열의 길이, 절제가능한 핵산 구축물의 전체 길이, 및 게놈 삽입 유전자 좌의 뉴클레오타이드 서열 또는 위치를 포함하나, 이로 한정되지 않는다. 예를 들어, 숙주 세포 게놈에서 게놈 삽입 서열의 한 가닥과 특정 유전자 좌의 한 가닥 사이의 효과적인 헤테로듀플렉스 형성은 상기 게놈 삽입 서열의 길이에 따라 다르다. 게놈 삽입 서열의 효과적인 길이 범위는 50 내지 5,000개 뉴클레오타이드이다. 게놈 삽입 서열과 게놈 유전자 좌 사이의 상동성의 효과적인 길이에 관해서는, Hasty et al ., Mol Cell Biol 11:5586-91 (1991)을 참조한다.
일부 실시 양태에서, (HR1)x 및 (HR2)x는, 효모 게놈 유전자 좌에서 외인성 핵산 (ES)x의 게놈 삽입을 허용하는, 충분한 길이 및 서열 동일성의 뉴클레오타이드 서열을 포함한다. 소정의 실시 양태에서, (HR1)x 및 (HR2)x는 각각 독립적으로 약 50 내지 5,000개 뉴클레오타이드로 이루어진다. 소정의 실시 양태에서, (HR1)x 및 (HR2)x는 각각 독립적으로 약 100 내지 2,500개 뉴클레오타이드로 이루어진다. 소정의 실시 양태에서, (HR1)x 및 (HR2)x는 각각 독립적으로 약 100 내지 1,000개 뉴클레오타이드로 이루어진다. 소정의 실시 양태에서, (HR1)x 및 (HR2)x는 각각 독립적으로 약 250 내지 750개 뉴클레오타이드로 이루어진다. 소정의 실시 양태에서, (HR1)x 및 (HR2)x는 각각 독립적으로 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900 또는 5,000개 뉴클레오타이드로 이루어진다. 일부 실시 양태에서, (HR1)x 및 (HR2)x는 각각 독립적으로 약 500개 뉴클레오타이드로 이루어진다.
6.3.2. 대상 핵산
일부 실시 양태에서, 삽입 폴리뉴클레오타이드는 추가로 대상 핵산 (D)x를 포함한다. 상기 대상 핵산은 당해 기술분야의 당업자에 의해 유용하게 여겨지는 DNA 분절일 수 있다. 예를 들어, 상기 DNA 분절은 숙주 게놈으로 "나킹 인(knocked in)"될 수 있는 대상 유전자를 포함할 수 있다. 다른 실시 양태에서, DNA 분절은 "낙아웃(knockout)" 구축물로서 기능하는데, 이는 숙주 세포 게놈의 표적 부위로 구축물이 삽입될 때 표적 유전자를 특이적으로 방해하여, 방해된 유전자가 비-기능성이 되게 할 수 있다. 대상 핵산 (D)x의 유용한 예로는, 단백질-코딩 서열, 리포터 유전자, 형광 마커 코딩 서열, 프로모터, 인핸서, 종결자, 전사 활성자, 전사 억제자, 전사 활성자 결합 부위, 인트론, 엑손, 폴리-A 꼬리, 다중 클로닝 자리, 핵 위치화 신호, mRNA 안정화 신호, 삽입 유전자 좌, 에피토프 테그 코딩 서열, 분해 신호, 또는 다른 천연 또는 합성적인 DNA 분자를 포함하나, 이로 한정되지 않는다. 일부 실시 양태에서, (D)x는 그 기원이 자연적일 수 있다. 다른 예로, (D)x는 그 기원이 완전히 합성적이어서 시험관내에서 생성될 수 있다. 아울러, (D)x는 분리된 천연 DNA 분자의 조합, 또는 분리된 천연 DNA 분자와 합성적인 DNA 분자의 조합을 포함할 수 있다. 예를 들어, (D)x는 단백질 코딩 서열에 조작적으로 연결된 이종성 프로모터, 폴리-A 꼬리에 연결된 단백질 코딩 서열, 에피토프 테그 코딩 서열과 프레임 내에서 연결된 단백질 코딩 서열 등을 포함할 수 있다. 대상 핵산 (D)x는 게놈 DNA, 또는 이의 절편의 화학적 합성에 의해, cDNA 클로닝에 의해, 또는 클로닝에 의해, 또는 PCR 증폭 및 클로닝에 의해, 당해 기술분야에 공지된 표준 절차에 의해 클로닝된 DNA (예를 들어, DNA "라이브러리")로부터 수득될 수 있다. 예를 들어, Sambrook et al ., Molecular Cloning, Laboratory Manual, 3d. ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001); Glover, D.M. (ed.), DNA Cloning : A Practical Approach, 2d. ed., MRL Press, Ltd., Oxford, U.K. (1995)를 참조한다.
특정 실시 양태에서, 대상 핵산 (D)x는 선별 마커를 코딩하는 핵산을 포함하지 않는다. 이들 실시 양태에서, 본원에서 기술한 방법에 의해 제공되는 삽입의 고효율은 선별 배지 상에서 형질전환된 세포를 성장시킬 필요 없이, 삽입 현상의 스크리닝하고 동정할 수 있게 한다. 그러나, 선별 배지 상에서의 성장이 바람직한 다른 실시 양태에서, 대상 핵산 (D)x는 외인성 핵산의 숙주 게놈으로의 삽입을 선별하는 데 사용할 수 있는 선별 마커를 포함한다.
여러 가지 다양한 선별 마커가 당해 기술분야에 알려져 있다 (예를 들어, Kaufinan, Meth . Enzymol., 185:487 (1990); Kaufman, Meth . Enzymol., 185:537 (1990); Srivastava and Schlessinger, Gene, 103:53 (1991); Romanos et al., in DNA Cloning 2: Expression Systems, 2nd Edition, pages 123-167 (IRL Press 1995); Markie, Methods Mol . Biol., 54:359 (1996); Pfeifer et al., Gene, 188:183 (1997); Tucker and Burke, Gene, 199:25 (1997); Hashida-Okado et al., FEBS Letters, 425:117 (1998) 참조). 일부 실시 양태에서, 상기 선별 마커는 약물 내성 마커이다. 약물 내성 마커는, 해독되지 않으면 세포를 사멸하게 할 외인성 약물을 세포가 해독할 수 있게 한다. 약물 내성 마커의 예시적인 예로는, 암피실린, 테트라사이클린, 케나마이신, 블레오마이신, 스트렙토마이신, 하이그로마이신, 네오마이신, Zeocin™ 등과 같은 항생제에 대해 내성을 부여하는 것들을 포함하나, 이로 한정되지 않는다. 다른 실시 양태에서, 선별 마커는 영양요구성 마커이다. 영양요구성 마커는 필수 구성분이 결여된 배지에서 성장되지만 필수 구성분 (통상 아미노산)을 세포가 합성할 수 있게 한다. 선별성 영양요구성 유전자 서열로는, 예를 들어, hisD을 포함하는데, 이는 히스티디놀의 존재 하에 히스티딘-무첨가 배지에서 성장할 수 있게 한다. 다른 선별 마커로는, 블레오마이신-내성 유전자, 메탈로티오네인 유전자, 하이그로마이신 B-포스포트랜스퍼라제 유전자, AURI 유전자, 아데노신 디아미나제(deaminase) 유전자, 아미노글라이코시드 포스포트랜스퍼라제 유전자, 다이하이드로폴레이트 리덕타제 유전자, 티미딘 키나제 유전자, 잔틴-구아닌 포스포리보실트랜스퍼라제 유전자 등을 포함한다. 다른 실시 양태에서, 선별 마커는 영양요구성 돌연변이를 구제하는 것이 아닌 마커이다. 예를 들어, 숙주 세포 균주는 영양요구성 돌연변이가 아닌 돌연변이, 예를 들어, 돌연변이가 공지된 선별 방법으로 동정될 수 있는 한, 숙주에 치명적이지 않으며 균주의 원하는 용도, 예를 들어 산업적 발효에 악영향을 야기하지 않는 돌연변이를 포함한다.
염색체적으로 삽입된 폴리뉴클레오타이드를 포함하는 숙주 세포 형질전환체는 또한, 개별 DNA 분절 또는 DNA 분절의 조합에 의해 코딩되는 다른 특성, 예를 들어, 발광하는 펩타이드의 발현을 나타내는 숙주 세포 형질전환체를 선별하거나, 또는 개별의 숙주 세포 콜로니의 분자적 분석, 예를 들어, 제한효소 효소 지도화, PCR 증폭, 또는 분리한 조립된 폴리뉴클레오타이드 또는 염색체 삽입 부위의 서열 분석에 의해, 동정할 수 있다.
6.4 뉴클레아제
본원에서 제공되는 방법의 일부 실시 양태에서, 숙주 세포 게놈을, 절단, 즉, 선별된 표적 부위 내 지정 영역에서 이중-가닥 절단을 유도할 수 있는, 1종 이상의 뉴클레아제와 접촉시킨다. 일부 실시 양태에서, 이중-가닥 절단 유도제는 특정 폴리뉴클레오타이드 인지 서열을 인지 및/또는 결합하여, 상기 인지 서열에 또는 그 근처에 절단이 생기게 하는, 임의의 제제이다. 이중-가닥 절단 유도제의 예로는, 엔도뉴클레아제, 부위-특이적인 재조합효소, 트랜스포자제, 토포아이소머라제, 및 징크 핑거 뉴클레아제를 포함하나 이로 한정되지 않으며, 이의 변형된 유도체, 변이체, 및 절편을 포함한다.
일부 실시 양태에서, 1종 이상의 뉴클레아제의 각각은 선별된 표적 부위 (TS)x 내 지정된 영역에 이중-가닥 절단을 유도할 수 있다. 일부 실시 양태에서, 상기 뉴클레아제는, (HR1)x 및 (HR2)x가 각각 상동성을 공유하는 (TS)x 의 5' 영역과 3' 영역 사이에 위치한 영역에서 이중-가닥 절단을 유도할 수 있다. 다른 실시 양태에서, 상기 뉴클레아제는 (TS)x의 5' 영역과 3' 영역의 상류 또는 하류에 위치한 영역에서 이중-가닥 절단을 유도할 수 있다.
인지 서열은 이중-가닥 절단 유도제에 의해 특이적으로 인지 및/또는 결합되는 폴리뉴클레오타이드 서열이다. 인지 부위 서열의 길이는 다양할 수 있으며, 예를 들어, 길이가 적어도 10, 12, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70개 이상의 뉴클레오타이드로 된 서열이다.
일부 실시 양태에서, 인지 서열은 회문식(palindromic)으로, 즉, 한쪽 가닥의 서열은 상보성 가닥의 반대 방향과 동일하게 판독된다. 일부 실시 양태에서, 닉/절단 부위가 상기 인지 서열 내에 존재한다. 다른 실시 양태에서, 상기 닉/절단 부위는 상기 인지 서열의 외부에 존재한다. 일부 실시 양태에서, 절단으로 블런트 말단이 생긴다. 다른 실시 양태에서, 절단으로 단일-가닥 오버행, 즉, "스티키성 말단"이 생기며, 이는 5' 오버행 또는 3' 오버행일 수 있다.
일부 실시 양태에서, 선별된 표적 부위 내 인지 서열은 상기 숙주 세포 게놈에 대해 내인성 또는 외인성일 수 있다. 인지 부위가 내인성 서열인 경우, 이는 천연, 또는 고유한 이중-가닥 절단 유도제에 의해 인지되는 인지 서열일 수 있다. 다른 예로, 내인성 인지 부위는, 내인성 인지 서열을 특이적으로 인지하도록 설계 또는 선별된 변형된 또는 조작된 이중-가닥 절단 유도제에 의해 인지 및/또는 결합되어, 이중-가닥 절단을 생성할 수 있다. 일부 실시 양태에서, 변형된 이중-가닥 절단 유도제는 고유의, 천연 이중-가닥 절단 유도제로부터 유래된다. 다른 실시 양태에서, 변형된 이중-가닥 절단 유도제는 인공적으로 만들어지거나 또는 합성된다. 이러한 변형된 또는 조작된 이중-가닥 절단 유도제를 선별하는 방법은 당해 기술분야에 알려져 있다. 예를 들어, 단백질(들)의 아미노산 서열 변이체는 DNA에서 돌연변이에 의해 제조될 수 있다. 돌연변이생성(mutagenesis) 및 뉴클레오타이드 서열 변경 방법으로는, 예를 들어, Kunkel, (1985) Proc Natl Acad Sci USA 82:488-92; Kunkel, et al., (1987) Meth Enzymol 154:367-82; 미국 특허 제4,873,192 호; Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York) 및 상기 문헌들에서 언급한 참조문헌들을 포함한다. 단백질의 생물학적 활성에 영향을 미치지 않을 아미노산 치환에 관한 지침은 예를 들어, Dayhoff, et al., (1978) Atlas of Protein Sequences and Structure (Natl Biomed Res Found, Washington, D.C.)의 모델에 나타나 있다. 보존적인 치환, 예컨대 하나의 아미노산을 유사한 특성을 가진 또 다른 아미노산으로 바꾸는 것이 바람직할 수 있다. 보존적 결실, 삽입, 및 아미노산 치환은 단백질의 특성에 급진적인 변화를 주지 않을 것으로 예상되며, 치환, 결실, 삽입, 또는 이들의 조합의 효과는 일상적인 스크리닝 분석법으로 평가할 수 있다. 이중-가닥 절단 유도 활성에 대한 분석법이 알려져 있으며, 이는 일반적으로 인지 부위를 포함하는 DNA 기질에 대한 상기 제제의 전반적인 활성 및 특이성을 측정한다.
본원에서 제공하는 방법의 일부 실시 양태에서, 1종 이상의 뉴클레아제는 엔도뉴클레아제이다. 엔도뉴클레아제는 폴리뉴클레오타이드 사슬 내 포스포다이에스테르 결합을 절단하는 효소로서, 염기에 손상을 주지 않으면서 특정 부위에서 DNA를 절단하는 제한효소 엔도뉴클레아제를 포함한다. 제한효소 엔도뉴클레아제로는 I형, II형, III형, 및 IV형 엔도뉴클레아제를 포함하며, 서브타입을 추가로 포함한다. 제한효소 엔도뉴클레아제는 예를 들어 REBASE 데이터베이스 (webpage at rebase.neb.com; Roberts, et al ., (2003) Nucleic Acids Res 31:418-20), Roberts, et al ., (2003) Nucleic Acids Res 31:1805-12, 및 Belfort, et al ., (2002) in Mobile DNA II, pp. 761-783, Eds. Craigie, et al ., ASM Press, Washington, D.C에서 추가로 기술 및 예시되어 있다.
본원에서, 엔도뉴클레아제는 또한, 제한효소 엔도뉴클레아제처럼 특정 인지 서열에 결합하여 절단하는 호밍 엔도뉴클레아제를 포함한다. 그러나, 호밍 엔도뉴클레아제에 대한 인지 부위는 전형적으로 더 길며, 예를 들어, 약 18 bp 이상이다. 메가뉴클레아제로도 알려져 있는 호밍 엔도뉴클레아제는 보존된 서열 모티프(motif)를 토대로 하기 패밀리로 분류된다 : LAGLIDADG (SEQ ID NO: 50) 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys box 호밍 엔도뉴클레아제, GIY-YIG (SEQ ID NO: 51) 호밍 엔도뉴클레아제, 및 시아노박테리아 호밍 엔도뉴클레아제. 예를 들어, Stoddard, Quarterly Review of Biophysics 38(1): 49-95 (2006)을 참조한다. 이들 패밀리는, 이들의 보존된 뉴클레아제 활성-부위 코어 모티프 및 촉매 메커니즘, 생물학적 및 게놈 구분, 및 비-호밍 뉴클레아제 시스템과의 보다 공범위한 관계에서 크게 상이하다. 예를 들어, Guhan and Muniyappa (2003) Crit Rev Biochem Mol Biol 38:199-248; Lucas, et al ., (2001) Nucleic Acids Res 29:960-9; Jurica and Stoddard, (1999) Cell Mol Life Sci 55:1304-26; Stoddard, (2006) Q Rev Biophys 38:49-95; 및 Moure, et al ., (2002) Nat Struct Biol 9:764를 참조한다. 이들 패밀리의 유용한 특정 호밍 엔도뉴클레아제의 예로는, I-CreI (Rochaix et al ., Nucleic Acids Res. 13: 975-984 (1985), I-MsoI (Lucas et al ., Nucleic Acids Res. 29: 960-969 (2001) 참조), I-SceI (Foury et al ., FEBS Lett . 440: 325-331 (1998) 참조), I-SceIV (Moran et al ., Nucleic Acids Res. 20: 4069-4076 (1992) 참조), H-DreI (Chevalier et al ., Mol . Cell 10: 895-905 (2002) 참조), I-HmuI (Goodrich-Blair et al ., Cell 63: 417-424 (1990); Goodrich-Blair et al ., Cell 84: 211-221 (1996) 참조), I-PpoI (Muscarella et al ., Mol . Cell. Biol . 10: 3386-3396 (1990) 참조), I-DirI (Johansen et al ., Cell 76: 725-734 (1994); Johansen, Nucleic Acids Res. 21: 4405 (1993) 참조), I-NjaI (Elde et al ., Eur . J. Biochem . 259: 281-288 (1999); De Jonckheere et al ., J. Eukaryot . Microbiol. 41: 457-463 (1994) 참조), I-NanI (Elde et al ., S. Eur . J. Biochem . 259: 281-288 (1999); De Jonckheere et al ., J. Eukaryot . Microbiol . 41: 457-463 (1994) 참조), I-NitI (De Jonckheere et al ., J. Eukaryot . Microbiol . 41: 457-463 (1994); Elde et al ., Eur . J. Biochem . 259: 281-288 (1999) 참조), I-TevI (Chu et al ., Cell 45: 157-166 (1986) 참조), I-TevII (Tomaschewski et al ., Nucleic Acids Res. 15: 3632-3633 (1987) 참조), I-TevIII (Eddy et al ., Genes Dev. 5: 1032-1041 (1991) 참조), F-TevI (Fujisawa et al ., Nucleic Acids Res. 13: 7473-7481 (1985) 참조), F-TevII (Kadyrov et al ., Dokl . Biochem . 339: 145-147 (1994); Kaliman, Nucleic Acids Res. 18: 4277 (1990) 참조), F-CphI (Zeng et al., Curr . Biol . 19: 218-222 (2009) 참조), PI-MgaI (Saves et al ., Nucleic Acids Res. 29:4310-4318 (2001) 참조), I-CsmI (Colleaux et al ., Mol . Gen . Genet. 223:288-296 (1990) 참조), I-CeuI (Turmel et al ., J . Mol . Biol . 218: 293-311 (1991) 참조), 및 PI-SceI (Hirata et al .,.J. Biol . Chem . 265: 6726-6733 (1990) 참조)를 포함하나, 이로 한정되지 않는다.
본원에서 제공되는 방법의 일부 실시 양태에서, 호밍 엔도뉴클레아제의 천연 변이체, 및/또는 변형된 유도체를 사용한다. 키네틱스, 보조인자 상호작용, 발현, 최적 조건, 및/또는 인지 부위 특이성, 및 활성 스크리닝을 변형하는 방법이 알려져 있다. 예를 들어, Epinat, et al ., (2003) Nucleic Acids Res 31:2952-62; Chevalier, et al ., (2002) Mol Cell 10:895-905; Gimble, et al ., (2003) Mol Biol 334:993-1008; Seligman, et al ., (2002) Nucleic Acids Res 30:3870-9; Sussman, et al ., (2004) J Mol Biol 342:31-41; Rosen, et al ., (2006) Nucleic Acids Res 34:4791-800; Chames, et al ., (2005) Nucleic Acids Res 33:e178; Smith, et al ., (2006) Nucleic Acids Res 34:e149; Gruen, et al ., (2002) Nucleic Acids Res 30:e29; Chen and Zhao, (2005) Nucleic Acids Res 33:e154; WO2005105989; WO2003078619; WO2006097854; WO2006097853; WO2006097784; 및 WO2004031346를 참조한다. 유용한 호밍 엔도뉴클레아제는 또한, WO04/067736; WO04/067753; WO06/097784; WO06/097853; WO06/097854; WO07/034262; WO07/049095; WO07/049156; WO07/057781; WO07/060495; WO08/152524; WO09/001159; WO09/095742; WO09/095793; WO10/001189; WO10/015899; 및 WO10/046786에 기술한 것들을 포함한다.
호밍 엔도뉴클레아제는 이중-가닥 절단 유도제로서 사용될 수 있으며, 이로는 H-DreI, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, Pi-PspI, F-SceI, F-SceII, F-SuvI, F-CphI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NclIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MgaI, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, 또는 PI-TliII, 또는 이의 변이체 또는 유도체를 포함하나, 이로 한정되지 않는다.
일부 실시 양태에서, 엔도뉴클레아제는 고유한 또는 내인성 인지 서열에 결합한다. 다른 실시 양태에서, 엔도뉴클레아제는, 비-고유한 또는 외인성 인지 서열에 결합하며 고유한 또는 내인성 인지 서열에는 결합하지 않는, 변형된 엔도뉴클레아제이다.
본원에서 제공하는 방법의 일부 실시 양태에서, 1종 이상의 뉴클레아제는 TAL-작동자 DNA 결합 도메인-뉴클레아제 융합 단백질 (TALEN)이다. 잔토모나스( Xanthomonas ) 속(genus)의 식물 병원성 박테리아의 TAL 작동자는 숙주 DNA에 결합하고 작동자-특정 숙주 유전자를 활성화함으로써, 질환에서 중요한 역할을 하거나 또는 방어를 유도한다. 예를 들어, Gu et al . (2005) Nature 435:1122-5; Yang et al ., (2006) Proc . Natl. Acad . Sci. USA 103:10503-8; Kay et al ., (2007) Science 318:648-51; Sugio et al ., (2007) Proc . Natl . Acad . Sci . USA 104:10720-5; Romer et al ., (2007) Science 318:645-8; Boch et al ., (2009) Science 326(5959):1509-12; 및 Moscou and Bogdanove, (2009) 326(5959):1501을 참조한다. TAL 작동자는, 1종 이상의 탠덤 반복 도메인(tandem repeat domain)을 통해 서열-특이적 방식으로 DNA와 상호작용하는 DNA 결합 도메인을 포함한다. 상기 반복된 서열은 전형적으로 34개 아미노산을 포함하며, 상기 반복체는 전형적으로 서로 91 내지 100% 상동성이다. 상기 반복체의 다형성은 통상 12번째 및 13번째 위치에 위치하며, 12번째 및 13번째 반복 가변성-2잔기(diresidue)의 동일성과, TAL-작동자의 표적 서열 내 인접(contiguous) 뉴클레오타이드의 동일성 간에 1:1 대응이 존재하는 것으로 보인다.
TAL-작동자 DNA 결합 도메인은 원하는 표적 서열에 결합하도록 변형되며, 예를 들어, II형 제한효소 엔도뉴클레아제의 뉴클레아제 도메인, 전형적으로 II형 제한효소 엔도뉴클레아제 예컨대 FokI의 비특정 절단 도메인에 융합될 수 있다 (예를 들어, Kim et al . (1996) Proc . Natl . Acad . Sci . USA 93:1156-1160 참조). 다른 유용한 엔도뉴클레아제로는, 예를 들어, HhaI, HindIII, Nod, BbvCI, EcoRI, BglI, 및AlwI을 포함할 수 있다. 따라서, 바람직한 실시 양태에서, TALEN은, TALEN이 특정 뉴클레오타이드 서열 내 또는 이에 인접한 표적 DNA를 절단하도록, 복수의 TAL 작동자 반복 서열을 포함하는, 즉, 표적 DNA 서열에 특정 뉴클레오타이드 서열을 결합시키는 TAL 작동자 도메인을 포함한다. 본원에서 제공하는 방법에 유용한 TALENS으로는 WO10/079430 및 미국 출원 공개 제2011/0145940 호에 기술된 것들을 포함한다.
일부 실시 양태에서, 표적 DNA 내 특정 뉴클레오타이드 서열에 결합하는 TAL 작동자 도메인은 10개 이상의 DNA 결합 반복체, 바람직하게는 15개 이상의 DNA 결합 반복체를 포함할 수 있다. 일부 실시 양태에서, 각각의 DNA 결합 반복체는 반복 가변성-2잔기(RVD)를 포함하며, 이는 표적 DNA 서열의 염기쌍의 인지을 결정하며, 상기 각각의 DNA 결합 반복체는 표적 DNA 서열의 하나의 염기쌍을 인지하는 데 관여하며, 상기 RVD는, C를 인지하는 HD; T를 인지하는 NG; A를 인지하는 NI; G 또는 A를 인지하는 NN; A 또는 C 또는 G 또는 T를 인지하는 NS; C 또는 T를 인지하는 N* (여기서, *는 RVD의 제2 위치에서의 갭을 나타냄); T를 인지하는 HG; T를 인지하는 H* (여기서, *는 RVD의 제2 위치에서의 갭을 나타냄); T를 인지하는 IG; G를 인지하는 NK; C를 인지하는 HA; C를 인지하는 ND; C를 인지하는 HI; G를 인지하는 HN; G를 인지하는 NA; G 또는 A를 인지하는 SN; 및 T를 인지하는 YG 중 1종 이상을 포함한다.
본원에서 제공하는 방법의 일부 실시 양태에서, 1종 이상의 뉴클레아제는 부위-특이적인 재조합효소이다. 재조합효소로도 지칭되는 부위-특이적인 재조합효소는, 융화성 재조합 부위 사이의 보존적 부위-특이적인 재조합을 촉매하며, 고유한 폴리펩타이드 뿐만 아니라, 활성을 유지하는 이의 유도체, 변이체 및/또는 절편, 및 재조합 효소를 코딩하는 고유한 폴리뉴클레오타이드, 활성을 유지하는 유도체, 변이체, 및/또는 절편을 포함하는 폴리펩타이드이다. 부위-특이적인 재조합효소 및 이들의 인지 부위에 관해서는, Sauer (1994) Curr Op Biotechnol 5:521-7; 및 Sadowski, (1993) FASEB 7:760-7을 참조한다. 일부 실시 양태에서, 재조합효소는 세린 재조합효소 또는 티로신 재조합효소이다. 일부 실시 양태에서, 재조합효소는 인테그라제(Integrase) 또는 레솔바제(Resolvase) 패밀리 유래이다. 일부 실시 양태에서, 재조합효소는 FLP, Cre, 람다 인테그라제, 및 R로 이루어진 군으로부터 선택되는 인테그라제이다. 인터그라제 패밀리의 다른 구성원들에 관해서는, 예를 들어, Esposito, et al ., (1997) Nucleic Acids Res 25:3605-14 및 Abremski, et al ., (1992) Protein Eng 5:87-91를 참조한다. 키네틱스, 보조인자 상호작용 및 요건, 발현, 최적 상태, 및/또는 인지 부위 특이성을 변형시키고, 재조합효소 및 변이체의 활성을 스크리닝하는 방법이 알려져 있으며, 예를 들어 Miller, et al ., (1980) Cell 20:721-9; Lange-Gustafson and Nash, (1984) J Biol Chem 259:12724-32; Christ, et al ., (1998) J Mol Biol 288:825-36; Lorbach, et al., (2000) J Mol Biol 296:1175-81; Vergunst, et al ., (2000) Science 290:979-82; Dorgai, et al ., (1995) J Mol Biol 252:178-88; Dorgai, et al ., (1998) J Mol Biol 277:1059-70; Yagu, et al ., (1995) J Mol Biol 252:163-7; Sclimente, et al ., (2001) Nucleic Acids Res 29:5044-51; Santoro and Schultze, (2002) Proc Natl Acad Sci USA 99:4185-90; Buchholz and Stewart, (2001) Nat Biotechnol 19:1047-52; Voziyanov, et al ., (2002) Nucleic Acids Res 30:1656-63; Voziyanov, et al., (2003) J Mol Biol 326:65-76; Klippel, et al ., (1988) EMBO J 7:3983-9; Arnold, et al ., (1999) EMBO J 18:1407-14; WO03/08045; WO99/25840; 및 WO99/25841을 참조한다. 인지 부위의 범위는 약 30개 뉴클레오타이드의 최소 부위부터 수백개 뉴클레오타이드에 이른다. 자연적인 부위 및 변이체를 비롯하여, 재조합효소에 대한 인지 부위를 사용할 수 있다. 변이체 인지 부위가 알려져 있으며, 예를 들어 Hoess, et al ., (1986) Nucleic Acids Res 14:2287-300; Albert, et al ., (1995) Plant J 7:649-59; Thomson, et al ., (2003) Genesis 36:162-7; Huang, et al ., (1991) Nucleic Acids Res 19:443-8; Siebler and Bode, (1997) Biochemistry 36:1740-7; Schlake and Bode, (1994) Biochemistry 33:12746-51; Thygarajan, et al ., (2001) Mol Cell Biol 21:3926-34; Umlauf and Cox, (1988) EMBO J 7:1845-52; Lee and Saito, (1998) Gene 216:55-65; WO01/23545; WO99/25821; WO99/25851; WO01/11058; WO01/07572 및 미국 특허 제5,888,732를 참조한다.
본원에서 제공하는 방법의 일부 실시 양태에서, 1종 이상의 뉴클레아제는 트랜스포자제이다. 트랜스포자제는, 게놈의 한 위치에서 또 다른 위치로 트랜스포존(transposon)이 전위되는 것을 매개하는 폴리펩타이드이다. 트랜스포자제는 전형적으로, 트랜스포존을 절제하기 위해 이중 가닥 절단을 유도하며, 서브말단 반복체를 인지하고, 절제된 트랜스포존의 말단들을 함께 연결하며, 일부 시스템에서는 전위 동안에 상기 말단들을 함께 연결하기 위한 다른 단백질들이 필요하다. 트랜스포존 및 트랜스포자제의 예로는, 옥수수 유래의 Ac/Ds, Dt/rdt, Mu-M1/Mn, 및 Spm(En)/dSpm 구성원, 금어초(snapdragon) 유래의 Tam 구성원, 박테리오파지 유래의 Mu 트랜스포존, 박테리아 트랜스포존(Tn) 및 삽입 서열(IS), 효모의 Ty 구성원 (레트로트랜스포존), 아라비돕시스(Arabidopsis) 유래의 Ta1 구성원 (레트로트랜스포존), 드로소필라(Drosophila) 유래의 P 구성원 트랜스포존 (Gloor, et al ., (1991) Science 253:1110-1117), 드로소필라 유래의 Copia, Mariner 및 Minos 구성원, 집파리 유래의 Hermes 구성원, 트리크플루시아 니( Trichplusia ni ) 유래의 PiggyBack 구성원, 씨. 엘레강스 (C. elegans ) 유래의 Tc1 구성원, 및 마우스 유래의 IAP 구성원 (레트로트랜스포존)을 포함하나, 이로 한정되지 않는다.
본원에서 제공하는 방법의 일부 실시 양태에서, 1종 이상의 뉴클레아제는 징크-핑거 뉴클레아제 (ZFN)이다. ZFN은 징크 핑거 DNA 결합 도메인 및 이중 가닥 절단 유도제 도메인으로 이루어진 변형된 이중-가닥 절단 유도제이다. 변형된 ZFN은 2개의 징크 핑거 어레이 (ZFA)로 이루어지며, 이들의 각각은 비-특정 엔도뉴클레아제의 단일 서브유닛, 예컨대 FokI 효소 유래의 뉴클레아제 도메인에 융합되며, 이량체화 시 활성화된다. 전형적으로, 단일 ZFA는 3 또는 4개의 징크 핑거 도메인으로 이루어지며, 이의 각각은 특정 뉴클레오타이드 3중체 (GGC, GAT, 등)를 인지하도록 설계된다. 따라서, "3-핑거" ZFA 2개로 이루어진 ZFN은 18개 염기쌍 표적 부위를 인지할 수 있으며; 18개 염기쌍 인지 서열은 일반적으로, 인간 및 식물과 같은 거대 게놈 내에서도 독특하다. 2개의 FokI 뉴클레아제 단량체의 공동-위치화 및 이량체화를 지시함으로써, ZFN은, 표적화된 유전자 좌에서 DNA에 이중-가닥 절단 (DSB)을 형성하는 기능성 부위-특이적인 엔도뉴클레아제를 생성한다.
유용한 징크-핑거 뉴클레아제로는, 공지된 것들과, 본원에서 기술한 1종 이상의 표적 부위 (TS)에 대한 특이성을 가지도록 변형되는 것들을 포함한다. 징크 핑거 도메인은, 예를 들어, 숙주 세포 게놈의 표적 부위 내 선별된 폴리뉴클레오타이드 인지 서열에 특이적으로 결합하는 폴리펩타이드를 설계하는 데 순응성이다(amenable). ZFN은, 비-특정 엔도뉴클레아제 도메인, 예를 들어 HO 또는 FokI와 같은 II형 엔도뉴클레아제 유래의 뉴클레아제 도메인에 연결된 변형된 DNA-결합 징크 핑거 도메인으로 이루어진다. 다른 예로, 변형된 징크 핑거 DNA 결합 도메인은 DNA 니킹(nicking)/절단 활성을 유지하는, 다른 이중-가닥 절단 유도제 또는 이들의 유도체이다. 예를 들어, 이러한 유형의 융합을 이용해, 서로 다른 표적 부위로 이중-가닥 절단 유도제를 위치시키거나, 닉 또는 절단 부위의 위치를 변경하거나, 더 짧은 표적 부위로 유도제를 위치시키거나, 또는 더 긴 표적 부위로 유도제를 위치시킬 수 있다. 일부 실시예에서, 징크 핑거 DNA 결합 도메인은 부위-특이적인 재조합효소, 트랜스포자제, 또는 니킹/절단 활성을 유지하는 이들의 유도체에 융합된다. 부가적인 기능기가 전사 활성자 도메인, 전사 억제자 도메인, 및 메틸라제를 비롯한 징크-핑거 결합 도메인에 융합될 수 있다. 일부 실시 양태에서, 뉴클레아제 도메인의 이량체화가 절단 활성에 필요하다.
각각의 징크 핑거는 표적 DNA 내 3개의 구성적인 염기쌍을 인지한다. 예를 들어, 3개 핑거 도메인은 9개의 인접 뉴클레오타이드의 서열을 인지하였으며, 뉴클레아제의 이량체화 요건과 함께, 징크 핑거 3중체의 2개 세트를 사용해 18개의 뉴클레오타이드 인지 서열에 결합한다. 유용한 설계자 징크 핑거 모듈로는, 다양한 GNN 및 ANN 3중체를 인지하는 것들 (Dreier, et al ., (2001) J Biol Chem 276:29466-78; Dreier, et al ., (2000) J Mol Biol 303:489-502; Liu, et al., (2002) J Biol Chem 277:3850-6), 뿐만 아니라 다양한 CNN 또는 TNN 3중체를 인지하는 것들 (Dreier, et al ., (2005) J Biol Chem 280:35588-97; Jamieson, et al., (2003) Nature Rev Drug Discov 2:361-8)을 포함한다. 또한, Durai, et al ., (2005) Nucleic Acids Res 33:5978-90; Segal, (2002) Methods 26:76-83; Porteus and Carroll, (2005) Nat Biotechnol 23:967-73; Pabo, et al ., (2001) Ann Rev Biochem 70:313-40; Wolfe, et al ., (2000) Ann Rev Biophys Biomol Struct 29:183-212; Segal and Barbas, (2001) Curr Opin Biotechnol 12:632-7; Segal, et al ., (2003) Biochemistry 42:2137-48; Beerli and Barbas, (2002) Nat Biotechnol 20:135-41; Carroll, et al ., (2006) Nature Protocols 1:1329; Ordiz, et al ., (2002) Proc Natl Acad Sci USA 99:13290-5; Guan, et al ., (2002) Proc Natl Acad Sci USA 99:13296-301; WO2002099084; WO00/42219; WO02/42459; WO2003062455; US20030059767; 미국 특허 출원 공개 제2003/0108880 호; 미국 특허 제6,140,466 호, 제6,511,808 호 및 제6,453,242 호를 참조한다. 유용한 징크-핑거 뉴클레아제는 또한, WO03/080809; WO05/014791; WO05/084190; WO08/021207; WO09/042186; WO09/054985; 및 WO10/065123에 기술된 것들을 포함한다.
6.5 게놈 표적 부위
본원에서 제공하는 방법에서, 뉴클레아제는, 게놈 표적 부위 근처 또는 그 내에 이중-가닥 절단을 유도할 수 있는 숙주 세포로 도입되며, 상기 절단 부위에서 또는 그 근처에서 상동성 재조합의 빈도를 크게 증가시킨다. 바람직한 실시 양태에서, 뉴클레아제에 대한 인지 서열은 숙주 세포 게놈 내 표적 부위에만 존재하여, 상기 뉴클레아제에 의한 표적-외 게놈 결합 및 절단을 최소화한다.
일부 실시 양태에서, 게놈 표적 부위는 숙주 세포에 대해 내인성으로,예컨대 고유한 유전자 좌이다. 일부 실시 양태에서, 고유한 게놈 표적 부위는 본원에서 제공하는 삽입 방법에 이용되는 뉴클레아제의 유형에 따라 선택된다. 이용되는 뉴클레아제가 징크 핑거 뉴클레아제인 경우, 최적의 표적 부위는 공개적으로 이용가능한 온라인 리소스를 이용해 선택될 수 있다. 예를 들어, 원용에 의해 본원에 포함된 Reyon et al ., BMC Genomes 12:83 (2011)을 참조한다. 예를 들어, 올리고머화된 풀 조작 (Oligomerized Pool Engineering, OPEN)은 징크 핑거 어레이를 고 특이성 및 생체내 기능성으로 조작하기 위한 매우 확실(robust)하며 공개적으로 이용가능한 프로토콜로서, 식물, 제브라피쉬, 및 인간의 체세포 및 만능줄기세포에서 효율적으로 기능하는 ZFN을 생성하는 데 성공적으로 이용되어 왔다. OPEN은, 후보 ZFA의 예비-구축된 랜덤화된 풀을 스크리닝하여 원하는 표적 서열에 대해 고 친화성 및 특이성을 가진 것들을 동정하는, 선별-기재 방법이다. ZFNGenome은 OPEN-생성된 ZFN에 대한 잠재적인 표적 부위를 동정 및 시각화하기 위한, GBrowse-기재의 툴이다. ZFNGenome은 모델 유기체의 서열화되고 아노테이트화(annotation)된 게놈에서 잠재적인 ZFN 표적 부위의 개요(compendium)를 제공한다. ZFNGenome은 현재 총 1억 1600만개 초과의 잠재적인 ZFN 표적 부위를 포함하며, 7가지의 모델 유기체인 S. 세레비지애(S. cerevisiae ), 씨. 레인하르드티이 (C. reinhardtii ), 에이. 탈리아나 (A. thaliana ), 디. 멜라노가스터 (D. melanogaster ), 디. 레리오 (D. rerio ), 씨. 엘레 강스(C. elegans ), 에이치. 사피엔스(H. sapiens )의 완전히 서열화된 게놈 내에서 지도화된다. 부가적인 모델 유기체로는 3가지 식물 종인 글리시네 막스( Glycine max ) (대두), 오리자 사티바 ( Oryza sativa ) (쌀), 제아 마이스( Zea mays) (옥수수)를 포함하며, 3가지 동물 종인 트리볼리움 카스타네움( Tribolium castaneum) (붉은밀가루갑충(red flour beetle)), 무스 무스쿨루스 ( Mus musculus ) (마우스), 라투스 노르베기쿠스 ( Rattus norvegicus ) (갈색 래트)가 머지않아 추가될 것이다. ZFNGenome은 전사 개시 부위(들)에 관한 이의 염색체의 자리 및 위치를 비롯하여 각각의 잠재적인 ZFN 표적 부위에 대한 정보를 제공한다. 사용자들은 몇몇 서로 다른 범주를 이용해 ZFNGenome에 조회할 수 있다 (예를 들어, 유전자 ID, 전사체 ID, 표적 부위 서열).
이용되는 뉴클레아제가 TAL-작동자 뉴클레아제인 경우, 일부 실시 양태에서, 최적의 표적 부위는 Sanjana et al ., Nature Protocols , 7:171-192 (2012) (원용에 의해 본원에 포함됨)에 기술된 방법에 따라 선별할 수 있다. 간략하게는, TALEN은 이량체로서 기능하며, 좌측 및 우측 TALEN이라고도 지칭하는 한 쌍의 TALEN은 DNA의 반대 가닥들의 서열을 표적으로 한다. TALEN은 TALE DNA-결합 도메인 및 단량체성 FokI 촉매성 도메인의 융합으로서 변형된다. FokI 이량체화를 촉진하기 위해, 좌측 및 우측 TALEN 표적 부위는 대략 14-20 염기로 간격을 두어 선택된다. 따라서, 각각이 20-bp 서열을 표적화하는 한 쌍의 TALEN의 경우, 최적의 표적 부위는 5'-TN19N14-20N19A-3'를 형성하며, 여기서, 좌측 TALEN은 5'-TN19-3'를 표적화하며, 우측 TALEN은 5'-N19A-3' (N = A, G, T 또는 C)의 안티센스 가닥을 표적화한다.
본원에서 제공하는 방법의 다른 실시 양태에서, 게놈 표적 부위는 숙주 세포에 대해 외인성이다. 예를 들어, 1종 이상의 게놈 표적 부위는, 본원에서 기술한 삽입 방법을 수행하기 전에, 전형적인 방법, 예를 들어 유전자 표적화를 이용해 숙주 세포 게놈으로 변형될 수 있다. 일부 실시 양태에서, 동일 표적 서열의 다중 카피를 서로 다른 유전자 좌에서 숙주 세포 게놈으로 변형시켜, 표적 서열을 특이적으로 인지하는 단일 뉴클레아제만을 이용하는 동시 다중 삽입 현상을 촉진한다. 다른 실시 양태에서, 복수의 서로 다른 표적 서열은 서로 다른 유전자 좌에서 숙주 세포 게놈으로 변형된다. 일부 실시 양태에서, 변형된 표적 부위는, 숙주 세포의 고유한 게놈에서는 나타나지 않는 표적 서열을 포함한다. 예를 들어, 호밍 엔도뉴클레아제는 통상 인트론 또는 인테인(intein)에 파묻혀 있는 거대 인지 부위 (12-40 bp)를 표적으로 하며, 이와 같이, 이들의 인지 부위는 극히 드물며, 이들 부위 중 어느 것도 또는 소수만이 포유류-크기의 게놈에 존재한다. 따라서, 일부 실시 양태에서, 외인성 게놈 표적 부위는 호밍 엔도뉴클레아제에 대한 인지 서열이다. 일부 실시 양태에서, 호밍 뉴클레아제는, H-DreI, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, Pi-PspI, F-SceI, F-SceII, F-SuvI, F-CphI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NclIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MgaI, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, 또는 PI-TliII, 또는 이들의 임의의 변이체 또는 유도체로 이루어진 군으로부터 선택된다. 특정 실시 양태에서, 상기 외인성 게놈 표적 부위는 I-SceI, VDE (PI-SceI), F-CphI, PI-MgaI 또는 PI-MtuII에 대한 인지 서열이며, 이들은 각각 하기에 제공된다.
Figure 112013108556036-pct00001
전달
일부 실시 양태에서, 본원에서 제공되는 방법에 유용한 1종 이상의 뉴클레아제는, 정제된 단백질로서 숙주 세포로 제공, 예를 들어 전달될 수 있다. 다른 실시 양태에서, 상기 1종 이상의 뉴클레아제는 뉴클레아제를 코딩하는 핵산을 포함하는 폴리뉴클레오타이드(들)를 통해 제공된다. 다른 실시 양태에서, 상기 1종 이상의 뉴클레아제는, 숙주 세포의 핵에서 직접 번역될 수 있는 정제된 RNA로서 숙주 세포로 도입된다.
소정의 실시 양태에서, 삽입 폴리뉴클레오타이드, 뉴클레아제를 코딩하는 폴리뉴클레오타이드, 또는 전술한 바와 같은 정제된 뉴클레아제 단백질, 또는 이들의 조합을 통상의 기법을 이용해 숙주 세포 내로 도입하여, 당해 기술분야에 공지된 세포 내로 외인성 단백질 및/또는 핵산을 도입할 수 있다. 이러한 방법으로는, 용액으로부터 세포에 의해 분자를 직접 취하는 것, 또는 예를 들어, 리포좀 또는 면역리포좀을 사용하는 리포펙틴(lipofection); 입자-매개성 형질감염 등을 통한 촉진화된 취득(facilitated uptake)을 포함하나, 이로 한정되지 않는다. 예를 들어, 미국 특허 제5,272,065 호; Goeddel et al ., eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al ., 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; and Ausubel et al ., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참조한다. 세포를 형질전환시키는 특정 방법들은 당해 기술분야에 잘 알려져 있다. Hinnen et al ., Proc . Natl . Acad . Sci. USA 75:1292-3 (1978); Cregg et al., Mol . Cell . Biol. 5:3376-3385 (1985)를 참조한다. 예시적인 기법으로는, 스페로플라스팅(spheroplasting), 전기천공, PEG 1000 매개성 형질전환, 및 리튬 아세테이트 또는 리튬 클로라이드 매개성 형질전환을 포함하나, 이로 한정되지 않는다.
일부 실시 양태에서, 바이오리스틱스(biolistics)를 이용해, 삽입 폴리뉴클레오타이드, 뉴클레아제를 코딩하는 폴리뉴클레오타이드, 정제된 뉴클레아제 단백질, 또는 이들의 조합을 숙주 세포, 특히 식물과 같이 통상적인 기술을 이용해 형질전환/형질감염되기 어려운 숙주 세포로 도입한다. 바이오리스틱스는, 형질전환 반응물을 현미경적 금 입자(microscopic gold particle)에 결합시킨 다음, 상기 입자들을 표적 세포에서 압축 가스를 이용해 추진함으로써, 작동한다.
일부 실시 양태에서, 뉴클레아제를 코딩하는 핵산을 포함하는 폴리뉴클레오타이드는 숙주 세포에서 뉴클레아제가 발현될 수 있게 하는 발현 벡터이다. 적절한 발현 벡터로는, 에스케리키아 콜라이( Escherichia coli ), 효모, 또는 포유류 세포에서 유전자를 발현하는 데 사용되는 것으로 알려진 것들을 포함하나, 이로 한정되지 않는다. 에스케리키아 콜라이 발현 벡터의 예로는, pSCM525, pDIC73, pSCM351, 및 pSCM353을 포함하나, 이로 한정되지 않는다. 효모 발현 벡터의 예로는, pPEX7 및 pPEX408을 포함하나, 이로 한정되지 않는다. 적절한 발현 벡터의 다른 예로는, CEN.ARS 서열 및 효모 선별 마커를 포함하는 효모-에스케리키아 콜라이 pRS 시리즈의 셔틀 벡터; 및 2μ 플라스미드를 포함한다. 일부 실시 양태에서, 뉴클레아제를 코딩하는 폴리뉴클레오타이드는, 자연적인 폴리뉴클레오타이드 서열에 비해 숙주 세포에서의 사용 빈도가 더 높은 코돈을 치환하도록 변형될 수 있다. 예를 들어, 뉴클레아제를 코딩하는 폴리뉴클레오타이드는, 자연적인 폴리뉴클레오타이드 서열에 비해, 에스 . 세레비지애에서 사용 빈도가 더 높은 코돈을 치환하도록 변형될 수 있다 .
뉴클레아제가 각각의 단량체의 개별 발현을 필요로 하는 헤테로이량체로서 기능하는 일부 실시 양태에서, 징크 핑거 뉴클레아제 및 TAL-작동자 뉴클레아제의 경우에서와 같이, 상기 헤테로이량체의 각각의 단량체는 동일한 발현 플라스미드, 또는 상이한 플라스미드로부터 발현될 수 있다. 다중 뉴클레아제가 서로 다른 표적 부위에서 이중-가닥 절단을 할 수 있도록 세포에 도입되는 실시 양태에서, 상기 뉴클레아제는 단일 플라스미드 또는 개별 플라스미드에서 코딩될 수 있다.
소정의 실시 양태에서, 뉴클레아제 발현 벡터는, 상기 발현 벡터를 포함하는 숙주 세포를 선별할 수 있게 하는 선별 마커를 추가로 포함한다. 이러한 선별은, 뉴클레아제가 충분한 양으로 발현하는 데 필요한 기간 동안, 예를 들어, 12, 24, 36, 48, 60, 72, 84, 96시간, 또는 96시간 이상 동안, 숙주 세포에서 벡터가 유지되는 것을 도울 수 있으며, 이후 상기 숙주 세포는 발현 벡터가 더 이상 유지되지 않는 조건 하에 배양될 수 있다. 소정의 실시 양태에서, 상기 선별 마커는, URA3, 하이그로마이신 B 포스포트랜스퍼라제, 아미노글라이코시드 포스포트랜스퍼라제, 제오신 내성, 및 포스피노트리신 N-아세틸트랜스퍼라제로 이루어진 군으로부터 선택된다. 일부 실시 양태에서, 뉴클레아제 발현 벡터는, 1종 이상의 공여체 핵산 분자의 삽입에 이어, 발현 벡터를 함유하지 않는 숙주 세포를 선별할 수 있게 하는 카운터-선별 마커를 포함할 수 있다. 사용되는 뉴클레아제 발현 벡터는 또한, 선별 마커를 가지지 않는 일시적인 벡터일 수 있으며, 또는 선별되지 않는 벡터이다. 특정 실시 양태에서, 일시적인 뉴클레아제 발현 벡터를 포함하는 숙주 세포의 자손은 시간이 지나면서 상기 벡터를 상실한다.
소정의 실시 양태에서, 발현 벡터는 전사 종결 서열, 및 뉴클레아제를 코딩하는 뉴클레오타이드 서열에 조작적으로 연결된 프로모터를 추가로 포함한다. 일부 실시 양태에서, 상기 프로모터는 구성적 프로모터이다. 일부 실시 양태에서, 상기 프로모터는 유도성 프로모터이다. 효모 세포에서 사용하기에 적절한 프로모터의 예시적인 예로는, 케이 . 락티스(K. lactis)의 TEF1 유전자의 프로모터, 사카로마이세스 세레비지애의 PGK1 유전자의 프로모터, 사카로마이세스 세레비지애의 TDH3 유전자의 프로모터, 억제성 프로모터, 예를 들어, 사카로마이세스 세레비지애의 CTR3 유전자의 프로모터, 및 유도성 프로모터, 예를 들어, 사카로마이세스 세레비지애의 갈락토스 유도성 프로모터 (예를 들어, GAL1, GAL7, 및 GAL10 유전자의 프로모터)를 포함하나, 이로 한정되지 않는다.
일부 실시 양태에서, 핵 위치화 서열 (NLS)을 포함하는 부가적인 뉴클레오타이드 서열은 뉴클레아제를 코딩하는 뉴클레오타이드 서열의 5'에 연결된다. NLS는 보다 큰 뉴클레아제 (>25 kD)의 핵 위치화를 촉진할 수 있다. 일부 실시 양태에서, 핵 위치화 서열는 SV40 핵 위치화 서열이다. 일부 실시 양태에서, 핵 위치화 서열은 효모 핵 위치화 서열이다.
뉴클레아제 발현 벡터는 당해 기술분야의 당업자가 알고 있는 기술을 이용해 제조할 수 있다. 소정의 실시 양태에서, 상기 벡터는 당해 기술분야에 잘 알려진 중합효소 연쇄반응 (PCR) 및 분자 클로닝 기술을 이용해 제조된다. 예를 들어, PCR Technology: Principles and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); Sambrook et al ., 2001, Molecular Cloning : A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY를 참조한다.
6.7 숙주 세포
다른 측면에서, 본원은, 본원에서 기술한 1종 이상의 외인성 핵산을 게놈에 삽입하는 방법에 의해 생성되는 변형된 숙주 세포를 제공한다. 적절한 숙주 세포는, 대상 핵산 또는 "공여체의 DNA"를 염색체 또는 에피좀 유전자 좌로 삽입하는 것이 바람직한 임의의 세포를 포함한다. 일부 실시 양태에서, 상기 세포는 상동성 재조합을 수행하는 능력을 가진 유기체의 세포이다. 예시적인 실시 양의 몇몇이 효모 (에스 . 세레비지애)에서 언급되어 있지만, 본원에서 제공되는 게놈 변형 방법은, 재조합 시스템이 효모에서만큼 효율적이지 않은 경우라도, 기능성 재조합 시스템을 가진 모든 생물학적 유기체에서 수행될 수 있다. 기능성 상동성 재조합 시스템을 가진 다른 세포 또는 세포 유형은, 바실러스 서브틸리스 ( Bacillus subtilis )이.콜라이(E. coli )와 같은 박테리아 (RecE RecT 재조합 효율성임; Muyrers et al., EMBO rep. 1: 239-243, 2000); 원생동물 (예를 들어, 플라스모디 움( Plasmodium ), 톡소플라즈마 ( Toxoplasma )); 기타 효모 (예를 들어, 스키조사카로마이세스 폼베 ( Schizosaccharomyces pombe)); 사상균 (예를 들어, 아시브야 고씨피 (Ashbya gossypii )); 필로스코미트렐라 파텐스( Physcomitrella patens ) 이끼와 같은 식물 (Schaefer and Zryd, Plant J. 11: 1195-1206, 1997); 및 포유류 세포 및 치킨 DT40 세포와 같은 동물 세포 (Dieken et al., Nat . Genet. 12:174-182, 1996)를 포함한다.
일부 실시 양태에서, 숙주 세포는 원핵 세포이다. 일부 실시 양태에서, 숙주 세포는 진핵 세포이다. 일부 실시 양태에서, 상기 세포는 진균 세포 (예를 들어, 효모 세포), 박테리아 세포, 식물 세포, 또는 동물 세포 (예를 들어, 치킨 세포)이다. 일부 실시 양태에서, 숙주 세포는 포유류 세포이다. 일부 실시 양태에서, 숙주 세포는 차이니즈 햄스터 난소 (CHO) 세포, COS-7 세포, 마우스 섬유아세포, 마우스 배아 암세포, 또는 마우스 배아 줄기세포이다. 일부 실시 양태에서, 숙주 세포는 곤충 세포이다. 일부 실시 양태에서, 숙주 세포는 S2 세포, Schneider 세포, S12 세포, 5B1-4 세포, Tn5 세포, 또는 Sf9 세포이다. 일부 실시 양태에서, 숙주 세포는 단세포성 진핵 유기체 세포이다.
특정 실시 양태에서, 숙주 세포는 효모 세포이다. 유용한 효모 숙주 세포는 미생물 수탁기관 (예를 들어, IFO, ATCC, etc.)에 기탁된 효모 세포를 포함하며, 특히, 아키쿨로코니디움( Aciculoconidium ), 암브로시오지마 ( Ambrosiozyma ), 아르트로아스쿠스( Arthroascus ), 아륵시오지마 ( Arxiozyma ), 아시브야 ( Ashbya ), 바베비아( Babjevia ), 벤싱토니아 ( Bensingtonia ), 보트리오아스쿠스 ( Botryoascus ), 보트리오지마( Botryozyma ), 브레타노마이세스 ( Brettanomyces ), 불레라 ( Bullera ), 불레라마이세스( Bulleromyces ), 칸디다( Candida ), 시테로마이세스 ( Citeromyces ), 클라비 스포라( Clavispora ), 크립토코커스 ( Cryptococcus ), 키스토필로바시디움( Cystofilobasidium ), 데바리오마이세스 ( Debaryomyces ), 데카라 ( Dekkara ), 디포다스콥시스( Dipodascopsis ), 디포다스쿠스 ( Dipodascus ), 에에니엘라 ( Eeniella ), 엔도마이콥셀라( Endomycopsella ), 에레마스쿠스 ( Eremascus ), 에레모테시움( Eremothecium ), 에리트로바시디움 ( Erythrobasidium ), 펠로마이세스( Fellomyces ), 필로바시디움 ( Filobasidium ), 갈락토마이세스 ( Galactomyces ), 게오트리쿰( Geotrichum ), 구일리에르몬델라 ( Guilliermondella ), 한세니이스포라( Hanseniaspora ), 한세눌라 ( Hansenula ), 하세가와에아 ( Hasegawaea ), 홀테르만니아( Holtermannia ), 호르모아스쿠스 ( Hormoascus ), 하이포피키아 ( Hyphopichia ), 이싸트켄키아( Issatchenkia ), 클로에케라 ( Kloeckera ), 클로에케라스포라( Kloeckeraspora ), 클루이베로마이세스 ( Kluyveromyces ), 콘도아 ( Kondoa ), 쿠라이시아( Kuraishia ), 쿠르츠마노마이세스 ( Kurtzmanomyces ), 레우코스포리디움( Leucosporidium ), 리포마이세스 ( Lipomyces ), 로데로마이세스 ( Lodderomyces ), 말라세지아( Malassezia ), 메트쉬니코위아 ( Metschnikowia ), 므라키아 ( Mrakia ), 마이속지아( Myxozyma ), 나드소니아 ( Nadsonia ), 나카자와에아 ( Nakazawaea ), 네마토스포라( Nematospora ), 오가테아 ( Ogataea ), 오오스포리디움 ( Oosporidium ), 파키솔렌( Pachysolen ), 파키티코스포라 ( Phachytichospora ), 파피아 ( Phaffia ), 피키아( Pichia ), 로도스포리디움 ( Rhodosporidium ), 로도토룰라 ( Rhodotorula ), 사카로마이세스( Saccharomyces ), 사카로마이코데스 ( Saccharomycodes ), 사카로마이콥시스( Saccharomycopsis ), 사이토엘라 ( Saitoella ), 사카구키아 ( Sakaguchia ), 사투르노스포라( Saturnospora ), 스키조블라스토스포리온 ( Schizoblastosporion ), 쉬조사카로마이세스( Schizosaccharomyces ), 쉬반니오마이세스 ( Schwanniomyces ), 스포리디오볼루스( Sporidiobolus ), 스포로볼로마이세스 ( Sporobolomyces ), 스포로파키데르미아( Sporopachydermia ), 스테파노아스쿠스 ( Stephanoascus ), 스테리그마토마이세스( Sterigmatomyces ), 스테리그마토스포리디움 ( Sterigmatosporidium ), 심보비오타프리나( Symbiotaphrina ), 심포디오마이세스 ( Sympodiomyces ), 심포디오마이콥시스( Sympodiomycopsis ), 토룰라스포라 ( Torulaspora ), 트리코스포리엘라( Trichosporiella ), 트리코스포론 ( Trichosporon ), 트리고놉시스 ( Trigonopsis ), 츠키야에아( Tsuchiyaea ), 우데니오마이세스 ( Udeniomyces ), 왈토마이세스( Waltomyces ), 위케르하미아 ( Wickerhamia ), 위케르하미엘라 ( Wickerhamiella ), 윌리옵시스( Williopsis ), 야마다지마 ( Yamadazyma ), 야로위아 ( Yarrowia ), 자이고아스쿠스( Zygoascus ), 자이고사카로마이세스 ( Zygosaccharomyces ), 자이고윌리옵시스(Zygowilliopsis ), 및 자이고자이마 ( Zygozyma ) 속에 속한다.
일부 실시 양태에서, 효모 숙주 세포는 사카로마이세스 세레비지애 세포, 피키아 파스토리스 ( Pichia pastoris ) 세포, 스키조사카로마이세스 폼베( Schizosaccharomyces pombe ) 세포, 데케라 브룩셀렌시스 ( Dekkera bruxellensis ) 세포, 클루이베로마이세스 락티스 ( Kluyveromyces lactis ) 세포, 아륵술라 아데니니 보란스( Arxula adeninivorans ) 세포, 또는 한세눌라 폴리모파( Hansenula polymorpha (현재 피키아 안구스타(Pichia angusta)로 알려져 있음) 세포이다. 특정 실시 양태에서, 효모 숙주 세포는 사카로마이세스 세레비지애 세포이다. 일부 실시 양태에서, 효모 숙주 세포는 사카로마이세스 프라길리스( Saccharomyces fragilis) 세포 또는 클루이베로마이세스 락티스 (과거 사카로마이세스 락티스( Saccharomyces lactis)로 불렸음) 세포이다. 일부 실시 양태에서, 효모 숙주 세포는 칸디다 속에 속하는 세포, 예컨대 칸디다 리폴리티카( Candida lipolytica ), 칸디다 구일리에르몬디이 ( Candida guilliermondii ), 칸디다 크루세이( Candida krusei), 칸디다 슈도트로피칼리스 ( andida pseudotropicalis ), 또는 칸디다 유틸리 스( Candida utilis)이다. 다른 특정 실시 양태에서, 효모 숙주 세포는 클루이베로마이세스 마륵시아누스 ( Kluveromyces marxianus ) 세포이다.
특정 실시 양태에서, 효모 숙주 세포는, 빵 효모 세포, CBS 7959 세포, CBS 7960 세포, CBS 7961 세포, CBS 7962 세포, CBS 7963 세포, CBS 7964 세포, IZ-1904 세포, TA 세포, BG-1 세포, CR-1 세포, SA-1 세포, M-26 세포, Y-904 세포, PE-2 세포, PE-5 세포, VR-1 세포, BR-1 세포, BR-2 세포, ME-2 세포, VR-2 세포, MA-3 세포, MA-4 세포, CAT-1 세포, CB-1 세포, NR-1 세포, BT-1 세포, 및 AL-1 세포로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 세포이다. 일부 실시 양태에서, 숙주 세포는 PE-2 세포, CAT-1 세포, VR-1 세포, BG-1 세포, CR-1 세포, 및 SA-1 로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 세포이다. 특정 실시 양태에서, 상기 사카로마이세스 세레비지애 숙주 세포는 PE-2 세포이다. 다른 특정 실시 양태에서, 상기 사카로마이세스 세레비지애 숙주 세포는 CAT-1 세포이다. 다른 특정 실시 양태에서, 상기 사카로마이세스 세레비지애 숙주 세포는 BG-1 세포이다.
일부 실시 양태에서, 효모 숙주 세포는 바이오에탄올 발효와 같은 산업적 발효에 적절한 세포이다. 특정 실시 양태에서, 상기 세포는 고 용매 농도, 고온, 확장된 기질 용도, 영양 제한, 삼투성 스트레스 요인(osmotic stress due), 산성, 설파이트 및 박테리아 오염, 또는 이들의 조합 (이들은 산업적 발효 환경의 스트레스 조건인 것으로 인지됨) 하에 생존하도록 조건화된다.
6.8 키트
다른 측면에서, 본원에서 기술한 1종 이상의 외인성 핵산을 게놈에 삽입하는 방법을 수행하는 데 유용한 키트를 제공한다. 일부 실시 양태에서, 상기 키트는,
(a) 복수의 외인성 핵산으로서, 상기 각각의 외인성 핵산 (ES)x이,
(i) 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x (여기서, 상기 (HR1)x 및 (HR2)x는 숙주 세포 게놈의 선별된 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있음); 및
(ii) (HR1)x의 3' 및 (HR2)x의 5'에 위치한 대상 핵산 (D)x을 포함하는, 복수의 외인성 핵산; 및
(b) 복수의 뉴클레아제 (여기서, 상기 각각의 뉴클레아제 (N)x는 (TS)x에서 절단할 수 있으며, 이때 상기 절단으로 (TS)x에서 (ES)x의 상동성 재조합이 이루어짐)를 포함하며,
x는 1 내지 n의 정수이며, n은 2 이상이다.
일부 실시 양태에서, (D)x는 선별 마커, 프로모터, 에피토프 테그(epitope tag)를 코딩하는 핵산 서열, 대상 유전자, 리포터 유전자, 및 종결 코돈을 코딩하는 핵산 서열로 이루어진 군으로부터 선택된다. 일부 실시 양태에서,상기 키트는 복수의 프라이머 쌍 (P)x을 추가로 포함하며, 상기 프라이머 쌍은 각각 PCR에 의해 (TS)x에서 (ES)x의 삽입을 동정할 수 있다. 일부 실시 양태에서, (ES)x는 선형이다. 일부 실시 양태에서, (ES)x는 원형이다.
특정 실시 양태에서, 상기 키트는 효모 게놈의 대략 6,000개의 유전자 좌 중 임의의 유전자 좌 내 고유 표적 부위에서 외인성 핵산을 부위-특이적인 삽입할 수 있게 한다. 이들 실시 양태에서, n은 ≥6000이며, 각각의 (TS)x는 효모 세포 게놈의 고유 영역이다.
일부 실시 양태에서, 상기 키트는 1종 이상의 외인성 핵산을 숙주 효모 세포의 유전자 좌 중 임의의 유전자 좌로 삽입하는 방법을 기술하는 용도에 대한 지시사항을 추가로 포함한다.
7. 실시예
7.1 실시예 1:
복수의 외인성 핵산의 동시 다중 삽입
본원에서 기술한 방법 및 조성물은 한번의 형질전환 공정으로 효모 세포 게놈의 2개의 유전자 좌에 2개의 외인성 핵산이 삽입된 변형된 효모 세포를 제조하기 위해 수행하며, 상기 변형된 효모 세포의 회수에는 선별 마커(들)가 사용되지 않는다.
(a) NDT80 유전자 좌에 위치한 F-CphI 엔도뉴클레아제에 대한 기존에 도입된 인지 부위; 및 (b): HO 유전자 좌 내 위치한 I-SceI 엔도뉴클레아제에 대한 기존에 도입된 인지 부위를 포함하는 숙주 균주를 제공한다. 숙주 세포는, (1) F-CphI를 코딩하는 발현 플라스미드; (2) I-SceI를 코딩하는 발현 플라스미드; (3) NDT80 유전자 좌의 5' 및 3' 영역에 상응하는 >500 bp 서열로 이루어진 2개의 연장부(stretch)의 측면에 위치한, 녹색 형광 단백질 (GFP)을 코딩하는 발현 카세트를 포함하는 선형 DNA; 및 (4) HO 유전자 좌의 5' 및 3' 영역에 상응하는 >500 bp 서열로 이루어진 2개의 연장부의 측면에 위치한, lacZ를 코딩하는 발현 카세트를 포함하는 선형 DNA로 동시에 형질전환시킨다. 각각 F-CphI 및 I-SceI를 코딩하는 발현 플라스미드의 삽입(inclusion)에 대한 대안으로서, 정제된 F-CphI 및 I-SceI 단백질을 형질전환 반응에 포함한다. 비-이중 가닥 절단 대조군은, F-CphI 및 I-SceI 발현 플라스미드 또는 정제된 단백질의 부재 하에, (3) 및 (4)만으로 숙주 세포를 형질전환시킴으로써 수행한다.
실험 및 대조군 형질전환체를 선별제-무첨가 배지에 평판배양하고, 각각의 플레이트로부터의 콜로니를 각각 GFP 및 lacZ의 발현에 대해 시각화한다. 콜로니 PCR은 독립적으로, 각각 삽입된 삽입 구축물 (3) 또는 (4)과 이들 각각의 표적 서열 사이의 접합점의 상류 및 하류에 어닐링되는 프라이머 쌍으로 수행하여, 삽입의 피델리티(fidelity) 및 빈도를 확인한다.
7.2 실시예 2:
복수의 외인성 핵산의 동시 다중 삽입
본 실시예는, 숙주 세포 게놈에 표적화된 이중-가닥 절단을 도입한 후, 에스. 세레비지애 숙주의 3개의 서로 다른 유전자 좌에서의 3개의 외인성 핵산의 동시 삽입을 나타내는 결과를 제공한다. 간략하게는, 에메랄드 녹색 형광 단백질의 단축된, 비-기능성 카피 (emgfp△)를 코딩하는 외인성 "표적" 핵산 서열을 숙주 효모 세포의 HO, YGR250c 및 NDT80 유전자 좌에 각각 삽입한다. 재조합 세포를, 에메랄드 녹색 형광 단백질 (EmGFP)의 본래의 기능성 카피를 코딩하는 선형 "공여체" DNA, 및 (1) 빈(empty) 벡터; 또는 (2) emgfp△ 코딩 서열 내 서열을 특이적으로 인지 및 절단하는 징크-핑거 뉴클레아제 (ZFN.gfp)를 코딩하는 발현 벡터, pZFN.gfp로 형질전환한다. 형질전환된 콜로니는, 표적 emgfp△ 코딩 서열의 1, 2, 또는 3개의 게놈 삽입된 카피가 공여체 EmGFP 코딩 서열로 대체되었는지에 대해, 콜로니 PCR (cPCR)로 스크리닝하였다.
7.2.1. 표적 DNA의 구축 및 삽입
뉴클레아제-매개성 이중-가닥 절단에 대한 외인성 게놈 표적 부위를 만들기 위해, emgfp△를 코딩하는 표적 DNA를 미국 특허 제 8,110,360 호 (원용에 의해 본원에 포함됨)에 기술한 바와 같이, RYSE-매개성 어셈블리를 이용해 구축하였다. 야생형 EmGFP 코딩 서열 (SEQ ID NO:1)의 450 내지 462개 뉴클레오타이드를 하기 서열: 5'-CGTCTAAATCATG-3' (SEQ ID NO:2)로 대체하여, (1) EmGFP (emgfp△)의 152번째 위치에 조기성숙 정지 코돈; 및 (2) ZFN.gfp에 대한 인지/절단 서열을 도입하였다.
emgfp△ 코딩 서열의, HO, YGR250c 및 NDT80 유전자 좌의 각각으로의 표적화된 삽입을 위해, 상기 emgfp△ 코딩 서열을, 각각의 유전자 좌 (SEQ ID NOS:3-8)에 대해 ~200-500 bp의 상류 및 하류 상동 서열 측면에 두었다. 성공적인 삽입 현상을 가진 콜로니를 선별하기 위해, 고유 선별 마커를 또한, 각각의 구축물로 삽입하여 emgfp△ 코딩 서열의 5'에 위치시켰다. HO 삽입 구축물은 KanR을 포함하였으며, YGR250c 삽입 구축물은 URA3을 포함하였으며, NDT80 삽입 구축물은 NatR을 포함하였다. 각각의 삽입 구축물을 고유한 CEN.PK2 반수체 효모 균주 (A 균주)에 차례대로 형질전환시키고, emgfp△ 코딩 서열의 3개의 삽입된 카피를 가지는지 상기 균주를 확인하였다.
7.2.2. ZFN 효모 발현 플라스미드의 구축
징크 핑거 뉴클레아제는 2가지 기능성 도메인인, 징크 핑거 단백질의 사슬로 이루어진 DNA-결합 도메인, 및 FokI의 뉴클레아제 도메인으로 이루어진 DNA-절단 도메인으로 이루어진다. FokI의 엔도뉴클레아제 도메인은 오빌리게이트(obligate) 헤테로이량체로서 작용하여 DNA를 절단해서, ZFN 한 쌍은 이의 표적 서열을 결합하고 절단할 것이 요구된다. ZFN.gfp (CompoZr®징크 핑거 뉴클레아제, Sigma-Aldrich, St. Louis, MO)의 표적 서열은, 5'-ACAACTACAACAGCCACAACgtctatATCATGGCCGACAAGCA-3' (SEQ ID NO: 9)로서, 인지 서열은 대문자로 표시하고, 절단 서열은 소문자에 표시한다.
고-복사(high-copy) ZFN.gfp 효모 발현 플라스미드인 pZFN.gfp를 하기와 같이 구축하였다. 각각이 ZFN.gfp 오빌리게이트 헤테로이량체의 일 구성원을 코딩하는 ZFN.gfp.1 및 ZFN.gfp.2 유전자를 포유류 발현 플라스미드로부터 PCR-증폭시키고, 분기성 PGAL1 ,10 프로모터 및 ADH1 및 CYC1 종결자에 각각 융합하였다. PGAL10>ZFN.gfp.1-TADH1 및 PGAL1>ZFN.gfp.2-TCYC1의 개별 PCR 산물을, LEU2 선별 마커를 포함하는 선형화된 벡터 백본과 함께, 중복 말단들의 상동성 재조합을 통해 생체내 어셈블리용의 고유한 효모 균주에 공동-형질전환시켰다. PCR 산물은 pGAL1,10 프로모터 서열에서 재조합하였고, 말단 프라이머에 의해 첨가된 상동 서열을 통해 벡터 백본으로 조립되었다. 형질전환체를 루신 결핍 최소 배지에서 선별하고, 분리하여, 액체 배지에서 배양하였다. 다중 클론 유래의 플라스미드를 Zymoprep 효모 플라스미드 Miniprep I kit (Zymo Research)를 사용해 효모로부터 추출하였다. 그런 다음, 추출 프로토콜로부터의 용출액을 이. 콜라이 XL-1 블루 화학적 컴피턴트(competent) 세포로 형질전환시켰다. 플라스미드를 이. 콜라이에서 밤새 확산시키고, 미니프렙하였다 (Qiagen, Valencia, CA). 올바른 클론을 제한효소 맴핑로 동정하였다.
7.2.3. 공여체 DNA로의 형질전환, 및 이중-가닥 절단의 유도
표준 리튬 아세테이트/SSDNA/PEG 프로토콜 (Gietz and Woods, Methods Enzymol. 350:87-96 (2002))을 이용해, A 균주를, EmGFP를 코딩하는 선형 "공여체" DNA, 및 : (1) 빈 벡터; 또는 (2) pZFN.gfp 발현 벡터로 공동-형질전환시켰다. EmGFP 코딩 서열은 ZFN.gfp에 대한 인지/절단 부위 내 위치들, 즉 450 (C→G), 456 (A→T), 461 (T→C) 및 462 (G→C)번째 위치들에서 emgfp△ 코딩 서열과 상이하였다. 따라서, ZFN.gfp는 emgfp△ 서열 내에서 인지 및 절단하며, EmGFP 서열 내에서는 그러지 않을 것으로 예상된다.
적절한 플라스미드 DNA 1 ㎍을 70 ul의 선형 EmGFP DNA (~300 ng/ul)로 공동-형질전환시켰다. 형질전환체 모두를 YP + 2% 갈락토스에서 밤새 회수하여, ZFN 발현을 유도하였다. 여러 가지 희석물을 루신 결핍 최소 배지 한천 플레이트 상으로 도말하여, 플라스미드 DNA로 형질전환된 콜로니를 선별하였다. 플레이트를 30℃에서 3-4일간 인큐베이션하였다.
7.2.4. 다중 동시 삽입의 확인
각각의 표적 유전자 좌에서 emgfp△ 코딩 서열을 EmGFP 코딩 서열로 치환하는 빈도를 측정하기 위해, 콜로니 PCR을 수행하였다. DNA는, 각각의 형질전환체 유래의 96개 콜로니로부터 프렙하고, 각각의 유전자 좌에서의 EmGFP 코딩 서열의 성공적인 삽입이 예상한 크기의 앰플리콘을 생성하는 것으로 예상되지만 비-삽입은 앰플리콘을 생성하지 않는 것으로 예상되도록, EmGFP 및 HO, EmGFP 및 NDT80, 및 EmGFP 및 YGR250c 각각에 대해 특이적인 프라이머 쌍으로 탐침하였다.
Figure 112013108556036-pct00002
도 5에서 나타낸 바와 같이, 선형 EmGFP 공여체 DNA (SEQ ID NO:1) 및 빈 벡터 대조군으로 형질전환시킨 96개 콜로니 중, 앰플리콘은 PCR 동안 생성되지 않았으며, 이는 성공적인 삽입 현상, 즉, 이중-가닥 절단의 부재 하에 표적 emgfp△ 코딩 서열을 포함하는 3개의 유전자 좌 중 임의의 유전자 좌에서의 치환이 존재하지 않았음을 나타낸다. 대조적으로, 선형 EmGFP DNA 및 pZFN.gfp로 형질전환시킨 96개 콜로니 중, 2개 콜로니는 하나의 유전자 좌가 치환되었으며, 4개 콜로니는 2개의 유전자 좌가 치환되었으며, 23개 콜로니는 3개 유전자 좌 모두가 EmGFP 코딩 서열로 치환되었다 (도 6). 콜로니 PCR 결과는, 플레이트 상에서의 형질전환된 콜로니의 형광을 시각화함으로써 뒷받침되었다 (데이터는 나타내지 않음). EmGFP DNA 및 빈 벡터로 형질전환된 콜로니 중 어느 것도 녹색을 띄지 않았으며, 이는 표적 emgfp△ 코딩 서열 중 어느 것도 기능성 EmGFP 코딩 서열로 치환되지 않았음을 나타낸다. 대조적으로, EmGFP DNA 및 pZFN.gfp로 형질전환된 콜로니 중 약 20%는 녹색을 띄었으며, 이는 cPCR에 의해 관찰되는 삽입 현상의 빈도와 대략 상관이 있다.
이들 결과는, 숙주 세포의 게놈에서 다중 표적화된 이중-가닥 절단의 유도는 외인성 공여체 핵산의 동시 다중 표적화된 삽입을 촉진할 수 있음을 나타낸다.
7.3 실시예 3:
파르네센 생성 균주를 아모파다이엔 생성 균주로의 전환을 촉진하기 위한, 테르펜 신타제 유전자의 동시 다중 삽입
본 실시예는, 고(high) 메발로네이트 경로 흐름을 위해 변형된 에스 . 세레비지애 숙주의 3개의 서로 다른 변형된 유전자 좌에서 3개의 세스퀴테르펜 신타제의 동시 삽입을 나타내는 결과를 제공한다. 그 결과, 파르네센을 생성하며 파르네센 신타제 유전자의 플라스미드-기재 카피를 포함하는 모 균주를, 아모파다이엔 신타제의 다중 게놈 삽입된 카피를 포함하는 아모파다이엔 생성 균주로 전환시켰다. 간략하게는, F-CphI 부위 측면에 있는 URA3, NatR 및 KanR 마커 카세트를 각각 숙주 균주의 Gal80, HXT3 및 Mata 유전자 좌로 삽입하였다. 그런 다음, 상기 숙주를, F-CphI 엔도뉴클레아제를 코딩하는 플라스미드, 뿐만 아니라 Gal1 프로모터로부터 발현되며 CYC1 종결자 (ADS 카세트)에 의해 종결되는 아모파다이엔 신타제 (ADS)의 구별되는 코돈 최적화를 포함하는 3개의 선형 "공여체' DNA 구축물 (각각은 이들 각각의 표적 유전자 좌에 대한 상동성 영역의 측면에 존재함)으로 공동-형질전환시켰다. 형질전환된 콜로니는, 1, 2, 또는 3개의 게놈 삽입된 표적 마커 유전자 좌가 ADS 카세트로 치환되었는지에 대해, 콜로니 PCR (cPCR)로 스크리닝하였다. 3중-삽입된 균주를 동정하고, 제4 ADS 카세트를 삽입시킴으로써 추가로 변형시켰으며, 이의 산물 프로파일을 파르네센에서 아모파다이엔으로 완전히 전환시키도록, 생성되는 균주를 파르네센 신타제를 코딩하는 플라스미드의 소실을 허용하는 조건 하에 배양하였다.
7.3.1. 파르네센 생성 균주의 구축
아모파다이엔 신타제를 코딩하는 외인성 공여체 DNA의 다중 동시 삽입에 유용한, 파르네센-생성 효모 균주인 Y3639를 하기와 같이 제조하였다.
균주 Y93 (MAT A) 및 Y94 (MAT 알파)는, 효모 균주 Y002 및 Y003 (각각 CEN.PK2 백그라운드 MAT A 또는 MAT 알파; ura3-52; trp1-289; leu2-3,112; his3D1; MAL2-8C; SUC2; van Dijken et al. (2000) Enzyme Microb. Technol. 26:706-714)의 ERG9 유전자의 프로모터를 각각 사카로마이세스 세레비지애의 MET3 유전자의 프로모터로 치환함으로써, 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y002 및 Y003 세포를 삽입 구축물 i8 (SEQ ID NO: 14)로 형질전환시켰으며, 상기 구축물은, 클루이베로마이세스 락티스의 Tef1 유전자의 프로모터 및 종결자의 측면에 위치하는 카나마이신 내성 마커 (KanMX), ERG9 코딩 서열, ERG9 프로모터의 단축된 분절 (trunc. PERG9), 및 MET3 프로모터 (PMET3) (ERG9 상류 및 하류 서열의 측면에 존재함)를 포함하였다. 숙주 세포 형질전환체는, 0.5 ㎍/㎖ 제네티신 (Invitrogen Corp., Carlsbad, CA)을 포함하는 배지에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y93 및 Y94를 수득하였다.
균주 Y176 (MAT A) 및 Y177 (MAT 알파)는, 균주 Y93 및 Y94 내 ADE1 유전자의 코딩 서열을 칸디다 글라브라타의 LEU2 유전자 (CgLEU2)의 코딩 서열로 치환함으로써 제조하였다. 이를 위해, 3.5 kb CgLEU2 게놈 유전자 좌는, 프라이머 61-67-CPK066-G (SEQ ID NO: 15) 및 61-67-CPK067-G (SEQ ID NO: 16)를 사용하여 칸디 글라브라타 게놈 DNA (ATCC, Manassas, VA)으로부터 PCR 증폭시키고, 상기 PCR 산물을 기하급수적으로 성장하는 Y93 및 Y94 세포로 형질전환시켰다. 숙주 세포 형질전환체를 CSM-L에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y176 및 Y177을 수득하였다.
균주 Y188는, 사카로마이세스 세레비지애의 ERG13, ERG10, 및 ERG12 유전자의 코딩 서열, 및 사카로마이세스 세레비지애의 HMG1 유전자의 단축된 코딩 서열의 부가적인 카피를 균주 Y176으로 도입함으로써 제조하였으며, 각각은 사카로마이세스 세레비지애의 GAL1 또는 GAL10 유전자의 갈락토스 유도성 프로모터의 제어 조절 하에서였다. 이를 위해, 기하급수적으로 성장하는 Y176 세포는, PmeI 제한효소 엔도뉴클레아제 (New England Biolabs, Beverly, MA)로 분해한 발현 플라스미드 pAM491 및 pAM495 2 ㎍으로 형질전환시켰다. 숙주 세포 형질전환체는, 우라실 및 히스티딘 결핍 CSM (CSM-U-H)에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y188을 수득하였다.
균주 Y189는, 사카로마이세스 세레비지애의 ERG20, ERG8, 및 ERG19 유전자의 코딩 서열, 및 사카로마이세스 세레비지애의 HMG1 유전자의 단축된 코딩 서열의 부가적인 카피를 균주 Y177로 도입함으로써 제조하였으며, 각각은 사카로마이세스 세레비지애의 GAL1 또는 GAL10 유전자의 갈락토스 유도성 프로모터의 제어 조절 하에서였다. 이를 위해, 기하급수적으로 성장하는 Y188 세포는, PmeI 제한효소 엔도뉴클레아제로 분해한 발현 플라스미드 pAM489 및 pAM497 2 ㎍으로 형질전환시켰다. 숙주 세포 형질전환체는, 트립토판 및 히스티딘 결핍 CSM (CSM-T-H)에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y189를 수득하였다.
균주 Y238은, 균주 Y188 및 Y189를 메이팅(mating)시키고, 사카로마이세스 세레비지애의 IDI1 유전자의 코딩 서열, 및 사카로마이세스 세레비지애의 HMG1 유전자의 단축된 코딩 서열의 부가적인 카피를 도입함으로써 제조하였으며, 각각은 사카로마이세스 세레비지애의 GAL1 또는 GAL10 유전자의 갈락토스 유도성 프로모터의 제어 조절 하에서였다. 이를 위해, 균주 Y188 및 Y189의 대략 1 x 107 세포를 실온에서 6시간 동안 YPD 배지 플레이트에서 혼합하였으며, 2배체 세포를 CSM-H-U-T에서 선별하였고, 기하급수적으로 성장하는 2배체를, PmeI 제한효소 엔도뉴클레아제로 분해된 발현 플라스미드 pAM493 2 ㎍으로 형질전환시켰다. 숙주 세포 형질전환체는, 아데닌 결핍 CSM (CSM-A)에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y238을 수득하였다.
균주 Y210 (MAT A) 및 Y211 (MAT 알파)는 균주 Y238를 포자형성시킴으로써 제조하였다. 2배체 세포는 2% 포타슘 아세테이트 및 0.02% 라피노스(raffinose) 액체 배지에서 포자형성시켰고, 대략 200 유전적 4배체를 Singer Instruments MSM300 시리즈 마이크로매니퓰레이터(series micromanipulator) (Singer Instrument Co, LTD. Somerset, UK)로 분리하였다. 포자는 CSM-A-H-U-T에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y210 (MAT A) 및 Y211 (MAT 알파)을 수득하였다.
균주 Y221는 기하급수적으로 성장하는 Y211 세포를 벡터 pAM178로 형질전환시킴으로써 제조하였다. 숙주 세포 형질전환체는 CSM-L에서 선별하였다.
균주 Y290는 균주 Y221의 GAL80 유전자의 코딩 서열을 결실시킴으로써 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y221 세포를 삽입 구축물 i32 (SEQ ID NO: 17)로 형질전환시켰으며, 이 구축물은, GAL80 상류 및 하류 서열의 측면에 위치하는 클루이베로마이세스 락티스의 Tef1 유전자의 프로모터 및 종결자의 측면에 위치하는 하이그로마이신 B 내성 마커 (hph)를 포함하였다. 숙주 세포 형질전환체는 하이그로마이신 B를 포함하는 배지에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y290을 수득하였다.
균주 Y318는, 루신-농후 배지에서의 단계식 확산(propagation)에 의해 균주 Y290으로부터 pAM178 벡터를 제거함으로써 제조하였으며, CSM-L에서의 성장불능에 대해 개별 콜로니를 시험하고, 균주 Y318을 수득하였다.
균주 Y409는, β-파르네센 신타제를 코딩하는 이종성 뉴클레오타이드 서열을 균주 Y318로 도입함으로써 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y318 세포를 발현 플라스미드 pAM404로 형질전환시켰다. 숙주 세포 형질전환체는 CSM-L에서 선별하였으며, 균주 Y409를 수득하였다.
균주 Y419는, 균주 Y409의 GAL 프로모터를 구성적으로 활성이 되게 함으로써 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y409 세포를 삽입 구축물 i33 (SEQ ID NO: 18)로 형질전환시켰으며, 이 구축물은, 클루이베로마이세스 락티스의 Tef1 유전자의 프로모터 및 종결자의 측면에 위치하는 스트렙토마이세스 노우세이( Streptomyces noursei )의 노우세오트리신(nourseothricin) 내성 마커 (NatR) 및 사카 로마이세스 세레비지애의 GAL4 유전자의 코딩 서열을 포함하였으며, "조작적인 구성적인(operative constitutive)" 버전의 이의 고유한 프로모터 (PGAL4oc; Griggs & Johnston (1991) PNAS 88(19):8597-8601) 및 GAL4 종결자 (TGAL4) (변형된 ERG9 프로모터 및 코딩 서열의 상류 및 하류 서열의 측면에 존재함)의 제어 조절 하에서였다. 숙주 세포 형질전환체는 노우세오트리신을 포함하는 배지에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였고, 균주 Y419를 수득하였다.
균주 Y677은, 사카로마이세스 세레비지애의 GAL1 유전자의 프로모터의 제어 조절 하에 사카로마이세스 세레비지애의 ERG12 유전자의 코딩 영역의 부가적인 카피를 균주 Y419의 변형된 GAL80 유전자 좌에 도입함으로써 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y677 세포를 삽입 구축물 i37 (SEQ ID NO: 19)로 형질전환시켰으며, 이 구축물은, 클루이베로마이세스 락티스의 Tef1 유전자의 프로모터 및 종결자의 측면에 위치하는 스트렙토마이세스 노우세이의 카나마이신 내성 마커 (KanR), 및 GAL1 프로모터 (PGAL1) 및 ERG12 종결자 (TERG12)의 측면에 위치하는 사카로마이세스 세레비지애 ERG12 유전자의 코딩 및 종결자 서열을 포함하였다. 숙주 세포 형질전환체는 카나마이신을 포함하는 배지에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였으며, 균주 Y677을 수득하였다.
균주 Y1551는 균주 Y677로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y1551을 수득하였다.
균주 Y1778은 균주 Y1551로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y1778을 수득하였다.
균주 Y1816는, 균주 Y1778의 HXT3 코딩 서열을 아세토아세틸-CoA 티올라제 코딩 서열의 2개의 카피 (하나의 카피는 사카로마이세스 세레비지애 유래이며, 다른 하나는 씨. 부틸리쿰 유래임), 및 비. 윤세아(B. juncea)의 HMGS 유전자의 코딩 서열의 하나의 카피로 치환함으로서 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y1778 세포를, 삽입 구축물 i301 (SEQ ID NO: 20)로 형질전환시켰으며, 이 구축물은, 클루이베로마이세스 락티스 Tef1 유전자의 프로모터 및 종결자의 측면에 위치하는 하이그로마이신 B 내성 마커 (hyg), 단축된 TDH3 프로모터 (tPTDH3) 및 AHP1 종결자 (TAHP1)의 측면에 위치하는 사카로마이세스 세레비지애의 ERG10 유전자의 코딩 서열, YPD1 프로모터 (PYPD1) 및 CCW12 종결자 (TCCW12)의 측면에 위치하는 씨. 부틸리쿰 (티올라제)의 아세토아세틸-CoA 티올라제 유전자의 코딩 서열, 및 사카로마이세스 세레비지애의 HXT3 유전자의 상류 및 하류 서열의 측면에 위치하는, TUB2 프로모터 (PTUB2)보다 선행하는 비. 윤세아 의 HMGS 유전자(HMGS)의 코딩 서열을 포함하였다. 숙주 세포 형질전환체는 하이그로마이신 B를 포함하는 배지에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하였고, 균주 Y1816을 수득하였다.
균주 Y2055는 균주 Y1778로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y2055를 수득하였다.
균주 Y2295는 균주 Y2055로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y2295를 수득하였다.
균주 Y3111는 MAT A 내지 MAT 알파의 균주 Y2295의 메이팅 형을 스위칭함으로서 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y2295 세포를 삽입 구축물 i476 (SEQ ID NO: 21)로 형질전환시켰으며, 이 구축물은 MAT 알파 메이팅 유전자 좌 및 하이그로마이신 B 내성 마커 (hygA)를 포함하였다. 숙주 세포 형질전환체는 하이그로마이신 B를 포함하는 배지에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하고, 균주 Y3111을 수득하였다.
균주 Y2168은 균주 Y1816으로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y2168을 수득하였다.
균주 Y2446은 균주 Y2168로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y2446을 수득하였다.
균주 Y3118은, 사카로마이세스 세레비지애의 GAL80 유전자의 코딩 서열, 프로모터, 및 종결자를 균주 Y2446의 고유한 URA3 유전자 좌로 삽입함으로써 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y2446 세포를 삽입 구축물 i477 (SEQ ID NO: 22)로 형질전환시켰으며, 이 구축물은 중복 URA3 서열의 측면에 위치하는 사카로마이 세스 세레비지애의 GAL80 유전자의 프로모터, 종결자, 및 코딩 서열을 포함하였다 (본래의 URA3 서열의 복구 및 상동성 재조합에 의해 GAL80 유전자의 루프-아웃(loop-out) 절제를 가능하게 함). 숙주 세포 형질전환체는 5-FOA를 포함하는 배지에서 선별하였으며, 균주 Y3118을 수득하였다.
균주 Y3215는 균주 Y3111 및 Y3118을 메이팅함으로써 제조하였다. 균주 Y3111 및 Y3118의 대략 1 x 107 세포를 실온에서 6시간 동안 YPD 배지 플레이트에서 혼합하여, 메이팅이 가능하게 한 다음, YPD 한천 플레이트에 도말하여, 단일 콜로니를 분리하였다. 2배체는, hphA-marked MAT 알파 유전자 좌 및 야생형 MAT A 유전자 좌 둘 다의 존재에 대해 콜로니 PCR로 스크리닝하여 동정하였다.
균주 Y3000는, 균주 Y3215을 포자형성시키고, GAL80 코딩 서열을 루핑-아웃함으로써 제조하였다. 2배체 세포는 2% 포타슘 아세테이트 및 0.02% 라피노스 액체 배지에서 포자형성시켰다. 랜덤 포자를 분리하고, YPD 한천에 도말하고, 3일 동안 배양한 다음, CSM-U에 레플리카-도말하여, GAL80이 결핍된 (즉, 기능성 URA3 유전자를 가진) 세포만 성장할 수 있게 하였다. 그런 다음, 포자를 β-파르네센 생성에 대해 시험하고, 최상의 생산자를 동정하고, 삽입 구축물 i301의 존재를 진단 PCR로 확인하였으며, 균주 Y3000을 수득하였다.
균주 Y3284는 균주 Y3000으로부터 URA3 마커를 제거으로써 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y3000 세포를 삽입 구축물 i94 (SEQ ID NO: 23)로 형질전환시켰으며, 이 구축물은, 살모넬라의 hisG 코딩 서열, 및 ERG13 유전자의 코딩 서열 및 사카로마이세스 세레비지애 HMG1 유전자의 단축된 코딩 서열을 포함하였다 (사카로마이세스 세레비지애의 GAL1 또는 GAL10 유전자의 갈락토스 유도성 프로모터의 조절 하에서, 그리고 사카로마이세스 세레비지애의 URA3 유전자의 상류 및 하류 서열의 측면에 존재함). 숙주 세포 형질전환체는 5-FOA를 포함하는 배지에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하고, 균주 Y3284를 수득하였다.
균주 Y3385는, 균주 Y3284의 NDT80 코딩 서열을, 사카로마이세스 세레비지 의 아세틸-CoA 신타제 유전자의 코딩 서열의 부가적인 카피, 및 제트. 모빌리스(Z. mobilis )의 PDC 유전자의 코딩 서열로 치환함으로써 제조하였다. 이를 위해, 기하급수적으로 성장하는 Y3385 세포를, 삽입 구축물 i467 (SEQ ID NO: 24)로 형질전환시켰으며, 이 구축물은 URA3 마커, HXT3 프로모터 (PHXT3) 및 PGK1 종결자 (TPGK1)의 측면에 위치하는 사카로마이세스 세레비지애의 ACS2 유전자의 코딩 서열 (ACS2), 및 GAL7 프로모터 (PGAL7) 및 TDH3 종결자 (TTDH3)의 측면에 위치하는 제트. 모빌리스의 PDC 유전자의 코딩 서열 (zmPDC) (상류 및 하류 NDT80 서열의 측면에 존재함)을 포함하였다. 숙주 세포 형질전환체는 CSM-U에서 선별하였으며, 선별된 클론은 진단 PCR로 확인하고, 균주 Y3385를 수득하였다.
균주 Y3547은 균주 Y3385로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y3547을 수득하였다.
균주 Y3639는 균주 Y3547로부터 화학적 돌연변이생성에 의해 제조하였다. 돌연변이화된 균주를 β-파르네센의 생성 증가에 대해 스크리닝하고, 균주 Y3639를 수득하였다.
7.3.2. 표적 DNA의 구축 및 삽입
FcphI 엔도뉴클레아제-매개성 이중-가닥 절단에 대한 외인성 게놈 표적 부위를 균주 Y3639의 3개의 서로 다른 유전자 좌로 삽입시켰다. 3개의 표적 부위 카세트는 중복 절편의 PCR 어셈블리를 사용해 구축하였으며, 각각은 FcphI 엔도뉴클레아제에 대한 인지 서열, 및 각각 (1) URA3 (변형된 Gal80 유전자 좌에 대한 상동성 영역의 측면에 존재함) (SEQ ID NO: 25); (2) NatR (변형된 HXT3 유전자 좌에 대한 상동성 영역의 측면에 존재함) (SEQ ID NO: 26); 및 (3) KanR (변형된 Mata 유전자 좌에 대한 상동성 영역의 측면에 존재함) (SEQ ID NO: 27)에 대한 코딩 서열을 포함하였다. 각각의 표적 부위 카세트를 Y3639로 단계적으로 형질전환시켰으며, 상기 균주는, 올바른 유전자 좌에서 F-CphI-플랭킹된 카세트의 3개의 삽입된 카피를 가지는지 콜로니 PCR로 확인하였다 ("B 균주").
7.3.3. F-CphI 효모 발현 플라스미드의 구축
HygR 선별 마커를 포함하는 F-CphI 효모 발현 플라스미드 pAM1799는 미국 특허 제 7,919,605 호 (원용에 의해 본원에 포함됨)에서 전술하였다.
7.3.4. 공여체 DNA으로의 형질전환, 및 이중-가닥 절단의 유도
표준 리튬 아세테이트/SSDNA/PEG 프로토콜 (Gietz and Woods, Methods Enzymol. 2002;350:87-96)은, 42도 열쇼크 전에 세포를 30도에서 30분 인큐베이션하는 것으로 포함하도록 변경하였다. 이 방법을 이용해, FcphI 엔도뉴클레아제를 코딩하는 pAM1799, 및 3개의 선형 "공여체" DNA로 균주 B를 형질전환시켰으며, 각각은, 각각 균주 B의 변형된 Gal80 (SEQ ID NO: 28), HXT3 (SEQ ID NO: 29) 및 Mata 유전자 좌 (SEQ ID NO: 30)에 대한 상동성 영역의 측면에 위치하는, 아르테미시아 안누아( Artemisia annua)의 아모파다이엔 신타제 (ADS)에 대한 코돈 최적화된 코딩 서열을 포함하였다.
1 ㎍의 pAM1799을 ADS 공여체 DNA 각각의 ~100 ng으로 공동-형질전환시켰다. 형질전환체 모두를 YP + 2% 갈락토스에서 밤새 회수하여, F-CphI 발현을 유도하였다. 여러 가지 희석물을 하이그로마이신 함유 YPD 한천 플레이트 상으로 도말하여, 플라스미드 DNA로 형질전환된 콜로니를 선별하였다. 플레이트를 30℃에서 3-4일간 인큐베이션하였다.
7.3.5. 다중 동시 삽입의 확인
콜로니 PCR (cPCR)을 수행하여, F-CphI-flanked 마커 카세트 코딩 서열이 ADS 카세트 코딩 서열로 치환되는 빈도를 측정하였다. DNA는, 각각의 유전자 좌에서의 ADS 카세트 코딩 서열의 성공적인 삽입이 예상한 크기의 앰플리콘을 생성하는 것으로 예상되지만 비-삽입은 앰플리콘을 생성하지 않는 것으로 예상되도록, ADS 및 Gal80 유전자 좌, ADS 및 HXT3 유전자 좌, 및 ADS 및 Mata 유전자 좌 각각에 대해 특이적인 프라이머 쌍으로 탐침한 20개의 콜로니로부터 프렙하였다. 각각의 유전자 좌의 5' 및 3' 말단으로부터 앰플리콘을 생성하기 위한 PCR 반응을 여러 번 수행하였다. 일부 경우, 5' 또는 3' 앰플리콘만이 성공적으로 검출되었지만, ADS 카세트의 적절한 삽입은 더 큰 PCR 절편을 서열분석함으로써 이들 유전자 좌에서 확인하였다.
Figure 112013108556036-pct00003
cPCR로 스크리닝한 20개 콜로니 중에서, 14개는 Gal80 유전자 좌에서 ADS 삽입되었으며, 17개는 HXT3 유전자 좌에서 ADS 삽입되었으며, 4개는 Matα 유전자 좌에서 ADS 삽입되었다. Matα 유전자 좌에서의 삽입률이 낮은 것은, F-CphI 부위의 측면에 위치하는 직접 반복 서열에 의해 매개되는, 이 유전자 좌에서 자가-밀폐(self-closure)때문일 수 있다. 전체적으로, 6개 클론은 단일 부위에서 ADS 삽입되었으며, 10개 클론은 2개 부위에서 ADS 삽입되었으며, 3개 클론은 3개 유전자 좌 모두에서 ADS 삽입되었다 ("C 균주"). 3중 삽입된 균주는 플랭크를 둘 다 포함하는 더 긴 PCR 산물을 서열분석함으로써 추가로 확인하였다.
1.1.5 삽입된 ADS 균주의 완성 및 세스퀴테르펜 분석법
3중 삽입된 ADS 균주는 표준 프로토콜을 이용해 His3 유전자 좌에서 URA 카세트 (SEQ ID NO: 40)로 마킹한 ADS의 최종 카피를 삽입시켜서 추가로 변형하였으며, 생성되는 균주는 이 4번째 카피에 대해 확인하였다 ("D 균주"). 마지막으로, 균주 D 세포를 비-선별성 배지에서 계대배양하여, Leu+ 마킹된 고 복사 파르네센 신타제 플라스미드 (pAM404)를 상실시켰다 ("E 균주").
E 균주의 여러 가지 분리물을 균주 D 및 본래 모 균주 B와 함께 세스퀴테르펜 생성에 대해 분석하였다. 간략하게는, 균주 B, D 및 E의 분리물을, 각 웰 당 360 ㎕ Bird Seed Medium (BSM) + 2% 수크로스가 든 96-웰의 개별 웰에서 인큐베이션하였다 (예비배양). 33.5℃에서 999 rpm 진탕과 함께 3일간 인큐베이션한 후, 각각의 웰의 14.4 ㎕를 360 ㎕의 신선한 BSM + 4% 수크로스가 든 새로운 96-웰 플레이트의 웰에 접종하였다 (생성 배양). 33.5℃에서 999 rpm 진탕과 함께 2일간 인큐베이션한 후, 샘플을 취하고, 기체 크로마토그래피 (CG) 분석에 의해 세스퀴테르펜 생성에 대해 분석하였다. 샘플을 메탄올-헵탄 (1:1)으로 추출하고, 혼합물을 원심분리하여 세포성 물질을 제거하였다. 메탄올-헵탄 추출물의 분취물을 헵탄 중에 희석시킨 다음, 펄스 스플리트 주입을 이용해 메틸 실리콘 고정상(stationary phase)으로 주입하였다. 파르네센 및 아모파다이엔을 불꽃 이온화 검출기 (FID)를 이용해 비점에 의해 분리하였다. 트랜스-β-카르요필렌을 체류 시간 마커로서 사용하여, 특정한 GC 오븐 프로파일 동안의 성공적인 주입 및 용출을 모니터링하였다.
도 7에 나타낸 바와 같이, 전체 세스퀴테르펜 생성은 모든 균주에 대해 거의 동일한 채로 있었지만 (3-3.5 g/L), 산물 프로파일은 파르네센 (균주 B) → 혼합 산물 (균주 D) → 아모파다이엔 (E 균주)로 성공적으로 전환되었다.
이들 결과는, 숙주 세포의 게놈에서 다중 표적화된 이중-가닥 절단을 유도하면, 기능성 유전자 카세트의 동시 다중 삽입을 촉진할 수 있으며, 이 경우 한번의 형질전환에서 파르네센-생성 균주에서 아모파다이엔-생성 균주로의 전환을 촉진함을 나타낸다.
7.4 실시예 4:
파르네센 신타제의 다중 삽입된 카피의 아모파다이엔 신타제로의 동시 치환
본 실시예는, 신타제 코딩 영역 내 설계자 뉴클레아제-유도성 이중-가닥 절단에 의해 촉진되는, 4개의 게놈 삽입된 테르펜 신타제 유전자의 동시 치환을 나타내는 결과를 제공한다. 간략하게는, 균주 Y3639 (실시예 3에서 기술) 유래이지만 파르네센 신타제 (FS) 유전자의 염색체외성 카피보다는 4개의 삽입체를 포함하는 기존의 파르네센 생성 균주를, 설계자 TAL-작동자 뉴클레아제 (TALEN)를 코딩하는 플라스미드, 및 새로운 테르펜 신타제 유전자를 코딩하는 4개의 선형 공여체 DNA로 공동-형질전환시켰다. 상기 설계자 TALEN은 삽입된 파르네센 신타제 유전자에 고유 서열을 결합 및 절단할 수 있다. 형질전환된 콜로니를 콜로니 PCR (cPCR)로 스크리닝하고, 1, 2, 3, 또는 4개의 게놈 삽입된 표적 마커 유전자 좌를 가진 균주를 동정하였다.
7.4.1. 표적 DNA의 구축 및 삽입
4개의 공여체 카세트 (각각은 표적 유전자 좌 각각에 대한 상동성 영역 (~500 bp)의 측면에 위치하는 테르펜 신타제 코딩 서열을 포함함)를 중복 PCR로 조립하였다. 공여체 DNA 중 3개는 ADS 코딩 서열을 포함하고 선별 마커는 포함하지 않았지만 (SEQ ID NOs: 41-43), 마지막의 공여체 DNA는 URA3 마커 카세트에 융합된 파르네센 신타제 (FS)의 새로운 코돈 최적화를 포함하는 카세트였다 (SEQ ID NO: 44). 공여체 DNA 중 어느 것도 FS-특정 TALEN (5'- TAGTGGAGGAATTAAAAGAGGAAGTTAAGAAGGAATTGATAACTATCAA-3' (SEQ ID NO:45))에 의해 인지되는 표적 부위를 포함하지 않았다.
균주에서 4개의 삽입된 FS 카세트의 치환의 경우 (균주 F), hyg+ marked TALEN 플라스미드를, 실시예 3에서 기술한 프로토콜에 따라, ~500 ng의 각각의 선형 공여체 DNA와 함께 숙주 균주로 공동-형질전환시켰다. 여러 가지 희석물을 CSM-URA + Hyg 플레이트로 도말하고, 30도에서 3일간 인큐베이션하였다.
7.4.2. 다중 동시 삽입의 확인
TALEN 플라스미드의 선별, 및 CSM-URA + Hyg 플레이트상에서의 URA3 마킹된 코돈-FS 카세트의 삽입 후, 콜로니 PCR를 수행하여, 3개의 유전자 좌에서 삽입된 FS 카세트를 비마킹된 ADS 카세트로 치환하는 빈도를 측정하였다. DNA는, 각각의 유전자 좌에서의 ADS 카세트 코딩 서열의 성공적인 삽입이 예상한 크기의 앰플리콘을 생성하는 것으로 예상되지만 비-삽입은 앰플리콘을 생성하지 않는 것으로 예상되도록, 20개의 콜로니로부터 프렙하고, NDT80, DIT1 및 ERG10 유전자 좌에서 ADS 카세트의 삽입에 특이적인 프라이머 쌍으로 탐침하였다.
Figure 112013108556036-pct00004
시험한 48개 클론 중 3개는 URA3-마킹된 FS 외에도 단일 ADS 카세트를 삽입하였으며, 1개의 클론은 2개의 ADS 카세트를 삽입하였으며, 1개의 클론은 3개의 ADS 카세트를 모두 삽입하였다. 다중 삽입 결과는, 플랭크 둘 다를 포함하는 더 긴 PCR 산물을 서열분석함으로써 추가로 확인하였다.
이들 결과는, 생합성 경로를 포함하는 숙주 세포에서 부위-특이적인 설계자 뉴클레아제의 발현이, 경로 유전자의 다중 삽입된 카피를 한번의 형질전환 공정에서 새로운 경로 유전자로 동시 치환되는 것을 촉진할 수 있음을 나타낸다.
7.5 실시예 5:
구별되는 설계자 뉴클레아제로 절단한 2개의 유전자 좌로의, 마커 리스 DNA 구축물의 동시 다중 삽입
본 실시예는 2개의 고유 표적 부위에서 2개의 마커리스 DNA 구축물의 동시 삽입을 나타내는 결과를 제공하며, 각각의 부위는 구별되는 설계자 뉴클레아제로 절단한다. 간략하게는, ADE- 숙주 균주를, (1) GFP 카세트 (SFC1 유전자 좌에 상동성인 상류 및 하류 영역에 의해 플랭킹됨)를 포함하는 선형 DNA 절편; (2) ADE2 카세트 (YJR030c 유전자 좌에 상동성인 상류 및 하류 영역에 의해 플랭킹됨)를 포함하는 선형 DNA 절편; 및 (3) 고유한 SFC1 및 YJR030c 개방형 판독 프레임(open reading frame) 각각에서 서열을 표적화하는 설계자 뉴클레아제를 코딩하는 플라스미드(들)로 공동-형질전환시켰다. 플라스미드(들)의 선별 후, 형질전환된 콜로니를, ADE- 표현형의 보완을 나타내는 GFP 형광 및 백색에 대해 시각적으로 스크리닝하였다. 콜로니 PCR (cPCR)을 또한 수행하여, 두 유전자 좌 모두의 치환을 확인하였다. 흥미롭게도, 단일 설계자 뉴클레아제만 사용한 경우의 삽입 속도에 비해 설계자 엔도뉴클레아제를 함께 사용하였을 때, 두 표적 유전자 좌 모두에서의 삽입 속도가 크게 개선되어 나타났다.
7.5.1. 공여체 DNA 카세트의 구축
2개의 공여체 DNA는 중복(overlapping) 절편의 PCR 어셈블리를 이용해 생성하였다: (1) SFC1 유전자 좌 (SEQ ID NO: 58)에 상동성인 상류 및 하류 영역의 ~500 bp에 의해 플랭킹된(flanked) GFP 카세트를 포함하는 선형 DNA 절편; 및 (2) YJR030c 유전자 좌 (SEQ ID NO: 59)에 상동성인 상류 및 하류 영역의 ~500 bp에 의해 플랭킹된 ADE2 카세트를 포함하는 선형 DNA 절편.
7.5.2. 헤테로이량체성 ZFN 발현 플라스미드의 구축
YJR030c-특정 징크 핑거 뉴클레아제 (ZFN)를 코딩하는 플라스미드를 2가지 방식으로 구축하였다. 제1 버전에서, 분기성(divergent) Gal1-10 프로모터의 발현 하에 Adh1 및 CYC1 종결자에 의해 종결되는 헤테로이량체성 ZFN의 2개의 ORF를 효모에서 3개 파트 갭 복구에 의해 Kan marked CEN-ARS 벡터로 클로닝하였다 (pCUT006). 제2 버전은 또한, 헤테로이량체성 ZFN의 ORF 둘 다, 절단형 펩타이드 링커를 코딩하는 DNA 서열에 의해 분리되는 단량체를 이용해 Gal10 프로모터로부터 단일 ORF로서 발현되도록 구축하였다. 이 제2 플라스미드는, PCR 절편의 IIS형 제한효소 효소 분해에 의해 생성된 링커를 이용해 Kan 마킹된 CEN-ARS 벡터 백본 (pCUT016)으로 3-파트 연결함으로써 구축하였다. SFC1-특정 ZFN을 코딩하는 플라스미드를 또한, 동일한 링커 방법, 마커 및 백본을 이용해 단일 ORF로서 구축하였다 (pCUT015). 그런 다음, 마커를 효모 (pCUT058)에서 갭 복구 반응에 의해 URA로 바꾸었다. YJR030c 및 SFC1-특정 뉴클레아제 둘 다의 발현을 위한 단일 플라스미드를 구축하기 위해, pCUT16 및 pCUT15 유래의 단일 ORF를 새로운 CEN-ARS Kan+ 벡터 백본으로 서브클로닝하고, Cyc1 및 Adh1 종결자 (pCUT032)를 이용해 Gal1-10 분기성 프로모터로부터 발현시켰다.
7.5.1. 공여체 DNA으로의 형질전환 및 이중-가닥 절단의 도입
1 ㎍의 각각의 설계자 뉴클레아제 플라스미드 DNA, 또는 단일 플라스미드에 설계자 엔도뉴클레아제를 둘 다 포함하는 플라스미드를 ~1 ㎍의 공여체 DNA 각각으로 공동-형질전환시켰다. 모든 형질전환체를 YP + 2% 갈락토스에서 밤새 회수하여, 뉴클레아제 발현을 유도하였다. 여러 가지 희석물을 URA 드롭아웃 + Kan 한천 플레이트 (이중 플라스미드의 경우) 또는 YPD + Kan 상으로 도말하여, 플라스미드 DNA로 형질전환된 콜로니를 선별하였다. 플레이트를 30℃에서 3-4일간 인큐베이션하였다.
7.5.2. 다중 동시 삽입의 확인
SFC1 유전자 좌에서의 마커리스 삽입은, 적절한 필터를 사용하여 UV 광 하에 GFP 형광을 관찰함으로써 스코어링하였다. ADE2의 마커리스 삽입은 백색 콜로니 색상을 관찰하여 스코어링하였으며, 이는 숙주 균주에서 ADE2 결실 표현형 (분홍색 콜로니)의 보완(complementation)을 나타낸다. 전형적인 실험에서, 50-150개 콜로니를 분석하였다. 시각적인 스코어링 방법은, 삽입 구축물의 5' 프라이머 및 내부 역방향 프라이머를 사용해 콜로니 PCR에 의해 콜로니의 서브셋에서 확인하였다. 각각의 유전자 좌에서의 삽입은 예상한 크기의 앰플리콘(amplicon)을 생성하는 것으로 예상하였지만, 비-삽입은 앰플리콘을 생성하지 않는 것으로 예상하였다. cPCR 결과는 시각적인 스코어링 방법의 정확도를 확인시켜 주었다.
Figure 112013108556036-pct00005
도 8에서 나타낸 바와 같이, SFC1 및 YJR030c 유전자 좌에 대한 선형 공여체 DNA와, YJR030c 엔도뉴클레아제 플라스미드 (pCUT006) 및 SFC1 엔도뉴클레아제 플라스미드 (pCUT058)로 공동-형질전환시킨 세포에서, URA 드롭아웃 + Kan 한천 플레이트 상에서 선별한 콜로니 중 80%는 GFP 양성이었다. 이들 콜로니 중, 91%는 ADE2 삽입에 대해 양성이었다. 전체적으로, 콜로니 중 72.8%는 두 유전자 좌 모두에서 공여체 DNA를 삽입하였다.
SFC1 유전자 좌에 대한 선형 공여체 DNA 및 SFC1를 표적으로 하는 설계자 뉴클레아제 플라스미드 (pCUT015)로 공동-형질전환된 세포에서, 상기 세포 중 50%는 GFP 양성이었다. 세포를 YJR030c 유전자 좌에 대한 선형 공여체 DNA, 및 YJR030c 유전자 좌를 표적으로 하는 설계자 뉴클레아제 플라스미드 (pCUT016)로 공동-형질전환시키는 경우, 상기 세포 중 단 5%만이 ADE2 삽입에 대해 양성이었다. 숙주 세포를 SFC1 및 YJR030c 유전자 좌에 대한 선형 DNA, 및 SFC1/YJR030c 설계자 뉴클레아제 플라스미드 (pCUT032)로 공동-형질전환시키는 경우, 상기 세포 중 76%는 GFP 양성이었으며, 63%는 ADE2 양성이었다. 이 결과는, 다중 부위가 설계자 엔도뉴클레아제에 의해 표적화되는 경우, 삽입 효율이 놀랍게도 크게 개선됨을 나타낸다.
이들 결과는, 숙주 세포의 게놈 내 고유한 유전자 좌에서 다중 표적화된 이중-가닥 절단의 도입은 기능성 유전자 카세트의 동시, 다중, 마커리스 삽입을 촉진할 수 있음을 나타낸다.
본 출원에서 언급한 모든 공개, 특허 및 특허 출원은 각각의 개별 공개 또는 특허 출원이 참조로서 구체적이면서 개별적으로 나타나 있는 것처럼, 본원에 참조로서 포함된다. 전술한 발명이 이해의 명확성을 위해 예시 및 실시예로써 좀더 상세히 기술되었지만, 당해 기술분야의 당업자는, 특정 변화 및 변형이 첨부된 청구항의 사상 또는 범위를 벗어나지 않으면서 이루어질 수 있음을 본 발명의 교시를 통해 쉽게 알 것이다.
SEQUENCE LISTING <110> AMYRIS, INC. SERBER, Zach HORWITZ, Andrew <120> METHODS FOR GENOMIC MODIFICATION <130> AM-4800-US <150> US 61/479,821 <151> 2011-04-27 <150> US 61/500,741 <151> 2011-06-24 <150> US 61/539,389 <151> 2011-09-26 <160> 66 <170> PatentIn version 3.5 <210> 1 <211> 741 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Wild-type Em.GFP coding sequence <400> 1 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccttgaccta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaag gtctatatca ccgccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gacccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720 ctcgagaagc ttgatccggc t 741 <210> 2 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: EmGFP linker encoding premature stop codon <400> 2 cgtctaaatc atg 13 <210> 3 <211> 500 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: HO upstream integration sequence <400> 3 cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 60 aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 120 gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 180 acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 240 aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 300 agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 360 acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 420 atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 480 aattctatct atactttaaa 500 <210> 4 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: HO downstream integration sequence <400> 4 aatgtgtata ttagtttaaa aagttgtatg taataaaagt aaaatttaat attttggatg 60 aaaaaaacca tttttagact ttttcttaac tagaatgctg gagtagaaat acgccatctc 120 aagatacaaa aagcgttacc ggcactgatt tgtttcaacc agtatataga ttattattgg 180 gtcttgatca actttcctca 200 <210> 5 <211> 490 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: YGR250c upstream integration sequence <400> 5 gtacgatgtt tctcccgctg atccgattac tagccgaaga cgtaaaattg gcgcttgatt 60 caatttatgc ccttcccggg aatagttgac caaagggcaa aaaaattcag tcggagattc 120 cctattgggc ggaatttagt agatctcttt ccgtgcataa cgcctgcccg ttagtcgtta 180 tttcacgtta acattttctt ggccactgcg ctatataaat aaatacatat atatatgtca 240 agcacaataa agaaacttcc cttaaatatt gaataagtaa ataatagttg aaaagtgcct 300 tttgttcgaa ggattagagt gttcttaatt ttagttcgtt caacggtctc aaaaaaagtg 360 tgaacaagta aagcatagca cacatcccaa attacaaggc accctgatta aaaatccaaa 420 aataaaccat aagttttatt ttactaaaaa cattatacgt gaaagacaaa ccgcatcaga 480 agtttcgagg 490 <210> 6 <211> 185 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: YGR250c downstream integration sequence <400> 6 attgcatcag gtccataaaa tgtttttgtc tgcttttttt tcttcatgta ttagttggtt 60 tttattttta tattttcatt tatcttattc atacttttta ctcctttttt cttcattctt 120 tacgatcttg gacattcaac tagcctatgg taacttttct tattactttg cccctccttg 180 aggtg 185 <210> 7 <211> 504 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NDT80 upstream integration sequence <400> 7 catcaagcgc tccaagctga cataaatcgc actttgtatc tacttttttt tattcgaaaa 60 caaggcacaa caatgaatct atcgccctgt gagattttca atctcaagtt tgtgtaatag 120 atagcgttat attatagaac tataaaggtc cttgaatata catagtgttt cattcctatt 180 actgtatatg tgactttaca ttgttacttc cgcggctatt tgacgttttc tgcttcaggt 240 gcggcttgga gggcaaagtg tcagaaaatc ggccaggccg tatgacacaa aagagtagaa 300 aacgagatct caaatatctc gaggcctgtc ctctatacaa ccgcccagct ctctgacaaa 360 gctccagaac ggttgtcttt tgtttcgaaa agccaaggtc ccttataatt gccctccatt 420 ttgtgtcacc tatttaagca aaaaattgaa agtttactaa cctttcatta aagagaaata 480 acaatattat aaaaagcgct taaa 504 <210> 8 <211> 202 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: NDT80 downstream integration sequence <400> 8 ataaactaat gattttaaat cgttaaaaaa atatgcgaat tctgtggatc gaacacagga 60 cctccagata acttgaccga agttttttct tcagtctggc gctctcccaa ctgagctaaa 120 tccgcttact atttgttatc agttcccttc atatctacat agaataggtt aagtatttta 180 ttagttgcca gaagaactac tg 202 <210> 9 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for ZFN.gfp <400> 9 acaactacaa cagccacaac gtctatatca tggccgacaa gca 43 <210> 10 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Forward primer specific to Em.GFP <400> 10 caactacaac agccacaagg tctatatcac c 31 <210> 11 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Reverse primer for HO locus <400> 11 ctctaacgct gttggtagat tg 22 <210> 12 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Reverse primer for NDT80 locus <400> 12 accatgtgat aatacactac taatgtgact actagttga 39 <210> 13 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Reverse primer for YGR250c locus <400> 13 tcagacgcgt tcggaggaga gtgcattcac 30 <210> 14 <211> 5251 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i8 <400> 14 ttgcctatgc tttgtttgct ttgaacactt gtttccgctc tccttttact tattggctac 60 taaaactacg tgtaaaagat cgcccagcgc aaaaaggtcc ggcggtttca aataatctcg 120 aactattcct ataatatgca aaatagtagg taggaacaag tcgactctag gcagataagg 180 aagatgtccg gtaaatggag actagtgctg accgggatag gcaatccaga gcctcagtac 240 gctggtaccc gtcacaatgt agggctatat atgctggagc tgctacgaaa gcggcttggt 300 ctgcagggga gaacttattc ccctgtgcct aatacgggcg gcaaagtgca ttatatagaa 360 gacgaacatt gtacgatact aagatcggat ggccagtaca tgaatctaag tggagaacag 420 gtgtgcaagg tctgggcccg gtacgccaag taccaagccc gacacgtagt tattcatgac 480 gagttaagtg tggcgtgtgg aaaagtgcag ctcagagccc ccagcaccag tattagaggt 540 cataatgggc tgcgaagcct gctaaaatgc agtggaggcc gtgtaccctt tgccaaattg 600 gctattggaa tcggcagaga acctgggtcc cgttctagag accctgcgag cgtgtcccgg 660 tgggttctgg gagctctaac tccgcaggaa ctacaaacct tgcttacaca gagtgaacct 720 gctgcctggc gtgctctgac tcagtacatt tcatagtgga tggcggcgtt agtatcgaat 780 cgacagcagt atagcgacca gcattcacat acgattgacg catgatatta ctttctgcgc 840 acttaacttc gcatctgggc agatgatgtc gaggcgaaaa aaaatataaa tcacgctaac 900 atttgattaa aatagaacaa ctacaatata aaaaaactat acaaatgaca agttcttgaa 960 aacaagaatc tttttattgt cagtactgat tagaaaaact catcgagcat caaatgaaac 1020 tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat 1080 gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg 1140 attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta 1200 tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa aagcttatgc 1260 atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca 1320 tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg 1380 ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca 1440 tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc tgttttgccg 1500 gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc 1560 ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg 1620 gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat 1680 cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa 1740 tcagcatcca tgttggaatt taatcgcggc ctcgaaacgt gagtcttttc cttacccatg 1800 gttgtttatg ttcggatgtg atgtgagaac tgtatcctag caagatttta aaaggaagta 1860 tatgaaagaa gaacctcagt ggcaaatcct aaccttttat atttctctac aggggcgcgg 1920 cgtggggaca attcaacgcg tctgtgaggg gagcgtttcc ctgctcgcag gtctgcagcg 1980 aggagccgta atttttgctt cgcgccgtgc ggccatcaaa atgtatggat gcaaatgatt 2040 atacatgggg atgtatgggc taaatgtacg ggcgacagtc acatcatgcc cctgagctgc 2100 gcacgtcaag actgtcaagg agggtattct gggcctccat gtcgctggcc gggtgacccg 2160 gcggggacga ggcaagctaa acagatctga tcttgaaact gagtaagatg ctcagaatac 2220 ccgtcaagat aagagtataa tgtagagtaa tataccaagt attcagcata ttctcctctt 2280 cttttgtata aatcacggaa gggatgattt ataagaaaaa tgaatactat tacacttcat 2340 ttaccaccct ctgatctaga ttttccaacg atatgtacgt agtggtataa ggtgaggggg 2400 tccacagata taacatcgtt taatttagta ctaacagaga cttttgtcac aactacatat 2460 aagtgtacaa atatagtaca gatatgacac acttgtagcg ccaacgcgca tcctacggat 2520 tgctgacaga aaaaaaggtc acgtgaccag aaaagtcacg tgtaattttg taactcaccg 2580 cattctagcg gtccctgtcg tgcacactgc actcaacacc ataaacctta gcaacctcca 2640 aaggaaatca ccgtataaca aagccacagt tttacaactt agtctcttat gaagttactt 2700 accaatgaga aatagaggct ctttctcgag aaatatgaat atggatatat atatatatat 2760 atatatatat atatatatat gtaaacttgg ttctttttta gcttgtgatc tctagcttgg 2820 gtctctctct gtcgtaacag ttgtgatatc ggaagaagag aaaagacgaa gagcagaagc 2880 ggaaaacgta tacacgtcac atatcacaca cacacaatgg gaaagctatt acaattggca 2940 ttgcatccgg tcgagatgaa ggcagctttg aagctgaagt tttgcagaac accgctattc 3000 tccatctatg atcagtccac gtctccatat ctcttgcact gtttcgaact gttgaacttg 3060 acctccagat cgtttgctgc tgtgatcaga gagctgcatc cagaattgag aaactgtgtt 3120 actctctttt atttgatttt aagggctttg gataccatcg aagacgatat gtccatcgaa 3180 cacgatttga aaattgactt gttgcgtcac ttccacgaga aattgttgtt aactaaatgg 3240 agtttcgacg gaaatgcccc cgatgtgaag gacagagccg ttttgacaga tttcgaatcg 3300 attcttattg aattccacaa attgaaacca gaatatcaag aagtcatcaa ggagatcacc 3360 gagaaaatgg gtaatggtat ggccgactac atcttagatg aaaattacaa cttgaatggg 3420 ttgcaaaccg tccacgacta cgacgtgtac tgtcactacg tagctggttt ggtcggtgat 3480 ggtttgaccc gtttgattgt cattgccaag tttgccaacg aatctttgta ttctaatgag 3540 caattgtatg aaagcatggg tcttttccta caaaaaacca acatcatcag agattacaat 3600 gaagatttgg tcgatggtag atccttctgg cccaaggaaa tctggtcaca atacgctcct 3660 cagttgaagg acttcatgaa acctgaaaac gaacaactgg ggttggactg tataaaccac 3720 ctcgtcttaa acgcattgag tcatgttatc gatgtgttga cttatttggc cggtatccac 3780 gagcaatcca ctttccaatt ttgtgccatt ccccaagtta tggccattgc aaccttggct 3840 ttggtattca acaaccgtga agtgctacat ggcaatgtaa agattcgtaa gggtactacc 3900 tgctatttaa ttttgaaatc aaggactttg cgtggctgtg tcgagatttt tgactattac 3960 ttacgtgata tcaaatctaa attggctgtg caagatccaa atttcttaaa attgaacatt 4020 caaatctcca agatcgaaca gtttatggaa gaaatgtacc aggataaatt acctcctaac 4080 gtgaagccaa atgaaactcc aattttcttg aaagttaaag aaagatccag atacgatgat 4140 gaattggttc caacccaaca agaagaagag tacaagttca atatggtttt atctatcatc 4200 ttgtccgttc ttcttgggtt ttattatata tacactttac acagagcgtg aagtctgcgc 4260 caaataacat aaacaaacaa ctccgaacaa taactaagta cttacataat aggtagaggc 4320 ctatccttaa agataacctt atatttcatt acatcaacta attcgacctt attatctttc 4380 gaattgaaat gcattatacc catcggtacg tctagctttg tcaccttccc cagtaaacgc 4440 tgtttcttgc cgacaaacaa tgtggccctc tctccgtcaa tctgtaacga cccaaatcgt 4500 attaaagttt cgccgtcctg ttcactgaac cttccctcat ttggagaatc tctcctcgcc 4560 agcgacgcaa agtccttagg caactctagt tcaccttgaa tctccagcat catcatccca 4620 agcggtgtta tcaccgtggt ctgcttttct cttgactgtg tcaacttctg ccattgacta 4680 gcatctatat ctacactagg cattcttttc agctgtttat tgggctgaat gatagtgata 4740 attctttttt ctatcactcc tttggctata ttagtggtta gcttactaaa aaagattaaa 4800 ggaaaaatga aattcaagat gctaacgttg acatgtatat tttaagaaaa caaaaatcat 4860 acaaagagga gatcggatat aaaagaataa cataaatatg tttagtgcat taggtaaatg 4920 ggtccgaggc tctcgcaatg ataaggactt tgtgacgaag tataccgcag atttatcaca 4980 aataacttca cagatccatc aattagatgt cgcgttaaag aaaagccaat ccatcttgag 5040 tcaatggcaa tcaaatctga ccttttatgg tattgcgtta acggtattgg ccctgagcta 5100 cacatattgg gagtaccatg gttatcgacc ataccttgtg gtgactgcgc tactatgcat 5160 aggctcgcta atcttgttca aatgggcatt aaccaaactc tatgcatttt ataacaacaa 5220 taggttacgc aagttggcaa aactccgtgc a 5251 <210> 15 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer 61-67-CPK066-G <400> 15 ggtaagacgg ttgggtttta tcttttgcag ttggtactat taagaacaat cacaggaaac 60 agctatgacc 70 <210> 16 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer 61-67-CPK067-G <400> 16 ttgcgttttg tactttggtt cgctcaattt tgcaggtaga taatcgaaaa gttgtaaaac 60 gacggccagt 70 <210> 17 <211> 4162 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i32 <400> 17 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360 ttgggtgcct ctatgatggg tatggcttgg gcaagtgtct ttttatgtat cgtggaattt 420 atcctgctgg tcttctggtc tgttagggca aggttggcct ctacttactc catcgacaat 480 tcaagataca gaacctcctc cagatggaat cccttccata gagagaagga gcaagcaact 540 gacccaatat tgactgccac tggacctgaa gacatgcaac aaagtgcaag catagtgggg 600 ccttcttcca atgctaatcc ggtcactgcc actgctgcta cggaaaacca acctaaaggt 660 attaacttct tcactataag aaaatcacac gagcgcccgg acgatgtctc tgtttaaatg 720 gcgcaagttt tccgctttgt aatatatatt tatacccctt tcttctctcc cctgcaatat 780 aatagtttaa ttctaatatt aataatatcc tatattttct tcatttaccg gcgcactctc 840 gcccgaacga cctcaaaatg tctgctacat tcataataac caaaagctca taactttttt 900 ttttgaacct gaatatatat acatcacata tcactgctgg tccttgccga ccagcgtata 960 caatctcgat agttggtttc ccgttctttc cactcccgtc cacaggaaac agctatgacc 1020 atgattacgc caagctattt aggtgacact atagaatact caagctatgc atcaagcttg 1080 gtaccgagct cggatccact agtaacggcc gccagtgtgc tggaattcgc cctgtcgaca 1140 ctagtaatac acatcatcgt cctacaagtt catcaaagtg ttggacagac aactatacca 1200 gcatggatct cttgtatcgg ttcttttctc ccgctctctc gcaataacaa tgaacactgg 1260 gtcaatcata gcctacacag gtgaacagag tagcgtttat acagggttta tacggtgatt 1320 cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa aatttttctt tccaacgcta 1380 gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt tctgagagtt ccctttttca 1440 tatatcgaat tttgaatata aaaggagatc gaaaaaattt ttctattcaa tctgttttct 1500 ggttttattt gatagttttt ttgtgtatta ttattatgga ttagtactgg tttatatggg 1560 tttttctgta taacttcttt ttattttagt ttgtttaatc ttattttgag ttacattata 1620 gttccctaac tgcaagagaa gtaacattaa aaatgaaaaa gcctgaactc accgcgacgt 1680 ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg cagctctcgg 1740 agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg 1800 taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac tttgcatcgg 1860 ccgcgctccc gattccggaa gtgcttgaca ttggggaatt cagcgagagc ctgacctatt 1920 gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg 1980 ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc tgcggccgat cttagccaga 2040 cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca tggcgtgatt 2100 tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg gacgacaccg 2160 tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag gactgccccg 2220 aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg gacaatggcc 2280 gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg 2340 ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg cgctacttcg 2400 agcggaggca tccggagctt gcaggatcgc cgcggctccg ggcgtatatg ctccgcattg 2460 gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca gcttgggcgc 2520 agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt acacaaatcg 2580 cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc gatagtggaa 2640 accgacgccc cagcactcgt ccgagggcaa aggaataggt ttaacttgat actactagat 2700 tttttctctt catttataaa atttttggtt ataattgaag ctttagaagt atgaaaaaat 2760 cctttttttt cattctttgc aaccaaaata agaagcttct tttattcatt gaaatgatga 2820 atataaacct aacaaaagaa aaagactcga atatcaaaca ttaaaaaaaa ataaaagagg 2880 ttatctgttt tcccatttag ttggagtttg cattttctaa tagatagaac tctcaattaa 2940 tgtggattta gtttctctgt tcgttttttt ttgttttgtt ctcactgtat ttacatttct 3000 atttagtatt tagttattca tataatctta acttctcgag gagctctaag ggcgaattct 3060 gcagatatcc atcacactgg cggccgctcg agcatgcatc tagagggccc aattcgccct 3120 atagtgagtc gtattacaat tcactggccg tcgttttaca acaagcatct tgccctgtgc 3180 ttggccccca gtgcagcgaa cgttataaaa acgaatactg agtatatatc tatgtaaaac 3240 aaccatatca tttcttgttc tgaactttgt ttacctaact agttttaaat ttcccttttt 3300 cgtgcatgcg ggtgttctta tttattagca tactacattt gaaatatcaa atttccttag 3360 tagaaaagtg agagaaggtg cactgacaca aaaaataaaa tgctacgtat aactgtcaaa 3420 actttgcagc agcgggcatc cttccatcat agcttcaaac atattagcgt tcctgatctt 3480 catacccgtg ctcaaaatga tcaaacaaac tgttattgcc aagaaataaa cgcaaggctg 3540 ccttcaaaaa ctgatccatt agatcctcat atcaagcttc ctcatagaac gcccaattac 3600 aataagcatg ttttgctgtt atcaccgggt gataggtttg ctcaaccatg gaaggtagca 3660 tggaatcata atttggatac taatacaaat cggccatata atgccattag taaattgcgc 3720 tcccatttag gtggttctcc aggaatacta ataaatgcgg tgcatttgca aaatgaattt 3780 attccaaggc caaaacaaca cgatgaatgg ctttattttt ttgttattcc tgacatgaag 3840 ctttatgtaa ttaaggaaac ggacatcgag gaatttgcat cttttttaga tgaaggagct 3900 attcaagcac caaagctatc cttccaggat tatttaagcg gtaaggccaa ggcttcccaa 3960 caggttcatg aagtgcatca tagaaagctt acaaggtttc agggtgaaac ttttctaaga 4020 gattggaact tagtctgtgg gcattataag agagatgcta agtgtggaga aatgggaccc 4080 gacataattg cagcatttca agatgaaaag ctttttcctg agaataatct agccttaatt 4140 tctcatattg ggggtcatat tt 4162 <210> 18 <211> 7879 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i33 <220> <221> misc_feature <222> (270)..(270) <223> n is a, c, g, or t <400> 18 atgaattggc cagttttttc caattatgga acgcctgttc ctgatccacg gcctgcactt 60 gcgaccacaa ttccacacct gaggcgcctg cctcttttcc agcatgtggc aactgtcccc 120 acgacagggc atcccagaat cctctggtaa atcttaaatg aaactgacgc gtggcagtag 180 attccaacaa tggtgggatg gcccgtggga aagtcgtgta gtgctcatac gcatcatatg 240 acatggatga tacggccggg tcaaacggtn cgattgcagt tggaatgcaa atgagagtag 300 cagatcattg ttgggcagcg gcttcaacac cagtgcttcg tcgtacggat accataaact 360 gtcatttata ccaatctgcg acaccgtgtc ttctgcgaac acacccagca gtagagtgcc 420 cagcatgaaa taggccagtg tgaggatcat cgtcgtcttg cctatgcttt gtttgctttg 480 aacacttgtt tccgctctcc ttttacttat tggctactaa aactacgtgt aaaagatcgc 540 ccagcgcaaa aaggtccggc ggtttcaaat aatctcgaac tattcctata atatgcaaaa 600 tagtaggtag gaacaagtca actctaggca gataacgaag atgtccggta aatggagact 660 agtgctgact gggataggca atccagagcc tcagtacgct ggcacccgtc acaatgtagg 720 gctatatatg ctggagctgc tacgaaagcg gcttggtctg caggggagaa cttattcccc 780 tgtgcctaat acgggcggca aagtgcatta tatagaagac gaacattgta cgatactaag 840 atcggatggc cagtacatga atctaagtgg agaacaggtg tgcaaggtct gggcccggta 900 cgccaagtac caagcccgac acgttgttat tcatgacgag ttaagtgtgg cgtgtggaaa 960 agtgcagctc agagccccca gcaccagtat tagaggtcat aatgggctgc gaagcctgct 1020 aaaatgcagt ggaggccgtg taccctttgc caaattggct attggaatcg gcagagaacc 1080 tgggtcccgt tctagagacc ctgcgagcgt gtcccggtgg gttctgggag ctctaactcc 1140 gcaggaacta caaaccttgc ttacacagag tgaacctgct gcctggcgtg ctctgactca 1200 gtacatttca taggacagca ttcgcccagt atttttttta ttctacaaac cttctataat 1260 ttcaaagtat ttacataatt ctgtatcagt ttaatcacca taatatcgtt ttctttgttt 1320 agtgcaatta atttttccta ttgttacttc gggccttttt ctgttttatg agctattttt 1380 tccgtcatcc ttccggatcc agattttcag cttcatctcc agattgtgtc tacgtaatgc 1440 acgccatcat tttaagagag gacagagaag caagcctcct gaaagatgaa gctactgtct 1500 tctatcgaac aagcatgcga tatttgccga cttaaaaagc tcaagtgctc caaagaaaaa 1560 ccgaagtgcg ccaagtgtct gaagaacaac tgggagtgtc gctactctcc caaaaccaaa 1620 aggtctccgc tgactagggc acatctgaca gaagtggaat caaggctaga aagactggaa 1680 cagctatttc tactgatttt tcctcgagaa gaccttgaca tgattttgaa aatggattct 1740 ttacaggata taaaagcatt gttaacagga ttatttgtac aagataatgt gaataaagat 1800 gccgtcacag atagattggc ttcagtggag actgatatgc ctctaacatt gagacagcat 1860 agaataagtg cgacatcatc atcggaagag agtagtaaca aaggtcaaag acagttgact 1920 gtatcgattg actcggcagc tcatcatgat aactccacaa ttccgttgga ttttatgccc 1980 agggatgctc ttcatggatt tgattggtct gaagaggatg acatgtcgga tggcttgccc 2040 ttcctgaaaa cggaccccaa caataatggg ttctttggcg acggttctct cttatgtatt 2100 cttcgatcta ttggctttaa accggaaaat tacacgaact ctaacgttaa caggctcccg 2160 accatgatta cggatagata cacgttggct tctagatcca caacatcccg tttacttcaa 2220 agttatctca ataattttca cccctactgc cctatcgtgc actcaccgac gctaatgatg 2280 ttgtataata accagattga aatcgcgtcg aaggatcaat ggcaaatcct ttttaactgc 2340 atattagcca ttggagcctg gtgtatagag ggggaatcta ctgatataga tgttttttac 2400 tatcaaaatg ctaaatctca tttgacgagc aaggtcttcg agtcaggttc cataattttg 2460 gtgacagccc tacatcttct gtcgcgatat acacagtgga ggcagaaaac aaatactagc 2520 tataattttc acagcttttc cataagaatg gccatatcat tgggcttgaa tagggacctc 2580 ccctcgtcct tcagtgatag cagcattctg gaacaaagac gccgaatttg gtggtctgtc 2640 tactcttggg agatccaatt gtccctgctt tatggtcgat ccatccagct ttctcagaat 2700 acaatctcct tcccttcttc tgtcgacgat gtgcagcgta ccacaacagg tcccaccata 2760 tatcatggca tcattgaaac agcaaggctc ttacaagttt tcacaaaaat ctatgaacta 2820 gacaaaacag taactgcaga aaaaagtcct atatgtgcaa aaaaatgctt gatgatttgt 2880 aatgagattg aggaggtttc gagacaggca ccaaagtttt tacaaatgga tatttccacc 2940 accgctctaa ccaatttgtt gaaggaacac ccttggctat cctttacaag attcgaactg 3000 aagtggaaac agttgtctct tatcatttat gtattaagag attttttcac taattttacc 3060 cagaaaaagt cacaactaga acaggatcaa aatgatcatc aaagttatga agttaaacga 3120 tgctccatca tgttaagcga tgcagcacaa agaactgtta tgtctgtaag tagctatatg 3180 gacaatcata atgtcacccc atattttgcc tggaattgtt cttattactt gttcaatgca 3240 gtcctagtac ccataaagac tctactctca aactcaaaat cgaatgctga gaataacgag 3300 accgcacaat tattacaaca aattaacact gttctgatgc tattaaaaaa actggccact 3360 tttaaaatcc agacttgtga aaaatacatt caagtactgg aagaggtatg tgcgccgttt 3420 ctgttatcac agtgtgcaat cccattaccg catatcagtt ataacaatag taatggtagc 3480 gccattaaaa atattgtcgg ttctgcaact atcgcccaat accctactct tccggaggaa 3540 aatgtcaaca atatcagtgt taaatatgtt tctcctggct cagtagggcc ttcacctgtg 3600 ccattgaaat caggagcaag tttcagtgat ctagtcaagc tgttatctaa ccgtccaccc 3660 tctcgtaact ctccagtgac aataccaaga agcacacctt cgcatcgctc agtcacgcct 3720 tttctagggc aacagcaaca gctgcaatca ttagtgccac tgaccccgtc tgctttgttt 3780 ggtggcgcca attttaatca aagtgggaat attgctgata gctcattgtc cttcactttc 3840 actaacagta gcaacggtcc gaacctcata acaactcaaa caaattctca agcgctttca 3900 caaccaattg cctcctctaa cgttcatgat aacttcatga ataatgaaat cacggctagt 3960 aaaattgatg atggtaataa ttcaaaacca ctgtcacctg gttggacgga ccaaactgcg 4020 tataacgcgt ttggaatcac tacagggatg tttaatacca ctacaatgga tgatgtatat 4080 aactatctat tcgatgatga agatacccca ccaaacccaa aaaaagagta aaatgaatcg 4140 tagatactga aaaaccccgc aagttcactt caactgtgca tcgtgcacca tctcaatttc 4200 tttcatttat acatcgtttt gccttctttt atgtaactat actcctctaa gtttcaatct 4260 tggccatgta acctctgatc tatagaattt tttaaatgac tagaattaat gcccatcttt 4320 tttttggacc taaattcttc atgaaaatat attacgaggg cttattcaga agcttcgctc 4380 agtcgacact agtaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 4440 ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 4500 aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 4560 cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 4620 caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 4680 ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 4740 tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 4800 tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 4860 acattatagt tccctaactg caagagaagt aacattaaaa atgaccactc ttgacgacac 4920 ggcttaccgg taccgcacca gtgtcccggg ggacgccgag gccatcgagg cactggatgg 4980 gtccttcacc accgacaccg tcttccgcgt caccgccacc ggggacggct tcaccctgcg 5040 ggaggtgccg gtggacccgc ccctgaccaa ggtgttcccc gacgacgaat cggacgacga 5100 atcggacgcc ggggaggacg gcgacccgga ctcccggacg ttcgtcgcgt acggggacga 5160 cggcgacctg gcgggcttcg tggtcgtctc gtactccggc tggaaccgcc ggctgaccgt 5220 cgaggacatc gaggtcgccc cggagcaccg ggggcacggg gtcgggcgcg cgttgatggg 5280 gctcgcgacg gagttcgccc gcgagcgggg cgccgggcac ctctggctgg aggtcaccaa 5340 cgtcaacgca ccggcgatcc acgcgtaccg gcggatgggg ttcaccctct gcggcctgga 5400 caccgccctg tacgacggca ccgcctcgga cggcgagcag gcgctctaca tgagcatgcc 5460 ctgcccctga gtttaacttg atactactag attttttctc ttcatttata aaatttttgg 5520 ttataattga agctttagaa gtatgaaaaa atcctttttt ttcattcttt gcaaccaaaa 5580 taagaagctt cttttattca ttgaaatgat gaatataaac ctaacaaaag aaaaagactc 5640 gaatatcaaa cattaaaaaa aaataaaaga ggttatctgt tttcccattt agttggagtt 5700 tgcattttct aatagataga actctcaatt aatgtggatt tagtttctct gttcgttttt 5760 ttttgttttg ttctcactgt atttacattt ctatttagta tttagttatt catataatct 5820 taacttctcg aggagctcga tcttgaaact gagtaagatg ctcagaatac ccgtcaagat 5880 aagagtataa tgtagagtaa tataccaagt attcagcata ttctcctctt cttttgtata 5940 aatcacggaa gggatgattt ataagaaaaa tgaatactat tacacttcat ttaccaccct 6000 ctgatctaga ttttccaacg atatgtacgt agtggtataa ggtgaggggg tccacagata 6060 taacatcgtt taatttagta ctaacagaga cttttgtcac aactacatat aagtgtacaa 6120 atatagtaca gatatgacac acttgtagcg ccaacgcgca tcctacggat tgctgacaga 6180 aaaaaaggtc acgtgaccag aaaagtcacg tgtaattttg taactcaccg cattctagcg 6240 gtccctgtcg tgcacactgc actcaacacc ataaacctta gcaacctcca aaggaaatca 6300 ccgtataaca aagccacagt tttacaactt agtctcttat gaagtgtctc tctctgtcgt 6360 aacagttgtg atatcggaag aagagaaaag acgaagagca gaagcggaaa acgtatacac 6420 gtcacatatc acacacacac aatgggaaag ctattacaat tggcattgca tccggtcgag 6480 atgaaggcag ctttgaagct gaagttttgc agaacaccgc tattctccat ctatgatcag 6540 tccacgtctc catatctctt gcactgtttc gaactgttga acttgacctc cagatcgttt 6600 gctgctgtga tcagagagct gcatccagaa ttgagaaact gtgttactct cttttatttg 6660 attttaaggg ctttggatac catcgaagac gatatgtcca tcgaacacga tttgaaaatt 6720 gacttgttgc gtcacttcca cgagaaattg ttgttaacta aatggagttt cgacggaaat 6780 gcccccgatg tgaaggacag agccgttttg acagatttcg aatcgattct tattgaattc 6840 cacaaattga aaccagaata tcaagaagtc atcaaggaga tcaccgagaa aatgggtaat 6900 ggtatggccg actacatctt ggatgaaaat tacaacttga atgggttgca aaccgtccac 6960 gactacgacg tgtactgtca ctacgtagct ggtttggtcg gtgatggttt gacccgtttg 7020 attgtcattg ccaagtttgc caacgaatct ttgtattcta atgagcaatt gtatgaaagc 7080 atgggtcttt tcctacaaaa aaccaacatc atcagagact acaatgaaga tttggtcgat 7140 ggtagatcct tctggcccaa ggaaatctgg tcacaatacg ctcctcagtt gaaggacttc 7200 atgaaacctg aaaacgaaca actggggttg gactgtataa accacctcgt cttaaacgca 7260 ttgagtcatg ttatcgatgt gttgacttat ttggccagta tccacgagca atccactttc 7320 caattttgtg ccattcccca agttatggcc attgcaacct tggctttggt attcaacaac 7380 cgtgaagtgc tacatggcaa tgtaaagatt cgtaagggta ctacctgcta tttaattttg 7440 aaatcaagga ctttgcgtgg ctgtgtcgag atttttgact attacttacg tgatatcaaa 7500 tctaaattgg ctgtgcaaga tccaaatttc ttaaaattga acattcaaat ctccaagatc 7560 gaacaattca tggaagaaat gtaccaggat aaattacctc ctaacgtgaa gccaaatgaa 7620 actccaattt tcttgaaagt taaagaaaga tccagatacg atgatgaatt ggtcccaacc 7680 caacaagaag aagagtacaa gttcaatatg gttttatcta tcatcttgtc cgttcttctt 7740 gggttttatt atatatacac tttacacaga gcgtgaagtc tgcgccaaat aacataaaca 7800 aacaactccg aacaataact aagtacttac ataataggta gaggcctatc cttaaagata 7860 accttatatt tcattacat 7879 <210> 19 <211> 5714 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i37 <400> 19 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360 ttgggtgcct ctatgatggg tttaaacgta tggcttgggc aagtgtcttt ttatgtatcg 420 tggaatttat cctgctggtc ttctggtctg ttagggcaag gttggcctct acttactcca 480 tcgacaattc aagatacaga acctcctcca gatggaatcc cttccataga gagaaggagc 540 aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 600 tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 660 ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 720 tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 780 tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 840 gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 900 actttttttt ttgaacctga atatatatac atcacatatc actgctggtc ctgagaagtt 960 aagattatat gaataactaa atactaaata gaaatgtaaa tacagtgaga acaaaacaaa 1020 aaaaaacgaa cagagaaact aaatccacat taattgagag ttctatctat tagaaaatgc 1080 aaactccaac taaatgggaa aacagataac ctcttttatt tttttttaat gtttgatatt 1140 cgagtctttt tcttttgtta ggtttatatt catcatttca atgaataaaa gaagcttctt 1200 attttggttg caaagaatga aaaaaaagga ttttttcata cttctaaagc ttcaattata 1260 accaaaaatt ttataaatga agagaaaaaa tctagtagta tcaagttaaa cttagaaaaa 1320 ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa taccatattt 1380 ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc ataggatggc 1440 aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac ctattaattt 1500 cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga ctgaatccgg 1560 tgagaatggc aaaagcttat gcatttcttt ccagacttgt tcaacaggcc agccattacg 1620 ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt gcgcctgagc 1680 gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg aatgcaaccg 1740 gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat attcttctaa 1800 tacctggaat gctgttttgc cggggatcgc agtggtgagt aaccatgcat catcaggagt 1860 acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt ttagtctgac 1920 catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa acaactctgg 1980 cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga cattatcgcg 2040 agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg gcctcgaaac 2100 gtgagtcttt tccttaccca tttttaatgt tacttctctt gcagttaggg aactataatg 2160 taactcaaaa taagattaaa caaactaaaa taaaaagaag ttatacagaa aaacccatat 2220 aaaccagtac taatccataa taataataca caaaaaaact atcaaataaa accagaaaac 2280 agattgaata gaaaaatttt ttcgatctcc ttttatattc aaaattcgat atatgaaaaa 2340 gggaactctc agaaaatcac caaatcaatt taattagatt tttcttttcc ttctagcgtt 2400 ggaaagaaaa atttttcttt ttttttttag aaatgaaaaa tttttgccgt aggaatcacc 2460 gtataaaccc tgtataaacg ctactctgtt cacctgtgta ggctatgatt gacccagtgt 2520 tcattgttat tgcgagagag cgggagaaaa gaaccgatac aagagatcca tgctggtata 2580 gttgtctgtc caacactttg atgaacttgt aggacgatga tgtgtattac tagtgtcgac 2640 accatataca tatccatatc taatcttact tatatgttgt ggaaatgtaa agagccccat 2700 tatcttagcc taaaaaaacc ttctctttgg aactttcagt aatacgctta actgctcatt 2760 gctatattga agtacggatt agaagccgcc gagcgggcga cagccctccg acggaagact 2820 ctcctccgtg cgtcctggtc ttcaccggtc gcgttcctga aacgcagatg tgcctcgcgc 2880 cgcactgctc cgaacaataa agattctaca atactagctt ttatggttat gaagaggaaa 2940 aattggcagt aacctggccc cacaaacctt caaatcaacg aatcaaatta acaaccatag 3000 gataataatg cgattagttt tttagcctta tttctggggt aattaatcag cgaagcgatg 3060 atttttgatc tattaacaga tatataaatg caaaagctgc ataaccactt taactaatac 3120 tttcaacatt ttcggtttgt attacttctt attcaaatgt cataaaagta tcaacaaaaa 3180 attgttaata tacctctata ctttaacgtc aaggagaaaa aactataatg tcattaccgt 3240 tcttaacttc tgcaccggga aaggttatta tttttggtga acactctgct gtgtacaaca 3300 agcctgccgt cgctgctagt gtgtctgcgt tgagaaccta cctgctaata agcgagtcat 3360 ctgcaccaga tactattgaa ttggacttcc cggacattag ctttaatcat aagtggtcca 3420 tcaatgattt caatgccatc accgaggatc aagtaaactc ccaaaaattg gccaaggctc 3480 aacaagccac cgatggcttg tctcaggaac tcgttagtct tttggatccg ttgttagctc 3540 aactatccga atccttccac taccatgcag cgttttgttt cctgtatatg tttgtttgcc 3600 tatgccccca tgccaagaat attaagtttt ctttaaagtc tactttaccc atcggtgctg 3660 ggttgggctc aagcgcctct atttctgtat cactggcctt agctatggcc tacttggggg 3720 ggttaatagg atctaatgac ttggaaaagc tgtcagaaaa cgataagcat atagtgaatc 3780 aatgggcctt cataggtgaa aagtgtattc acggtacccc ttcaggaata gataacgctg 3840 tggccactta tggtaatgcc ctgctatttg aaaaagactc acataatgga acaataaaca 3900 caaacaattt taagttctta gatgatttcc cagccattcc aatgatccta acctatacta 3960 gaattccaag gtctacaaaa gatcttgttg ctcgcgttcg tgtgttggtc accgagaaat 4020 ttcctgaagt tatgaagcca attctagatg ccatgggtga atgtgcccta caaggcttag 4080 agatcatgac taagttaagt aaatgtaaag gcaccgatga cgaggctgta gaaactaata 4140 atgaactgta tgaacaacta ttggaattga taagaataaa tcatggactg cttgtctcaa 4200 tcggtgtttc tcatcctgga ttagaactta ttaaaaatct gagcgatgat ttgagaattg 4260 gctccacaaa acttaccggt gctggtggcg gcggttgctc tttgactttg ttacgaagag 4320 acattactca agagcaaatt gacagtttca aaaagaaatt gcaagatgat tttagttacg 4380 agacatttga aacagacttg ggtgggactg gctgctgttt gttaagcgca aaaaatttga 4440 ataaagatct taaaatcaaa tccctagtat tccaattatt tgaaaataaa actaccacaa 4500 agcaacaaat tgacgatcta ttattgccag gaaacacgaa tttaccatgg acttcataag 4560 ctaatttgcg ataggcatta tttattagtt gtttttaatc ttaactgtgt atgaagtttt 4620 atgtaataaa gatagaaaga gaaacaaaaa aaaatttttc gtagtatcaa ttcagctttc 4680 gaagacagaa tgaaatttaa gcagaccatc atcttgccct gtgcttggcc cccagtgcag 4740 cgaacgttat aaaaacgaat actgagtata tatctatgta aaacaaccat atcatttctt 4800 gttctgaact ttgtttacct aactagtttt aaatttccct ttttcgtgca tgcgggtgtt 4860 cttatttatt agcatactac atttgaaata tcaaatttcc ttagtagaaa agtgagagaa 4920 ggtgcactga cacaaaaaat aaaatgctac gtataactgt caaaactttg cagcagcggg 4980 catccttcca tcatagcttc aaacatatta gcgttcctga tcttcatacc cgtgctcaaa 5040 atgatcaaac aaactgttat tgccaagaaa taaacgcaag gctgccttca aaaactgatc 5100 cattagatcc tcatatcaag cttcctcata gaacgcccaa ttacaataag catgttttgc 5160 tgttatcacc gggtgatagg tttgctcaac catggaaggt agcatggaat cataatttgg 5220 atactaatac aaatcggcca tataatgcca ttagtaaatt gcgctcccat ttaggtggtt 5280 ctccaggcaa atttgaatac taataaatgc ggtgcatttg caaaatgaat ttattccaag 5340 gccaaaacaa cacgatgaat ggctttattt ttttgttatt cctgacatga agctttatgt 5400 aattaaggaa acggacatcg aggaatttgc atctttttta gatgaaggag ctattcaagc 5460 accaaagcta tccttccagg attatttaag cggtaaggcc aaggcttccc aacaggttca 5520 tgaagtgcat catagaaagc ttacaaggtt tcagggtgaa acttttctaa gagattggaa 5580 cttagtctgt gggcattata agagagatgc taagtgtgga gaaatgggac ccgacataat 5640 tgcagcattt caagatgaaa agctttttcc tgagaataat ctagccttaa tttctcatat 5700 tgggggtcat attt 5714 <210> 20 <211> 7688 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i301 <400> 20 gacggcacgg ccacgcgttt aaaccgccga gctattcgcg gaacattcta gctcgtttgc 60 atcttcttgc atttggtagg ttttcaatag ttcggtaata ttaacggata cctactatta 120 tcccctagta ggctcttttc acggagaaat tcgggagtgt tttttttccg tgcgcatttt 180 cttagctata ttcttccagc ttcgcctgct gcccggtcat cgttcctgtc acgtagtttt 240 tccggattcg tccggctcat ataataccgc aataaacacg gaatatctcg ttccgcggat 300 tcggttaaac tctcggtcgc ggattatcac agagaaagct tcgtggagaa tttttccaga 360 ttttccgctt tccccgatgt tggtatttcc ggaggtcatt atactgaccg ccattataat 420 gactgtacaa cgaccttctg gagaaagaaa caactcaata acgatgtggg acattggggg 480 cccactcaaa aaatctgggg actatatccc cagagaattt ctccagaaga gaagaaaagt 540 caaagttttt tttcgcttgg gggttgcata taaagctcac acgcggccag ggggagccat 600 gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag 660 cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt 720 aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg 780 ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg 840 ggaattcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca 900 agacctgcct gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc 960 gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat 1020 cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca 1080 ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct 1140 gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc 1200 caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat 1260 gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg 1320 tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg 1380 gctccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg 1440 caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc 1500 cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg 1560 tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga 1620 atagcgctcg tccaacgccg gcggacctcg ctcgtccaac gccggcggac ctcttttaat 1680 tctgctgtaa cccgtacatg cccaaaatag ggggcgggtt acacagaata tataacatcg 1740 taggtgtctg ggtgaacagt ttattcctgg catccactaa atataatgga gcccgctttt 1800 taagctggca tccagaaaaa aaaagaatcc cagcaccaaa atattgtttt cttcaccaac 1860 catcagttca taggtccatt ctcttagcgc aactacagag aacaggggca caaacaggca 1920 aaaaacgggc acaacctcaa tggagtgatg caacctgcct ggagtaaatg atgacacaag 1980 gcaattgacc cacgcatgta tctatctcat tttcttacac cttctattac cttctgctct 2040 ctctgatttg gaaaaagctg aaaaaaaagg ttgaaaccag ttccctgaaa ttattcccct 2100 acttgactaa taagtatata aagacggtag gtattgattg taattctgta aatctatttc 2160 ttaaacttct taaattctac ttttatagtt agtctttttt ttagttttaa aacaccaaga 2220 acttagtttc gatccccgcg tgcttggccg gccgtatccc cgcgtgcttg gccggccgta 2280 tgtctcagaa cgtttacatt gtatcgactg ccagaacccc aattggttca ttccagggtt 2340 ctctatcctc caagacagca gtggaattgg gtgctgttgc tttaaaaggc gccttggcta 2400 aggttccaga attggatgca tccaaggatt ttgacgaaat tatttttggt aacgttcttt 2460 ctgccaattt gggccaagct ccggccagac aagttgcttt ggctgccggt ttgagtaatc 2520 atatcgttgc aagcacagtt aacaaggtct gtgcatccgc tatgaaggca atcattttgg 2580 gtgctcaatc catcaaatgt ggtaatgctg atgttgtcgt agctggtggt tgtgaatcta 2640 tgactaacgc accatactac atgccagcag cccgtgcggg tgccaaattt ggccaaactg 2700 ttcttgttga tggtgtcgaa agagatgggt tgaacgatgc gtacgatggt ctagccatgg 2760 gtgtacacgc agaaaagtgt gcccgtgatt gggatattac tagagaacaa caagacaatt 2820 ttgccatcga atcctaccaa aaatctcaaa aatctcaaaa ggaaggtaaa ttcgacaatg 2880 aaattgtacc tgttaccatt aagggattta gaggtaagcc tgatactcaa gtcacgaagg 2940 acgaggaacc tgctagatta cacgttgaaa aattgagatc tgcaaggact gttttccaaa 3000 aagaaaacgg tactgttact gccgctaacg cttctccaat caacgatggt gctgcagccg 3060 tcatcttggt ttccgaaaaa gttttgaagg aaaagaattt gaagcctttg gctattatca 3120 aaggttgggg tgaggccgct catcaaccag ctgattttac atgggctcca tctcttgcag 3180 ttccaaaggc tttgaaacat gctggcatcg aagacatcaa ttctgttgat tactttgaat 3240 tcaatgaagc cttttcggtt gtcggtttgg tgaacactaa gattttgaag ctagacccat 3300 ctaaggttaa tgtatatggt ggtgctgttg ctctaggtca cccattgggt tgttctggtg 3360 ctagagtggt tgttacactg ctatccatct tacagcaaga aggaggtaag atcggtgttg 3420 ccgccatttg taatggtggt ggtggtgctt cctctattgt cattgaaaag atatgattac 3480 gttctgcgat tttctcatga tctttttcat aaaatacata aatatataaa tggctttatg 3540 tataacaggc ataatttaaa gttttatttg cgattcatcg tttttcaggt actcaaacgc 3600 tgaggtgtgc cttttgactt acttttccgc cttggcaagc tggccgggtg atacttgcac 3660 aagttccact aattactgac atttgtggta ttaactcgtt tgactgctct acaattgtag 3720 gatgttaatc aatgtcttgg ctgcctaacc tgcaggccgc gagcgccgat atgctatgta 3780 atagacaata aaaccatgtt tatataaaaa aaattcaaaa tagaaaacga ttctgtacaa 3840 ggagtatttt ttttttgttc tagtgtgttt atattatcct tggctaagag gcactgcgta 3900 tacttcaagg tacccctgtg ttttgaaaaa aaacaacagt aaaataggaa ctccgcgagg 3960 ttcaggaacc tgaaacaaaa tcaataaaaa cattatatgc gtttcgaaca aaattaaaga 4020 aaaagaataa atatagatta aaaaaaaaaa gaagaaatta aaagaatttc tactaaatcc 4080 caattgttat atatttgtta aatgccaaaa aagtttataa aaaatttaga atgtataaat 4140 aataataaac taagtaacgc gatcgccgac gccgccgata tctccctcgc cagcggccgc 4200 cttatggcta agaatgttgg aattttggcc atggacatct acttcccacc aacttgtgtt 4260 cagcaggagg ctttagaagc acatgacgga gcctcaaagg gtaagtacac aatcggatta 4320 ggacaggatt gcttagcatt ctgcactgaa ttggaggacg tcatctcaat gtctttcaac 4380 gccgtcacct cattgttaga gaagtacaaa atcgacccaa accagatcgg aaggttggaa 4440 gtcggttctg aaaccgtcat cgacaagtct aaatcaatca agactttcgt tatgcagttg 4500 ttcgaaaagt gcggtaatac tgacgtcgag ggtgtagact ctactaacgc ttgttatggt 4560 ggtaccgcag ctttattgaa ctgcgtaaac tgggttgagt caaactcatg ggatggtagg 4620 tacggattag tcatttgcac cgattctgcc gtctacgccg agggtccagc aaggccaacc 4680 ggtggagctg cagctattgc tatgttaatc ggaccagatg cccctatagt cttcgagtct 4740 aagttgaggg gttcacacat ccctaacgtc tacgacttct acaagccaaa cttggcctca 4800 gagtatccag ttgtcgacgg aaagttatct cagacatgct acttgatggc cttagattca 4860 tgttacaagc acttatgcaa caagttcgaa aagttggagg gaaaggagtt ctcaattaac 4920 gacgccgact acttcgtttt tcactctcca tacaacaaat tggtccagaa gtcattcgcc 4980 aggttattgt acaacgattt tttgagaaac gcatcatcta tcgatgaggc cgccaaggag 5040 aaattcaccc catattcttc tttgtcattg gacgagtctt accagtctag ggacttggag 5100 aaggtatcac agcaattggc taaaaccttc tatgacgcca aagttcagcc aaccaccttg 5160 gtccctaaac aggtcggaaa tatgtatact gcatctttgt atgccgcctt tgcctctttg 5220 atccacaaca agcacaacga tttagtcgga aaaagggttg tcatgttttc ttacggtgcc 5280 ggatctactg ccactatgtt ctcattgagg ttatgcgaaa accagtcacc attttcattg 5340 tctaacatcg cctcagtcat ggacgtaggt gtctcacctg agaagttcgt agaaaccatg 5400 aagttgatgg agcacagata cggtgccaaa gaattcgtca cttcaaaaga gggaatcttg 5460 gatttgttgg ccccaggaac ctactatttg aaggaggtcg actctttgta cagaaggttc 5520 tatggaaaga agggagacga cggatctgtc gcaaacggtc agtaaatcgg cggcgtcggc 5580 gatcgcgtta aggcggccgc tggcgaggga gatatttcaa cctgggccta acagtaaaga 5640 tatcctcctc aaaactggtg cacttaatcg ctgaatttgt tctggcttct cttctttttc 5700 tttattcccc ccatgggcca aaaaaaatag tactatcagg aatttggcgc cgggtcacga 5760 tatacgtgta cagtgaccta ggcgacgcca caaggaaaaa ggaaaaaaac agaaaaaaca 5820 acaaaaacta aaacaaacac gaaaacttta atagatctaa gtgaagtagt ggtgaggcaa 5880 ttggagtgac atagcagcta ctacaactac aaaaaaggcg cgccacggtc gtgcggatat 5940 gaaagaggtc gttatagctt ctgccgtcag gaccgccatc ggatcttacg gtaagtcatt 6000 aaaggacgtc cctgccgttg atttaggagc caccgcaatt aaagaggccg ttaaaaaggc 6060 aggtataaag ccagaggacg tcaacgaggt catcttggga aatgtcttac aagccggatt 6120 aggtcaaaac ccagcaagac aagcatcatt caaagccggt ttacctgtcg agatacctgc 6180 aatgaccatc aacaaggttt gcggttcagg attaaggacc gtttctttag cagcacagat 6240 cattaaggct ggagatgcag acgttatcat tgctggtggt atggaaaaca tgtcaagagc 6300 cccatacttg gctaataacg ccaggtgggg atataggatg ggaaacgcca agtttgtcga 6360 cgaaatgatt actgacggat tgtgggacgc cttcaatgac tatcacatgg gtataaccgc 6420 agaaaacatt gccgagaggt ggaatatctc aagagaagaa caggatgagt ttgcattggc 6480 ctcacagaaa aaagcagagg aggcaataaa gtcaggtcag tttaaggatg aaatcgtccc 6540 agtcgtcatc aagggaagaa agggtgagac agttgtcgac accgacgaac accctagatt 6600 tggttcaacc atcgagggat tagcaaagtt gaagccagcc ttcaagaaag acggaaccgt 6660 aaccgccggt aatgcatctg gattgaacga ttgcgcagca gttttggtca taatgtcagc 6720 cgagaaagct aaggagttgg gtgtcaagcc attggcaaaa attgtttcat acggatcagc 6780 cggtgtcgac cctgccatca tgggttacgg acctttttac gccaccaagg ctgcaatcga 6840 aaaggccggt tggaccgtag atgaattgga tttgatcgag tcaaacgagg cctttgccgc 6900 ccaatcattg gctgtcgcca aggacttgaa gttcgacatg aacaaggtca acgtcaacgg 6960 tggtgccatc gcattgggtc accctatcgg agcctctggt gccaggatct tggttacctt 7020 ggtccacgcc atgcagaaga gggacgcaaa gaagggtttg gccaccttgt gcatcggtgg 7080 aggtcaggga acagctatct tgttagagaa atgcagcccc tcagcccccc tagcgtcgaa 7140 taaaagacat tggtacatga tatcaaacag aattttaaca tttcttgatc cagtttgtaa 7200 acaaaacaaa caatttttct accatttaac ttcataccat cggcgagagc cgaacaggaa 7260 aaaaaagaag tctccggtta tcgtaagcag tatcaaataa taagaatgta tgtgtgtgca 7320 atttgttata cccacgaaga agtgcgcagt agagttagaa aaccaactga gtaatcttta 7380 ctcccgacaa tcgtccaata atcctcttgt tgctaggaac gtgatgatgg atttcgtttg 7440 aaatccggac ggaaaactca aaagaagtcc aaccaccaac cattttcgag cctcaagaat 7500 ctctaagcag gtttctttac taaggggatg gcctttctgt cctggacatt ttttccttcc 7560 ttttttcatt tccttgaaag gaacagattt tttttgactt ttgccacaca gctgcactat 7620 ctcaacccct tttacatttt aagttttcgg gttgaatggc cggtgtttaa accccagcgc 7680 ctggcggg 7688 <210> 21 <211> 5025 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i476 <400> 21 caggatccga cggcacggcc acgcgtttaa accgcctggg ataggatagt agcaactctt 60 ggaggagagc attgtcagtt gtccagtctc tgaagttaag tagtaagttt gcggagtcaa 120 agggggatgg cttttgccat ttgtgagagt tgtgcggcag catcttattc aaatagagct 180 gtattctgaa gacctcttgt agaacatcat ccatactaaa aagtaaatcg tcctgtccca 240 ttacgagctg tattagtgct gtgaccctct gtatatttac gttgccatga agaaggtaat 300 gggcgatatt ttgatacaat tcctgagttg catgttggat tgagtttacg aagggtcgcc 360 agacggccag aaacctccag gcggagttaa caactagtaa tacggcatcc atgtttgcat 420 cagcgccgag cctataccag tcactgagta gacgttttct tgctcttttt atgtcctgac 480 ttcttttgac gagggggcat tctctagaga cacaggcagt tgcttccagc aactgccgta 540 cggccgttct catgctgtcg aggatttttt ttgggacgat attgtcatta tagggcagtg 600 tgtgacttat gaattgttgt agaaggacgt ctgtgatgtt ggagatatgt attttgttaa 660 ctcttcttga gacgatttgg ccctggatag cgaagcgtgc ggttacaaat aggtcgtctt 720 gttcaagaag gtaggcgagg acattatcta tcagtacaaa catcttagta gtgtctgagg 780 agagggttga ttgtttatgt atttttgcga aatatatata tatatattct acacagatat 840 atacatattt gtttttcggg ctcattcttt cttctttgcc agaggctcac cgctcaagag 900 gtccgctaat tctggagcga ttgttattgt tttttctttt cttcttctat tcgaaaccca 960 gtttttgatt tgaatgcgag ataaactggt attcttcatt agattctcta ggcccttggt 1020 atctagatat gggttctcga tgttctttgc aaaccaactt tctagtattc ggacattttc 1080 ttttgtaaac cggtgtcctc tgtaaggttt agtacttttg tttatcatat cttgagttac 1140 cacattaaat accaacccat ccgccgattt atttttctgt gtaagttgat aattacttct 1200 atcgttttct atgctgcgca tttctttgag taatacagta atggtagtag tgagttgaga 1260 tgttgtttgc aacaacttct tctcctcatc actaatctta cggtttttgt tggccctaga 1320 taagaatcct aatatatccc ttaattcaac ttcttcttct gttgttacac tctctggtaa 1380 cttaggtaaa ttacagcaaa tagaaaagag ctttttattt atgtctagta tgctggattt 1440 aaactcatct gtgatttgtg gatttaaaag gtctttaatg ggtattttat tcattttttc 1500 ttgcttatct tccttttttt cttgcccact tctaagctga tttcaatctc tcctttatat 1560 atatttttaa gttccaacat tttatgtttc aaaacattaa tgatgtctgg gttttgtttg 1620 ggatgcaatt tattgcttcc caatgtagaa aagtacatca tatgaaacaa cttaaactct 1680 taactacttc ttttaacctt cactttttat gaaatgtatc aaccatatat aataacttaa 1740 tagacgacat tcacaatatg tttacttcga agcctgcttt caaaattaag aacaaagcat 1800 ccaaatcata cagaaacaca gcggtttcaa aaaagctgaa agaaaaacgt ctagctgagc 1860 atgtgaggcc aagctgcttc aatattattc gaccactcaa gaaagatatc cagattcctg 1920 ttccttcctc tcgattttta aataaaatcc aaattcacag gatagcgtct ggaagtcaaa 1980 atactcagtt tcgacagttc aataagacat ctataaaatc ttcaaagaaa tatttaaact 2040 catttatggc ttttagagca tattactcac agtttggctc cggtgtaaaa caaaatgtct 2100 tgtcttctct gctcgctgaa gaatggcacg cggacaaaat gcagcacgga atatgggact 2160 acttcgcgca acagtataat tttataaacc ctggttttgg ttttgtagag tggttgacga 2220 ataattatgc tgaagtacgt ggtgacggat attgggaaga tgtgtttgta catttggcct 2280 tatagagtgt ggtcgtggcg gaggttgttt atctttcgag tactgaatgt tgtcagtata 2340 gctatcctat ttgaaactcc ccatcgtctt gctcttgttc ccaatgtttg tttatacact 2400 catatggcta tacccttatc tacttgcctc ttttgtttat gtctatgtat ttgtataaaa 2460 tatgatatta ctcagactca agcaaacaat caatgctcac acgcggccag ggggagcctc 2520 gacactagta atacacatca tcgtcctaca agttcatcaa agtgttggac agacaactat 2580 accagcatgg atctcttgta tcggttcttt tctcccgctc tctcgcaata acaatgaaca 2640 ctgggtcaat catagcctac acaggtgaac agagtagcgt ttatacaggg tttatacggt 2700 gattcctacg gcaaaaattt ttcatttcta aaaaaaaaaa gaaaaatttt tctttccaac 2760 gctagaagga aaagaaaaat ctaattaaat tgatttggtg attttctgag agttcccttt 2820 ttcatatatc gaattttgaa tataaaagga gatcgaaaaa atttttctat tcaatctgtt 2880 ttctggtttt atttgatagt ttttttgtgt attattatta tggattagta ctggtttata 2940 tgggtttttc tgtataactt ctttttattt tagtttgttt aatcttattt tgagttacat 3000 tatagttccc taactgcaag agaagtaaca ttaaaaatga aaaagcctga actcaccgcg 3060 acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct gatgcagctc 3120 tcggagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg 3180 cgggtaaata gctgcgccga tggtttctac aaagatcgtt atgtttatcg gcactttgca 3240 tcggccgcgc tcccgattcc ggaagtgctt gacattgggg aattcagcga gagcctgacc 3300 tattgcatct cccgccgtgc acagggtgtc acgttgcaag acctgcctga aaccgaactg 3360 cccgctgttc tgcagccggt cgcggaggcc atggatgcga tcgctgcggc cgatcttagc 3420 cagacgagcg ggttcggccc attcggaccg caaggaatcg gtcaatacac tacatggcgt 3480 gatttcatat gcgcgattgc tgatccccat gtgtatcact ggcaaactgt gatggacgac 3540 accgtcagtg cgtccgtcgc gcaggctctc gatgagctga tgctttgggc cgaggactgc 3600 cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca acaatgtcct gacggacaat 3660 ggccgcataa cagcggtcat tgactggagc gaggcgatgt tcggggattc ccaatacgag 3720 gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta tggagcagca gacgcgctac 3780 ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc tccgggcgta tatgctccgc 3840 attggtcttg accaactcta tcagagcttg gttgacggca atttcgatga tgcagcttgg 3900 gcgcagggtc gatgcgacgc aatcgtccga tccggagccg ggactgtcgg gcgtacacaa 3960 atcgcccgca gaagcgcggc cgtctggacc gatggctgtg tagaagtact cgccgatagt 4020 ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat aggtttaact tgatactact 4080 agattttttc tcttcattta taaaattttt ggttataatt gaagctttag aagtatgaaa 4140 aaatcctttt ttttcattct ttgcaaccaa aataagaagc ttcttttatt cattgaaatg 4200 atgaatataa acctaacaaa agaaaaagac tcgaatatca aacattaaaa aaaaataaaa 4260 gaggttatct gttttcccat ttagttggag tttgcatttt ctaatagata gaactctcaa 4320 ttaatgtgga tttagtttct ctgttcgttt ttttttgttt tgttctcact gtatttacat 4380 ttctatttag tatttagtta ttcatataat cttaacttct cgaggagctc cgctcgtcca 4440 acgccggcgg acctcggagg ttgtttatct ttcgagtact gaatgttgtc agtatagcta 4500 tcctatttga aactccccat cgtcttgctc ttgttcccaa tgtttgttta tacactcata 4560 tggctatacc cttatctact tgcctctttt gtttatgtct atgtatttgt ataaaatatg 4620 atattactca gactcaagca aacaatcaat tcttagcatc attctttgtt cttatcttaa 4680 ccataaacga tcttgatgtg acttttgtaa tttgaacgaa ttggctatac gggacggatg 4740 acaaatgcac cattactcta ggttgttgtt ggatcttaac aaaccgtaaa ggtaaactgc 4800 ccatgcggtt cacatgactt ttgactttcc tttgtttgct agttaccttc ggcttcacaa 4860 tttgtttttc cacttttcta acaggtttat cacctttcaa acttatcttt atcttattcg 4920 ccttcttggg tgcctccaca gtagaggtta cttccttttt aatatgtact tttaggatac 4980 tttcacgctt tataacacgg tgtttaaacc ccagcgcctg gcggg 5025 <210> 22 <211> 3665 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i477 <400> 22 agctcgagga cggcacggcc acgcgtttaa accgccaagc ttttcaattc atcttttttt 60 tttttgttct tttttttgat tccggtttct ttgaaatttt tttgattcgg taatctccga 120 gcagaaggaa gaacgaagga aggagcacag acttagattg gtatatatac gcatatgtgg 180 tgttgaagaa acatgaaatt gcccagtatt cttaacccaa ctgcacagaa caaaaacctg 240 caggaaacga agataaatca tgtcgaaagc tacatataag gaacgtgctg ctactcatcc 300 tagtcctgtt gctgccaagc tatttaatat catgcacgaa aagcaaacaa acttgtgtgc 360 ttcattggat gttcgtacca ccaaggaatt actggagtta gttgaagcat taggtcccaa 420 aatttgttta ctaaaaacac atgtggatat cttgactgat ttttccatgg agggcacagt 480 taagccgcta aaggcattat ccgccaagta caatttttta ctcttcgaag acagaaaatt 540 tgctgacatt ggtaatacag tcaaattgca gtactctgcg ggtgtataca gaatagcaga 600 atgggcagac attacgaatg cacacggtgt ggtgggccca ggtattgtta gcggtttgaa 660 gcaggcggca gaagaagtaa caaaggaacc tagaggcctt ttgatgttag cagaattgtc 720 atgcaagggc tccctatcta ctggagaata tactaagggt actgttgaca ttgcgaagag 780 tgacaaagat tttgttatcg gctttattgc tcaaagagac atgggtggaa gagatgaagg 840 ttacgattgg ttgattatga cacccggtgt gggtttagat gacaagggag acgcattggg 900 tcaacagtat agaaccgtgg atgatgtggt ctctacagga tctgacatta ttattgttgg 960 aagcgctcgt ccaacgccgg cggacctatg gcgcaagttt tccgctttgt aatatatatt 1020 tatacccctt tcttctctcc cctgcaatat aatagtttaa ttctaatatt aataatatcc 1080 tatattttct tcatttaccg gcgcactctc gcccgaacga cctcaaaatg tctgctacat 1140 tcataataac caaaagctca taactttttt ttttgaacct gaatatatat acatcacata 1200 tcactgctgg tccttgccga ccagcgtata caatctcgat agttggtttc ccgttctttc 1260 cactcccgtc atggactaca acaagagatc ttcggtctca accgtgccta atgcagctcc 1320 cataagagtc ggattcgtcg gtctcaacgc agccaaagga tgggcaatca agacacatta 1380 ccccgccata ctgcaactat cgtcacaatt tcaaatcact gccttataca gtccaaaaat 1440 tgagacttct attgccacca tccagcgtct aaaattgagt aatgccactg cttttcccac 1500 tttagagtca tttgcatcat cttccactat agatatgata gtgatagcta tccaagtggc 1560 cagtcattat gacgttgtta tgcctctctt ggaattctcc aaaaataatc cgaacctcaa 1620 gtatcttttc gtagaatggg cccttgcatg ttcactagat caagccgaat ccatttataa 1680 ggctgctgct gaacgtgggg ttcaaaccat catctcttta caaggtcgta aatcaccata 1740 tattttgaga gcaaaagaat taatatctca aggctatatc ggcgacatta attctatcga 1800 gattgctgga aatggcggtt ggtacggcta cgaaaggcct gttaaatcac caaaatacat 1860 ctatgaaatc gggaacggtg tagatctggt aaccacaaca tttggtcaca caatcgatat 1920 tttacaatac atgacaagtt cgtacttttc caggataaat gcaatggttt tcaataatat 1980 tccagagcaa gagctgatag atgagcgtgg taaccgattg ggccagcgag tcccaaagac 2040 agtaccggat catcttttat tccaaggcac attgttaaat ggcaatgttc cagtgtcatg 2100 cagtttcaaa ggtggcaaac ctaccaaaaa atttaccaaa aatttggtca ttgatattca 2160 cggtaccaag ggagatttga aacttgaagg cgatgccgga ttcgcagaaa tttcaaatct 2220 ggtcctttac tacagtggaa ctagagcaaa cgacttcccg ctagctaatg gacaacaagc 2280 tcctttagac ccggggtatg atgcaggtaa agaaatcatg gaagtatatc atttacgaaa 2340 ttataatgcc attgtcggta atattcatcg actgtatcaa tctatctctg acttccactt 2400 caatacaaag aaaattcctg aattaccctc acaatttgta atgcaaggtt tcgatttcga 2460 aggctttccc accttgatgg atgctctgat attacacagg ttaatcgaga gcgtttataa 2520 aagtaacatg atgggctcca cattaaacgt tagcaatatc tcgcattata gtttataaaa 2580 gcatcttgcc ctgtgcttgg cccccagtgc agcgaacgtt ataaaaacga atactgagta 2640 tatatctatg taaaacaacc atatcatttc ttgttctgaa ctttgtttac ctaactagtt 2700 ttaaatttcc ctttttcgtg catgcgggtg ttcttattta ttagcatact acatttgaaa 2760 tatcaaattt ccttagtaga aaagtgagag aaggtgcact gacacaaaaa ataaaatccc 2820 cgcgtgcttg gccggccgtc ttcattggat gttcgtacca ccaaggaatt actggagtta 2880 gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat cttgactgat 2940 ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta caatttttta 3000 ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca gtactctgcg 3060 ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt ggtgggccca 3120 ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa caaaggaacc tagaggcctt 3180 ttgatgttag cagaattgtc atgcaagggc tccctatcta ctggagaata tactaagggt 3240 actgttgaca ttgcgaagag tgacaaagat tttgttatcg gctttattgc tcaaagagac 3300 atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt gggtttagat 3360 gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt ctctacagga 3420 tctgacatta ttattgttgg aagaggacta tttgcaaagg gaagggatgc taaggtagag 3480 ggtgaacgtt acagaaaagc aggctgggaa gcatatttga gaagatgcgg ccagcaaaac 3540 taaaaaactg tattataagt aaatgcatgt atactaaact cacaaattag agcttcaatt 3600 taattatatc agttattacc cgggaatctc ggtgtttaaa ccccagcgcc tggcgggtct 3660 agatc 3665 <210> 23 <211> 10623 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i94 <400> 23 atgagtgata gggaattcgt cacggtagat cccgtcacta tcataatcaa agaatgcatt 60 aatttatcga cagcgatgcg gaaatactct aaatttacct ctcaatctgg agtggccgct 120 ttgctggggg gaggaagtga aatatttagc aatcaagatg actacttggc tcacacattc 180 aacaatttga ataccaacaa gcacaatgat ccatttttat ctggattcat tcagttaaga 240 cttatgttga ataaactgaa aaatctagat aatatagatt cactaaccat attgcagcca 300 tttttattaa ttgtgagtac aagttccatt tctggttaca tcacttccct ggccctggac 360 tctttgcaga aattctttac cttgaatatc atcaatgaat catcgcaaaa ctatattggt 420 gcacacaggg cgacggtaaa tgctctaaca cattgtaggt ttgaaggatc tcaacaactt 480 tctgatgatt cagttctttt gaaagtcgtg tttttactgc gttcaatcgt cgactcacct 540 tacggagatt tattatcaaa ctctatcata tatgacgtat tgcaaacgat tctttcattg 600 gcttgtaata acagaaggag cgaagtcctt aggaatgctg cacaatcaac aatgatagcc 660 gttaccgtaa agattttctc aaaactaaag actattgagc ctgttaatgt gaatcaaata 720 tacatcaatg atgaaagtta cacaaatgat gtattgaagg ccgatacaat tggcacaaat 780 gtagaatcca aagaagaagg aagtcaagaa gatcccatcg gcatgaaagt gaataatgag 840 gaagctatta gcgaggacga tggcattgaa gaagagcata ttcattcaga gaagagcaca 900 aatggcgccg aacaactaga tattgtgcaa aaaacaacaa gatcaaattc caggatccaa 960 gcgtatgctg atgataacta tggattgccc gtggttaggc aatatttaaa cttattacta 1020 tcattgattg cgccagaaaa tgaattaaaa cattcatact ccactagaat atttggccta 1080 gagttaattc aaacggcatt agaaatttca ggtgatcgat tgcagctata cccacggctt 1140 tttacactga tatcagatcc tattttcaaa agcattttgt ttatcataca gaacactaca 1200 aaattatcac tacttcaagc tacattgcag ctatttacta ctctagttgt tatattgggc 1260 aacaacttac aattacagat cgagctcact ctaacaagaa tattttctat tcttttagat 1320 gatggtaccg caaataactc gagttctgaa aataagaaca agccatcaat aataaaggaa 1380 cttctaattg agcaaatatc catcttatgg actaggtcgc catctttttt tacttctact 1440 tttatcaatt tcgattgtaa tctcgatagg gcagacgttt ccataaactt tttgaaggct 1500 ttgactaaat tggccttacc agaatccgcc ttaactacca cagaaagtgt accacccatt 1560 tgccttgagg gattggtctc cctagtcgat gatatgttcg atcacatgaa ggacattgac 1620 agagaagaat ttggcaggca aaagaatgaa atggaaatct taaaaaagag ggaccgtaaa 1680 acagagttta ttgaatgtac caatgcattc aatgaaaagc ccaaaaaggg tattccgatg 1740 ttaatagaaa aaggtttcat tgcttccgac tccgataaag atattgcgga gtttcttttc 1800 aataataaca accgtatgaa taaaaaaaca atcggtttgc tactttgcca tccggacaaa 1860 gtaagcttgt tgaatgaata tattcgtttg tttgattttt cagggttaag ggtcgatgaa 1920 gctattagaa ttttgttgac gaaatttagg ttgcctggtg aatcgcaaca aattgaaaga 1980 atcatcgaag ccttctcgtc tgcgtattgt gaaaatcaag attacgatcc atccaaaatc 2040 agtgacaacg cggaggatga catttctact gttcaaccag acgctgattc tgttttcatt 2100 ttaagttatt caattattat gttgaacact gacctacata accctcaagt gaaggaacac 2160 atgtcatttg aagattactc tggtaactta aagggatgct gtaatcacaa agacttccca 2220 ttctggtatt tggatagaat ttactgttca atcagagata aagaaattgt tatgcctgaa 2280 gagcaccacg gcaacgaaaa gtggtttgaa gatgcttgga ataacttgat atcttcaact 2340 actgttataa ctgaaataaa aaaagacaca caatctgtca tggataaatt aacacccttg 2400 gagcttttga actttgatag agcaattttt aaacaagttg gcccaagtat tgtcagtact 2460 ttattcaaca tttacgtagt tgcatctgat gaccatatat ctaccagaat gataacaagt 2520 ttggacaaat gttcctatat ttccgcattt tttgacttca aagatctctt taatgatata 2580 ctaaactcca ttgctaaggg cactactttg attaattcaa gccatgacga tgaactttca 2640 actttagctt ttgaatatgg cccaatgcca ctggtgcaaa ttaaattcga agacactaac 2700 actgagatcc cggttagtac agatgctgtt agatttggta gatcatttaa gggtcaacta 2760 aatacagttg tttttttccg gattattcgc aggaacaaag atcctaaaat tttctccaag 2820 gaattatggt taaacattgt taatattata ctaacattgt acgaagactt gattttgtct 2880 cctgatattt tccctgattt acaaaaaaga ctgaaattaa gcaacttgcc taagccatct 2940 cctgaaattt ctattaacaa gagcaaagaa agcaaaggtc tcttatcaac atttgcttct 3000 tatttaaaag gtgatgaaga acccacagaa gaggaaatca aatcctcaaa aaaagcgatg 3060 gagtgcataa agtcgagtaa tattgccgcc tctgtctttg gaaatgaatc aaatataaca 3120 gcggatttaa taaaaacttt actagactcc gccaaaactg agaaaaacgc agataattcc 3180 aggtattttg aagcagaact tttatttatc atcgaattga ctattgcatt atttctattt 3240 tgcaaagagg agaaagaatt aggaaagttc atacttcaaa aagttttcca actttctcac 3300 acgaaaggcc tcacgaaaag gactgttcgt agaatgctaa catacaaaat tttgttaatt 3360 tcgttatgtg cggatcagac ggagtacttg tccaaattaa taaacgatga gctgttaaaa 3420 aagggggata tttttaccca aaaatttttt gcaactaatc aaggtaagga atttttgaag 3480 agactatttt cattgaccga atcagagttt tatagaggat ttttactagg aaatgagaat 3540 ttttggaaat ttttaagaaa agttacagca atgaaagagc agagcgagag catttttgaa 3600 tatttaaatg aatcgatcaa gacagacagc aatattttga caaatgagaa cttcatgtgg 3660 gtcctaggac tattagatga aatttcatca atgggtgccg ttggaaatca ctgggaaata 3720 gaatacaaga aattgacaga aagtggtcat aaaattgata aggagaatcc atacaagaaa 3780 tcgatcgaat tatcattgaa atccattcaa ctaacatcac acttgctgga agataataac 3840 gatctgcgta aaaacgagat attcgctatt attcaagctt tggcacatca atgcatcaat 3900 ccgtgtaagc agataagtga atttgcagtg gtaacgctag agcagacgct catcaataaa 3960 atcgaaattc caactaatga gatggaatcg gtagaagaat taattgaggg cggattacta 4020 ccgttgctaa attcgagtga aacacaggaa gaccagaaaa tcctcatttc atccatatta 4080 acaataattt caaatgttta tttgcattat ttgaaactag ggaagacaag caacgaaacg 4140 tttttgaaaa ttttgagtat tttcaataaa tttgtagagg actcagatat tgaaaaaaag 4200 ctacagcaat taatacttga taagaagagt attgagaagg gcaacggttc atcatctcat 4260 ggatctgcac atgaacaaac accagagtca aacgacgttg aaattgaggc tactgcgcca 4320 attgatgaca atacagacga tgataacaaa ccgaagttat ctgatgtaga aaaggattaa 4380 agatgctaag agatagtgat gatatttcat aaataatgta attctatata tgttaattac 4440 cttttttgcg aggcatattt atggtgaagg ataagttttg accatcaaag aaggttaatg 4500 tggctgtggt ttcagggtcc atacccggga gttatgacaa ttacaacaac agaattcttt 4560 ctatatatgc acgaacttgt aatatggaag aaattatgac gtacaaacta taaagtaaat 4620 attttacgta acacatggtg ctgttgtgct tctttttcaa gagaatacca atgacgtatg 4680 actaagttta ggatttaatg caggtgacgg acccatcttt caaacgattt atatcagtgg 4740 cgtccaaatt gttaggtttt gttggttcag caggtttcct gttgtgggtc atatgacttt 4800 gaaccaaatg gccggctgct agggcagcac ataaggataa ttcacctgcc aagacggcac 4860 aggcaactat tcttgctaat tgacgtgcgt tggtaccagg agcggtagca tgtgggcctc 4920 ttacacctaa taagtccaac atggcacctt gtggttctag aacagtacca ccaccgatgg 4980 tacctacttc gatggatggc atggatacgg aaattctcaa atcaccgtcc acttctttca 5040 tcaatgttat acagttggaa ctttcgacat tttgtgcagg atcttgtcct aatgccaaga 5100 aaacagctgt cactaaatta gctgcatgtg cgttaaatcc accaacagac ccagccattg 5160 cagatccaac caaattctta gcaatgttca actcaaccaa tgcggaaaca tcacttttta 5220 acacttttct gacaacatca ccaggaatag tagcttctgc gacgacactc ttaccacgac 5280 cttcgatcca gttgatggca gctggttttt tgtcggtaca gtagttacca gaaacggaga 5340 caacctccat atcttcccag ccatactctt ctaccatttg ctttaatgag tattcgacac 5400 ccttagaaat catattcata cccattgcgt caccagtagt tgttctaaat ctcatgaaga 5460 gtaaatctcc tgctagacaa gtttgaatat gttgcagacg tgcaaatctt gatgtagagt 5520 taaaagcttt tttaattgcg ttttgtccct cttctgagtc taaccatatc ttacaggcac 5580 cagatctttt caaagttggg aaacggacta ctgggcctct tgtcatacca tccttagtta 5640 aaacagttgt tgcaccaccg ccagcattga ttgccttaca gccacgcatg gcagaagcta 5700 ccaaacaacc ctctgtagtt gccattggta tatgataaga tgtaccatcg ataaccaagg 5760 ggcctataac accaacgggc aaaggcatgt aacctataac attttcacaa caagcgccaa 5820 atacgcggtc gtagtcataa tttttatatg gtaaacgatc agatgctaat acaggagctt 5880 ctgccaaaat tgaaagagcc ttcctacgta ccgcaaccgc tctcgtagta tcacctaatt 5940 ttttctccaa agcgtacaaa ggtaacttac cgtgaataac caaggcagcg acctctttgt 6000 tcttcaattg ttttgtattt ccactactta ataatgcttc taattcttct aaaggacgta 6060 ttttcttatc caagctttca atatcgcggg aatcatcttc ctcactagat gatgaaggtc 6120 ctgatgagct cgattgcgca gatgataaac ttttgacttt cgatccagaa atgactgttt 6180 tattggttaa aactggtgta gaagcctttt gtacaggagc agtaaaagac ttcttggtga 6240 cttcagtctt caccaattgg tctgcagcca ttatagtttt ttctccttga cgttaaagta 6300 tagaggtata ttaacaattt tttgttgata cttttatgac atttgaataa gaagtaatac 6360 aaaccgaaaa tgttgaaagt attagttaaa gtggttatgc agcttttgca tttatatatc 6420 tgttaataga tcaaaaatca tcgcttcgct gattaattac cccagaaata aggctaaaaa 6480 actaatcgca ttattatcct atggttgtta atttgattcg ttgatttgaa ggtttgtggg 6540 gccaggttac tgccaatttt tcctcttcat aaccataaaa gctagtattg tagaatcttt 6600 attgttcgga gcagtgcggc gcgaggcaca tctgcgtttc aggaacgcga ccggtgaaga 6660 ccaggacgca cggaggagag tcttccgtcg gagggctgtc gcccgctcgg cggcttctaa 6720 tccgtacttc aatatagcaa tgagcagtta agcgtattac tgaaagttcc aaagagaagg 6780 tttttttagg ctaagataat ggggctcttt acatttccac aacatataag taagattaga 6840 tatggatatg tatatggtgg tattgccatg taatatgatt attaaacttc tttgcgtcca 6900 tccaaaaaaa aagtaagaat ttttgaaaat tcaatataaa tgaaactctc aactaaactt 6960 tgttggtgtg gtattaaagg aagacttagg ccgcaaaagc aacaacaatt acacaataca 7020 aacttgcaaa tgactgaact aaaaaaacaa aagaccgctg aacaaaaaac cagacctcaa 7080 aatgtcggta ttaaaggtat ccaaatttac atcccaactc aatgtgtcaa ccaatctgag 7140 ctagagaaat ttgatggcgt ttctcaaggt aaatacacaa ttggtctggg ccaaaccaac 7200 atgtcttttg tcaatgacag agaagatatc tactcgatgt ccctaactgt tttgtctaag 7260 ttgatcaaga gttacaacat cgacaccaac aaaattggta gattagaagt cggtactgaa 7320 actctgattg acaagtccaa gtctgtcaag tctgtcttga tgcaattgtt tggtgaaaac 7380 actgacgtcg aaggtattga cacgcttaat gcctgttacg gtggtaccaa cgcgttgttc 7440 aactctttga actggattga atctaacgca tgggatggta gagacgccat tgtagtttgc 7500 ggtgatattg ccatctacga taagggtgcc gcaagaccaa ccggtggtgc cggtactgtt 7560 gctatgtgga tcggtcctga tgctccaatt gtatttgact ctgtaagagc ttcttacatg 7620 gaacacgcct acgattttta caagccagat ttcaccagcg aatatcctta cgtcgatggt 7680 catttttcat taacttgtta cgtcaaggct cttgatcaag tttacaagag ttattccaag 7740 aaggctattt ctaaagggtt ggttagcgat cccgctggtt cggatgcttt gaacgttttg 7800 aaatatttcg actacaacgt tttccatgtt ccaacctgta aattggtcac aaaatcatac 7860 ggtagattac tatataacga tttcagagcc aatcctcaat tgttcccaga agttgacgcc 7920 gaattagcta ctcgcgatta tgacgaatct ttaaccgata agaacattga aaaaactttt 7980 gttaatgttg ctaagccatt ccacaaagag agagttgccc aatctttgat tgttccaaca 8040 aacacaggta acatgtacac cgcatctgtt tatgccgcct ttgcatctct attaaactat 8100 gttggatctg acgacttaca aggcaagcgt gttggtttat tttcttacgg ttccggttta 8160 gctgcatctc tatattcttg caaaattgtt ggtgacgtcc aacatattat caaggaatta 8220 gatattacta acaaattagc caagagaatc accgaaactc caaaggatta cgaagctgcc 8280 atcgaattga gagaaaatgc ccatttgaag aagaacttca aacctcaagg ttccattgag 8340 catttgcaaa gtggtgttta ctacttgacc aacatcgatg acaaatttag aagatcttac 8400 gatgttaaaa aataatcttc ccccatcgat tgcatcttgc tgaaccccct tcataaatgc 8460 tttatttttt tggcagcctg ctttttttag ctctcattta atagagtagt tttttaatct 8520 atatactagg aaaactcttt atttaataac aatgatatat atatattcca gtggtgcatg 8580 aacgcatgag aaagcccccg gaagatcatc ttccgggggc tttttttttg gcgcgcgata 8640 cagaccggtt cagacaggat aaagaggaac gcagaatgtt agacaacacc cgcttacgca 8700 tagctattca gaaatcaggc cgtttaagcg atgattcacg agaattgctg gcccgctgcg 8760 gcataaaaat taatttacac actcagcgcc tgattgcgat ggcggaaaac atgccgattg 8820 atatcctgcg cgtgcgtgat gatgacattc cgggtctggt aatggatggc gtggtcgatc 8880 tcggtattat cggcgaaaac gtgctggaag aagagctact caaccgccgc gcacagggcg 8940 aagatccacg ctatttaacc ctgcgccgtc ttgacttcgg cggctgccgt ttatcgctgg 9000 caacaccggt tgacgaagcc tgggacggcc cggccgcgct ggacggtaaa cgtatcgcta 9060 cctcatatcc gcacctcctc aaacgctacc tcgaccagaa aggcgtctct tttaaatcgt 9120 gtctgttaaa tggttctgtc gaagtcgcgc cgcgcgcggg gctggccgac gctatctgcg 9180 atttggtctc taccggcgcg acgcttgaag ctaacggcct gcgtgaagtc gaagttatct 9240 accgctctaa agcctgtctg attcagcgcg acggtgagat ggcacagagc aagcaagagc 9300 tgatcgataa attgctgacc cgtattcagg gcgtgattca ggcgcgcgaa tcgaaataca 9360 tcatgatgca cgcgccaagt gaacgcctgg aagaggttat cgccctgctg ccaggcgccg 9420 aaaggccgac aattctgccg ctggcaggcg agcaacagcg cgtggcgatg cacatggtca 9480 gcagcgaaac gttgttctgg gaaaccatgg agaaactgaa agcgcttggc gccagctcga 9540 ttctggtact gccgatcgag aagatgatgg agtgatctga cgcctgatgg cgctgcgctt 9600 atcaggccta cgtaatgcgt tgaaaaactg tattataagt aaatgcatgt atactaaact 9660 cacaaattag agcttcaatt taattatatc agttattacc cgggaatctc ggtcgtaatg 9720 atttctataa tgacgaaaaa aaaaaaattg gaaagaaaaa gcttcatggc ctttataaaa 9780 aggaactatc caatacctcg ccagaaccaa gtaacagtat tttacggggc acaaatcaag 9840 aacaataaga caggactgta aagatggacg cattgaactc caaagaacaa caagagttcc 9900 aaaaagtagt ggaacaaaag caaatgaagg atttcatgcg tttgtactct aatctggtag 9960 aaagatgttt cacagactgt gtcaatgact tcacaacatc aaagctaacc aataaggaac 10020 aaacatgcat catgaagtgc tcagaaaagt tcttgaagca tagcgaacgt gtagggcagc 10080 gtttccaaga acaaaacgct gccttgggac aaggcttggg ccgataaggt gtactggcgt 10140 atatatatct aattatgtat ctctggtgta gcccattttt agcatgtaaa tataaagaga 10200 aaccatatct aatctaacca aatccaaaca aaattcaata gttactatcg cttttttctt 10260 tctgtatcgc aaataagtga aaattaaaaa agaaagatta aattggaagt tggatatggg 10320 ctggaacagc agcagtaatc ggtatcgggt tcgccactaa tgacgtccta cgattgcact 10380 caacagacct tgacgctcac gccgtagcgg gcgacaagtc aaacggaaca accgttgccg 10440 ttcccatcgg agtccgacct aggccgaact ccgtgaattt ctgataacaa cggtcggtaa 10500 agactggttc cccagtatat ttcttctctc aggagcaggg gccaatgcca aaagcgacat 10560 taacccggag gacaaggctc cactgtgttc caccgaattt cccacctgat aatatctgat 10620 aac 10623 <210> 24 <211> 8479 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Integration construct i467 <400> 24 gacggcacgg ccacgcgttt aaaccgccct ccaagctgac ataaatcgca ctttgtatct 60 actttttttt attcgaaaac aaggcacaac aatgaatcta tcgccctgtg agattttcaa 120 tctcaagttt gtgtaataga tagcgttata ttatagaact ataaaggtcc ttgaatatac 180 atagtgtttc attcctatta ctgtatatgt gactttacat tgttacttcc gcggctattt 240 gacgttttct gcttcaggtg cggcttggag ggcaaagtgt cagaaaatcg gccaggccgt 300 atgacacaaa agagtagaaa acgagatctc aaatatctcg aggcctgtcc tctatacaac 360 cgcccagctc tctgacaaag ctccagaacg gttgtctttt gtttcgaaaa gccaaggtcc 420 cttataattg ccctccattt tgtgtcacct atttaagcaa aaaattgaaa gtttactaac 480 ctttcattaa agagaaataa caatattata aaaagcgctt aaagctcaca cgcggccagg 540 gggagccgtt catcatctca tggatctgca catgaacaaa caccagagtc aaacgacgtt 600 gaaattgagg ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 660 tctgatgtag aaaaggatta aagatgctaa gagatagtga tgatatttca taaataatgt 720 aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 780 gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 840 cttttttttt tttgttcttt tttttgattc cggtttcttt gaaatttttt tgattcggta 900 atctccgagc agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc 960 atatgtggtg ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca 1020 aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga acgtgctgct 1080 actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac 1140 ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt tgaagcatta 1200 ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt ttccatggag 1260 ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact cttcgaagac 1320 agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg tgtatacaga 1380 atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg tattgttagc 1440 ggtttgaagc aggcggcaga agaagtaaca aaggaaccta gaggcctttt gatgttagca 1500 gaattgtcat gcaagggctc cctatctact ggagaatata ctaagggtac tgttgacatt 1560 gcgaagagtg acaaagattt tgttatcggc tttattgctc aaagagacat gggtggaaga 1620 gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga caagggagac 1680 gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc tgacattatt 1740 attgttggaa gaggactatt tgcaaaggga agggatgcta aggtagaggg tgaacgttac 1800 agaaaagcag gctgggaagc atatttgaga agatgcggcc agcaaaacta aaaaactgta 1860 ttataagtaa atgcatgtat actaaactca caaattagag cttcaattta attatatcag 1920 ttattacccg ggaatctcgg tcgtaatgat ttctataatg acgaaaaaaa aaaaattgga 1980 aagaaaaagc ttcatggcct ttataaaaag gaactatcca atacctcgcc agaaccaagt 2040 aacagtattt tacggggcac aaatcaagaa caataagaca ggactgtaaa gatggacgca 2100 tcgctcgtcc aacgccggcg gacctgtttt caatagttcg gtaatattaa cggataccta 2160 ctattatccc ctagtaggct cttttcacgg agaaattcgg gagtgttttt tttccgtgcg 2220 cattttctta gctatattct tccagcttcg cctgctgccc ggtcatcgtt cctgtcacgt 2280 agtttttccg gattcgtccg gctcatataa taccgcaata aacacggaat atctcgttcc 2340 gcggattcgg ttaaactctc ggtcgcggat tatcacagag aaagcttcgt ggagaatttt 2400 tccagatttt ccgctttccc cgatgttggt atttccggag gtcattatac tgaccgccat 2460 tataatgact gtacaacgac cttctggaga aagaaacaac tcaataacga tgtgggacat 2520 tgggggccca ctcaaaaaat ctggggacta tatccccaga gaatttctcc agaagagaag 2580 aaaagtcaaa gttttttttc gcttgggggt tgcatataaa tacaggcgct gttttatctt 2640 cagcatgaat attccataat tttacttaat agcttttcat aaataataga atcacaaaca 2700 aaatttacat ctgagttaaa caatcatgac aatcaaggaa cataaagtag tttatgaagc 2760 tcacaacgta aaggctctta aggctcctca acatttttac aacagccaac ccggcaaggg 2820 ttacgttact gatatgcaac attatcaaga aatgtatcaa caatctatca atgagccaga 2880 aaaattcttt gataagatgg ctaaggaata cttgcattgg gatgctccat acaccaaagt 2940 tcaatctggt tcattgaaca atggtgatgt tgcatggttt ttgaacggta aattgaatgc 3000 atcatacaat tgtgttgaca gacatgcctt tgctaatccc gacaagccag ctttgatcta 3060 tgaagctgat gacgaatccg acaacaaaat catcacattt ggtgaattac tcagaaaagt 3120 ttcccaaatc gctggtgtct taaaaagctg gggcgttaag aaaggtgaca cagtggctat 3180 ctatttgcca atgattccag aagcggtcat tgctatgttg gctgtggctc gtattggtgc 3240 tattcactct gttgtctttg ctgggttctc cgctggttcg ttgaaagatc gtgtcgttga 3300 cgctaattct aaagtggtca tcacttgtga tgaaggtaaa agaggtggta agaccatcaa 3360 cactaaaaaa attgttgacg aaggtttgaa cggagtcgat ttggtttccc gtatcttggt 3420 tttccaaaga actggtactg aaggtattcc aatgaaggcc ggtagagatt actggtggca 3480 tgaggaggcc gctaagcaga gaacttacct acctcctgtt tcatgtgacg ctgaagatcc 3540 tctattttta ttatacactt ccggttccac tggttctcca aagggtgtcg ttcacactac 3600 aggtggttat ttattaggtg ccgctttaac aactagatac gtttttgata ttcacccaga 3660 agatgttctc ttcactgccg gtgacgtcgg ctggatcacg ggtcacacct atgctctata 3720 tggtccatta accttgggta ccgcctcaat aattttcgaa tccactcctg cctacccaga 3780 ttatggtaga tattggagaa ttatccaacg tcacaaggct acccatttct atgtggctcc 3840 aactgcttta agattaatca aacgtgtagg tgaagccgaa attgccaaat atgacacttc 3900 ctcattacgt gtcttgggtt ccgtcggtga accaatctct ccagacttat gggaatggta 3960 tcatgaaaaa gtgggtaaca aaaactgtgt catttgtgac actatgtggc aaacagagtc 4020 tggttctcat ttaattgctc ctttggcagg tgctgtccca acaaaacctg gttctgctac 4080 cgtgccattc tttggtatta acgcttgtat cattgaccct gttacaggtg tggaattaga 4140 aggtaatgat gtcgaaggtg tccttgccgt taaatcacca tggccatcaa tggctagatc 4200 tgtttggaac caccacgacc gttacatgga tacttacttg aaaccttatc ctggtcacta 4260 tttcacaggt gatggtgctg gtagagatca tgatggttac tactggatca ggggtagagt 4320 tgacgacgtt gtaaatgttt ccggtcatag attatccaca tcagaaattg aagcatctat 4380 ctcaaatcac gaaaacgtct cggaagctgc tgttgtcggt attccagatg aattgaccgg 4440 tcaaaccgtc gttgcatatg tttccctaaa agatggttat ctacaaaaca acgctactga 4500 aggtgatgca gaacacatca caccagataa tttacgtaga gaattgatct tacaagttag 4560 gggtgagatt ggtcctttcg cctcaccaaa aaccattatt ctagttagag atctaccaag 4620 aacaaggtca ggaaagatta tgagaagagt tctaagaaag gttgcttcta acgaagccga 4680 acagctaggt gacctaacta ctttggccaa cccagaagtt gtacctgcca tcatttctgc 4740 tgtagagaac caatttttct ctcaaaaaaa gaaataaatt gaattgaatt gaaatcgata 4800 gatcaatttt tttcttttct ctttccccat cctttacgct aaaataatag tttattttat 4860 tttttgaata ttttttattt atatacgtat atatagacta ttatttatct tttaatgatt 4920 attaagattt ttattaaaaa aaaattcgct cctcttttaa tgcctttatg cagttttttt 4980 ttcccattcg atatttctat gttcgggttc agcgtatttt aagtttaata actcgaaaat 5040 tctgcgttcg ttaaagcttt cgagaaggat attatttcga aataaaccgt gttgtgtaag 5100 cttgaagcct ttttgcgctg ccaatattct tatccatcta ttgtactctt tagatccagt 5160 atagtgtatt cttcctgctc caagctcatc ccatccccgc gtgcttggcc ggccgttttg 5220 ccagcttact atccttcttg aaaatatgca ctctatatct tttagttctt aattgcaaca 5280 catagatttg ctgtataacg aattttatgc tattttttaa atttggagtt cagtgataaa 5340 agtgtcacag cgaatttcct cacatgtagg gaccgaattg tttacaagtt ctctgtacca 5400 ccatggagac atcaaaaatt gaaaatctat ggaaagatat ggacggtagc aacaagaata 5460 tagcacgagc cgcggagttc atttcgttac ttttgatatc actcacaact attgcgaagc 5520 gcttcagtga aaaaatcata aggaaaagtt gtaaatatta ttggtagtat tcgtttggta 5580 aagtagaggg ggtaattttt cccctttatt ttgttcatac attcttaaat tgctttgcct 5640 ctccttttgg aaagctatac ttcggagcac tgttgagcga aggctcatta gatatatttt 5700 ctgtcatttt ccttaaccca aaaataaggg aaagggtcca aaaagcgctc ggacaactgt 5760 tgaccgtgat ccgaaggact ggctatacag tgttcacaaa atagccaagc tgaaaataat 5820 gtgtagctat gttcagttag tttggctagc aaagatataa aagcaggtcg gaaatattta 5880 tgggcattat tatgcagagc atcaacatga taaaaaaaaa cagttgaata ttccctcaaa 5940 aatgtcttac accgtcggaa cctacttggc cgagaggttg gtccagatcg gattgaagca 6000 ccacttcgcc gtcgccggtg actacaactt ggtcttgttg gacaacttgt tgttgaacaa 6060 gaacatggag caggtctatt gctgcaacga gttgaactgc ggtttctcag cagaaggtta 6120 tgcaagagcc aagggagcag ccgctgccgt cgtcacctac tcagtcggtg cattatcagc 6180 attcgatgca attggaggtg cttacgctga gaacttgcca gtcatcttga tctctggagc 6240 acctaacaac aacgaccatg ctgctggtca cgtattgcac cacgccttgg gtaaaacaga 6300 ctaccactac cagttggaaa tggcaaaaaa tattaccgca gccgcagagg ccatctacac 6360 cccagaggaa gcacctgcca aaattgacca cgtcataaag accgctttga gagagaagaa 6420 gcctgtttac ttggagatcg cctgcaacat cgcttctatg ccatgcgccg cacctggtcc 6480 agcctctgct ttgttcaacg acgaggcctc tgacgaagct tcattgaacg ccgcagtcga 6540 agagacatta aagttcatcg ccaacaggga caaagttgcc gtcttagtcg gttcaaagtt 6600 gagggccgct ggtgccgaag aggcagctgt caagttcgct gacgccttgg gaggagccgt 6660 cgccaccatg gccgcagcaa aatctttctt tcctgaggag aacccacatt acatcggaac 6720 ctcatggggt gaagtatcat atcctggagt agaaaaaacc atgaaagagg ccgatgccgt 6780 aatagcattg gctcctgtct tcaacgacta ctcaaccaca ggatggactg atataccaga 6840 tccaaagaaa ttagtcttgg ctgagcctag gtctgtcgtc gtaaacggta tcaggttccc 6900 ttctgttcat ttgaaggact acttaacaag attggcccaa aaggtatcta aaaagactgg 6960 tgccttggac ttcttcaagt cattaaacgc aggagaattg aaaaaagcag caccagccga 7020 tccatcagcc ccattagtta acgctgaaat cgctagacaa gtagaggctt tgttgactcc 7080 aaacactacc gtcatagctg agacaggtga ctcttggttc aacgcacaga gaatgaaatt 7140 gccaaatggt gccagggtcg agtatgaaat gcagtgggga catataggtt ggtcagtccc 7200 agccgccttt ggatacgcag taggtgcccc tgagaggagg aacatattga tggttggtga 7260 tggttcattc caattaacag cccaggaggt agcccaaatg gtcaggttga agttgcctgt 7320 catcatcttc ttgatcaaca attacggata caccatcgag gtcatgatcc acgacggacc 7380 ttacaacaac atcaaaaact gggactacgc cggtttgatg gaggttttca acggtaacgg 7440 tggttatgac tcaggagccg gtaagggatt aaaggctaag accggtggtg aattggctga 7500 agcaattaag gtcgcattgg ccaacaccga tggacctaca ttgattgaat gcttcatcgg 7560 aagggaggac tgcaccgagg aattggttaa atggggtaaa agggtagccg ctgctaattc 7620 aagaaaacca gttaataaat tattataata agtgaattta ctttaaatct tgcatttaaa 7680 taaattttct ttttatagct ttatgactta gtttcaattt atatactatt ttaatgacat 7740 tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc attgttcttg 7800 tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga tgctgagtga 7860 aattttagtt aataatggag gcgctcttaa taattttggg gatattggct taacctgcag 7920 gccgcgagcg ccgatataaa ctaatgattt taaatcgtta aaaaaatatg cgaattctgt 7980 ggatcgaaca caggacctcc agataacttg accgaagttt tttcttcagt ctggcgctct 8040 cccaactgag ctaaatccgc ttactatttg ttatcagttc ccttcatatc tacatagaat 8100 aggttaagta ttttattagt tgccagaaga actactgata gttgggaata tttggtgaat 8160 aatgaagatt gggtgaataa tttgataatt ttgagattca attgttaatc aatgttacaa 8220 tattatgtat acagagtata ctagaagttc tcttcggaga tcttgaagtt cacaaaaggg 8280 aatcgatatt tctacataat attatcatta cttcttcccc atcttatatt tgtcattcat 8340 tattgattat gatcaatgca ataatgattg gtagttgcca aacatttaat acgatcctct 8400 gtaatatttc tatgaataat tatcacagca acgttcaatt atcttcaatt ccggtgttta 8460 aaccccagcg cctggcggg 8479 <210> 25 <211> 5628 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: URA3 FcphI target site cassette <400> 25 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360 ttgggtgcct ctatgatggg tttaaacgta tggcttgggc aagtgtcttt ttatgtatcg 420 tggaatttat cctgctggtc ttctggtctg ttagggcaag gttggcctct acttactcca 480 tcgacaattc aagatacaga acctcctcca gatggaatcc cttccataga gagaaggagc 540 aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 600 tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 660 ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 720 tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 780 tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 840 gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 900 actttttttt ttgaacctga atatatatac atcacatatc actgctggtc ctttgtgagc 960 gttgcgctcg tgcatcatgc gtccatcttt acagtcctgt cttattgttc ttgatttgtg 1020 ccccgtaaaa tactgttact tggttctggc gaggtattgg atagttcctt tttataaagg 1080 ccatgaagct ttttctttcc aatttttttt ttttcgtcat tatagaaatc attacgaccg 1140 agattcccgg gtaataactg atataattaa attgaagctc taatttgtga gtttagtata 1200 catgcattta cttataatac agttttttag ttttgctggc cgcatcttct caaatatgct 1260 tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc ctttgcaaat 1320 agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc cacggttcta 1380 tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt cataatcaac 1440 caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc gataacaaaa 1500 tctttgtcac tcttcgcaat gtcaacagta cccttagtat attctccagt agatagggag 1560 cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt tacttcttct 1620 gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc attcgtaatg 1680 tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac tgtattacca 1740 atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga taatgccttt 1800 agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg tgtttttagt 1860 aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt ggtacgaaca 1920 tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag cttggcagca 1980 acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat gatttatctt 2040 cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca atttcatgtt 2100 tcttcaacac cacatatgcg tatatatacc aatctaagtc tgtgctcctt ccttcgttct 2160 tccttctgct cggagattac cgaatcaaaa aaatttcaaa gaaaccggaa tcaaaaaaaa 2220 gaacaaaaaa aaaaaagatg aattgaaaag ctttatggac cctgaaacca cagccacatt 2280 aaccttcttt gatggtcaaa acttatcctt caccataaat atgcctcgca aaaaaggtaa 2340 ttaacatata tagaattaca ttatttatga aatatcatca ctatctctta gcatctttaa 2400 tccttttcta catcagataa cttcggtttg ttatcatcgt ctgtattgtc atcaattggc 2460 gcagtagcct caatttcaac gtcgtttgac tctggtgttt gttcatgtgc agatccatga 2520 gatgatgaac ttgtgagcgt tgcgctcgtg catcaccata tacatatcca tatctaatct 2580 tacttatatg ttgtggaaat gtaaagagcc ccattatctt agcctaaaaa aaccttctct 2640 ttggaacttt cagtaatacg cttaactgct cattgctata ttgaagtacg gattagaagc 2700 cgccgagcgg gcgacagccc tccgacggaa gactctcctc cgtgcgtcct ggtcttcacc 2760 ggtcgcgttc ctgaaacgca gatgtgcctc gcgccgcact gctccgaaca ataaagattc 2820 tacaatacta gcttttatgg ttatgaagag gaaaaattgg cagtaacctg gccccacaaa 2880 ccttcaaatc aacgaatcaa attaacaacc ataggataat aatgcgatta gttttttagc 2940 cttatttctg gggtaattaa tcagcgaagc gatgattttt gatctattaa cagatatata 3000 aatgcaaaag ctgcataacc actttaacta atactttcaa cattttcggt ttgtattact 3060 tcttattcaa atgtcataaa agtatcaaca aaaaattgtt aatatacctc tatactttaa 3120 cgtcaaggag aaaaaactat aatgtcatta ccgttcttaa cttctgcacc gggaaaggtt 3180 attatttttg gtgaacactc tgctgtgtac aacaagcctg ccgtcgctgc tagtgtgtct 3240 gcgttgagaa cctacctgct aataagcgag tcatctgcac cagatactat tgaattggac 3300 ttcccggaca ttagctttaa tcataagtgg tccatcaatg atttcaatgc catcaccgag 3360 gatcaagtaa actcccaaaa attggccaag gctcaacaag ccaccgatgg cttgtctcag 3420 gaactcgtta gtcttttgga tccgttgtta gctcaactat ccgaatcctt ccactaccat 3480 gcagcgtttt gtttcctgta tatgtttgtt tgcctatgcc cccatgccaa gaatattaag 3540 ttttctttaa agtctacttt acccatcggt gctgggttgg gctcaagcgc ctctatttct 3600 gtatcactgg ccttagctat ggcctacttg ggggggttaa taggatctaa tgacttggaa 3660 aagctgtcag aaaacgataa gcatatagtg aatcaatggg ccttcatagg tgaaaagtgt 3720 attcacggta ccccttcagg aatagataac gctgtggcca cttatggtaa tgccctgcta 3780 tttgaaaaag actcacataa tggaacaata aacacaaaca attttaagtt cttagatgat 3840 ttcccagcca ttccaatgat cctaacctat actagaattc caaggtctac aaaagatctt 3900 gttgctcgcg ttcgtgtgtt ggtcaccgag aaatttcctg aagttatgaa gccaattcta 3960 gatgccatgg gtgaatgtgc cctacaaggc ttagagatca tgactaagtt aagtaaatgt 4020 aaaggcaccg atgacgaggc tgtagaaact aataatgaac tgtatgaaca actattggaa 4080 ttgataagaa taaatcatgg actgcttgtc tcaatcggtg tttctcatcc tggattagaa 4140 cttattaaaa atctgagcga tgatttgaga attggctcca caaaacttac cggtgctggt 4200 ggcggcggtt gctctttgac tttgttacga agagacatta ctcaagagca aattgacagt 4260 ttcaaaaaga aattgcaaga tgattttagt tacgagacat ttgaaacaga cttgggtggg 4320 actggctgct gtttgttaag cgcaaaaaat ttgaataaag atcttaaaat caaatcccta 4380 gtattccaat tatttgaaaa taaaactacc acaaagcaac aaattgacga tctattattg 4440 ccaggaaaca cgaatttacc atggacttca taagctaatt tgcgataggc attatttatt 4500 agttgttttt aatcttaact gtgtatgaag ttttatgtaa taaagataga aagagaaaca 4560 aaaaaaaatt tttcgtagta tcaattcagc tttcgaagac agaatgaaat ttaagcagac 4620 catcatcttg ccctgtgctt ggcccccagt gcagcgaacg ttataaaaac gaatactgag 4680 tatatatcta tgtaaaacaa ccatatcatt tcttgttctg aactttgttt acctaactag 4740 ttttaaattt ccctttttcg tgcatgcggg tgttcttatt tattagcata ctacatttga 4800 aatatcaaat ttccttagta gaaaagtgag agaaggtgca ctgacacaaa aaataaaatg 4860 ctacgtataa ctgtcaaaac tttgcagcag cgggcatcct tccatcatag cttcaaacat 4920 attagcgttc ctgatcttca tacccgtgct caaaatgatc aaacaaactg ttattgccaa 4980 gaaataaacg caaggctgcc ttcaaaaact gatccattag atcctcatat caagcttcct 5040 catagaacgc ccaattacaa taagcatgtt ttgctgttat caccgggtga taggtttgct 5100 caaccatgga aggtagcatg gaatcataat ttggatacta atacaaatcg gccatataat 5160 gccattagta aattgcgctc ccatttaggt ggttctccag gcaaatttga atactaataa 5220 atgcggtgca tttgcaaaat gaatttattc caaggccaaa acaacacgat gaatggcttt 5280 atttttttgt tattcctgac atgaagcttt atgtaattaa ggaaacggac atcgaggaat 5340 ttgcatcttt tttagatgaa ggagctattc aagcaccaaa gctatccttc caggattatt 5400 taagcggtaa ggccaaggct tcccaacagg ttcatgaagt gcatcataga aagcttacaa 5460 ggtttcaggg tgaaactttt ctaagagatt ggaacttagt ctgtgggcat tataagagag 5520 atgctaagtg tggagaaatg ggacccgaca taattgcagc atttcaagat gaaaagcttt 5580 ttcctgagaa taatctagcc ttaatttctc atattggggg tcatattt 5628 <210> 26 <211> 10019 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: HXT3 FcphI target site cassette <400> 26 accggtatat caaatggcgg tgtagtttga aaagtacact gtatgtccat taataaaatt 60 acgccgaaga acactgacta gctataaatt ctcttccggc gtccaatttc aacctaaggc 120 aagtattgtt aatcaataat gcgtgttggt aaatatgaag cccgatgttg attaagaaga 180 attattcgta taagaattaa gcaagcaaaa ttaaggaaaa ttttttcttt cctattcgtc 240 atcgcagaca gccttcatct tctcgagata acacctggag gaggagcaat gaaatgaaag 300 gaaaaaaaaa tactttcttt ttcttgaaaa aagaaaaaaa ttgtaagatg agctattcgc 360 ggaacattct agctcgtttg catcttcttg catttggtag gttttcaata gttcggtaat 420 attaacggat acctactatt atcccctagt aggctctttt cacggagaaa ttcgggagtg 480 ttttttttcc gtgcgcattt tcttagctat attcttccag cttcgcctgc tgcccggtca 540 tcgttcctgt cacgtagttt ttccggattc gtccggctca tataataccg caataaacac 600 ggaatatctc gttccgcgga ttcggttaaa ctctcggtcg cggattatca cagagaaagc 660 ttcgtggaga atttttccag attttccgct ttccccgatg ttggtatttc cggaggtcat 720 tatactgacc gccattataa tgactgtaca acgaccttct ggagaaagaa acaactcaat 780 aacgatgtgg gacattgggg gcccactcaa aaaatctggg gactatatcc ccagagaatt 840 tctccagaag agaagaaaag tcaaagtttt ttttcgcttg ggggttgcat ataaattgtg 900 agcgttgcgc tcgtgcatcg tcgacactag taatacacat catcgtccta caagttcatc 960 aaagtgttgg acagacaact ataccagcat ggatctcttg tatcggttct tttctcccgc 1020 tctctcgcaa taacaatgaa cactgggtca atcatagcct acacaggtga acagagtagc 1080 gtttatacag ggtttatacg gtgattccta cggcaaaaat ttttcatttc taaaaaaaaa 1140 aagaaaaatt tttctttcca acgctagaag gaaaagaaaa atctaattaa attgatttgg 1200 tgattttctg agagttccct ttttcatata tcgaattttg aatataaaag gagatcgaaa 1260 aaatttttct attcaatctg ttttctggtt ttatttgata gtttttttgt gtattattat 1320 tatggattag tactggttta tatgggtttt tctgtataac ttctttttat tttagtttgt 1380 ttaatcttat tttgagttac attatagttc cctaactgca agagaagtaa cattaaaaat 1440 gaccactctt gacgacacgg cttaccggta ccgcaccagt gtcccggggg acgccgaggc 1500 catcgaggca ctggatgggt ccttcaccac cgacaccgtc ttccgcgtca ccgccaccgg 1560 ggacggcttc accctgcggg aggtgccggt ggacccgccc ctgaccaagg tgttccccga 1620 cgacgaatcg gacgacgaat cggacgccgg ggaggacggc gacccggact cccggacgtt 1680 cgtcgcgtac ggggacgacg gcgacctggc gggcttcgtg gtcgtctcgt actccggctg 1740 gaaccgccgg ctgaccgtcg aggacatcga ggtcgccccg gagcaccggg ggcacggggt 1800 cgggcgcgcg ttgatggggc tcgcgacgga gttcgcccgc gagcggggcg ccgggcacct 1860 ctggctggag gtcaccaacg tcaacgcacc ggcgatccac gcgtaccggc ggatggggtt 1920 caccctctgc ggcctggaca ccgccctgta cgacggcacc gcctcggacg gcgagcaggc 1980 gctctacatg agcatgccct gcccctgagt ttaacttgat actactagat tttttctctt 2040 catttataaa atttttggtt ataattgaag ctttagaagt atgaaaaaat cctttttttt 2100 cattctttgc aaccaaaata agaagcttct tttattcatt gaaatgatga atataaacct 2160 aacaaaagaa aaagactcga atatcaaaca ttaaaaaaaa ataaaagagg ttatctgttt 2220 tcccatttag ttggagtttg cattttctaa tagatagaac tctcaattaa tgtggattta 2280 gtttctctgt tcgttttttt ttgttttgtt ctcactgtat ttacatttct atttagtatt 2340 tagttattca tataatctta acttctcgag gagctcgatg cgtccatctt tacagtcctg 2400 tcttattgtt cttgatttgt gccccgtaaa atactgttac ttggttctgg cgaggtattg 2460 gatagttcct ttttataaag gccatgaagc tttttctttc caattttttt tttttcgtca 2520 ttatagaaat cattacgacc gagattcccg ggtaataact gatataatta aattgaagct 2580 ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta gttttgctgg 2640 ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc ctctacctta 2700 gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga tcctgtagag 2760 accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc atctaaaccc 2820 acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat gtctctttga 2880 gcaataaagc cgataacaaa atctttgtca ctcttcgcaa tgtcaacagt acccttagta 2940 tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa aaggcctcta 3000 ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc tgggcccacc 3060 acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc cgcagagtac 3120 tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag taaaaaattg 3180 tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa atcagtcaag 3240 atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac taactccagt 3300 aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt ttcgtgcatg 3360 atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc cttatatgta 3420 gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag ttgggttaag 3480 aatactgggc aatttcatgt ttcttcaaca ccacatatgc gtatatatac caatctaagt 3540 ctgtgctcct tccttcgttc ttccttctgc tcggagatta ccgaatcaaa aaaatttcaa 3600 agaaaccgga atcaaaaaaa agaacaaaaa aaaaaaagat gaattgaaaa gctttatgga 3660 ccctgaaacc acagccacat taaccttctt tgatggtcaa aacttatcct tcaccataaa 3720 tatgcctcgc aaaaaaggta attaacatat atagaattac attatttatg aaatatcatc 3780 actatctctt agcatcttta atccttttct acatcagata acttcggttt gttatcatcg 3840 tctgtattgt catcaattgg cgcagtagcc tcaatttcaa cgtcgtttga ctctggtgtt 3900 tgttcatgtg cagatccatg agatgatgaa cttgtgagcg ttgcgctcgt gcatccgctc 3960 gtccaacgcc ggcggacctc gctcgtccaa cgccggcgga cctcttttaa ttctgctgta 4020 acccgtacat gcccaaaata gggggcgggt tacacagaat atataacatc gtaggtgtct 4080 gggtgaacag tttattcctg gcatccacta aatataatgg agcccgcttt ttaagctggc 4140 atccagaaaa aaaaagaatc ccagcaccaa aatattgttt tcttcaccaa ccatcagttc 4200 ataggtccat tctcttagcg caactacaga gaacaggggc acaaacaggc aaaaaacggg 4260 cacaacctca atggagtgat gcaacctgcc tggagtaaat gatgacacaa ggcaattgac 4320 ccacgcatgt atctatctca ttttcttaca ccttctatta ccttctgctc tctctgattt 4380 ggaaaaagct gaaaaaaaag gttgaaacca gttccctgaa attattcccc tacttgacta 4440 ataagtatat aaagacggta ggtattgatt gtaattctgt aaatctattt cttaaacttc 4500 ttaaattcta cttttatagt tagtcttttt tttagtttta aaacaccaag aacttagttt 4560 cgatccccgc gtgcttggcc ggccgtatcc ccgcgtgctt ggccggccgt atgtctcaga 4620 acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt tctctatcct 4680 ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct aaggttccag 4740 aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt tctgccaatt 4800 tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat catatcgttg 4860 caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg ggtgctcaat 4920 ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct atgactaacg 4980 caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact gttcttgttg 5040 atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg ggtgtacacg 5100 cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat tttgccatcg 5160 aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat gaaattgtac 5220 ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag gacgaggaac 5280 ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa aaagaaaacg 5340 gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc gtcatcttgg 5400 tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc aaaggttggg 5460 gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca gttccaaagg 5520 ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa ttcaatgaag 5580 ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca tctaaggtta 5640 atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt gctagagtgg 5700 ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt gccgccattt 5760 gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatgatta cgttctgcga 5820 ttttctcatg atctttttca taaaatacat aaatatataa atggctttat gtataacagg 5880 cataatttaa agttttattt gcgattcatc gtttttcagg tactcaaacg ctgaggtgtg 5940 ccttttgact tacttttccg ccttggcaag ctggccgggt gatacttgca caagttccac 6000 taattactga catttgtggt attaactcgt ttgactgctc tacaattgta ggatgttaat 6060 caatgtcttg gctgcctaac ctgcaggccg cgagcgccga tatgctatgt aatagacaat 6120 aaaaccatgt ttatataaaa aaaattcaaa atagaaaacg attctgtaca aggagtattt 6180 tttttttgtt ctagtgtgtt tatattatcc ttggctaaga ggcactgcgt atacttcaag 6240 gtacccctgt gttttgaaaa aaaacaacag taaaatagga actccgcgag gttcaggaac 6300 ctgaaacaaa atcaataaaa acattatatg cgtttcgaac aaaattaaag aaaaagaata 6360 aatatagatt aaaaaaaaaa agaagaaatt aaaagaattt ctactaaatc ccaattgtta 6420 tatatttgtt aaatgccaaa aaagtttata aaaaatttag aatgtataaa taataataaa 6480 ctaagtaacg cgatcgccga cgccgccgat atctccctcg ccagcggccg ccttatggct 6540 aagaatgttg gaattttggc catggacatc tacttcccac caacttgtgt tcagcaggag 6600 gctttagaag cacatgacgg agcctcaaag ggtaagtaca caatcggatt aggacaggat 6660 tgcttagcat tctgcactga attggaggac gtcatctcaa tgtctttcaa cgccgtcacc 6720 tcattgttag agaagtacaa aatcgaccca aaccagatcg gaaggttgga agtcggttct 6780 gaaaccgtca tcgacaagtc taaatcaatc aagactttcg ttatgcagtt gttcgaaaag 6840 tgcggtaata ctgacgtcga gggtgtagac tctactaacg cttgttatgg tggtaccgca 6900 gctttattga actgcgtaaa ctgggttgag tcaaactcat gggatggtag gtacggatta 6960 gtcatttgca ccgattctgc cgtctacgcc gagggtccag caaggccaac cggtggagct 7020 gcagctattg ctatgttaat cggaccagat gcccctatag tcttcgagtc taagttgagg 7080 ggttcacaca tccctaacgt ctacgacttc tacaagccaa acttggcctc agagtatcca 7140 gttgtcgacg gaaagttatc tcagacatgc tacttgatgg ccttagattc atgttacaag 7200 cacttatgca acaagttcga aaagttggag ggaaaggagt tctcaattaa cgacgccgac 7260 tacttcgttt ttcactctcc atacaacaaa ttggtccaga agtcattcgc caggttattg 7320 tacaacgatt ttttgagaaa cgcatcatct atcgatgagg ccgccaagga gaaattcacc 7380 ccatattctt ctttgtcatt ggacgagtct taccagtcta gggacttgga gaaggtatca 7440 cagcaattgg ctaaaacctt ctatgacgcc aaagttcagc caaccacctt ggtccctaaa 7500 caggtcggaa atatgtatac tgcatctttg tatgccgcct ttgcctcttt gatccacaac 7560 aagcacaacg atttagtcgg aaaaagggtt gtcatgtttt cttacggtgc cggatctact 7620 gccactatgt tctcattgag gttatgcgaa aaccagtcac cattttcatt gtctaacatc 7680 gcctcagtca tggacgtagg tgtctcacct gagaagttcg tagaaaccat gaagttgatg 7740 gagcacagat acggtgccaa agaattcgtc acttcaaaag agggaatctt ggatttgttg 7800 gccccaggaa cctactattt gaaggaggtc gactctttgt acagaaggtt ctatggaaag 7860 aagggagacg acggatctgt cgcaaacggt cagtaaatcg gcggcgtcgg cgatcgcgtt 7920 aaggcggccg ctggcgaggg agatatttca acctgggcct aacagtaaag atatcctcct 7980 caaaactggt gcacttaatc gctgaatttg ttctggcttc tcttcttttt ctttattccc 8040 cccatgggcc aaaaaaaata gtactatcag gaatttggcg ccgggtcacg atatacgtgt 8100 acagtgacct aggcgacgcc acaaggaaaa aggaaaaaaa cagaaaaaac aacaaaaact 8160 aaaacaaaca cgaaaacttt aatagatcta agtgaagtag tggtgaggca attggagtga 8220 catagcagct actacaacta caaaaaaggc gcgccacggt cgtgcggata tgaaagaggt 8280 cgttatagct tctgccgtca ggaccgccat cggatcttac ggtaagtcat taaaggacgt 8340 ccctgccgtt gatttaggag ccaccgcaat taaagaggcc gttaaaaagg caggtataaa 8400 gccagaggac gtcaacgagg tcatcttggg aaatgtctta caagccggat taggtcaaaa 8460 cccagcaaga caagcatcat tcaaagccgg tttacctgtc gagatacctg caatgaccat 8520 caacaaggtt tgcggttcag gattaaggac cgtttcttta gcagcacaga tcattaaggc 8580 tggagatgca gacgttatca ttgctggtgg tatggaaaac atgtcaagag ccccatactt 8640 ggctaataac gccaggtggg gatataggat gggaaacgcc aagtttgtcg acgaaatgat 8700 tactgacgga ttgtgggacg ccttcaatga ctatcacatg ggtataaccg cagaaaacat 8760 tgccgagagg tggaatatct caagagaaga acaggatgag tttgcattgg cctcacagaa 8820 aaaagcagag gaggcaataa agtcaggtca gtttaaggat gaaatcgtcc cagtcgtcat 8880 caagggaaga aagggtgaga cagttgtcga caccgacgaa caccctagat ttggttcaac 8940 catcgaggga ttagcaaagt tgaagccagc cttcaagaaa gacggaaccg taaccgccgg 9000 taatgcatct ggattgaacg attgcgcagc agttttggtc ataatgtcag ccgagaaagc 9060 taaggagttg ggtgtcaagc cattggcaaa aattgtttca tacggatcag ccggtgtcga 9120 ccctgccatc atgggttacg gaccttttta cgccaccaag gctgcaatcg aaaaggccgg 9180 ttggaccgta gatgaattgg atttgatcga gtcaaacgag gcctttgccg cccaatcatt 9240 ggctgtcgcc aaggacttga agttcgacat gaacaaggtc aacgtcaacg gtggtgccat 9300 cgcattgggt caccctatcg gagcctctgg tgccaggatc ttggttacct tggtccacgc 9360 catgcagaag agggacgcaa agaagggttt ggccaccttg tgcatcggtg gaggtcaggg 9420 aacagctatc ttgttagaga aatgcagccc ctcagccccc ctagcgtcga ataaaagaca 9480 ttggtacatg atatcaaaca gaattttaac atttcttgat ccagtttgta aacaaaacaa 9540 acaatttttc taccatttaa cttcatacca tcggcgagag ccgaacagga aaaaaaagaa 9600 gtctccggtt atcgtaagca gtatcaaata ataagaatgt atgtgtgtgc aatttgttat 9660 acccacgaag aagtgcgcag tagagttaga aaaccaactg agtaatcttt actcccgaca 9720 atcgtccaat aatcctcttg ttgctaggaa cgtgatgatg gatttcgttt gaaatccgga 9780 cggaaaactc aaaagaagtc caaccaccaa ccattttcga gcctcaagaa tctctaagca 9840 ggtttcttta ctaaggggat ggcctttctg tcctggacat tttttccttc cttttttcat 9900 ttccttgaaa ggaacagatt ttttttgact tttgccacac agctgcacta tctcaacccc 9960 ttttacattt taagttttcg ggttgaatgg ccggtgttta aaccccagcg cctggcggg 10019 <210> 27 <211> 5027 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Mat alpha FcphI target site cassette <400> 27 tgatgtctgg gttttgtttg ggatgcaatt tattgcttcc caatgtagaa aagtacatca 60 tatgaaacaa cttaaactct taactacttc ttttaacctt cactttttat gaaatgtatc 120 aaccatatat aataacttaa tagacgacat tcacaatatg tttacttcga agcctgcttt 180 caaaattaag aacaaagcat ccaaatcata cagaaacaca gcggtttcaa aaaagctgaa 240 agaaaaacgt ctagctgagc atgtgaggcc aagctgcttc aatattattc gaccactcaa 300 gaaagatatc cagattcctg ttccttcctc tcgattttta aataaaatcc aaattcacag 360 gatagcgtct ggaagtcaaa atactcagtt tcgacagttc aataagacat ctataaaatc 420 ttcaaagaaa tatttaaact catttatggc ttttagagca tattactcac agtttggctc 480 cggtgtaaaa caaaatgtct tgtcttctct gctcgctgaa gaatggcacg cggacaaaat 540 gcagcacgga atatgggact acttcgcgca acagtataat tttataaacc ctggttttgg 600 ttttgtagag tggttgacga ataattatgc tgaagtacgt ggtgacggat attgggaaga 660 tgtgtttgta catttggcct tatagagtgt ggtcgtggcg gaggttgttt atctttcgag 720 tactgaatgt tgtcagtata gctatcctat ttgaaactcc ccatcgtctt gctcttgttc 780 ccaatgtttg tttatacact catatggcta tacccttatc tacttgcctc ttttgtttat 840 gtctatgtat ttgtataaaa tatgatatta ctcagactca agcaaacaat caatttgtga 900 gcgttgcgct cgtgcatcga gaagttaaga ttatatgaat aactaaatac taaatagaaa 960 tgtaaataca gtgagaacaa aacaaaaaaa aacgaacaga gaaactaaat ccacattaat 1020 tgagagttct atctattaga aaatgcaaac tccaactaaa tgggaaaaca gataacctct 1080 tttatttttt tttaatgttt gatattcgag tctttttctt ttgttaggtt tatattcatc 1140 atttcaatga ataaaagaag cttcttattt tggttgcaaa gaatgaaaaa aaaggatttt 1200 ttcatacttc taaagcttca attataacca aaaattttat aaatgaagag aaaaaatcta 1260 gtagtatcaa gttaaactta gaaaaactca tcgagcatca aatgaaactg caatttattc 1320 atatcaggat tatcaatacc atatttttga aaaagccgtt tctgtaatga aggagaaaac 1380 tcaccgaggc agttccatag gatggcaaga tcctggtatc ggtctgcgat tccgactcgt 1440 ccaacatcaa tacaacctat taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa 1500 tcaccatgag tgacgactga atccggtgag aatggcaaaa gcttatgcat ttctttccag 1560 acttgttcaa caggccagcc attacgctcg tcatcaaaat cactcgcatc aaccaaaccg 1620 ttattcattc gtgattgcgc ctgagcgaga cgaaatacgc gatcgctgtt aaaaggacaa 1680 ttacaaacag gaatcgaatg caaccggcgc aggaacactg ccagcgcatc aacaatattt 1740 tcacctgaat caggatattc ttctaatacc tggaatgctg ttttgccggg gatcgcagtg 1800 gtgagtaacc atgcatcatc aggagtacgg ataaaatgct tgatggtcgg aagaggcata 1860 aattccgtca gccagtttag tctgaccatc tcatctgtaa catcattggc aacgctacct 1920 ttgccatgtt tcagaaacaa ctctggcgca tcgggcttcc catacaatcg atagattgtc 1980 gcacctgatt gcccgacatt atcgcgagcc catttatacc catataaatc agcatccatg 2040 ttggaattta atcgcggcct cgaaacgtga gtcttttcct tacccatttt taatgttact 2100 tctcttgcag ttagggaact ataatgtaac tcaaaataag attaaacaaa ctaaaataaa 2160 aagaagttat acagaaaaac ccatataaac cagtactaat ccataataat aatacacaaa 2220 aaaactatca aataaaacca gaaaacagat tgaatagaaa aattttttcg atctcctttt 2280 atattcaaaa ttcgatatat gaaaaaggga actctcagaa aatcaccaaa tcaatttaat 2340 tagatttttc ttttccttct agcgttggaa agaaaaattt ttcttttttt ttttagaaat 2400 gaaaaatttt tgccgtagga atcaccgtat aaaccctgta taaacgctac tctgttcacc 2460 tgtgtaggct atgattgacc cagtgttcat tgttattgcg agagagcggg agaaaagaac 2520 cgatacaaga gatccatgct ggtatagttg tctgtccaac actttgatga acttgtagga 2580 cgatgatgtg tattactagt gtcgacatgc gtccatcttt acagtcctgt cttattgttc 2640 ttgatttgtg ccccgtaaaa tactgttact tggttctggc gaggtattgg atagttcctt 2700 tttataaagg ccatgaagct ttttctttcc aatttttttt ttttcgtcat tatagaaatc 2760 attacgaccg agattcccgg gtaataactg atataattaa attgaagctc taatttgtga 2820 gtttagtata catgcattta cttataatac agttttttag ttttgctggc cgcatcttct 2880 caaatatgct tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc 2940 ctttgcaaat agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc 3000 cacggttcta tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt 3060 cataatcaac caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc 3120 gataacaaaa tctttgtcac tcttcgcaat gtcaacagta cccttagtat attctccagt 3180 agatagggag cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt 3240 tacttcttct gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc 3300 attcgtaatg tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac 3360 tgtattacca atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga 3420 taatgccttt agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg 3480 tgtttttagt aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt 3540 ggtacgaaca tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag 3600 cttggcagca acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat 3660 gatttatctt cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca 3720 atttcatgtt tcttcaacac cacatatgcg tatatatacc aatctaagtc tgtgctcctt 3780 ccttcgttct tccttctgct cggagattac cgaatcaaaa aaatttcaaa gaaaccggaa 3840 tcaaaaaaaa gaacaaaaaa aaaaaagatg aattgaaaag ctttatggac cctgaaacca 3900 cagccacatt aaccttcttt gatggtcaaa acttatcctt caccataaat atgcctcgca 3960 aaaaaggtaa ttaacatata tagaattaca ttatttatga aatatcatca ctatctctta 4020 gcatctttaa tccttttcta catcagataa cttcggtttg ttatcatcgt ctgtattgtc 4080 atcaattggc gcagtagcct caatttcaac gtcgtttgac tctggtgttt gttcatgtgc 4140 agatccatga gatgatgaac ttgtgagcgt tgcgctcgtg catccggagg ttgtttatct 4200 ttcgagtact gaatgttgtc agtatagcta tcctatttga aactccccat cgtcttgctc 4260 ttgttcccaa tgtttgttta tacactcata tggctatacc cttatctact tgcctctttt 4320 gtttatgtct atgtatttgt ataaaatatg atattactca gactcaagca aacaatcaat 4380 tcttagcatc attctttgtt cttatcttaa ccataaacga tcttgatgtg acttttgtaa 4440 tttgaacgaa ttggctatac gggacggatg acaaatgcac cattactcta ggttgttgtt 4500 ggatcttaac aaaccgtaaa ggtaaactgc ccatgcggtt cacatgactt ttgactttcc 4560 tttgtttgct agttaccttc ggcttcacaa tttgtttttc cacttttcta acaggtttat 4620 cacctttcaa acttatcttt atcttattcg ccttcttggg tgcctccaca gtagaggtta 4680 cttccttttt aatatgtact tttaggatac tttcacgctt tataacaata tcaagtttac 4740 cttcttcatt actattcatc ttcgccacaa gtcttctctc ccttggtgtt tccaatctaa 4800 ctacaaaact gttgattagg gtgtacatca ccctaacaag atcatgtatt tgcttcctct 4860 ggtacaagct aagaacaggt aaattcaaaa catcccagag taatatcttc aaagggctat 4920 accctttaaa catatctcgg catatttgta ttaacccact aatattttga cggccaatct 4980 tttctatttt tattttcata tcatcgacgt aatgaccact taaaaac 5027 <210> 28 <211> 6126 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADS_GAL80 donor cassette <400> 28 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360 ttgggtgcct ctatgatggg tttaaacgta tggcttgggc aagtgtcttt ttatgtatcg 420 tggaatttat cctgctggtc ttctggtctg ttagggcaag gttggcctct acttactcca 480 tcgacaattc aagatacaga acctcctcca gatggaatcc cttccataga gagaaggagc 540 aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 600 tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 660 ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 720 tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 780 tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 840 gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 900 actttttttt ttgaacctga atatatatac atcacatatc actgctggtc ctcttcgagc 960 gtcccaaaac cttctcaagc aaggttttca gtataatgtt acatgcgtac acgcgtctgt 1020 acagaaaaaa aagaaaaatt tgaaatataa ataacgttct taatactaac ataactataa 1080 aaaaataaat agggacctag acttcaggtt gtctaactcc ttccttttcg gttagagcgg 1140 atcttagcta gcttaaatag acatgggata aactaataaa gacttaatta aatgcttgta 1200 ctcatctccc atacgagtga agttatcttt acccgcgtac tgcacttcca ggaattgaca 1260 aagatagata actgccatca gtaatggtct gggtatgttt ttagtggtca agtattctct 1320 gtttatgtcc ttccaaacgt cttcgacttc cttgtatatg agggtttgtg cgtattcctc 1380 atttacatta tattccttca tataagattc tagagaagat gatgagtgct ttctctcctg 1440 ttctgccttg tgcgtcatca agtcgtttag acgacgaccc aaaataccag aataccggaa 1500 tagtggtggc gctgacacgg cccattcaac tgattcttta gtgaaaatat ctgacatccc 1560 caggtaacat gtggttgtca gtaggttcgc tccaccagtt ataataacaa ctggatcgtg 1620 ttcttcagtg gtcggtatgt gcccttcgtt tgcccacttt gcttcgacca tgagattccg 1680 tacaaattcc ttaacaaact cttttccgca attaaataaa tctgttctcc cttcttttgc 1740 aagaaattcc tccatttctg tatacgtatc catgaataat ttatagatag gcttcatgta 1800 ttctggcagc gtatcaaggc aggtaatcga ccaacgttct acagcttcag tgaaaatttt 1860 taattcttca tatgttccat aagcatcgta agtatcatca atcagggtta taacggctac 1920 cactttggtg aagaaaactc gtgctcttga atattgtggt tcataaccag aacctaaacc 1980 ccagaaataa cactctacaa tgcggtcgcg caaacaaggt gcgttctttt ttatatcaaa 2040 tgctttccac catttacaga cgtggctaag ctcctccttg tgcaaagatt gcagcaggtt 2100 gaattctaat tttgctaatt ttaaaagcgt cttattatga gagtcttgtt gttggtagaa 2160 aggaatatac tgagcagctt ctatgcgggg aagacgcttc cataaaggtt gttttaatgc 2220 tctttgtatt tcggtaaaca aagccggatt agtggagaat gcatccttag tcattataga 2280 taatcgactt ctagtaaacc caagcgcgtc ttccaaaata atttcgcctg gaacccgcat 2340 ggaagtcgcc tcatataact ctaataaccc ttccacatca ttagccaatg attgtttaaa 2400 agcaccgttt ttatctttgt aattattgaa aacatcacag gtcacgtagt agccttgctt 2460 cctcatcaag cgaaaccata gtgaactgcg atctccattc cagttgtctc cgtatgtctc 2520 gtaaatacat tgaagagcat ggtcaatttc cctttcaaaa tggtatggaa ttcctagtct 2580 ctgtatttca tctattaatt ttaacaaatt agcatgcttc ataggaatgt ctaaggcttc 2640 cttcaggagc tgtcttactt ctttcttcag atcgtttaca atttgttcga ccccttgttc 2700 tacttgtttc tcataaatga gaaactgatc accccaaata gagggaggga aattggctat 2760 aggtctaatc ggtttctcct cggttagtgc catggatcct tcagttacag taaatgtttt 2820 agttgcatcg tcataggtcc attcaccatc aacaccatta tcattagcat attgcttaaa 2880 gaccttttcg gctgttgctg catctactgc ttcggtagta gtttcaccct tcaaagtttt 2940 accattcaaa attaatttat attgacccat ttatattgaa ttttcaaaaa ttcttacttt 3000 ttttttggat ggacgcaaag aagtttaata atcatattac atggcattac caccatatac 3060 atatccatat ctaatcttac ttatatgttg tggaaatgta aagagcccca ttatcttagc 3120 ctaaaaaaac cttctctttg gaactttcag taatacgctt aactgctcat tgctatattg 3180 aagtacggat tagaagccgc cgagcgggcg acagccctcc gacggaagac tctcctccgt 3240 gcgtcctcgt cttcaccggt cgcgttcctg aaacgcagat gtgcctcgcg ccgcactgct 3300 ccgaacaata aagattctac aatactagct tttatggtta tgaagaggaa aaattggcag 3360 taacctggcc ccacaaacct tcaaattaac gaatcaaatt aacaaccata ggatgataat 3420 gcgattagtt ttttagcctt atttctgggg taattaatca gcgaagcgat gatttttgat 3480 ctattaacag atatataaat ggaaaagctg cataaccact ttaactaata ctttcaacat 3540 tttcagtttg tattacttct tattcaaatg tcataaaagt atcaacaaaa aattgttaat 3600 atacctctat actttaacgt caaggagaaa aaactataat gtcattaccg ttcttaactt 3660 ctgcaccggg aaaggttatt atttttggtg aacactctgc tgtgtacaac aagcctgccg 3720 tcgctgctag tgtgtctgcg ttgagaacct acctgctaat aagcgagtca tctgcaccag 3780 atactattga attggacttc ccggacatta gctttaatca taagtggtcc atcaatgatt 3840 tcaatgccat caccgaggat caagtaaact cccaaaaatt ggccaaggct caacaagcca 3900 ccgatggctt gtctcaggaa ctcgttagtc ttttggatcc gttgttagct caactatccg 3960 aatccttcca ctaccatgca gcgttttgtt tcctgtatat gtttgtttgc ctatgccccc 4020 atgccaagaa tattaagttt tctttaaagt ctactttacc catcggtgct gggttgggct 4080 caagcgcctc tatttctgta tcactggcct tagctatggc ctacttgggg gggttaatag 4140 gatctaatga cttggaaaag ctgtcagaaa acgataagca tatagtgaat caatgggcct 4200 tcataggtga aaagtgtatt cacggtaccc cttcaggaat agataacgct gtggccactt 4260 atggtaatgc cctgctattt gaaaaagact cacataatgg aacaataaac acaaacaatt 4320 ttaagttctt agatgatttc ccagccattc caatgatcct aacctatact agaattccaa 4380 ggtctacaaa agatcttgtt gctcgcgttc gtgtgttggt caccgagaaa tttcctgaag 4440 ttatgaagcc aattctagat gccatgggtg aatgtgccct acaaggctta gagatcatga 4500 ctaagttaag taaatgtaaa ggcaccgatg acgaggctgt agaaactaat aatgaactgt 4560 atgaacaact attggaattg ataagaataa atcatggact gcttgtctca atcggtgttt 4620 ctcatcctgg attagaactt attaaaaatc tgagcgatga tttgagaatt ggctccacaa 4680 aacttaccgg tgctggtggc ggcggttgct ctttgacttt gttacgaaga gacattactc 4740 aagagcaaat tgacagtttc aaaaagaaat tgcaagatga ttttagttac gagacatttg 4800 aaacagactt gggtgggact ggctgctgtt tgttaagcgc aaaaaatttg aataaagatc 4860 ttaaaatcaa atccctagta ttccaattat ttgaaaataa aactaccaca aagcaacaaa 4920 ttgacgatct attattgcca ggaaacacga atttaccatg gacttcataa gctaatttgc 4980 gataggcatt atttattagt tgtttttaat cttaactgtg tatgaagttt tatgtaataa 5040 agatagaaag agaaacaaaa aaaaattttt cgtagtatca attcagcttt cgaagacaga 5100 atgaaattta agcagaccat tcatcttgcc ctgtgcttgg cccccagtgc agcgaacgtt 5160 ataaaaacga atactgagta tatatctatg taaaacaacc atatcatttc ttgttctgaa 5220 ctttgtttac ctaactagtt ttaaatttcc ctttttcgtg catgcgggtg ttcttattta 5280 ttagcatact acatttgaaa tatcaaattt ccttagtaga aaagtgagag aaggtgcact 5340 gacacaaaaa ataaaatgct acgtataact gtcaaaactt tgcagcagcg ggcatccttc 5400 catcatagct tcaaacatat tagcgttcct gatcttcata cccgtgctca aaatgatcaa 5460 acaaactgtt attgccaaga aataaacgca aggctgcctt caaaaactga tccattagat 5520 cctcatatca agcttcctca tagaacgccc aattacaata agcatgtttt gctgttatca 5580 ccgggtgata ggtttgctca accatggaag gtagcatgga atcataattt ggatactaat 5640 acaaatcggc catataatgc cattagtaaa ttgcgctccc atttaggtgg ttctccaggc 5700 aaatttgaat actaataaat gcggtgcatt tgcaaaatga atttattcca aggccaaaac 5760 aacacgatga atggctttat ttttttgtta ttcctgacat gaagctttat gtaattaagg 5820 aaacggacat cgaggaattt gcatcttttt tagatgaagg agctattcaa gcaccaaagc 5880 tatccttcca ggattattta agcggtaagg ccaaggcttc ccaacaggtt catgaagtgc 5940 atcatagaaa gcttacaagg tttcagggtg aaacttttct aagagattgg aacttagtct 6000 gtgggcatta taagagagat gctaagtgtg gagaaatggg acccgacata attgcagcat 6060 ttcaagatga aaagcttttt cctgagaata atctagcctt aatttctcat attgggggtc 6120 atattt 6126 <210> 29 <211> 9550 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADS_HXT3 donor cassette <400> 29 accggtatat caaatggcgg tgtagtttga aaagtacact gtatgtccat taataaaatt 60 acgccgaaga acactgacta gctataaatt ctcttccggc gtccaatttc aacctaaggc 120 aagtattgtt aatcaataat gcgtgttggt aaatatgaag cccgatgttg attaagaaga 180 attattcgta taagaattaa gcaagcaaaa ttaaggaaaa ttttttcttt cctattcgtc 240 atcgcagaca gccttcatct tctcgagata acacctggag gaggagcaat gaaatgaaag 300 gaaaaaaaaa tactttcttt ttcttgaaaa aagaaaaaaa ttgtaagatg agctattcgc 360 ggaacattct agctcgtttg catcttcttg catttggtag gttttcaata gttcggtaat 420 attaacggat acctactatt atcccctagt aggctctttt cacggagaaa ttcgggagtg 480 ttttttttcc gtgcgcattt tcttagctat attcttccag cttcgcctgc tgcccggtca 540 tcgttcctgt cacgtagttt ttccggattc gtccggctca tataataccg caataaacac 600 ggaatatctc gttccgcgga ttcggttaaa ctctcggtcg cggattatca cagagaaagc 660 ttcgtggaga atttttccag attttccgct ttccccgatg ttggtatttc cggaggtcat 720 tatactgacc gccattataa tgactgtaca acgaccttct ggagaaagaa acaactcaat 780 aacgatgtgg gacattgggg gcccactcaa aaaatctggg gactatatcc ccagagaatt 840 tctccagaag agaagaaaag tcaaagtttt ttttcgcttg ggggttgcat ataaacttcg 900 agcgtcccaa aaccttctca agcaaggttt tcagtataat gttacatgcg tacacgcgtc 960 tgtacagaaa aaaaagaaaa atttgaaata taaataacgt tcttaatact aacataacta 1020 taaaaaaata aatagggacc tagacttcag gttgtctaac tccttccttt tcggttagag 1080 cggatcttag atagacatag ggtagaccaa caaagactta attaagtgct tatattcgtc 1140 acccattctg gtgaaattgt ctttaccagc gtattgaact tctaagaatt gacataaata 1200 gataacagcc attaacaatg gacgtggaat atttttggtg gtcaagtatt ctctgttaat 1260 atctttccaa acgtcttcaa cttccttgta aatcaaagtt tgagcgtatt cttcgttaac 1320 gttgtattcc ttcatgtaag attctaagga agaggaggag tgctttcttt cttgctcagc 1380 cttgtgagtc atcaaatcgt ttaatcttct acccaaaata ccagagtatc tgaacaaagg 1440 tggagcggaa acggcccatt caacagattc cttggtgaaa atatcagaca tacctaagta 1500 acaagtagta gtcaacaagt tagcaccacc agtaatgata acgactggat cgtgttcttc 1560 agtagttgga atatgacctt cgttagccca tttagcttca accatcaagt tacgaacgaa 1620 ttccttaacg aattccttac cacaattgaa caagtcggta cgaccttcct tagccaagaa 1680 ttcttccatt tcggtgtaag tgtccatgaa caacttataa attggcttca tgtattctgg 1740 taaagtatct aaacaggtaa tggaccatct ttcgacagct tcagtgaaaa tcttcaattc 1800 ttcgtaggta ccgtaagcgt cgtaagtgtc gtcaatcaag gtaataacag caaccacctt 1860 agtaaagaaa actctagctc tagagtattg tggttcgtaa ccggaaccca aaccccagaa 1920 gtaacattcg acaattctat ctctcaaaca tggagcgttc ttcttaatat cgaaggcttt 1980 ccaccactta caaacgtgag acaattcttc cttgtgcaag gattgcaaca agttaaattc 2040 caatttagcc aatttcaaca aggttttgtt gtgagagtct tgttgttggt agaatgggat 2100 gtattgagca gcttcgattc ttggcaaacg cttccacaat ggttgtttca aagctctttg 2160 gatttcagtg aacaaagctg ggttagtaga gaaggcatct ttagtcatga tggacaatct 2220 agatctagta aaacccaaag cgtcttccaa gatgatttca ccaggaactc tcatggaggt 2280 ggcttcatac aattctaaca aaccttcaac atcgttggcc aaagattgct taaaagcacc 2340 attcttatct ttgtagttgt tgaaaacgtc acaagtaacg tagtaacctt gctttctcat 2400 taatctgaac cataaggaag atctgtcacc gttccagtta tcaccgtaag tttcgtaaat 2460 acattgcaaa gcgtgatcaa tttctctttc gaaatggtat ggaataccta atctttggat 2520 ttcgtcgatt aatttcaata agttagcgtg cttcattggg atgtccaaag cttccttcaa 2580 caattgtcta acttccttct tcaaatcgtt aacgatttgt tcaacacctt gctcaacttg 2640 cttttcgtag atcaagaatt ggtcacccca gatagaaggt ggaaaattag caattggtct 2700 gattggtttt tcttcagtca aagccatgga tccttcagtt acagtaaatg ttttagttgc 2760 atcgtcatag gtccattcac catcaacacc attatcatta gcatattgct taaagacctt 2820 ttcggctgtt gctgcatcta ctgcttcggt agtagtttca cccttcaaag ttttaccatt 2880 caaaattaat ttatattgac ccatttatat tgaattttca aaaattctta cttttttttt 2940 ggatggacgc aaagaagttt aataatcata ttacatggca ttaccaccat atacatatcc 3000 atatctaatc ttacttatat gttgtggaaa tgtaaagagc cccattatct tagcctaaaa 3060 aaaccttctc tttggaactt tcagtaatac gcttaactgc tcattgctat attgaagtac 3120 ggattagaag ccgccgagcg ggcgacagcc ctccgacgga agactctcct ccgtgcgtcc 3180 tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac tgctccgaac 3240 aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg gcagtaacct 3300 ggccccacaa accttcaaat taacgaatca aattaacaac cataggatga taatgcgatt 3360 agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt tgatctatta 3420 acagatatat aaatggaaaa gctgcataac cactttaact aatactttca acattttcag 3480 tttgtattac ttcttattca aatgtcataa aagtatcaac aaaaaattgt taatatttta 3540 attctgctgt aacccgtaca tgcccaaaat agggggcggg ttacacagaa tatataacat 3600 cgtaggtgtc tgggtgaaca gtttattcct ggcatccact aaatataatg gagcccgctt 3660 tttaagctgg catccagaaa aaaaaagaat cccagcacca aaatattgtt ttcttcacca 3720 accatcagtt cataggtcca ttctcttagc gcaactacag agaacagggg cacaaacagg 3780 caaaaaacgg gcacaacctc aatggagtga tgcaacctgc ctggagtaaa tgatgacaca 3840 aggcaattga cccacgcatg tatctatctc attttcttac accttctatt accttctgct 3900 ctctctgatt tggaaaaagc tgaaaaaaaa ggttgaaacc agttccctga aattattccc 3960 ctacttgact aataagtata taaagacggt aggtattgat tgtaattctg taaatctatt 4020 tcttaaactt cttaaattct acttttatag ttagtctttt ttttagtttt aaaacaccaa 4080 gaacttagtt tcgatccccg cgtgcttggc cggccgtatc cccgcgtgct tggccggccg 4140 tatgtctcag aacgtttaca ttgtatcgac tgccagaacc ccaattggtt cattccaggg 4200 ttctctatcc tccaagacag cagtggaatt gggtgctgtt gctttaaaag gcgccttggc 4260 taaggttcca gaattggatg catccaagga ttttgacgaa attatttttg gtaacgttct 4320 ttctgccaat ttgggccaag ctccggccag acaagttgct ttggctgccg gtttgagtaa 4380 tcatatcgtt gcaagcacag ttaacaaggt ctgtgcatcc gctatgaagg caatcatttt 4440 gggtgctcaa tccatcaaat gtggtaatgc tgatgttgtc gtagctggtg gttgtgaatc 4500 tatgactaac gcaccatact acatgccagc agcccgtgcg ggtgccaaat ttggccaaac 4560 tgttcttgtt gatggtgtcg aaagagatgg gttgaacgat gcgtacgatg gtctagccat 4620 gggtgtacac gcagaaaagt gtgcccgtga ttgggatatt actagagaac aacaagacaa 4680 ttttgccatc gaatcctacc aaaaatctca aaaatctcaa aaggaaggta aattcgacaa 4740 tgaaattgta cctgttacca ttaagggatt tagaggtaag cctgatactc aagtcacgaa 4800 ggacgaggaa cctgctagat tacacgttga aaaattgaga tctgcaagga ctgttttcca 4860 aaaagaaaac ggtactgtta ctgccgctaa cgcttctcca atcaacgatg gtgctgcagc 4920 cgtcatcttg gtttccgaaa aagttttgaa ggaaaagaat ttgaagcctt tggctattat 4980 caaaggttgg ggtgaggccg ctcatcaacc agctgatttt acatgggctc catctcttgc 5040 agttccaaag gctttgaaac atgctggcat cgaagacatc aattctgttg attactttga 5100 attcaatgaa gccttttcgg ttgtcggttt ggtgaacact aagattttga agctagaccc 5160 atctaaggtt aatgtatatg gtggtgctgt tgctctaggt cacccattgg gttgttctgg 5220 tgctagagtg gttgttacac tgctatccat cttacagcaa gaaggaggta agatcggtgt 5280 tgccgccatt tgtaatggtg gtggtggtgc ttcctctatt gtcattgaaa agatatgatt 5340 acgttctgcg attttctcat gatctttttc ataaaataca taaatatata aatggcttta 5400 tgtataacag gcataattta aagttttatt tgcgattcat cgtttttcag gtactcaaac 5460 gctgaggtgt gccttttgac ttacttttcc gccttggcaa gctggccggg tgatacttgc 5520 acaagttcca ctaattactg acatttgtgg tattaactcg tttgactgct ctacaattgt 5580 aggatgttaa tcaatgtctt ggctgcctaa cctgcaggcc gcgagcgccg atatgctatg 5640 taatagacaa taaaaccatg tttatataaa aaaaattcaa aatagaaaac gattctgtac 5700 aaggagtatt ttttttttgt tctagtgtgt ttatattatc cttggctaag aggcactgcg 5760 tatacttcaa ggtacccctg tgttttgaaa aaaaacaaca gtaaaatagg aactccgcga 5820 ggttcaggaa cctgaaacaa aatcaataaa aacattatat gcgtttcgaa caaaattaaa 5880 gaaaaagaat aaatatagat taaaaaaaaa aagaagaaat taaaagaatt tctactaaat 5940 cccaattgtt atatatttgt taaatgccaa aaaagtttat aaaaaattta gaatgtataa 6000 ataataataa actaagtaac gcgatcgccg acgccgccga tatctccctc gccagcggcc 6060 gccttatggc taagaatgtt ggaattttgg ccatggacat ctacttccca ccaacttgtg 6120 ttcagcagga ggctttagaa gcacatgacg gagcctcaaa gggtaagtac acaatcggat 6180 taggacagga ttgcttagca ttctgcactg aattggagga cgtcatctca atgtctttca 6240 acgccgtcac ctcattgtta gagaagtaca aaatcgaccc aaaccagatc ggaaggttgg 6300 aagtcggttc tgaaaccgtc atcgacaagt ctaaatcaat caagactttc gttatgcagt 6360 tgttcgaaaa gtgcggtaat actgacgtcg agggtgtaga ctctactaac gcttgttatg 6420 gtggtaccgc agctttattg aactgcgtaa actgggttga gtcaaactca tgggatggta 6480 ggtacggatt agtcatttgc accgattctg ccgtctacgc cgagggtcca gcaaggccaa 6540 ccggtggagc tgcagctatt gctatgttaa tcggaccaga tgcccctata gtcttcgagt 6600 ctaagttgag gggttcacac atccctaacg tctacgactt ctacaagcca aacttggcct 6660 cagagtatcc agttgtcgac ggaaagttat ctcagacatg ctacttgatg gccttagatt 6720 catgttacaa gcacttatgc aacaagttcg aaaagttgga gggaaaggag ttctcaatta 6780 acgacgccga ctacttcgtt tttcactctc catacaacaa attggtccag aagtcattcg 6840 ccaggttatt gtacaacgat tttttgagaa acgcatcatc tatcgatgag gccgccaagg 6900 agaaattcac cccatattct tctttgtcat tggacgagtc ttaccagtct agggacttgg 6960 agaaggtatc acagcaattg gctaaaacct tctatgacgc caaagttcag ccaaccacct 7020 tggtccctaa acaggtcgga aatatgtata ctgcatcttt gtatgccgcc tttgcctctt 7080 tgatccacaa caagcacaac gatttagtcg gaaaaagggt tgtcatgttt tcttacggtg 7140 ccggatctac tgccactatg ttctcattga ggttatgcga aaaccagtca ccattttcat 7200 tgtctaacat cgcctcagtc atggacgtag gtgtctcacc tgagaagttc gtagaaacca 7260 tgaagttgat ggagcacaga tacggtgcca aagaattcgt cacttcaaaa gagggaatct 7320 tggatttgtt ggccccagga acctactatt tgaaggaggt cgactctttg tacagaaggt 7380 tctatggaaa gaagggagac gacggatctg tcgcaaacgg tcagtaaatc ggcggcgtcg 7440 gcgatcgcgt taaggcggcc gctggcgagg gagatatttc aacctgggcc taacagtaaa 7500 gatatcctcc tcaaaactgg tgcacttaat cgctgaattt gttctggctt ctcttctttt 7560 tctttattcc ccccatgggc caaaaaaaat agtactatca ggaatttggc gccgggtcac 7620 gatatacgtg tacagtgacc taggcgacgc cacaaggaaa aaggaaaaaa acagaaaaaa 7680 caacaaaaac taaaacaaac acgaaaactt taatagatct aagtgaagta gtggtgaggc 7740 aattggagtg acatagcagc tactacaact acaaaaaagg cgcgccacgg tcgtgcggat 7800 atgaaagagg tcgttatagc ttctgccgtc aggaccgcca tcggatctta cggtaagtca 7860 ttaaaggacg tccctgccgt tgatttagga gccaccgcaa ttaaagaggc cgttaaaaag 7920 gcaggtataa agccagagga cgtcaacgag gtcatcttgg gaaatgtctt acaagccgga 7980 ttaggtcaaa acccagcaag acaagcatca ttcaaagccg gtttacctgt cgagatacct 8040 gcaatgacca tcaacaaggt ttgcggttca ggattaagga ccgtttcttt agcagcacag 8100 atcattaagg ctggagatgc agacgttatc attgctggtg gtatggaaaa catgtcaaga 8160 gccccatact tggctaataa cgccaggtgg ggatatagga tgggaaacgc caagtttgtc 8220 gacgaaatga ttactgacgg attgtgggac gccttcaatg actatcacat gggtataacc 8280 gcagaaaaca ttgccgagag gtggaatatc tcaagagaag aacaggatga gtttgcattg 8340 gcctcacaga aaaaagcaga ggaggcaata aagtcaggtc agtttaagga tgaaatcgtc 8400 ccagtcgtca tcaagggaag aaagggtgag acagttgtcg acaccgacga acaccctaga 8460 tttggttcaa ccatcgaggg attagcaaag ttgaagccag ccttcaagaa agacggaacc 8520 gtaaccgccg gtaatgcatc tggattgaac gattgcgcag cagttttggt cataatgtca 8580 gccgagaaag ctaaggagtt gggtgtcaag ccattggcaa aaattgtttc atacggatca 8640 gccggtgtcg accctgccat catgggttac ggaccttttt acgccaccaa ggctgcaatc 8700 gaaaaggccg gttggaccgt agatgaattg gatttgatcg agtcaaacga ggcctttgcc 8760 gcccaatcat tggctgtcgc caaggacttg aagttcgaca tgaacaaggt caacgtcaac 8820 ggtggtgcca tcgcattggg tcaccctatc ggagcctctg gtgccaggat cttggttacc 8880 ttggtccacg ccatgcagaa gagggacgca aagaagggtt tggccacctt gtgcatcggt 8940 ggaggtcagg gaacagctat cttgttagag aaatgcagcc cctcagcccc cctagcgtcg 9000 aataaaagac attggtacat gatatcaaac agaattttaa catttcttga tccagtttgt 9060 aaacaaaaca aacaattttt ctaccattta acttcatacc atcggcgaga gccgaacagg 9120 aaaaaaaaga agtctccggt tatcgtaagc agtatcaaat aataagaatg tatgtgtgtg 9180 caatttgtta tacccacgaa gaagtgcgca gtagagttag aaaaccaact gagtaatctt 9240 tactcccgac aatcgtccaa taatcctctt gttgctagga acgtgatgat ggatttcgtt 9300 tgaaatccgg acggaaaact caaaagaagt ccaaccacca accattttcg agcctcaaga 9360 atctctaagc aggtttcttt actaagggga tggcctttct gtcctggaca ttttttcctt 9420 ccttttttca tttccttgaa aggaacagat tttttttgac ttttgccaca cagctgcact 9480 atctcaaccc cttttacatt ttaagttttc gggttgaatg gccggtgttt aaaccccagc 9540 gcctggcggg 9550 <210> 30 <211> 4429 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADS_Mat alpha donor cassette <400> 30 tgatgtctgg gttttgtttg ggatgcaatt tattgcttcc caatgtagaa aagtacatca 60 tatgaaacaa cttaaactct taactacttc ttttaacctt cactttttat gaaatgtatc 120 aaccatatat aataacttaa tagacgacat tcacaatatg tttacttcga agcctgcttt 180 caaaattaag aacaaagcat ccaaatcata cagaaacaca gcggtttcaa aaaagctgaa 240 agaaaaacgt ctagctgagc atgtgaggcc aagctgcttc aatattattc gaccactcaa 300 gaaagatatc cagattcctg ttccttcctc tcgattttta aataaaatcc aaattcacag 360 gatagcgtct ggaagtcaaa atactcagtt tcgacagttc aataagacat ctataaaatc 420 ttcaaagaaa tatttaaact catttatggc ttttagagca tattactcac agtttggctc 480 cggtgtaaaa caaaatgtct tgtcttctct gctcgctgaa gaatggcacg cggacaaaat 540 gcagcacgga atatgggact acttcgcgca acagtataat tttataaacc ctggttttgg 600 ttttgtagag tggttgacga ataattatgc tgaagtacgt ggtgacggat attgggaaga 660 tgtgtttgta catttggcct tatagagtgt ggtcgtggcg gaggttgttt atctttcgag 720 tactgaatgt tgtcagtata gctatcctat ttgaaactcc ccatcgtctt gctcttgttc 780 ccaatgtttg tttatacact catatggcta tacccttatc tacttgcctc ttttgtttat 840 gtctatgtat ttgtataaaa tatgatatta ctcagactca agcaaacaat caattttcaa 900 aaattcttac tttttttttg gatggacgca aagaagttta ataatcatat tacatggcat 960 taccaccata tacatatcca tatacatatc catatctaat cttacttata tgttgtggaa 1020 atgtaaagag ccccattatc ttagcctaaa aaaaccttct ctttggaact ttcagtaata 1080 cgcttaactg ctcattgcta tattgaagta cggattagaa gccgccgagc gggtgacagc 1140 cctccgaagg aagactctcc tccgtgcgtc ctcgtcttca ccggtcgcgt tcctgaaacg 1200 cagatgtgcc tcgcgccgca ctgctccgaa caataaagat tctacaatac tagcttttat 1260 ggttatgaag aggaaaaatt ggcagtaacc tggccccaca aaccttcaaa tgaacgaatc 1320 aaattaacaa ccataggatg ataatgcgat tagtttttta gccttatttc tggggtaatt 1380 aatcagcgaa gcgatgattt ttgatctatt aacagatata taaatgcaaa aactgcataa 1440 ccactttaac taatactttc aacattttcg gtttgtatta cttcttattc aaatgtaata 1500 aaagtatcaa caaaaaattg ttaatatacc tctatacttt aacgtcaagg agaaaaaacc 1560 ccggatccat gggtcaatat aaattaattt tgaatggtaa aactttgaag ggtgaaacta 1620 ctaccgaagc agtagatgca gcaacagccg aaaaggtctt taagcaatat gctaatgata 1680 atggtgttga tggtgaatgg acctatgacg atgcaactaa aacatttact gtaactgaag 1740 gatccatggc cttaacagaa gagaagccaa tcagacccat agccaacttc cctccatcaa 1800 tatggggtga tcaatttctt atatacgaaa agcaagttga acaaggtgtc gaacaaatcg 1860 tcaacgatct aaagaaggag gtcaggcagt tattaaaaga agctctggac ataccgatga 1920 aacatgctaa tctactaaaa ttaattgatg agattcaaag attgggcatc ccttatcact 1980 tcgagagaga gattgatcat gcattgcaat gtatatacga gacgtacggt gataactgga 2040 acggagatag gagtagtcta tggttcaggt tgatgagaaa gcaaggctac tatgtgacat 2100 gcgatgtctt taataactat aaggacaaaa atggtgcatt taagcaatct ctagccaacg 2160 atgttgaagg tttattagaa ttatatgaag ccacaagcat gagagtccca ggagagatca 2220 tattggaaga tgctctaggg ttcacacgtt ctagattgtc aataatgacc aaggacgcat 2280 tcagtactaa ccctgcgtta ttcactgaaa tccaaagggc actaaagcaa cctctttgga 2340 aaagattgcc tcgtattgaa gcagcacaat atataccctt ctatcagcag caggactctc 2400 acaacaaaac tctacttaaa ttagcaaagt tagaattcaa tttgttgcaa agtttacata 2460 aggaagaatt atctcacgta tgcaaatggt ggaaagcttt cgatattaag aagaacgccc 2520 catgcctgag agacagaata gttgagtgtt atttctgggg tctgggttcc ggttatgaac 2580 cacaatattc tagggccaga gtctttttta ccaaagttgt cgcggtcata actttaatcg 2640 acgatactta tgatgcttat ggtacctacg aggagttaaa gatattcacc gaagctgtgg 2700 aaaggtggtc tataacttgc ttggacaccc taccagaata tatgaaacca atttacaaat 2760 tgtttatgga tacttatact gaaatggagg aattcctggc aaaagaaggt agaactgatt 2820 tgtttaattg cggtaaggaa tttgtgaagg aattcgtaag aaacttaatg gtcgaggcaa 2880 aatgggccaa cgaaggacac attccaacaa ccgaagagca tgatcctgtc gtgataatca 2940 ccggtggcgc taacctacta accactacct gctacctagg tatgtctgat atcttcacaa 3000 aagagagtgt tgaatgggca gttagtgctc cgcctttgtt caggtatagc ggtatacttg 3060 gcaggcgttt aaatgatctt atgacccata aagccgaaca agaaagaaaa cactcaagct 3120 cctctcttga atcctatatg aaggaataca atgttaacga ggaatatgcg caaactttaa 3180 tatacaagga ggtggaagat gtgtggaaag atatcaacag agaatatctt actacaaaga 3240 acataccccg tccacttttg atggcagtga tttacttgtg tcagttctta gaggtacaat 3300 acgctggtaa ggataacttt acaagaatgg gcgacgaata caaacatttg atcaagtcat 3360 tattagttta tcccatgtcc atctaagcta gctaagatcc gctctaaccg aaaaggaagg 3420 agttagacaa cctgaagtct aggtccctat ttattttttt atagttatgt tagtattaag 3480 aacgttattt atatttcaaa tttttctttt ttttctgtac agacgcgtgt acgcatgtaa 3540 cattatactg aaaaccttgc ttgagaaggt tttgggacgc tcgaagcgga ggttgtttat 3600 ctttcgagta ctgaatgttg tcagtatagc tatcctattt gaaactcccc atcgtcttgc 3660 tcttgttccc aatgtttgtt tatacactca tatggctata cccttatcta cttgcctctt 3720 ttgtttatgt ctatgtattt gtataaaata tgatattact cagactcaag caaacaatca 3780 attcttagca tcattctttg ttcttatctt aaccataaac gatcttgatg tgacttttgt 3840 aatttgaacg aattggctat acgggacgga tgacaaatgc accattactc taggttgttg 3900 ttggatctta acaaaccgta aaggtaaact gcccatgcgg ttcacatgac ttttgacttt 3960 cctttgtttg ctagttacct tcggcttcac aatttgtttt tccacttttc taacaggttt 4020 atcacctttc aaacttatct ttatcttatt cgccttcttg ggtgcctcca cagtagaggt 4080 tacttccttt ttaatatgta cttttaggat actttcacgc tttataacaa tatcaagttt 4140 accttcttca ttactattca tcttcgccac aagtcttctc tcccttggtg tttccaatct 4200 aactacaaaa ctgttgatta gggtgtacat caccctaaca agatcatgta tttgcttcct 4260 ctggtacaag ctaagaacag gtaaattcaa aacatcccag agtaatatct tcaaagggct 4320 atacccttta aacatatctc ggcatatttg tattaaccca ctaatatttt gacggccaat 4380 cttttctatt tttattttca tatcatcgac gtaatgacca cttaaaaac 4429 <210> 31 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer CUT24 <400> 31 gtttcttttg gattgcgctt gcc 23 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer ART12 <400> 32 tactgacaac cacatgttac 20 <210> 33 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer ART45 <400> 33 tactgcttcg gtagtagttt cacccttca 29 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer ART210 <400> 34 gggaagtcca attcaatagt 20 <210> 35 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer HJ207 <400> 35 catcttctcg agataacacc tggag 25 <210> 36 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer KB349 <400> 36 acgcgtgtac gcatgtaac 19 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer HJ602 <400> 37 caattggggt tctggcagtc 20 <210> 38 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer CUT76 <400> 38 gaagcctgct ttcaaaatta agaacaaagc 30 <210> 39 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer HJ362 <400> 39 gaatttacct gttcttagct tgtaccagag 30 <210> 40 <211> 6523 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADS_HIS3 donor cassette <400> 40 attgtgaggg tcagttattt catccagata taacccgaga ggaaacttct tagcgtctgt 60 tttcgtacca taaggcagtt catgaggtat attttcgtta ttgaagccca gctcgtgaat 120 gcttaatgct gctgaactgg tgtccatgtc gcctaggtac gcaatctcca caggctgcaa 180 aggttttgtc tcaagagcaa tgttattgtg caccccgtaa ttggtcaaca agtttaatct 240 gtgcttgtcc accagctctg tcgtaacctt cagttcatcg actatctgaa gaaatttact 300 aggaatagtg ccatggtaca gcaaccgaga atggcaattt ctactcgggt tcagcaacgc 360 tgcataaacg ctgttggtgc cgtagacata ttcgaagata ggattatcat tcataagttt 420 cagagcaatg tccttattct ggaacttgga tttatggctc ttttggttta atttcgcctg 480 attcttgatc tcctttagct tctcgacgtg ggcctttttc ttgccatatg gatccgctgc 540 acggtcctgt tccctagcat gtacgtgagc gtatttcctt ttaaaccacg acgctttgtc 600 ttcattcaac gtttcccatt gtttttttct actattgctt tgctgtggga aaaacttatc 660 gaaagatgac gactttttct taattctcgt tttaagagct tggtgagcgc taggagtcac 720 tgccaggtat cgtttgaaca cggcattagt cagggaagtc ataacacagt cctttcccgc 780 aattttcttt ttctattact cttggcctcc tctagtacac tctatatttt tttatgcctc 840 ggtaatgatt ttcatttttt ttttttccac ctagcggatg actctttttt tttcttagcg 900 attggcatta tcacataatg aattatacat tatataaagt aatgtgattt cttcgaagaa 960 tatactaaaa aaatcgttat tgtcttgaag gtgaaatttc tactcttatt aatggtgaac 1020 gttaagctga tgctatgatg gaagctgatt ggtcttaact tgcttgtcat cttgctaatg 1080 gtcattggct cgtgttatta cttaagttat ttgtactcgt tttgaacgta atgctaatga 1140 tcatcttatg gaataatagt gagtggtttc agggtccata aagcttttca attcatcttt 1200 tttttttttg ttcttttttt tgattccggt ttctttgaaa tttttttgat tcggtaatct 1260 ccgagcagaa ggaagaacga aggaaggagc acagacttag attggtatat atacgcatat 1320 gtggtgttga agaaacatga aattgcccag tattcttaac ccaactgcac agaacaaaaa 1380 cctgcaggaa acgaagataa atcatgtcga aagctacata taaggaacgt gctgctactc 1440 atcctagtcc tgttgctgcc aagctattta atatcatgca cgaaaagcaa acaaacttgt 1500 gtgcttcatt ggatgttcgt accaccaagg aattactgga gttagttgaa gcattaggtc 1560 ccaaaatttg tttactaaaa acacatgtgg atatcttgac tgatttttcc atggagggca 1620 cagttaagcc gctaaaggca ttatccgcca agtacaattt tttactcttc gaagacagaa 1680 aatttgctga cattggtaat acagtcaaat tgcagtactc tgcgggtgta tacagaatag 1740 cagaatgggc agacattacg aatgcacacg gtgtggtggg cccaggtatt gttagcggtt 1800 tgaagcaggc ggcggaagaa gtaacaaagg aacctagagg ccttttgatg ttagcagaat 1860 tgtcatgcaa gggctcccta gctactggag aatatactaa gggtactgtt gacattgcga 1920 agagtgacaa agattttgtt atcggcttta ttgctcaaag agacatgggt ggaagagatg 1980 aaggttacga ttggttgatt atgacacccg gtgtgggttt agatgacaag ggagacgcat 2040 tgggtcaaca gtatagaacc gtggatgatg tggtctctac aggatctgac attattattg 2100 ttggaagagg actatttgca aagggaaggg atgctaaggt agagggtgaa cgttacagaa 2160 aagcaggctg ggaagcatat ttgagaagat gcggccagca aaactaaaaa actgtattat 2220 aagtaaatgc atgtatacta aactcacaaa ttagagcttc aatttaatta tatcagttat 2280 taccacgaaa atcgttattg tcttgaaggt gaaatttcta ctcttattaa tggtgaacgt 2340 taagctgatg ctatgatgga agctgattgg tcttaacttg cttgtcatct tgctaatggt 2400 catatggctc gtgttattac ttaagttatt tgtactcgtt ttgaacgtaa tgctaatgat 2460 catcttatgc ttcgagcgtc ccaaaacctt ctcaagcaag gttttcagta taatgttaca 2520 tgcgtacacg cgtctgtaca gaaaaaaaag aaaaatttga aatataaata acgttcttaa 2580 tactaacata actataaaaa aataaatagg gacctagact tcaggttgtc taactccttc 2640 cttttcggtt agagcggatc ttagctagct tagctagctt agatagacat agggtagacc 2700 aacaaagact taattaagtg cttatattcg tcacccattc tggtgaaatt gtctttacca 2760 gcgtattgaa cttctaagaa ttgacataaa tagataacag ccattaacaa tggacgtgga 2820 atatttttgg tggtcaagta ttctctgtta atatctttcc aaacgtcttc aacttccttg 2880 taaatcaaag tttgagcgta ttcttcgtta acgttgtatt ccttcatgta agattctaag 2940 gaagaggagg agtgctttct ttcttgctca gccttgtgag tcatcaaatc gtttaatctt 3000 ctacccaaaa taccagagta tctgaacaaa ggtggagcgg aaacggccca ttcaacagat 3060 tccttggtga aaatatcaga catacctaag taacaagtag tagtcaacaa gttagcacca 3120 ccagtaatga taacgactgg atcgtgttct tcagtagttg gaatatgacc ttcgttagcc 3180 catttagctt caaccatcaa gttacgaacg aattccttaa cgaattcctt accacaattg 3240 aacaagtcgg tacgaccttc cttagccaag aattcttcca tttcggtgta agtgtccatg 3300 aacaacttat aaattggctt catgtattct ggtaaagtat ctaaacaggt aatggaccat 3360 ctttcgacag cttcagtgaa aatcttcaat tcttcgtagg taccgtaagc gtcgtaagtg 3420 tcgtcaatca aggtaataac agcaacagcc ttagtaaaga aaactctagc tctagagtat 3480 tgtggttcgt aaccggaacc caaaccccag aagtaacatt cgacaattct atctctcaaa 3540 catggagcgt tcttcttaat atcgaaggct ttccaccact tacaaacgtg agacaattct 3600 tccttgtgca aggattgcaa caagttaaat tccaatttag ccaatttcaa caaggttttg 3660 ttgtgagagt cttgttgttg gtagaatggg atgtattgag cagcttcgat tcttggcaaa 3720 cgcttccaca atggttgttt caaagctctt tggatttcag tgaacaaagc tgggttagta 3780 gagaaggcat ctttagtcat gatggacaat ctagatctag taaaacccaa agcgtcttcc 3840 aagatgattt caccaggaac tctcatggag gtggcttcat acaattctaa caaaccttca 3900 acatcgttgg ccaaagattg cttaaaagca ccattcttat ctttgtagtt gttgaaaacg 3960 tcacaagtaa cgtagtaacc ttgctttctc attaatctga accataagga agatctgtca 4020 ccgttccagt tatcaccgta agtttcgtaa atacattgca aagcgtgatc aatttctctt 4080 tcgaaatggt atggaatacc taatctttgg atttcgtcga ttaatttcaa taagttagcg 4140 tgcttcattg ggatgtccaa agcttccttc aacaattgtc taacttcctt cttcaaatcg 4200 ttaacgattt gttcaacacc ttgctcaact tgcttttcgt agatcaagaa ttggtcaccc 4260 cagatagaag gtggaaaatt agcaattggt ctgattggtt tttcttcagt caaagccatg 4320 gatccttcag ttacagtaaa tgttttagtt gcatcgtcat aggtccattc accatcaaca 4380 ccattatcat tagcatattg cttaaagacc ttttcggctg ttgctgcatc tactgcttcg 4440 gtagtagttt cacccttcaa agttttacca ttcaaaatta atttatattg acccattata 4500 gttttttctc cttgacgtta aagtatagag gtatattaac aattttttgt tgatactttt 4560 attacatttg aataagaagt aatacaaacc gaaaatgttg aaagtattag ttaaagtggt 4620 tatgcagttt ttgcatttat atatctgtta atagatcaaa aatcatcgct tcgctgatta 4680 attaccccag aaataaggct aaaaaactaa tcgcattatc atcctatggt tgttaatttg 4740 attcgttcat ttgaaggttt gtggggccag gttactgcca atttttcctc ttcataacca 4800 taaaagctag tattgtagaa tctttattgt tcggagcagt gcggcgcgag gcacatctgc 4860 gtttcaggaa cgcgaccggt gaagacgagg acgcacggag gagagtcttc cttcggaggg 4920 ctgtcacccg ctcggcggct tctaatccgt acttcaatat agcaatgagc agttaagcgt 4980 attactgaaa gttccaaaga gaaggttttt ttaggctaag ataatggggc tctttacatt 5040 tccacaacat ataagtaaga ttagatatgg atatgtatat ggatatgtat atggtggtaa 5100 tgccatgtaa tatgattatt aaacttcttt gcgtccatcc aaaaaaaaag taagaatttt 5160 tgaaaattca atataaatgt ctcagaacgt ttacattgta tcgactgcca gaaccccaat 5220 tggttcattc cagggttctc tatcctccaa gacagcagtg gaattgggtg ctgttgcttt 5280 aaaaggcgcc ttggctaagg ttccagaatt ggatgcatcc aaggattttg acgaaattat 5340 ttttggtaac gttctttctg ccaatttggg ccaagctccg gccagacaag ttgctttggc 5400 tgccggtttg agtaatcata tcgttgcaag cacagttaac aaggtctgtg catccgctat 5460 gaaggcaatc attttgggtg ctcaatccat caaatgtggt aatgctgatg ttgtcgtagc 5520 tggtggttgt gaatctatga ctaacgcacc atactacatg ccagcagccc gtgcgggtgc 5580 caaatttggc caaactgttc ttgttgatgg tgtcgaaaga gatgggttga acgatgcgta 5640 cgatggtcta gccatgggtg tacacgcaga aaagtgtgcc cgtgattggg atattactag 5700 agaacaacaa gacaattttg ccatcgaatc ctaccaaaaa tctcaaaaat ctcaaaagga 5760 aggtaaattc gacaatgaaa ttgtacctgt taccattaag ggatttagag gtaagcctga 5820 tactcaagtc acgaaggacg aggaacctgc tagattacac gttgaaaaat tgagatctgc 5880 aaggactgtt ttccaaaaag aaaacggtac tgttactgcc gctaacgctt ctccaatcaa 5940 cgatggtgct gcagccgtca tcttggtttc cgaaaaagtt ttgaaggaaa agaatttgaa 6000 gcctttggct attatcaaag gttggggtga ggccgctcat caaccagctg attttacatg 6060 ggctccatct cttgcagttc caaaggcttt gaaacatgct ggcatcgaag acatcaattc 6120 tgttgattac tttgaattca atgaagcctt ttcggttgtc ggtttggtga acactaagat 6180 tttgaagcta gacccatcta aggttaatgt atatggtggt gctgttgctc taggtcaccc 6240 attgggttgt tctggtgcta gagtggttgt tacactgcta tccatcttac agcaagaagg 6300 aggtaagatc ggtgttgccg ccatttgtaa tggtggtggt ggtgcttcct ctattgtcat 6360 tgaaaagata tgattacgtt ctgcgatttt ctcatgatct ttttcataaa atacataaat 6420 atataaatgg ctttatgtat aacaggcata atttaaagtt ttatttgcga ttcatcgttt 6480 ttcaggtact caaacgctga ggtgtgcctt ttgacttact ttt 6523 <210> 41 <211> 10379 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADS_FS.1 donor cassette <400> 41 atattgtttt ttccctagct gttttcggtt tggttatgaa cgcattgtct gcgaaaagaa 60 acgtggataa gtattataga aacagcactt cttcggccaa caatatcacg caaattgagc 120 aagatagtgc tataaaaggt cttttgccct tttttgccta ttatgcaagc attgctttac 180 tagtgtggat gcaaccaagc tttattacac tctctttcat cctttccgtt ggtttcacgg 240 gagcatttac cgtcggaaga ataatcgttt gccatttaac taagcagagc tttcccatgt 300 tcaatgcacc catgttaatt cctttgtgcc agatagtatt gtacaaaata tgtctatccc 360 tttggggaat tgagtctaat aaaatcgtct ttgccctatc ttggcttggg ttcggtctct 420 cactaggtgt tcacattatg tttatgaatg acattatcca tgaatttact gagtacctgg 480 acgtttatgc tttatccatc aagcgctcca agctgacata aatcgcactt tgtatctact 540 tttttttatt cgaaaacaag gcacaacaat gaatctatcg ccctgtgaga ttttcaatct 600 caagtttgtg taatagatag cgttatatta tagaactata aaggtccttg aatatacata 660 gtgtttcatt cctattactg tatatgtgac tttacattgt tacttccgcg gctatttgac 720 gttttctgct tcaggtgcgg cttggagggc aaagtgtcag aaaatcggcc aggccgtatg 780 acacaaaaga gtagaaaacg agatctcaaa tatctcgagg cctgtcctct atacaaccgc 840 ccagctctct gacaaagctc cagaacggtt gtcttttgtt tcgaaaagcc aaggtccctt 900 ataattgccc tccattttgt gtcacctatt taagcaaaaa attgaaagtt tactaacctt 960 tcattaaaga gaaataacaa tattataaaa agcgcttaaa tatacctgag aaagcaacct 1020 gacctacagg aaagagttac tcaagaataa gaattttcgt tttaaaacct aagagtcact 1080 ttaaaatttg tatacactta ttttttttat aacttattta ataataaaaa tcataaatca 1140 taagaaattc gcttatttag aagtgtcaac aacgtatcta ccaacgattt gacccttttc 1200 catcttttcg taaatttctg gcaaggtaga caagccgaca accttgattg gagacttgac 1260 caaacctctg gcgaagaatt gttaattaag agctcagatc ttatcgtcgt catccttgta 1320 atccatcgat actagtgcgg ccgcccttta gtgagggttg aattcgaatt ttcaaaaatt 1380 cttacttttt ttttggatgg acgcaaagaa gtttaataat catattacat ggcattacca 1440 ccatatacat atccatatac atatccatat ctaatcttac ttatatgttg tggaaatgta 1500 aagagcccca ttatcttagc ctaaaaaaac cttctctttg gaactttcag taatacgctt 1560 aactgctcat tgcgccgccg agcgggtgac agccctccga aggaagactc tcctccgtgc 1620 gtcctcgtct tcaccggtcg cgttcctgaa acgcagatgt gcctcgcgcc gcactgctcc 1680 gaacaataaa gattctacaa tactagcttt tatggttatg aagaggaaaa attggcagta 1740 acctggcccc acaaaccttc aaatgaacga atcaaattaa caaccatagg atgataatgc 1800 gattagtttt ttagccttat ttctggggta attaatcagc gaagcgatga tttttgatct 1860 attaacagat atataaatgc aaaaactgca taaccacttt aactaatact ttcaacattt 1920 tcggtttgta ttacttctta ttcaaatgta ataaaagtat caacaaaaaa ttgttaatat 1980 acctctatac tttaacgtca aggagaaaaa actataatgg gtcaatataa attaattttg 2040 aatggtaaaa ctttgaaggg tgaaactact accgaagcag tagatgcagc aacagccgaa 2100 aaggtcttta agcaatatgc taatgataat ggtgttgatg gtgaatggac ctatgacgat 2160 gcaactaaaa catttactgt aactgaagga tccatggctt tgactgaaga aaaaccaatc 2220 agaccaattg ctaattttcc accttctatc tggggtgacc aattcttgat ctacgaaaag 2280 caagttgagc aaggtgttga acaaatcgtt aacgatttga agaaggaagt tagacaattg 2340 ttgaaggaag ctttggacat cccaatgaag cacgctaact tattgaaatt aatcgacgaa 2400 atccaaagat taggtattcc ataccatttc gaaagagaaa ttgatcacgc tttgcaatgt 2460 atttacgaaa cttacggtga taactggaac ggtgacagat cttccttatg gttcagatta 2520 atgagaaagc aaggttacta cgttacttgt gacgttttca acaactacaa agataagaat 2580 ggtgctttta agcaatcttt ggccaacgat gttgaaggtt tgttagaatt gtatgaagcc 2640 acctccatga gagttcctgg tgaaatcatc ttggaagacg ctttgggttt tactagatct 2700 agattgtcca tcatgactaa agatgccttc tctactaacc cagctttgtt cactgaaatc 2760 caaagagctt tgaaacaacc attgtggaag cgtttgccaa gaatcgaagc tgctcaatac 2820 atcccattct accaacaaca agactctcac aacaaaacct tgttgaaatt ggctaaattg 2880 gaatttaact tgttgcaatc cttgcacaag gaagaattgt ctcacgtttg taagtggtgg 2940 aaagccttcg atattaagaa gaacgctcca tgtttgagag atagaattgt cgaatgttac 3000 ttctggggtt tgggttccgg ttacgaacca caatactcta gagctagagt tttctttact 3060 aaggtggttg ctgttattac cttgattgac gacacttacg acgcttacgg tacctacgaa 3120 gaattgaaga ttttcactga agctgtcgaa agatggtcca ttacctgttt agatacttta 3180 ccagaataca tgaagccaat ttataagttg ttcatggaca cttacaccga aatggaagaa 3240 ttcttggcta aggaaggtcg taccgacttg ttcaattgtg gtaaggaatt cgttaaggaa 3300 ttcgttcgta acttgatggt tgaagctaaa tgggctaacg aaggtcatat tccaactact 3360 gaagaacacg atccagtcgt tatcattact ggtggtgcta acttgttgac tactacttgt 3420 tacttaggta tgtctgatat tttcaccaag gaatctgttg aatgggccgt ttccgctcca 3480 cctttgttca gatactctgg tattttgggt agaagattaa acgatttgat gactcacaag 3540 gctgagcaag aaagaaagca ctcctcctct tccttagaat cttacatgaa ggaatacaac 3600 gttaacgaag aatacgctca aactttgatt tacaaggaag ttgaagacgt ttggaaagat 3660 attaacagag aatacttgac caccaaaaat attccacgtc cattgttaat ggctgttatc 3720 tatttatgtc aattcttaga agttcaatac gctggtaaag acaatttcac cagaatgggt 3780 gacgaatata agcacttaat taagtctttg ttggtctacc ctatgtctat ctaagatccg 3840 ctctaaccga aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta 3900 tagttatgtt agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca 3960 gacgcgtgta cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct 4020 cgaaggtttt caatagttcg gtaatattaa cggataccta ctattatccc ctagtaggct 4080 cttttcacgg agaaattcgg gagtgttttt tttccgtgcg cattttctta gctatattct 4140 tccagcttcg cctgctgccc ggtcatcgtt cctgtcacgt agtttttccg gattcgtccg 4200 gctcatataa taccgcaata aacacggaat atctcgttcc gcggattcgg ttaaactctc 4260 ggtcgcggat tatcacagag aaagcttcgt ggagaatttt tccagatttt ccgctttccc 4320 cgatgttggt atttccggag gtcattatac tgaccgccat tataatgact gtacaacgac 4380 cttctggaga aagaaacaac tcaataacga tgtgggacat tgggggccca ctcaaaaaat 4440 ctggggacta tatccccaga gaatttctcc agaagagaag aaaagtcaaa gttttttttc 4500 gcttgggggt tgcatataaa tacaggcgct gttttatctt cagcatgaat attccataat 4560 tttacttaat agcttttcat aaataataga atcacaaaca aaatttacat ctgagttaaa 4620 caatcatgac aatcaaggaa cataaagtag tttatgaagc tcacaacgta aaggctctta 4680 aggctcctca acatttttac aacagccaac ccggcaaggg ttacgttact gatatgcaac 4740 attatcaaga aatgtatcaa caatctatca atgagccaga aaaattcttt gataagatgg 4800 ctaaggaata cttgcattgg gatgctccat acaccaaagt tcaatctggt tcattgaaca 4860 atggtgatgt tgcatggttt ttgaacggta aattgaatgc atcatacaat tgtgttgaca 4920 gacatgcctt tgctaatccc gacaagccag ctttgatcta tgaagctgat gacgaatccg 4980 acaacaaaat catcacattt ggtgaattac tcagaaaagt ttcccaaatc gctggtgtct 5040 taaaaagctg gggcgttaag aaaggtgaca cagtggctat ctatttgcca atgattccag 5100 aagcggtcat tgctatgttg gctgtggctc gtattggtgc tattcactct gttgtctttg 5160 ctgggttctc cgctggttcg ttgaaagatc gtgtcgttga cgctaattct aaagtggtca 5220 tcacttgtga tgaaggtaaa agaggtggta agaccatcaa cactaaaaaa attgttgacg 5280 aaggtttgaa cggagtcgat ttggtttccc gtatcttggt tttccaaaga actggtactg 5340 aaggtattcc aatgaaggcc ggtagagatt actggtggca tgaggaggcc gctaagcaga 5400 gaacttacct acctcctgtt tcatgtgacg ctgaagatcc tctattttta ttatacactt 5460 ccggttccac tggttctcca aagggtgtcg ttcacactac aggtggttat ttattaggtg 5520 ccgctttaac aactagatac gtttttgata ttcacccaga agatgttctc ttcactgccg 5580 gtgacgtcgg ctggatcacg ggtcacacct atgctctata tggtccatta accttgggta 5640 ccgcctcaat aattttcgaa tccactcctg cctacccaga ttatggtaga tattggagaa 5700 ttatccaacg tcacaaggct acccatttct atgtggctcc aactgcttta agattaatca 5760 aacgtgtagg tgaagccgaa attgccaaat atgacacttc ctcattacgt gtcttgggtt 5820 ccgtcggtga accaatctct ccagacttat gggaatggta tcatgaaaaa gtgggtaaca 5880 aaaactgtgt catttgtgac actatgtggc aaacagagtc tggttctcat ttaattgctc 5940 ctttggcagg tgctgtccca acaaaacctg gttctgctac cgtgccattc tttggtatta 6000 acgcttgtat cattgaccct gttacaggtg tggaattaga aggtaatgat gtcgaaggtg 6060 tccttgccgt taaatcacca tggccatcaa tggctagatc tgtttggaac caccacgacc 6120 gttacatgga tacttacttg aaaccttatc ctggtcacta tttcacaggt gatggtgctg 6180 gtagagatca tgatggttac tactggatca ggggtagagt tgacgacgtt gtaaatgttt 6240 ccggtcatag attatccaca tcagaaattg aagcatctat ctcaaatcac gaaaacgtct 6300 cggaagctgc tgttgtcggt attccagatg aattgaccgg tcaaaccgtc gttgcatatg 6360 tttccctaaa agatggttat ctacaaaaca acgctactga aggtgatgca gaacacatca 6420 caccagataa tttacgtaga gaattgatct tacaagttag gggtgagatt ggtcctttcg 6480 cctcaccaaa aaccattatt ctagttagag atctaccaag aacaaggtca ggaaagatta 6540 tgagaagagt tctaagaaag gttgcttcta acgaagccga acagctaggt gacctaacta 6600 ctttggccaa cccagaagtt gtacctgcca tcatttctgc tgtagagaac caatttttct 6660 ctcaaaaaaa gaaataaatt gaattgaatt gaaatcgata gatcaatttt tttcttttct 6720 ctttccccat cctttacgct aaaataatag tttattttat tttttgaata ttttttattt 6780 atatacgtat atatagacta ttatttatct tttaatgatt attaagattt ttattaaaaa 6840 aaaattcgct cctcttttaa tgcctttatg cagttttttt ttcccattcg atatttctat 6900 gttcgggttc agcgtatttt aagtttaata actcgaaaat tctgcgttcg ttaaagcttt 6960 cgagaaggat attatttcga aataaaccgt gttgtgtaag cttgaagcct ttttgcgctg 7020 ccaatattct tatccatcta ttgtactctt tagatccagt atagtgtatt cttcctgctc 7080 caagctcatc ccatccccgc gtgcttggcc ggccgttttg ccagcttact atccttcttg 7140 aaaatatgca ctctatatct tttagttctt aattgcaaca catagatttg ctgtataacg 7200 aattttatgc tattttttaa atttggagtt cagtgataaa agtgtcacag cgaatttcct 7260 cacatgtagg gaccgaattg tttacaagtt ctctgtacca ccatggagac atcaaaaatt 7320 gaaaatctat ggaaagatat ggacggtagc aacaagaata tagcacgagc cgcggagttc 7380 atttcgttac ttttgatatc actcacaact attgcgaagc gcttcagtga aaaaatcata 7440 aggaaaagtt gtaaatatta ttggtagtat tcgtttggta aagtagaggg ggtaattttt 7500 cccctttatt ttgttcatac attcttaaat tgctttgcct ctccttttgg aaagctatac 7560 ttcggagcac tgttgagcga aggctcatta gatatatttt ctgtcatttt ccttaaccca 7620 aaaataaggg aaagggtcca aaaagcgctc ggacaactgt tgaccgtgat ccgaaggact 7680 ggctatacag tgttcacaaa atagccaagc tgaaaataat gtgtagctat gttcagttag 7740 tttggctagc aaagatataa aagcaggtcg gaaatattta tgggcattat tatgcagagc 7800 atcaacatga taaaaaaaaa cagttgaata ttccctcaaa aatgtcttac accgtcggaa 7860 cctacttggc cgagaggttg gtccagatcg gattgaagca ccacttcgcc gtcgccggtg 7920 actacaactt ggtcttgttg gacaacttgt tgttgaacaa gaacatggag caggtctatt 7980 gctgcaacga gttgaactgc ggtttctcag cagaaggtta tgcaagagcc aagggagcag 8040 ccgctgccgt cgtcacctac tcagtcggtg cattatcagc attcgatgca attggaggtg 8100 cttacgctga gaacttgcca gtcatcttga tctctggagc acctaacaac aacgaccatg 8160 ctgctggtca cgtattgcac cacgccttgg gtaaaacaga ctaccactac cagttggaaa 8220 tggcaaaaaa tattaccgca gccgcagagg ccatctacac cccagaggaa gcacctgcca 8280 aaattgacca cgtcataaag accgctttga gagagaagaa gcctgtttac ttggagatcg 8340 cctgcaacat cgcttctatg ccatgcgccg cacctggtcc agcctctgct ttgttcaacg 8400 acgaggcctc tgacgaagct tcattgaacg ccgcagtcga agagacatta aagttcatcg 8460 ccaacaggga caaagttgcc gtcttagtcg gttcaaagtt gagggccgct ggtgccgaag 8520 aggcagctgt caagttcgct gacgccttgg gaggagccgt cgccaccatg gccgcagcaa 8580 aatctttctt tcctgaggag aacccacatt acatcggaac ctcatggggt gaagtatcat 8640 atcctggagt agaaaaaacc atgaaagagg ccgatgccgt aatagcattg gctcctgtct 8700 tcaacgacta ctcaaccaca ggatggactg atataccaga tccaaagaaa ttagtcttgg 8760 ctgagcctag gtctgtcgtc gtaaacggta tcaggttccc ttctgttcat ttgaaggact 8820 acttaacaag attggcccaa aaggtatcta aaaagactgg tgccttggac ttcttcaagt 8880 cattaaacgc aggagaattg aaaaaagcag caccagccga tccatcagcc ccattagtta 8940 acgctgaaat cgctagacaa gtagaggctt tgttgactcc aaacactacc gtcatagctg 9000 agacaggtga ctcttggttc aacgcacaga gaatgaaatt gccaaatggt gccagggtcg 9060 agtatgaaat gcagtgggga catataggtt ggtcagtccc agccgccttt ggatacgcag 9120 taggtgcccc tgagaggagg aacatattga tggttggtga tggttcattc caattaacag 9180 cccaggaggt agcccaaatg gtcaggttga agttgcctgt catcatcttc ttgatcaaca 9240 attacggata caccatcgag gtcatgatcc acgacggacc ttacaacaac atcaaaaact 9300 gggactacgc cggtttgatg gaggttttca acggtaacgg tggttatgac tcaggagccg 9360 gtaagggatt aaaggctaag accggtggtg aattggctga agcaattaag gtcgcattgg 9420 ccaacaccga tggacctaca ttgattgaat gcttcatcgg aagggaggac tgcaccgagg 9480 aattggttaa atggggtaaa agggtagccg ctgctaattc aagaaaacca gttaataaat 9540 tattataata agtgaattta ctttaaatct tgcatttaaa taaattttct ttttatagct 9600 ttatgactta gtttcaattt atatactatt ttaatgacat tttcgattca ttgattgaaa 9660 gctttgtgtt ttttcttgat gcgctattgc attgttcttg tctttttcgc cacatgtaat 9720 atctgtagta gatacctgat acattgtgga tgctgagtga aattttagtt aataatggag 9780 gcgctcttaa taattttggg gatattggct taacctgcag gccgcgagcg ccgatataaa 9840 ctaatgattt taaatcgtta aaaaaatatg cgaattctgt ggatcgaaca caggacctcc 9900 agataacttg accgaagttt tttcttcagt ctggcgctct cccaactgag ctaaatccgc 9960 ttactatttg ttatcagttc ccttcatatc tacatagaat aggttaagta ttttattagt 10020 tgccagaaga actactgata gttgggaata tttggtgaat aatgaagatt gggtgaataa 10080 tttgataatt ttgagattca attgttaatc aatgttacaa tattatgtat acagagtata 10140 ctagaagttc tcttcggaga tcttgaagtt cacaaaaggg aatcgatatt tctacataat 10200 attatcatta cttcttcccc atcttatatt tgtcattcat tattgattat gatcaatgca 10260 ataatgattg gtagttgcca aacatttaat acgatcctct gtaatatttc tatgaataat 10320 tatcacagca acgttcaatt atcttcaatt ccggtgttta aaccccagcg cctggcggg 10379 <210> 42 <211> 4140 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADS_FS.2 donor cassette <400> 42 tcctcttgtg gtccgtggct tgtaattttc gggaaagata gaaatcactg cattcatcga 60 aagaagtgaa aataaattgt atcggggaag taatgagggg tggaatacgt aattgcttct 120 caatttgata atacaagtta cagtcttttt attgagagtc cctggaagga aaattattga 180 tgtttacctt tttttgcgac gcgcgtctgg ccataaataa aagggttctc ttgccaagaa 240 aaaataaaaa ggcgccttaa gggaccttct atgacaaata tggtgaggta tgcaacctca 300 atgaagagca atgagaaaat ttaaggggta agtaagcatc ggaatttgtt gtttcctaac 360 aatttgtcta atttactcaa taatatcagg agaattgatc gaaaaaagca aaccaggaac 420 ccctcacaaa taagggaaca taaagtaatt gctcgtcttt acatacatgg cactcaatcc 480 cagacgtcgc gtgctaaaaa tccttatatt attggcccct caggagttta tttgaatttt 540 gattgcattg ctttcagtgg acagtatatc ataaaatttg caagggcata gtgcctgccc 600 tacgatgttg taaaacaatt tctgaaaata ggttcagaat caaaaatgat gtataaatat 660 tgaaataaat tttcacataa attgtgctcc tccgcaaagt cttgactaaa taaacaattt 720 gttaatatcc tttcaaaaat tcttactttt tttttggatg gacgcaaaga agtttaataa 780 tcatattaca tggcattacc accatataca tatccatata catatccata tctaatctta 840 cttatatgtt gtggaaatgt aaagagcccc attatcttag cctaaaaaaa ccttctcttt 900 ggaactttca gtaatacgct taactgctca ttgctatatt gaagtacgga ttagaagccg 960 ccgagcgggt gacagccctc cgaaggaaga ctctcctccg tgcgtcctcg tcttcaccgg 1020 tcgcgttcct gaaacgcaga tgtgcctcgc gccgcactgc tccgaacaat aaagattcta 1080 caatactagc ttttatggtt atgaagagga aaaattggca gtaacctggc cccacaaacc 1140 ttcaaatgaa cgaatcaaat taacaaccat aggatgataa tgcgattagt tttttagcct 1200 tatttctggg gtaattaatc agcgaagcga tgatttttga tctattaaca gatatataaa 1260 tgcaaaaact gcataaccac tttaactaat actttcaaca ttttcggttt gtattacttc 1320 ttattcaaat gtaataaaag tatcaacaaa aaattgttaa tatacctcta tactttaacg 1380 tcaaggagaa aaaaccccgg atccatgggt caatataaat taattttgaa tggtaaaact 1440 ttgaagggtg aaactactac cgaagcagta gatgcagcaa cagccgaaaa ggtctttaag 1500 caatatgcta atgataatgg tgttgatggt gaatggacct atgacgatgc aactaaaaca 1560 tttactgtaa ctgaaggatc catggctttg actgaagaaa aaccaatcag accaattgct 1620 aattttccac cttctatctg gggtgaccaa ttcttgatct acgaaaagca agttgagcaa 1680 ggtgttgaac aaatcgttaa cgatttgaag aaggaagtta gacaattgtt gaaggaagct 1740 ttggacatcc caatgaagca cgctaactta ttgaaattaa tcgacgaaat ccaaagatta 1800 ggtattccat accatttcga aagagaaatt gatcacgctt tgcaatgtat ttacgaaact 1860 tacggtgata actggaacgg tgacagatct tccttatggt tcagattaat gagaaagcaa 1920 ggttactacg ttacttgtga cgttttcaac aactacaaag ataagaatgg tgcttttaag 1980 caatctttgg ccaacgatgt tgaaggtttg ttagaattgt atgaagccac ctccatgaga 2040 gttcctggtg aaatcatctt ggaagacgct ttgggtttta ctagatctag attgtccatc 2100 atgactaaag atgccttctc tactaaccca gctttgttca ctgaaatcca aagagctttg 2160 aaacaaccat tgtggaagcg tttgccaaga atcgaagctg ctcaatacat cccattctac 2220 caacaacaag actctcacaa caaaaccttg ttgaaattgg ctaaattgga atttaacttg 2280 ttgcaatcct tgcacaagga agaattgtct cacgtttgta agtggtggaa agccttcgat 2340 attaagaaga acgctccatg tttgagagat agaattgtcg aatgttactt ctggggtttg 2400 ggttccggtt acgaaccaca atactctaga gctagagttt tctttactaa ggtggttgct 2460 gttattacct tgattgacga cacttacgac gcttacggta cctacgaaga attgaagatt 2520 ttcactgaag ctgtcgaaag atggtccatt acctgtttag atactttacc agaatacatg 2580 aagccaattt ataagttgtt catggacact tacaccgaaa tggaagaatt cttggctaag 2640 gaaggtcgta ccgacttgtt caattgtggt aaggaattcg ttaaggaatt cgttcgtaac 2700 ttgatggttg aagctaaatg ggctaacgaa ggtcatattc caactactga agaacacgat 2760 ccagtcgtta tcattactgg tggtgctaac ttgttgacta ctacttgtta cttaggtatg 2820 tctgatattt tcaccaagga atctgttgaa tgggccgttt ccgctccacc tttgttcaga 2880 tactctggta ttttgggtag aagattaaac gatttgatga ctcacaaggc tgagcaagaa 2940 agaaagcact cctcctcttc cttagaatct tacatgaagg aatacaacgt taacgaagaa 3000 tacgctcaaa ctttgattta caaggaagtt gaagacgttt ggaaagatat taacagagaa 3060 tacttgacca ccaaaaatat tccacgtcca ttgttaatgg ctgttatcta tttatgtcaa 3120 ttcttagaag ttcaatacgc tggtaaagac aatttcacca gaatgggtga cgaatataag 3180 cacttaatta agtctttgtt ggtctaccct atgtctatct aagatccgct ctaaccgaaa 3240 aggaaggagt cagacaacct gaagtctagg tccctattta tttttttata gttatgttag 3300 tattaagaac gttatttata tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg 3360 catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg aagctacctt 3420 tttgttcttt tacttaaaca ttagttagtt cgttttcttt ttctcatttt tttatgtttc 3480 ccccccaaag ttctgatttt ataatatttt atttcacaca attccattta acagaggggg 3540 aatagattct ttagcttaga aaattagtga tcaatatata tttgcctttc ttttcatctt 3600 ttcagtgata ttaatggttt cgagacactg caatggccct agttgtctaa gaggatagat 3660 gttactgtca aagatgatat tttgaatttc aattgacgta attaatgata ctattaataa 3720 tacagagcgt atatgaagta ttgcaaataa catgcacagt tcttttggga tgagaatgat 3780 aatgaaaggc gaaggcgggc gttcagaaaa gcgttgcgga gtaacaagtg attaaatagc 3840 acccaaataa tcttctttga tactaccgat tgcgtgaata gaactcactt gactgataca 3900 accttcaatt ttaactctaa ttctactttt tatggtgatg acatcctcgg aactttggta 3960 tgatggtggg tttgaacccg cattaaaggt taaatcttga ggcatcagat gctttgtcac 4020 aaatactttc attggaccta cttgcacttc gaacccgtgc tgagaacatg aaacgactgt 4080 gccgtccact acttcccctt taaatggttt gaaaactaca gctctatatt tcacgttgaa 4140 <210> 43 <211> 4475 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADS_FS.3 donor cassette <400> 43 attgaagcac ctgtggagta tttaaaaact gcggttacat ggcctacaga tgaaatatgt 60 gctcaactaa tgacacaatt cccaccagga acgccgacca gtgtcctgct gcagactatt 120 tcagatgagc tagagaaaag ttctgacaac ctgttcacgt tatctgattt aaagagcaaa 180 ctgaaagtta ttggcttatt cgagcacatg gaagatatcc catttttcga caagctgaaa 240 ctaagcaatg cgcccgtgaa ggacatgcct atggtcacaa aggcgttcac caaattttgc 300 gaaacaatag caaaaaggca tacaagaggc ctactgtcat accgattacc ttttaaccta 360 ctggactaca attgcatacc gaatgagagt tattcattag aggtttatga gtcattgtac 420 aacatcatta ctctatactt ctggctcagc aacaggtacc caaactactt cattgacatg 480 gaatctgcta aagatttgaa gtatttctgt gagatgatta ttttcgagaa acttgatcga 540 ttaaagaaga atccttacgc acataagccc tttggttcta caagaggtca cctctcatct 600 tcgagaagaa gattgcgtac ataatctacg atatatcctg taaatagaaa cagctacact 660 gcttgaaagc cttaacatga tacatttctg gtatgatgcc attgttgtgc cctgccgggt 720 ttatcgtttc ctaacaggca cgtcacttat aacgaggtgc ctgtcgttta ccgcccaagc 780 cggttttttc gctggagagt acggtactac tagcccacca cacgttcgtg gccaggttga 840 taggccaccg ttgagcaaag ggcagtaaaa tatataaaag aggaacaagc gcttccatta 900 agagcactgc taagcctact cgttttctag ttctctgaaa aaaggtagcc taaaacaagc 960 gccatatcat atatatttat acagattaga cgtactcaaa attcttactt tttttttgga 1020 tggacgcaaa gaagtttaat aatcatatta catggcatta ccaccatata catatccata 1080 tacatatcca tatctaatct tacttatatg ttgtggaaat gtaaagagcc ccattatctt 1140 agcctaaaaa aaccttctct ttggaacttt cagtaatacg cttaactgct cattgcgccg 1200 ccgagcgggt gacagccctc cgaaggaaga ctctcctccg tgcgtcctcg tcttcaccgg 1260 tcgcgttcct gaaacgcaga tgtgcctcgc gccgcactgc tccgaacaat aaagattcta 1320 caatactagc ttttatggtt atgaagagga aaaattggca gtaacctggc cccacaaacc 1380 ttcaaatgaa cgaatcaaat taacaaccat aggatgataa tgcgattagt tttttagcct 1440 tatttctggg gtaattaatc agcgaagcga tgatttttga tctattaaca gatatataaa 1500 tgcaaaaact gcataaccac tttaactaat actttcaaca ttttcggttt gtattacttc 1560 ttattcaaat gtaataaaag tatcaacaaa aaattgttaa tatacctcta tactttaacg 1620 tcaaggagaa aaaactataa tgggtcaata taaattaatt ttgaatggta aaactttgaa 1680 gggtgaaact actaccgaag cagtagatgc agcaacagcc gaaaaggtct ttaagcaata 1740 tgctaatgat aatggtgttg atggtgaatg gacctatgac gatgcaacta aaacatttac 1800 tgtaactgaa ggatccatgg ctttgactga agaaaaacca atcagaccaa ttgctaattt 1860 tccaccttct atctggggtg accaattctt gatctacgaa aagcaagttg agcaaggtgt 1920 tgaacaaatc gttaacgatt tgaagaagga agttagacaa ttgttgaagg aagctttgga 1980 catcccaatg aagcacgcta acttattgaa attaatcgac gaaatccaaa gattaggtat 2040 tccataccat ttcgaaagag aaattgatca cgctttgcaa tgtatttacg aaacttacgg 2100 tgataactgg aacggtgaca gatcttcctt atggttcaga ttaatgagaa agcaaggtta 2160 ctacgttact tgtgacgttt tcaacaacta caaagataag aatggtgctt ttaagcaatc 2220 tttggccaac gatgttgaag gtttgttaga attgtatgaa gccacctcca tgagagttcc 2280 tggtgaaatc atcttggaag acgctttggg ttttactaga tctagattgt ccatcatgac 2340 taaagatgcc ttctctacta acccagcttt gttcactgaa atccaaagag ctttgaaaca 2400 accattgtgg aagcgtttgc caagaatcga agctgctcaa tacatcccat tctaccaaca 2460 acaagactct cacaacaaaa ccttgttgaa attggctaaa ttggaattta acttgttgca 2520 atccttgcac aaggaagaat tgtctcacgt ttgtaagtgg tggaaagcct tcgatattaa 2580 gaagaacgct ccatgtttga gagatagaat tgtcgaatgt tacttctggg gtttgggttc 2640 cggttacgaa ccacaatact ctagagctag agttttcttt actaaggtgg ttgctgttat 2700 taccttgatt gacgacactt acgacgctta cggtacctac gaagaattga agattttcac 2760 tgaagctgtc gaaagatggt ccattacctg tttagatact ttaccagaat acatgaagcc 2820 aatttataag ttgttcatgg acacttacac cgaaatggaa gaattcttgg ctaaggaagg 2880 tcgtaccgac ttgttcaatt gtggtaagga attcgttaag gaattcgttc gtaacttgat 2940 ggttgaagct aaatgggcta acgaaggtca tattccaact actgaagaac acgatccagt 3000 cgttatcatt actggtggtg ctaacttgtt gactactact tgttacttag gtatgtctga 3060 tattttcacc aaggaatctg ttgaatgggc cgtttccgct ccacctttgt tcagatactc 3120 tggtattttg ggtagaagat taaacgattt gatgactcac aaggctgagc aagaaagaaa 3180 gcactcctcc tcttccttag aatcttacat gaaggaatac aacgttaacg aagaatacgc 3240 tcaaactttg atttacaagg aagttgaaga cgtttggaaa gatattaaca gagaatactt 3300 gaccaccaaa aatattccac gtccattgtt aatggctgtt atctatttat gtcaattctt 3360 agaagttcaa tacgctggta aagacaattt caccagaatg ggtgacgaat ataagcactt 3420 aattaagtct ttgttggtct accctatgtc tatctaagat ccgctctaac cgaaaaggaa 3480 ggagttagac aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta 3540 agaacgttat ttatatttca aatttttctt ttttttctgt acagacgcgt gtacgcatgt 3600 aacattatac tgaaaacctt gcttgagaag gttttgggac gctcgaagga tacttgcaca 3660 agttccacta attactgaca tttgtggtat taactcgttt gactgctcta caattgtagg 3720 atgttaatca atgtcttggc tgccttcatt ctcttcaggc tctattaatt ttaaccgtta 3780 taagttcctt ttctcccttg gaagcaaaca tcaactgcct taaaatctgg tggcgaggaa 3840 agaggaaatg gcatgtacta atgatggtcc taataaatat cccgaaattg tgagtgttaa 3900 gcacctgttc caacattcgg gatccaagca tgaatttagt gctggtaaac gattttcaaa 3960 atccattggt aaaatattca aacgaaactc tgctttgaaa acttctagaa ctgaaacggc 4020 aaatcataaa atggaattga aaaaaagaga gggtgttacc ttattgccac ctgtcccaga 4080 atcattatta cataaactca attcttggtt ggaaactttt tcttccacca agaacatgaa 4140 aatcgaagaa aacaaaattg ttattaatga aaaagagatt cgggattcag tctcttacta 4200 ccctgataag aatggaggaa gtgctgtatt ttgttacttg cccgaccttg tgctatatta 4260 taagccgcct ataaaagtca caggcaagca atgtccaata aagagaagtc cttgggaatc 4320 gatggaaatc caatatcaaa agtttatgta ccccttagaa aggttggaaa gacagtttga 4380 ggaagttcca tttaggccct ggtattttgc aatgcgatta aaggaacttt acagatgctg 4440 tgaaaggtct tttactaacg cggcaaatag aggaa 4475 <210> 44 <211> 8247 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: 9XFS_URA3_FS.4 donor cassette <400> 44 attgctattg agtaagttcg atccgtttgg cgtcttttgg ggtgtaacgc caaacttatt 60 acttttccta tttgaggttg gtattgattg ttgtcaaaga atgaaaatat acacaaacgc 120 cacaatatac gtaccaggtt cacgaaaact gatcgtatgg ttcataccct gacttggcaa 180 acctaatgtg accgtcgctg attagcggat cacgaaaagt gatctcgata caattagagg 240 atccacgaaa atgatgtgaa tgaatacatg aaagattcat gagatctgac aacatggtag 300 acgtgtgtgt ctcatggaaa ttgatgcagt tgaagacatg tgcgtcacga aaaaagaaat 360 caatcctaca cagggcttaa gggcaaatgt attcatgtgt gtcacgaaaa gtgatgtaac 420 taaatacacg attaccatgg aaattaacgt accttttttg tgcgtgtatt gaaatattat 480 gacatattac agaaagggtt cgcaagtcct gtttctatgc ctttctctta gtaattcacg 540 aaataaacct atggtttacg aaatgatcca cgaaaatcat gttattattt acatcaacat 600 atcgcgaaaa ttcatgtcat gtccacatta acatcattgc agagcaacaa ttcattttca 660 tagagaaatt tgctactatc acccactagt actaccattg gtacctacta ctttgaattg 720 tactaccgct gggcgttatt aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa 780 agtcgcggaa aaaagtaaac agctattgct actcaaatga ggtttgcaga agcttgttga 840 agcatgatga agcgttctaa acgcactatt catcattaaa tatttaaagc tcataaaatt 900 gtattcaatt cctattctaa atggctttta tttctattac aactattagc tctaaatcca 960 tatcctcata agcagcaatc aattctatct atactttaaa agtaaaattc ttgagggaac 1020 tttcaccatt atgggaaatg gttcaagaag gtattgactt aaactccatc aaatggtcag 1080 gtcattgagt gttttttatt tgttgtattt tttttttttt agagaaaatc ctccaatatc 1140 aaattaggaa tcgtagtttc atgattttct gttacaccta actttttgtg tggtgccctc 1200 ctccttgtca atattaatgt taaagtgcaa ttctttttcc ttatcacgtt gagccattag 1260 tatcaatttg cttacctgta ttcctttact atcctccttt ttctccttct tgataaatgt 1320 atgtagattg cgtatatagt ttcgtctacc ctatgaacat attccatttt gtaatttcgt 1380 gtcgtttcta ttatgaattt catttataaa gtttatgtac aaatatcata aaaaaagaga 1440 atctttttaa gcaaggattt tcttaacttc ttcggcgaca gcatcaccga cttcggtggt 1500 actgttggaa ccacctaaat caccagttct gatacctgca tccaaaacct ttttaactgc 1560 atcttcaatg gccttacctt cttcaggcaa gttcaatgac aatttcaaca tcattgcagc 1620 agacaagata gtggcgatag ggtcaacctt attctttggc aaatctggag cagaaccgtg 1680 gcatggttcg tacaaaccaa atgcggtgtt cttgtctggc aaagaggcca aggacgcaga 1740 tggcaacaaa cccaaggaac ctgggataac ggaggcttca tcggagatga tatcaccaaa 1800 catgttgctg gtgattataa taccatttag gtgggttggg ttcttaacta ggatcatggc 1860 ggcagaatca atcaattgat gttgaacctt caatgtaggg aattcgttct tgatggtttc 1920 ctccacagtt tttctccata atcttgaaga ggccaaaaca ttagctttat ccaaggacca 1980 aataggcaat ggtggctcat gttgtagggc catgaaagcg gccattcttg tgattctttg 2040 cacttctgga acggtgtatt gttcactatc ccaagcgaca ccatcaccat cgtcttcctt 2100 tctcttacca aagtaaatac ctcccactaa ttctctgaca acaacgaagt cagtaccttt 2160 agcaaattgt ggcttgattg gagataagtc taaaagagag tcggatgcaa agttacatgg 2220 tcttaagttg gcgtacaatt gaagttcttt acggattttt agtaaacctt gttcaggtct 2280 aacactaccg gtaccccatt taggaccacc cacagcacct aacaaaacgg catcaacctt 2340 cttggaggct tccagcgcct catctggaag tgggacacct gtagcatcga tagcagcacc 2400 accaattaaa tgattttcga aatcgaactt gacattggaa cgaacatcag aaatagcttt 2460 aagaacctta atggcttcgg ctgtgatttc ttgaccaacg tggtcacctg gcaaaacgac 2520 gatcttctta ggggcagaca taggggcaga cattagaatg gtatatcctt gaaatatata 2580 tatatattgc tgaaatgtaa aaggtaagaa aagttagaaa gtaagacgat tgctaaccac 2640 ctattggaaa aaacaatagg tccttaaata atattgtcaa cttcaagtat tgtgatgcaa 2700 gcatttagtc atgaacgctt ctctattcta tatgaaaagc cggttccggc ctctcacctt 2760 tcctttttct cccaattttt cagttgaaaa aggtatatgc gtcaggcgac ctctgaaatt 2820 aacaaaaaat ttccagtcat cgaatttgat tctgtgcgat agcgcccctg tgtgttctcg 2880 ttatgttgag gaaaaaaata atggttgcta agagattcga actcttgcat cttacgatac 2940 ctgagtattc ccacagttaa ctgcggtcaa gatatttctt gaatcaggcg ccttagaccg 3000 ctcggccaaa caaccaatta cttgttgaga aatagagtat aattatccta taaatataac 3060 gtttttgaac acacatgaac aaggaagtac aggacaattg attttgaaga gaatgtggat 3120 tttgatgtaa ttgttgggat tccattttta ataaggcaat aatattaggt atgtggatat 3180 actagaagtt ctcctcgacc gtaataatca tattacatgg cattaccacc atatacatat 3240 ccatatacat atccatatct aatcttactt atatgttgtg gaaatgtaaa gagccccatt 3300 atcttagcct aaaaaaacct tctctttgga actttcagta atacgcttaa ctgctcattg 3360 cgccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt cctcgtcttc 3420 accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga acaataaaga 3480 ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac ctggccccac 3540 aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga ttagtttttt 3600 agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat taacagatat 3660 ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc ggtttgtatt 3720 acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac ctctatactt 3780 taacgtcaag gagaaaaaac tataatgtcc actttgccta tttcctctgt ttcttcctct 3840 ccatctactt ccccaattgt tgtcgatgat aaggattcta ccaagccaga cgttattaga 3900 cataccgcta acttcaacgc ttccatttgg ggtgatcaat ttttgactta cgatgaacca 3960 gaggacttgg ttatgaagaa gcaattagtc gaagagttaa aggaggaagt taagaaggaa 4020 ttgattacta ttaagggttc taacgaacct atgcaacatg ttaagttgat cgaattaatc 4080 aatgctgttc aacgtttagg tattgcttac cattttgaag aagaaatcga agaagcttta 4140 caacatatcc atgtcactta cggtgaacaa tgggtcgata aggaaaattt acaatctatc 4200 tccttgtggt ttcgtttgtt gcgtcaacaa ggtttcaatg tctcctctgg tgttttcaag 4260 gactttatgg acgaaaaagg taaatttaag gaatctttgt gtaacgacgc tcaaggtatc 4320 ttggccttgt acgaagctgc tttcatgaga gtcgaagatg aaaccatctt ggacaacgct 4380 ttggaattct ctaaggttca cttggacatt attgccaagg atccatcttg tgactcttcc 4440 ttaagaaccc aaatccacca agccttgaag caaccattga gaagaagatt ggccagaatc 4500 gaagctttac actatatgcc aatttaccaa caagaaactt ctcacgacga ggttttgttg 4560 aagttggcta agttagattt ctctgttttg caatccatgc ataagaaaga attgtctcac 4620 atctgcaagt ggtggaaaga tttagacttg caaaacaaat tgccattcgt tcgtgataga 4680 gttgtcgaag gttacttctg gattttgtct atttactatg aaccacaaca tgccagaacc 4740 agaatgttct tgatgaagtc ttgtatgtgg ttggtcgttt tggatgatac cttcgacaac 4800 tacggtacct acgaagaatt ggaaattttc actcaagccg ttgagaagtg gtccatttct 4860 tgtttggaca tgttgccaga atacatgaag ttgatctacc aagaattggt taacttgcac 4920 gttgaaatgg aagaatcttt agaaaaggaa ggtaaggctt atcaaatcca ctacgttaag 4980 gaaatggcta aggaattggt cagaaactac ttggttgaag ccagatggtt gaaagaaggt 5040 tacatgccta ctttggaaga gtacatgtct gtttccatgg ttaccggtac ctacggtttg 5100 atcactgcta gatcttacgt tggtagaggt gacattgtta acgaggacac ttttaaatgg 5160 gtttcttcct acccacctat tgttgaagct tcttgtgtta tcattagatt gatggatgat 5220 attgtctctc ataaagaaga acaagaaaga ggtcatgttg cctcctccat cgaatgttat 5280 tctaaggaat ccggtgcttc tgaagaagaa gcctgtgaat acatctctag aaaagtcgaa 5340 gacgcctgga aggttattaa cagagaatct ttgagaccaa ccgccgttcc attccctttg 5400 ttaatgccag ctatcaactt ggctagaatg tgtgaagttt tatactctgt taacgatggt 5460 ttcactcacg ccgaaggtga catgaaatct tacatgaagt ccttctttgt ccatccaatg 5520 gtcgtttgag cgaatttctt atgatttatg atttttatta ttaaataagt tataaaaaaa 5580 ataagtgtat acaaatttta aagtgactct taggttttaa aacgaaaatt cttattcttg 5640 agtaactctt tcctgtaggt caggttgctt tctcaggtat agcatgaggt cgctcatgcg 5700 tccatcttta cagtcctgtc ttattgttct tgatttgtgc cccgtaaaat actgttactt 5760 ggttctggcg aggtattgga tagttccttt ttataaaggc catgaagctt tttctttcca 5820 attttttttt tttcgtcatt atagaaatca ttacgaccga gattcccggg taataactga 5880 tataattaaa ttgaagctct aatttgtgag tttagtatac atgcatttac ttataataca 5940 gttttttagt tttgctggcc gcatcttctc aaatatgctt cccagcctgc ttttctgtaa 6000 cgttcaccct ctaccttagc atcccttccc tttgcaaata gtcctcttcc aacaataata 6060 atgtcagatc ctgtagagac cacatcatcc acggttctat actgttgacc caatgcgtct 6120 cccttgtcat ctaaacccac accgggtgtc ataatcaacc aatcgtaacc ttcatctctt 6180 ccacccatgt ctctttgagc aataaagccg ataacaaaat ctttgtcact cttcgcaatg 6240 tcaacagtac ccttagtata ttctccagta gatagggagc ccttgcatga caattctgct 6300 aacatcaaaa ggcctctagg ttcctttgtt acttcttctg ccgcctgctt caaaccgcta 6360 acaatacctg ggcccaccac accgtgtgca ttcgtaatgt ctgcccattc tgctattctg 6420 tatacacccg cagagtactg caatttgact gtattaccaa tgtcagcaaa ttttctgtct 6480 tcgaagagta aaaaattgta cttggcggat aatgccttta gcggcttaac tgtgccctcc 6540 atggaaaaat cagtcaagat atccacatgt gtttttagta aacaaatttt gggacctaat 6600 gcttcaacta actccagtaa ttccttggtg gtacgaacat ccaatgaagc acacaagttt 6660 gtttgctttt cgtgcatgat attaaatagc ttggcagcaa caggactagg atgagtagca 6720 gcacgttcct tatatgtagc tttcgacatg atttatcttc gtttcctgca ggtttttgtt 6780 ctgtgcagtt gggttaagaa tactgggcaa tttcatgttt cttcaacacc acatatgcgt 6840 atatatacca atctaagtct gtgctccttc cttcgttctt ccttctgctc ggagattacc 6900 gaatcaaaaa aatttcaaag aaaccggaat caaaaaaaag aacaaaaaaa aaaaagatga 6960 attgaaaagc tttatggacc ctgaaaccac agccacatta accttctttg atggtcaaaa 7020 cttatccttc accataaata tgcctcgcaa aaaaggtaat taacatatat agaattacat 7080 tatttatgaa atatcatcac tatctcttag catctttaat ccttttctac atcagataac 7140 ttcggtttgt tatcatcgtc tgtattgtca tcaattggcg cagtagcctc aatttcaacg 7200 tcgtttgact ctggtgtttg ttcatgtgca gatccatgag atgatgaaat gtgtatatta 7260 gtttaaaaag ttgtatgtaa taaaagtaaa atttaatatt ttggatgaaa aaaaccattt 7320 ttagactttt tcttaactag aatgctggag tagaaatacg ccatctcaag atacaaaaag 7380 cgttaccggc actgatttgt ttcaaccagt atatagatta ttattgggtc ttgatcaact 7440 ttcctcagac atatcagtaa cagttatcaa gctaaatatt tacgcgaaag aaaaacaaat 7500 attttaattg tgatacttgt gaattttatt ttattaagga tacaaagtta agagaaaaca 7560 aaatttatat acaatataag taatattcat atatatgtga tgaatgcagt cttaacgaga 7620 agacatggcc ttggtgacaa ctctcttcaa accaacttca gcctttctca attcatcagc 7680 agatgggtct tcgatttgca aagcagccaa agcatcggac aaagcagctt caatcttgga 7740 cttggaacct ctcttcaatt tagaagacaa gactgggtca gtgacagttt gttcgatgga 7800 ggcaacgtag gattccaatc tttgtctagc ttcgtgcttc ttggcaaaag cttcatcggc 7860 agccttgaac tcttcagctt ggttaaccat cttttcaatt tcttcagaag acaatctacc 7920 aacagcgtta gagatagtga tgttagaaga cttaccggta gacttttcga cggcagtaac 7980 cttcaagata ccgttagcat caacttcgaa gatagcttcc aagactggtt caccagctgg 8040 catcattggg atgttcttca agtcgaattc acccaacaaa gtgttttctt tacagttaac 8100 acgttcacct tggtagactg ggaattgaac ggtggtttgg ttgtcagcac atgtagtaaa 8160 ggttcttctc ttgatggttg gaacagtagt gtttcttgga acaacgatac cgaacatgtc 8220 accttgcata ccaacaccta gagataa 8247 <210> 45 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for FS-specific TALEN <400> 45 tagtggagga attaaaagag gaagttaaga aggaattgat aactatcaa 49 <210> 46 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer HJ272 <400> 46 ataacaatat tataaaaagc gcttaa 26 <210> 47 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer ART45 <400> 47 tactgcttcg gtagtagttt cacccttca 29 <210> 48 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer HJ643 <400> 48 aaaatcctta tattattggc cc 22 <210> 49 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer HJ799 <400> 49 gtagcctaaa acaagcgcc 19 <210> 50 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Homing endonuclease family conserved motif <400> 50 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 51 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: Homing endonuclease family conserved motif <400> 51 Gly Ile Tyr Tyr Ile Gly 1 5 <210> 52 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for I-SceI <400> 52 tagggataac agggtaat 18 <210> 53 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for VDE (PI-SceI) <400> 53 tatgtcgggt gcggagaaag aggtaatgaa a 31 <210> 54 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for F-CphI <400> 54 gatgcacgag cgcaacgctc acaa 24 <210> 55 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for PI-MgaI <400> 55 gcgtagctgc ccagtatgag tcag 24 <210> 56 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for PI-MtuII <400> 56 acgtgcacta cgtagagggt cgcaccgcac cgatctacaa 40 <210> 57 <211> 4300 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADE2_SFC1 donor cassette <400> 57 ccggtggtgc ttatactgtt tctactgcag ctgccgctac tgttagatct accatcagaa 60 gattaagaga aatggttgaa gcttaaactt ctttcattca ttttctcttg gctttcacta 120 ggtatatcta ttccataacg actatgtttt gtatttgtta atttacataa aaccatatca 180 gtacatcaac gaactgtaaa aaagaaactt tagcataatt attgcggata tttaaactca 240 cttgcaggta agagcaaaag gcgattgatt tccagtccgc ctcttgtcac gtgatttagt 300 aagaaatttt gacagcaccc tcggtttaat ggaaaagagg ggcgtttttc gatgaacccg 360 aggggagact agagaatcat ctcggttgaa tggagcatta tttttttagt agcgcccgcc 420 cggagaaatg gacgttggcg aatgagccat gaattattaa ccgcccatgt ctaccagata 480 gacggcacgg ccacgcgttt aaaccgcccc acatcgtatg acagtaccag cctagtcccg 540 gtaaaccgca aacggacctt aattgtgacg aagggcccaa atttgatggg tcggtgttaa 600 tgattagtcc tcattgtcat aataaagtgt gatgatggag gcaatgatga tatacggtag 660 tactactgct cgaggtgcta tcttttaacc aatcctttga gattcttgtc gccacggagt 720 tactaccttt tacaaaccgt aatgtcacat tttgcatata tcttatgtat aaatatatag 780 ttcacttact acttgttctc gttttgttaa ctttcttgtt gtagttcttc ttgttcttgg 840 cgtttccccc tttgttttct atctgcttca taagtaaagt gcaaagcatt ttggaagata 900 ttatcaattg agtcattgaa agaaacttgg catcttccct attactaaaa ctaagaatac 960 ttgattcaag aaagaagttt atattagttt tagccgtaag ataacataac aaagaagaag 1020 aaagaaaatt cttgaataat acataacttt tcttaaaaga atcaaagaca gataaaattt 1080 aagagatatt aaatattagt gagaagccga gaattttgta acaccaacat aacactgaca 1140 tctttaacaa cttttaatta tgatacattt cttacgtcat gattgattat tacagctatg 1200 ctgacaaatg actcttgttg catggctacg aaccgggtaa tactaagtga ttgactcttg 1260 ctgacctttt attaagaact aaatggacaa tattatggag catttcatgt ataaattggt 1320 gcgtaaaatc gttggatctc tcttctaagt acatcctact ataacaatca agaaaaacaa 1380 gaaaatcgga caaaacaatc aagtatggat tctagaacag ttggtatatt aggaggggga 1440 caattgggac gtatgattgt tgaggcagca aacaggctca acattaagac ggtaatacta 1500 gatgctgaaa attctcctgc caaacaaata agcaactcca atgaccacgt taatggctcc 1560 ttttccaatc ctcttgatat cgaaaaacta gctgaaaaat gtgatgtgct aacgattgag 1620 attgagcatg ttgatgttcc tacactaaag aatcttcaag taaaacatcc caaattaaaa 1680 atttaccctt ctccagaaac aatcagattg atacaagaca aatatattca aaaagagcat 1740 ttaatcaaaa atggtatagc agttacccaa agtgttcctg tggaacaagc cagtgagacg 1800 tccctattga atgttggaag agatttgggt tttccattcg tcttgaagtc gaggactttg 1860 gcatacgatg gaagaggtaa cttcgttgta aagaataagg aaatgattcc ggaagctttg 1920 gaagtactga aggatcgtcc tttgtacgcc gaaaaatggg caccatttac taaagaatta 1980 gcagtcatga ttgtgaggtc tgttaacggt ttagtgtttt cttacccaat tgtagagact 2040 atccacaagg acaatatttg tgacttatgt tatgcgcctg ctagagttcc ggactccgtt 2100 caacttaagg cgaagttgtt ggcagaaaat gcaatcaaat cttttcccgg ttgtggtata 2160 tttggtgtgg aaatgttcta tttagaaaca ggggaattgc ttattaacga aattgcccca 2220 aggcctcaca actctggaca ttataccatt gatgcttgcg tcacttctca atttgaagct 2280 catttgagat caatattgga tttgccaatg ccaaagaatt tcacatcttt ctccaccatt 2340 acaacgaacg ccattatgct aaatgttctt ggagacaaac atacaaaaga taaagagcta 2400 gaaacttgcg aaagagcatt ggcgactcca ggttcctcag tgtacttata tggaaaagag 2460 tctagaccta acagaaaagt aggtcacata aatattattg cctccagtat ggcggaatgt 2520 gaacaaaggc tgaactacat tacaggtaga actgatattc caatcaaaat ctctgtcgct 2580 caaaagttgg acttggaagc aatggtcaaa ccattggttg gaatcatcat gggatcagac 2640 tctgacttgc cggtaatgtc tgccgcatgt gcggttttaa aagattttgg cgttccattt 2700 gaagtgacaa tagtctctgc tcatagaact ccacatagga tgtcagcata tgctatttcc 2760 gcaagcaagc gtggaattaa aacaattatc gctggagctg gtggggctgc tcacttgcca 2820 ggtatggtgg ctgcaatgac accacttcct gtcatcggtg tgcccgtaaa aggttcttgt 2880 ctagatggag tagattcttt acattcaatt gtgcaaatgc ctagaggtgt tccagtagct 2940 accgtcgcta ttaataatag tacgaacgct gcgctgttgg ctgtcagact gcttggcgct 3000 tatgattcaa gttatacaac gaaaatggaa cagtttttat taaagcaaga agaagaagtt 3060 cttgtcaaag cacaaaagtt agaaactgtc ggttacgaag cttatctaga aaacaagtaa 3120 tatataagtt tattgatata cttgtacagc aaataattat aaaatgatat acctattttt 3180 taggctttgt tatgattaca tcaaatgtgg acttcataca tagaaatcaa cgcttacagg 3240 tgtccttttt taagaatttc atacataaga tcatgatgaa caatgggact acaaaatgaa 3300 ataaagaaaa aatagaaata gaatagaaga tcaattatta atcgccctat tcttccttat 3360 tacctacaca aaataaagca gcaacataag aaacaaaaac aaaatgaaaa caaaccaaat 3420 aaatctatgt aagcatactc atttcaattt gatattcatt acttgacttt tttgtcctta 3480 tttgaggctc cataagcgcg ccattttccc ctactccctt ttttcgtaaa tagtaataat 3540 gtgctgaaaa gaacaatgaa gtagttatca tacatattcc gtcgtgtcga tatgagggga 3600 ggtgtctctt tctttcatcc cttgtcgcaa cctccaatat ataagagcat aagcaactga 3660 tcttacttta gtaattaact tagcatacct ggcccgaagg aagaaaaaaa attcacctca 3720 acaacatggt tcctaagttt tacaaacttt caaacggctt caaaatccca agcattgctt 3780 tgggaaccta ccggtgttta aaccccagcg cctggcgggg atattccaag atcgcaaaca 3840 gccgaaattg tgtatgaagg tgtcaagtgc ggctaccgtc atttcgatac tgctgttctt 3900 tatggtaatg agaaggaagt tggcgatggt atcattaaat ggttgaacga agatccaggg 3960 aaccataaac gtgaggaaat cttctacact actaaattat ggaattcgca aaacggatat 4020 aaaagagcta aagctgccat tcagcaatgt ttgaatgaag tctcgggctt gcaatacatc 4080 gatcttcttt tgattcattc gccactggaa ggttctaaat taaggttgga aacttggcgc 4140 gccatgcaag aagcggttga tgaaggattg gttaagtcta taggggtttc caactatggg 4200 aaaaagcaca ttgatgaact tttgaactgg ccagaactga agcacaagcc agtggtcaac 4260 caaatcgaga tatcaccttg gattatgaga caagaattag 4300 <210> 58 <211> 3586 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: GFP_SFC1 donor cassette <400> 58 ccggtggtgc ttatactgtt tctactgcag ctgccgctac tgttagatct accatcagaa 60 gattaagaga aatggttgaa gcttaaactt ctttcattca ttttctcttg gctttcacta 120 ggtatatcta ttccataacg actatgtttt gtatttgtta atttacataa aaccatatca 180 gtacatcaac gaactgtaaa aaagaaactt tagcataatt attgcggata tttaaactca 240 cttgcaggta agagcaaaag gcgattgatt tccagtccgc ctcttgtcac gtgatttagt 300 aagaaatttt gacagcaccc tcggtttaat ggaaaagagg ggcgtttttc gatgaacccg 360 aggggagact agagaatcat ctcggttgaa tggagcatta tttttttagt agcgcccgcc 420 cggagaaatg gacgttggcg aatgagccat gaattattaa ccgcccatgt ctaccagata 480 gacggcacgg ccacgcgttt aaaccgcccc acatcgtatg acagtaccag cctagtcccg 540 gtaaaccgca aacggacctt aattgtgacg aagggcccaa atttgatggg tcggtgttaa 600 tgattagtcc tcattgtcat aataaagtgt gatgatggag gcaatgatga tatacggtag 660 tactactgct cgaggtgcta tcttttaacc aatcctttga gattcttgtc gccacggagt 720 tactaccttt tacaaaccgt aatgtcacat tttgcatata tcttatgtat aaatatatag 780 ttcacttact acttgttctc gttttgttaa ctttcttgtt gtagttcttc ttgttcttgg 840 cgtttccccc tttgttttct atctgcttca taagtaaagt gcaaagcatt ttggaagata 900 ttatcaattg agtcattgaa agaaacttgg catcttccct attactaaaa ctaagaatac 960 ttgattcaag aaagaagttt atattagttt tagccgtaag ataacataac aaagaagaag 1020 aaagaaaaac acaattacag taacaataac aagaggacag atactaccaa aatgtgtggg 1080 gaagcgggta agctgccaca gcaattaatg cacaacattt aacctacatt cttccttatc 1140 ggatcctcaa aacccttaaa aacatatgcc tcaccctaac atattttcca attaaccctc 1200 aatatttctc tgtcacccgg cctctatttt ccattttctt ctttacccgc cacgcgtttt 1260 tttctttcaa atttttttct tctttcttct ttttcttcca cgtcctcttg cataaataaa 1320 taaaccgttt tgaaaccaaa ctcgcctctc tctctccttt ttgaaatatt tttgggtttg 1380 tttgatcctt tccttcccaa tctctcttgt ttaatatata ttcatttata tcacgctctc 1440 tttttatctt cctttttttc ctctctcttg tattcttcct tcccctttct actcaaacca 1500 agaagaaaaa gaaaaggtca atctttgtta aagaatagga tcttctacta catcagcttt 1560 tagatttttc acgcttactg cttttttctt cccaagatcg aaaatttact gaattaacaa 1620 tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg 1680 gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg 1740 gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc 1800 tcgtgaccac cttgacctac ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc 1860 agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 1920 tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg 1980 tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca 2040 agctggagta caactacaac agccacaagg tctatatcac cgccgacaag cagaagaacg 2100 gcatcaaggt gaacttcaag acccgccaca acatcgagga cggcagcgtg cagctcgccg 2160 accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact 2220 acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc 2280 tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaac 2340 tcgagaagct tgatccggct gcgaatttct tatgatttat gatttttatt attaaataag 2400 ttataaaaaa aataagtgta tacaaatttt aaagtgactc ttaggtttta aaacgaaaat 2460 tcttattctt gagtaactct ttcctgtagg tcaggttgct ttctcaggta tagcatgagg 2520 tcgctcttat tgaccacacc tctaccggca tgccgagcat gatgaacaat gggactacaa 2580 aatgaaataa agaaaaaata gaaatagaat agaagatcaa ttattaatcg ccctattctt 2640 ccttattacc tacacaaaat aaagcagcaa cataagaaac aaaaacaaaa tgaaaacaaa 2700 ccaaataaat ctatgtaagc atactcattt caatttgata ttcattactt gacttttttg 2760 tccttatttg aggctccata agcgcgccat tttcccctac tccctttttt cgtaaatagt 2820 aataatgtgc tgaaaagaac aatgaagtag ttatcataca tattccgtcg tgtcgatatg 2880 aggggaggtg tctctttctt tcatcccttg tcgcaacctc caatatataa gagcataagc 2940 aactgatctt actttagtaa ttaacttagc atacctggcc cgaaggaaga aaaaaaattc 3000 acctcaacaa catggttcct aagttttaca aactttcaaa cggcttcaaa atcccaagca 3060 ttgctttggg aacctaccgg tgtttaaacc ccagcgcctg gcggggatat tccaagatcg 3120 caaacagccg aaattgtgta tgaaggtgtc aagtgcggct accgtcattt cgatactgct 3180 gttctttatg gtaatgagaa ggaagttggc gatggtatca ttaaatggtt gaacgaagat 3240 ccagggaacc ataaacgtga ggaaatcttc tacactacta aattatggaa ttcgcaaaac 3300 ggatataaaa gagctaaagc tgccattcag caatgtttga atgaagtctc gggcttgcaa 3360 tacatcgatc ttcttttgat tcattcgcca ctggaaggtt ctaaattaag gttggaaact 3420 tggcgcgcca tgcaagaagc ggttgatgaa ggattggtta agtctatagg ggtttccaac 3480 tatgggaaaa agcacattga tgaacttttg aactggccag aactgaagca caagccagtg 3540 gtcaaccaaa tcgagatatc accttggatt atgagacaag aattag 3586 <210> 59 <211> 4300 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: ADE2_YJR030C donor cassette <400> 59 ggaactttat gaacatatta agtctgcttg atgaaatgtc atgtgcaggt gccgttggca 60 caaaatggga acaaaattat gaaaattcag tcgaggatgg gtgtgaagca cctgaatcca 120 atccataccg ttctattatt gatctttcta gtcgttccat taatataact gcagacctac 180 tttcgactgt tgggaggagt aattcagcac tcaacaagaa tgagattata gctgctattc 240 aaggtctcgc ccatcaatgc ctcaatccct gtgacgaact aggtatgcaa gcattgcaag 300 cattagagaa cattctgtta tctcgagcaa gtcaactacg tacggaaaaa gttgcggtgg 360 ataacctact agagacagga ttattaccga tttttgagtt ggatgaaatc caagatgtca 420 agatgaaacg aattactagc attttatccg ttctttctaa aatgacggca cggccacgcg 480 tttaaaccgc ccttcttggg tcaacttgtg gaaggcgtaa caagtaacga aacttttttg 540 agagtgctta acgtatttaa caagtatgta gatgatccta cggtggaaag gcagttgcaa 600 gagttgatta tttctaagag ggaaatcgag aaggagtaga ccaacgataa tgtaactata 660 ccaagaaact tagtatgatg gaattttttc aaggagtcgt aaattagatt ttcgcaggta 720 ataatgcgat atataagcaa tctcatttaa atatcgacgg tggcatttat accatcattt 780 actgttatat ttatctaacg cgtcgcgacg cgttagataa aatacaacaa gatttttttt 840 tcgtgtcacc aatggcatga aagcttcgag aataatttga aggaaatttc acttaatggg 900 aaaaataaaa atgtaccctt atcgagatta ctcttttacc ctcagttcaa ttaaaattca 960 tcatgaacca agtaaaagtt cctctaatta cgaacgagca agcaaattag tattgtgtgg 1020 gagacgggtt cttgaataat acataacttt tcttaaaaga atcaaagaca gataaaattt 1080 aagagatatt aaatattagt gagaagccga gaattttgta acaccaacat aacactgaca 1140 tctttaacaa cttttaatta tgatacattt cttacgtcat gattgattat tacagctatg 1200 ctgacaaatg actcttgttg catggctacg aaccgggtaa tactaagtga ttgactcttg 1260 ctgacctttt attaagaact aaatggacaa tattatggag catttcatgt ataaattggt 1320 gcgtaaaatc gttggatctc tcttctaagt acatcctact ataacaatca agaaaaacaa 1380 gaaaatcgga caaaacaatc aagtatggat tctagaacag ttggtatatt aggaggggga 1440 caattgggac gtatgattgt tgaggcagca aacaggctca acattaagac ggtaatacta 1500 gatgctgaaa attctcctgc caaacaaata agcaactcca atgaccacgt taatggctcc 1560 ttttccaatc ctcttgatat cgaaaaacta gctgaaaaat gtgatgtgct aacgattgag 1620 attgagcatg ttgatgttcc tacactaaag aatcttcaag taaaacatcc caaattaaaa 1680 atttaccctt ctccagaaac aatcagattg atacaagaca aatatattca aaaagagcat 1740 ttaatcaaaa atggtatagc agttacccaa agtgttcctg tggaacaagc cagtgagacg 1800 tccctattga atgttggaag agatttgggt tttccattcg tcttgaagtc gaggactttg 1860 gcatacgatg gaagaggtaa cttcgttgta aagaataagg aaatgattcc ggaagctttg 1920 gaagtactga aggatcgtcc tttgtacgcc gaaaaatggg caccatttac taaagaatta 1980 gcagtcatga ttgtgaggtc tgttaacggt ttagtgtttt cttacccaat tgtagagact 2040 atccacaagg acaatatttg tgacttatgt tatgcgcctg ctagagttcc ggactccgtt 2100 caacttaagg cgaagttgtt ggcagaaaat gcaatcaaat cttttcccgg ttgtggtata 2160 tttggtgtgg aaatgttcta tttagaaaca ggggaattgc ttattaacga aattgcccca 2220 aggcctcaca actctggaca ttataccatt gatgcttgcg tcacttctca atttgaagct 2280 catttgagat caatattgga tttgccaatg ccaaagaatt tcacatcttt ctccaccatt 2340 acaacgaacg ccattatgct aaatgttctt ggagacaaac atacaaaaga taaagagcta 2400 gaaacttgcg aaagagcatt ggcgactcca ggttcctcag tgtacttata tggaaaagag 2460 tctagaccta acagaaaagt aggtcacata aatattattg cctccagtat ggcggaatgt 2520 gaacaaaggc tgaactacat tacaggtaga actgatattc caatcaaaat ctctgtcgct 2580 caaaagttgg acttggaagc aatggtcaaa ccattggttg gaatcatcat gggatcagac 2640 tctgacttgc cggtaatgtc tgccgcatgt gcggttttaa aagattttgg cgttccattt 2700 gaagtgacaa tagtctctgc tcatagaact ccacatagga tgtcagcata tgctatttcc 2760 gcaagcaagc gtggaattaa aacaattatc gctggagctg gtggggctgc tcacttgcca 2820 ggtatggtgg ctgcaatgac accacttcct gtcatcggtg tgcccgtaaa aggttcttgt 2880 ctagatggag tagattcttt acattcaatt gtgcaaatgc ctagaggtgt tccagtagct 2940 accgtcgcta ttaataatag tacgaacgct gcgctgttgg ctgtcagact gcttggcgct 3000 tatgattcaa gttatacaac gaaaatggaa cagtttttat taaagcaaga agaagaagtt 3060 cttgtcaaag cacaaaagtt agaaactgtc ggttacgaag cttatctaga aaacaagtaa 3120 tatataagtt tattgatata cttgtacagc aaataattat aaaatgatat acctattttt 3180 taggctttgt tatgattaca tcaaatgtgg acttcataca tagaaatcaa cgcttacagg 3240 tgtccttttt taagaatttc atacataaga tcatgttgag ataattgttg ggattccatt 3300 gttgataaag gctataatat taggtataca gaatatacta gaagttctcc tcgaggatat 3360 aggaatcctc aaaatggaat ctatatttct acatactaat attacgatta ttcctcattc 3420 cgttttatat gtttatattc attgatccta ttacattatc aatccttgcg tttcagcttc 3480 ctctaacttc gatgacagct tctcataact tatgtcatca tcttaacacc gtatatgata 3540 atatattgat aatataacta ttagttgata gacgatagtg gatttttatt ccaacatacc 3600 acccataatg taatagatct aatgaatcca tttgtttgtt aatagtttga atgtttttat 3660 cggaagaggt ttggtcatta cgtctgcaat attctttttg gtttcgatat agcatacgtg 3720 cagatgattt cctgatactt catctctcaa tctcattgct ttagtaccaa aaaatctgtt 3780 cctaaatttc cggtgtttaa accccagcgc ctggcgggtc ttcattattg gatataatta 3840 tactgattgt agatttactg tcggttagta atcctttggt aattggtttc ttgtcaagtt 3900 cttgtatcag gtaacttaga ttatttaata atgggacaga ttcacttatc gcgtgtattt 3960 ctgcttccgt agttgaagta catgttaatg aagccttggt ggactttcct ccaattacct 4020 ttccattaag taaatatatg ttgccaattt gtgatttata atacggttgg ttgccatacg 4080 aggcatcgct tataacaact aatttatttg ttggcttaac aggtttgctt ttgtgccata 4140 ttaattgctt atctctcgta ttccatatga actgtatcaa ttcatatgtc atatctaaca 4200 cttgcttgga cggaaatagt atatgttgtg caagtgtgtt gatgtagtat aataggtcaa 4260 atctaaattt atatccaaca tatgatgcta gacctatcag 4300 <210> 60 <211> 3586 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: GFP_YJR030C donor cassette <400> 60 ggaactttat gaacatatta agtctgcttg atgaaatgtc atgtgcaggt gccgttggca 60 caaaatggga acaaaattat gaaaattcag tcgaggatgg gtgtgaagca cctgaatcca 120 atccataccg ttctattatt gatctttcta gtcgttccat taatataact gcagacctac 180 tttcgactgt tgggaggagt aattcagcac tcaacaagaa tgagattata gctgctattc 240 aaggtctcgc ccatcaatgc ctcaatccct gtgacgaact aggtatgcaa gcattgcaag 300 cattagagaa cattctgtta tctcgagcaa gtcaactacg tacggaaaaa gttgcggtgg 360 ataacctact agagacagga ttattaccga tttttgagtt ggatgaaatc caagatgtca 420 agatgaaacg aattactagc attttatccg ttctttctaa aatgacggca cggccacgcg 480 tttaaaccgc ccttcttggg tcaacttgtg gaaggcgtaa caagtaacga aacttttttg 540 agagtgctta acgtatttaa caagtatgta gatgatccta cggtggaaag gcagttgcaa 600 gagttgatta tttctaagag ggaaatcgag aaggagtaga ccaacgataa tgtaactata 660 ccaagaaact tagtatgatg gaattttttc aaggagtcgt aaattagatt ttcgcaggta 720 ataatgcgat atataagcaa tctcatttaa atatcgacgg tggcatttat accatcattt 780 actgttatat ttatctaacg cgtcgcgacg cgttagataa aatacaacaa gatttttttt 840 tcgtgtcacc aatggcatga aagcttcgag aataatttga aggaaatttc acttaatggg 900 aaaaataaaa atgtaccctt atcgagatta ctcttttacc ctcagttcaa ttaaaattca 960 tcatgaacca agtaaaagtt cctctaatta cgaacgagca agcaaattag tattgtgtgg 1020 gagacgggac acaattacag taacaataac aagaggacag atactaccaa aatgtgtggg 1080 gaagcgggta agctgccaca gcaattaatg cacaacattt aacctacatt cttccttatc 1140 ggatcctcaa aacccttaaa aacatatgcc tcaccctaac atattttcca attaaccctc 1200 aatatttctc tgtcacccgg cctctatttt ccattttctt ctttacccgc cacgcgtttt 1260 tttctttcaa atttttttct tctttcttct ttttcttcca cgtcctcttg cataaataaa 1320 taaaccgttt tgaaaccaaa ctcgcctctc tctctccttt ttgaaatatt tttgggtttg 1380 tttgatcctt tccttcccaa tctctcttgt ttaatatata ttcatttata tcacgctctc 1440 tttttatctt cctttttttc ctctctcttg tattcttcct tcccctttct actcaaacca 1500 agaagaaaaa gaaaaggtca atctttgtta aagaatagga tcttctacta catcagcttt 1560 tagatttttc acgcttactg cttttttctt cccaagatcg aaaatttact gaattaacaa 1620 tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg 1680 gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg 1740 gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc 1800 tcgtgaccac cttgacctac ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc 1860 agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 1920 tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg 1980 tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca 2040 agctggagta caactacaac agccacaagg tctatatcac cgccgacaag cagaagaacg 2100 gcatcaaggt gaacttcaag acccgccaca acatcgagga cggcagcgtg cagctcgccg 2160 accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact 2220 acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc 2280 tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaac 2340 tcgagaagct tgatccggct gcgaatttct tatgatttat gatttttatt attaaataag 2400 ttataaaaaa aataagtgta tacaaatttt aaagtgactc ttaggtttta aaacgaaaat 2460 tcttattctt gagtaactct ttcctgtagg tcaggttgct ttctcaggta tagcatgagg 2520 tcgctcttat tgaccacacc tctaccggca tgccgagcat gttgagataa ttgttgggat 2580 tccattgttg ataaaggcta taatattagg tatacagaat atactagaag ttctcctcga 2640 ggatatagga atcctcaaaa tggaatctat atttctacat actaatatta cgattattcc 2700 tcattccgtt ttatatgttt atattcattg atcctattac attatcaatc cttgcgtttc 2760 agcttcctct aacttcgatg acagcttctc ataacttatg tcatcatctt aacaccgtat 2820 atgataatat attgataata taactattag ttgatagacg atagtggatt tttattccaa 2880 cataccaccc ataatgtaat agatctaatg aatccatttg tttgttaata gtttgaatgt 2940 ttttatcgga agaggtttgg tcattacgtc tgcaatattc tttttggttt cgatatagca 3000 tacgtgcaga tgatttcctg atacttcatc tctcaatctc attgctttag taccaaaaaa 3060 tctgttccta aatttccggt gtttaaaccc cagcgcctgg cgggtcttca ttattggata 3120 taattatact gattgtagat ttactgtcgg ttagtaatcc tttggtaatt ggtttcttgt 3180 caagttcttg tatcaggtaa cttagattat ttaataatgg gacagattca cttatcgcgt 3240 gtatttctgc ttccgtagtt gaagtacatg ttaatgaagc cttggtggac tttcctccaa 3300 ttacctttcc attaagtaaa tatatgttgc caatttgtga tttataatac ggttggttgc 3360 catacgaggc atcgcttata acaactaatt tatttgttgg cttaacaggt ttgcttttgt 3420 gccatattaa ttgcttatct ctcgtattcc atatgaactg tatcaattca tatgtcatat 3480 ctaacacttg cttggacgga aatagtatat gttgtgcaag tgtgttgatg tagtataata 3540 ggtcaaatct aaatttatat ccaacatatg atgctagacc tatcag 3586 <210> 61 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for ZFN.YJR030C <400> 61 cccggtatca gcaacccccc atgacgataa cgttgatgaa acg 43 <210> 62 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Recognition sequence for ZFN.SFC1 <400> 62 cacctttacc gtttatgaat atgtaaggga gcatttagaa 40 <210> 63 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer CUT351 <400> 63 gcgaatgagc catgaattat taaccgc 27 <210> 64 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer CUT350 <400> 64 agatgaaacg aattactagc attttatccg ttc 33 <210> 65 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer CUT371 <400> 65 taactaccat tactcagtgt acttgattgt tttgtccgat tttcttg 47 <210> 66 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: Primer HJ788 <400> 66 gccgggtgac agagaaatat tg 22

Claims (105)

  1. 복수 (n)개의 외인성 핵산을 숙주 세포 게놈의 복수 (n)개의 표적 부위에 동시에 삽입하는 시험관 내 (in vitro) 방법으로서, 상기 n은 2 이상이며, 상기 숙주 세포가 효모 세포이고, 상기 방법은,
    (a) 숙주 세포를 하기 (i) 및 (ii)와 동시에 접촉시키는 단계:
    (i) 상기 복수의 외인성 핵산으로서,
    x는 1 내지 n의 정수이며, 각각의 정수 x에 대해, 상기 각각의 외인성 핵산 (ES)x는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 상기 복수 (n)개의 표적 부위로부터 선택되는 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있는 것인, 복수의 외인성 핵산; 및
    (ii) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x 로서, 상기 절단으로 (TS)x에서 (ES)x의 상동성 재조합이 이루어지는 것인, 뉴클레아제 (N)x,

    (b) 각각의 외인성 핵산 (ES)x가 이의 선택된 표적 서열 (TS)x에 삽입된 숙주 세포를 회수하는 단계를 포함하며,
    상기 회수에는 선별 마커의 삽입이 필요 없고,
    상기 회수는, 스크리닝한, 접촉된 숙주 세포 또는 이의 클론 개체군 10, 9, 8, 7, 6, 5, 4, 3, 또는 2건 당 1건의 회수율로 이루어지는 것을 특징으로 하는, 방법.
  2. 숙주 세포로서,
    (a) 복수 (n)개의 게놈 표적 부위로서, 상기 n이 2 이상인, 게놈 표적 부위;
    (b) 복수 (n)개의 외인성 핵산으로서, x가 1 내지 n의 정수이며, 각각의 정수 x에 대해, 상기 각각의 외인성 핵산 (ES)x는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 복수 (n)개의 게놈 표적 부위로부터 선택되는 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있는, 복수의 외인성 핵산; 및
    (c) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x로서, 상기 절단으로 (TS)x에서 (ES)x의 상동성 재조합이 이루어지는, 뉴클레아제 (N)x를 포함하며,
    상기 외인성 핵산 (ES)x는 선별 마커를 코딩하는 핵산을 포함하지 않고, 상기 숙주 세포가 효모 세포인, 숙주 세포.
  3. 숙주 세포로서,
    (a) 복수 (n)개의 게놈 표적 부위로서, 상기 n이 2 이상인, 게놈 표적 부위; 및
    (b) 복수 (n)개의 외인성 핵산으로서, x가 1 내지 n의 정수이며, 각각의 정수 x에 대해, 상기 각각의 외인성 핵산 (ES)x는 제1 상동성 영역 (HR1)x 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 복수 (n)개의 게놈 표적 부위로부터 선택되는 표적 부위 (TS)x에서 (ES)x의 숙주 세포 매개의 상동성 재조합을 개시할 수 있는, 복수의 외인성 핵산을 포함하고,
    상기 각각의 게놈 표적 부위 (TS)x는 이중-가닥 절단(double-strand break)을 포함하며,
    상기 외인성 핵산 (ES)x는 선별 마커를 코딩하는 핵산을 포함하지 않고, 상기 숙주 세포가 효모 세포인, 숙주 세포.
  4. 제1항에 있어서,
    상기 (HR1)x가 (TS)x의 5' 영역과 상동성이며,
    상기 (HR2)x는 (TS)x의 3' 영역과 상동성인, 방법.
  5. 제4항에 있어서,
    상기 (N)x가 (TS)x의 상기 5'과 상기 3' 영역 사이에 위치한 영역에서 절단할 수 있는, 방법.
  6. 제1항에 있어서,
    단일 뉴클레아제가 각각의 (TS)x를 절단할 수 있는, 방법.
  7. 제1항에 있어서,
    n이 3, 4, 5, 6, 7, 8, 9 또는 10인, 방법.
  8. 제1항 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 회수는, 숙주 세포를 상기 표적 부위에서 절단할 수 있는 뉴클레아제와 접촉시키지 않는 경우와 비교해, 더 높은 회수율(frequency)로 이루어지는, 방법.
  9. 제1항 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 (N)x가 (TS)x 내 내인성 게놈 서열을 절단할 수 있는, 방법.
  10. 제1항 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 (N)x가 (TS)x 내 외인성 서열을 절단할 수 있는, 방법.
  11. 제10항에 있어서,
    상기 외인성 서열이 호밍 엔도뉴클레아제(homing endonuclease)에 대한 인지 서열인, 방법.
  12. 제11항에 있어서,
    상기 호밍 엔도뉴클레아제가 F-cphI인, 방법.
  13. 제1항 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 (ES)x가, (HR1)x의 3' 및 (HR2)x의 5'에 위치한 대상 핵산 (D)x를 추가로 포함하는, 방법.
  14. 제13항에 있어서,
    상기 (D)x가 선별 마커, 프로모터, 에피토프 테그(epitope tag)를 코딩하는 핵산 서열, 대상 유전자, 리포터 유전자 및 종결 코돈을 코딩하는 핵산 서열로 이루어진 군으로부터 선택되는, 방법.
  15. 제1항 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 (ES)x가 선형인, 방법.
  16. 제1항 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 (N)x가 (N)x를 코딩하는 핵산 서열을 포함하는 발현 벡터로서 제공되는, 방법.
  17. 제1항 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 (N)x가 엔도뉴클레아제, 징크 핑거(zinc finger) 뉴클레아제, TAL-작동자(effector) DNA 결합 도메인-뉴클레아제 융합 단백질 (TALEN), 트랜스포자제(transposase) 및 부위-특이적인 재조합효소로 이루어진 군으로부터 선택되는, 방법.
  18. 제17항에 있어서,
    상기 엔도뉴클레아제가 내인성 게놈 서열에 특이적으로 결합하도록 변형되며,
    상기 변형된 엔도뉴클레아제는 더이상 이의 야생형 엔도뉴클레아제 인지 서열에 결합하지 않는, 방법.
  19. 제17항에 있어서,
    상기 엔도뉴클레아제가 LAGLIDADG 호밍 엔도뉴클레아제, HNH 호밍 엔도뉴클레아제, His-Cys box 호밍 엔도뉴클레아제, GIY-YIG 호밍 엔도뉴클레아제 및 시아노박테리아 호밍 엔도뉴클레아제로 이루어진 군으로부터 선택되는 호밍 엔도뉴클레아제인, 방법.
  20. 제17항에 있어서,
    상기 엔도뉴클레아제가 H-DreI, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, Pi-PspI, F-SceI, F-SceII, F-SuvI, F-CphI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NclIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MgaI, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI 또는 PI-TliII로 이루어진 군으로부터 선택되는 엔도뉴클레아제로부터 유래되는, 방법.
  21. 제1항에 있어서,
    상기 효모 세포가 사카로마이세스 세래비지애(Saccharomyces cerevisiae) 세포인, 방법.
  22. 복수 (n)개의 외인성 핵산을 숙주 세포 게놈의 복수 (n)개의 표적 부위에 동시에 삽입하는 시험관 내(in vitro) 방법으로서, 상기 n은 2 이상이며, 상기 숙주 세포가 효모 세포이고, 상기 방법은,
    (a) 숙주 세포를 하기 (i) 및 (ii)와 동시에 접촉시키는 단계:
    (i) 복수의 라이브러리로서, x가 1 내지 n의 정수이며, 각각의 정수 x에 대해, 상기 각각의 라이브러리 (L)x는 복수의 외인성 핵산을 포함하며, 상기 각각의 외인성 핵산은 5'에서 3' 방향으로, 제1 상동성 영역 (HR1)x, (D)x 군으로부터 선택되는 대상 핵산 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 선택된 외인성 핵산의 숙주 세포 매개의 상동성 재조합을 개시할 수 있는 것인, 복수의 라이브러리; 및
    (ii) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x로서, 상기 절단으로 (TS)x에서 (L)x 유래의 외인성 핵산의 상동성 재조합이 이루어지는 것인, 뉴클레아제 (N)x,

    (b) 각각의 라이브러리 (L)x 유래의 외인성 핵산이 각각의 선택된 표적 서열 (TS)x에 삽입된 숙주 세포를 회수하는 단계를 포함하는, 방법.
  23. 숙주 세포로서,
    (a) 복수 (n)개의 게놈 표적 부위로서, 상기 n이 2 이상인, 게놈 표적 부위;
    (b) 복수의 라이브러리로서, x가 1 내지 n의 정수이며, 각각의 정수 x에 대해, 상기 각각의 라이브러리 (L)x는 복수의 외인성 핵산을 포함하며, 상기 각각의 외인성 핵산은 5'에서 3' 방향으로, 제1 상동성 영역 (HR1)x, (D)x 군으로부터 선택되는 대상 핵산, 및 제2 상동성 영역 (HR2)x를 포함하며, 상기 (HR1)x 및 (HR2)x는 상기 숙주 세포 게놈의 표적 부위 (TS)x에서 선택된 외인성 핵산의 숙주 세포 매개의 상동성 재조합을 개시할 수 있는 것인, 복수의 라이브러리; 및
    (c) 각각의 상기 표적 부위 (TS)x에 대해, (TS)x에서 절단할 수 있는 뉴클레아제 (N)x로서, 상기 절단으로 (TS)x에서 (L)x 유래의 외인성 핵산의 상동성 재조합이 이루어지는, 뉴클레아제 (N)x를 포함하고, 상기 숙주 세포가 효모 세포인, 숙주 세포.
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
  87. 삭제
  88. 삭제
  89. 삭제
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
  94. 삭제
  95. 삭제
  96. 삭제
  97. 삭제
  98. 삭제
  99. 삭제
  100. 삭제
  101. 삭제
  102. 삭제
  103. 삭제
  104. 삭제
  105. 삭제
KR1020137031551A 2011-04-27 2012-04-27 게놈 변형 방법 KR102068107B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201161479821P 2011-04-27 2011-04-27
US61/479,821 2011-04-27
US201161500741P 2011-06-24 2011-06-24
US61/500,741 2011-06-24
US201161539389P 2011-09-26 2011-09-26
US61/539,389 2011-09-26
PCT/US2012/035657 WO2012149470A1 (en) 2011-04-27 2012-04-27 Methods for genomic modification

Publications (2)

Publication Number Publication Date
KR20140027354A KR20140027354A (ko) 2014-03-06
KR102068107B1 true KR102068107B1 (ko) 2020-01-20

Family

ID=46051948

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137031551A KR102068107B1 (ko) 2011-04-27 2012-04-27 게놈 변형 방법

Country Status (13)

Country Link
US (3) US8685737B2 (ko)
EP (1) EP2702160B1 (ko)
JP (2) JP6158170B2 (ko)
KR (1) KR102068107B1 (ko)
CN (1) CN103492578B (ko)
AU (2) AU2012249390B2 (ko)
BR (1) BR112013025567B1 (ko)
CA (1) CA2834375C (ko)
MX (1) MX351043B (ko)
PT (1) PT2702160T (ko)
SG (1) SG194089A1 (ko)
WO (1) WO2012149470A1 (ko)
ZA (1) ZA201307225B (ko)

Families Citing this family (106)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013025567B1 (pt) * 2011-04-27 2021-09-21 Amyris, Inc Métodos para modificação genômica
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10813630B2 (en) 2011-08-09 2020-10-27 Corquest Medical, Inc. Closure system for atrial wall
US10307167B2 (en) 2012-12-14 2019-06-04 Corquest Medical, Inc. Assembly and method for left atrial appendage occlusion
US10314594B2 (en) 2012-12-14 2019-06-11 Corquest Medical, Inc. Assembly and method for left atrial appendage occlusion
WO2013074916A1 (en) 2011-11-18 2013-05-23 Board Of Regents, The University Of Texas System Car+ t cells genetically modified to eliminate expression of t- cell receptor and/or hla
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9213944B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Trio-based phasing using a dynamic Bayesian network
US9213947B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Scalable pipeline for local ancestry inference
US20140142689A1 (en) 2012-11-21 2014-05-22 Didier De Canniere Device and method of treating heart valve malfunction
PT2896697E (pt) * 2012-12-12 2015-12-31 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
CN105658796B (zh) * 2012-12-12 2021-10-26 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
KR20140109183A (ko) * 2013-03-05 2014-09-15 삼성전자주식회사 다중 유전자 삽입 기술을 이용한 유전자 재조합 균주 제작 방법
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
CN105338805A (zh) * 2013-03-15 2016-02-17 希博斯美国有限公司 采用寡核苷酸介导的基因修复提高靶向基因修饰的效率的方法和组合物
WO2014169810A1 (zh) * 2013-04-16 2014-10-23 深圳华大基因科技服务有限公司 分离的寡核苷酸及其用途
EP3725885A1 (en) 2013-06-17 2020-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
AU2014281028B2 (en) 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
EP3011029B1 (en) 2013-06-17 2019-12-11 The Broad Institute, Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
JP6702858B2 (ja) 2013-06-17 2020-06-03 ザ・ブロード・インスティテュート・インコーポレイテッド ウイルス成分を使用して障害および疾患をターゲティングするためのCRISPR−Cas系および組成物の送達、使用および治療上の適用
US20150044192A1 (en) * 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
KR101735697B1 (ko) 2013-10-07 2017-05-24 서울대학교산학협력단 이종 시스템에서 (-)-α-비사보롤을 생산하는 방법
WO2015053510A1 (ko) * 2013-10-07 2015-04-16 서울대학교산학협력단 이종 시스템에서 (-)-α-비사보롤을 생산하는 방법
US9566443B2 (en) 2013-11-26 2017-02-14 Corquest Medical, Inc. System for treating heart valve malfunction including mitral regurgitation
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
CN111206032A (zh) 2013-12-12 2020-05-29 布罗德研究所有限公司 用于基因组编辑的crispr-cas系统和组合物的递送、用途和治疗应用
SG10201804973TA (en) 2013-12-12 2018-07-30 Broad Inst Inc Compositions and Methods of Use of Crispr-Cas Systems in Nucleotide Repeat Disorders
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
KR102274445B1 (ko) * 2013-12-19 2021-07-08 아미리스 인코퍼레이티드 게놈 삽입을 위한 방법
MX2016010285A (es) * 2014-02-11 2017-01-11 Univ Colorado Regents Ingenieria genetica multiplexada habilitada por crispr.
WO2015164748A1 (en) 2014-04-24 2015-10-29 Sangamo Biosciences, Inc. Engineered transcription activator like effector (tale) proteins
CA2946881A1 (en) * 2014-04-28 2015-11-05 Recombinetics, Inc. Multiplex gene editing in swine
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
CN105331604A (zh) * 2014-05-29 2016-02-17 中国科学院上海生命科学研究院 一种dna构建物以及dna体外拼接方法
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CA2967027A1 (en) * 2014-11-12 2016-05-19 Recombinetics, Inc. Heterozygous modifications of tumor suppressor genes
US11352666B2 (en) 2014-11-14 2022-06-07 Institute For Basic Science Method for detecting off-target sites of programmable nucleases in a genome
JP6621820B2 (ja) * 2014-11-14 2019-12-18 インスティチュート フォー ベーシック サイエンスInstitute For Basic Science ゲノムでプログラマブルヌクレアーゼの非標的位置を検出する方法
CN105713885B (zh) * 2014-12-04 2019-06-11 清华大学 特异识别并修复β地中海贫血症beta-globin基因的嵌合核酸酶
US10842626B2 (en) 2014-12-09 2020-11-24 Didier De Canniere Intracardiac device to correct mitral regurgitation
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
US11673928B2 (en) 2015-03-03 2023-06-13 Regents Of The University Of Minnesota Genetically modified pig cells with an inactivated Etv2 gene
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
CN108290933A (zh) 2015-06-18 2018-07-17 布罗德研究所有限公司 降低脱靶效应的crispr酶突变
AU2016284689B9 (en) 2015-06-25 2022-01-20 Amyris, Inc. Maltose dependent degrons, maltose-responsive promoters, stabilization constructs, and their use in production of non-catabolic compounds
AU2016288196A1 (en) 2015-06-30 2018-02-01 Regents Of The University Of Minnesota Humanized skeletal muscle
WO2017004388A1 (en) 2015-06-30 2017-01-05 Regents Of The University Of Minnesota Humanized heart muscle
US20170000743A1 (en) * 2015-07-02 2017-01-05 Vindico NanoBio Technology Inc. Compositions and Methods for Delivery of Gene Editing Tools Using Polymeric Vesicles
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
WO2017075538A1 (en) 2015-10-29 2017-05-04 Amyris, Inc. Compositions and methods for production of myrcene
BR112018011503A2 (pt) 2015-12-07 2018-12-04 Zymergen Inc promotores da corynebacterium glutamicum
CA3105722C (en) * 2015-12-07 2022-10-11 Zymergen Inc. Microbial strain improvement by a htp genomic engineering platform
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
EP4089166A1 (en) 2016-01-27 2022-11-16 Oncorus, Inc. Oncolytic viral vectors and uses thereof
US20190249172A1 (en) 2016-02-18 2019-08-15 The Regents Of The University Of California Methods and compositions for gene editing in stem cells
JP2019515654A (ja) 2016-03-16 2019-06-13 ザ ジェイ. デヴィッド グラッドストーン インスティテューツ 肥満及び/又は糖尿病を処置するための方法及び組成物、並びに候補処置薬剤を識別するための方法及び組成物
ES2865481T3 (es) 2016-04-29 2021-10-15 Poseida Therapeutics Inc Micelas basadas en poli(histidina) para la complejación y el aporte de proteínas y ácidos nucleicos
EP4219731A3 (en) * 2016-05-18 2023-08-09 Amyris, Inc. Compositions and methods for genomic integration of nucleic acids into exogenous landing pads
CN107513538A (zh) * 2016-06-17 2017-12-26 北京大学 基因敲除方法
WO2018005655A2 (en) 2016-06-30 2018-01-04 Zymergen Inc. Methods for generating a bacterial hemoglobin library and uses thereof
JP2019519241A (ja) 2016-06-30 2019-07-11 ザイマージェン インコーポレイテッド グルコース透過酵素ライブラリーを生成するための方法およびその使用
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
US11078481B1 (en) 2016-08-03 2021-08-03 KSQ Therapeutics, Inc. Methods for screening for cancer targets
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US10576167B2 (en) * 2016-08-17 2020-03-03 Factor Bioscience Inc. Nucleic acid products and methods of administration thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11078483B1 (en) 2016-09-02 2021-08-03 KSQ Therapeutics, Inc. Methods for measuring and improving CRISPR reagent function
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
AU2017378427A1 (en) 2016-12-14 2019-06-20 Ligandal, Inc. Methods and compositions for nucleic acid and protein payload delivery
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US12016313B2 (en) 2017-01-19 2024-06-25 Omniab Operations, Inc. Human antibodies from transgenic rodents with multiple heavy chain immunoglobulin loci
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
SG11201908658TA (en) 2017-03-23 2019-10-30 Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
JP6990385B2 (ja) * 2017-05-16 2022-02-03 国立大学法人 長崎大学 多重遺伝子導入手法
US20200370058A1 (en) * 2017-06-06 2020-11-26 Zymergen Inc. A htp genomic engineering platform for improving escherichia coli
HRP20220615T1 (hr) 2017-06-30 2022-06-24 Inscripta, Inc. Postupci, moduli, instrumenti i sustavi za automatiziranu obradu stanica
RU2771110C2 (ru) 2017-07-26 2022-04-26 Онкорус, Инк. Онколитические вирусные векторы и их применение
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
EP3684927B1 (en) 2017-09-18 2024-05-29 Amyris, Inc. Methods for genomic integration for kluyveromyces host cells
CN111356766A (zh) 2017-09-18 2020-06-30 阿迈瑞斯公司 用于遗传工程改造克鲁维酵母宿主细胞的方法
EP3687621A4 (en) 2017-09-30 2021-08-11 Inscripta, Inc. CONTINUOUS FLOW ELECTROPORATION INSTRUMENTATION
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
GB201720351D0 (en) 2017-12-06 2018-01-17 Iontas Ltd Selecting for developability in drug discovery
WO2020047138A1 (en) * 2018-08-29 2020-03-05 Amyris, Inc. Cells and methods for selection based assay
BR112021005115A2 (pt) * 2018-09-20 2021-06-15 Sanofi métodos e composições de clonagem universal baseada em íntron
US20220145330A1 (en) 2019-02-10 2022-05-12 The J. David Gladstone Institutes, a testamentary trust established under the Will of J. David Glads Modified mitochondrion and methods of use thereof
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
US10501404B1 (en) 2019-07-30 2019-12-10 Factor Bioscience Inc. Cationic lipids and transfection methods
WO2021100731A1 (ja) * 2019-11-19 2021-05-27 国立大学法人 長崎大学 Cas9ヌクレアーゼを用いて相同組み換えを誘導する方法
CN111154704B (zh) * 2020-03-30 2023-04-11 河南巨龙生物工程股份有限公司 一株粘质沙雷氏菌突变株以及发酵生产组氨酸的方法
EP4146804A1 (en) 2020-05-08 2023-03-15 The Broad Institute Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US11817176B2 (en) 2020-08-13 2023-11-14 23Andme, Inc. Ancestry composition determination
CA3229003A1 (en) 2021-08-25 2023-03-02 Kothai Nachiar Devi PARTHIBAN Preparation of libraries of protein variants expressed in eukaryotic cells
WO2023228969A1 (ja) * 2022-05-25 2023-11-30 キッコーマン株式会社 遺伝子導入のための糸状菌

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6503712B1 (en) 2000-05-10 2003-01-07 Amgen Inc. Methods and compositions for preparing a genomic library for knockout targeting vectors
WO2004067753A2 (en) 2003-01-28 2004-08-12 Cellectis Use of meganucleases for inducing homologous recombination ex vivo and in toto in vertebrate somatic tissues and application thereof.
EP2180058A1 (en) 2008-10-23 2010-04-28 Cellectis Meganuclease recombination system
US20100212035A1 (en) * 2007-06-01 2010-08-19 Omt, Inc. Compositions and Methods for Producing Transgenic Mammals Having Recombinant Immunoglobulin Loci
JP2010539930A (ja) 2007-09-27 2010-12-24 ダウ・アグロサイエンス・エル・エル・シー 5−エノールピルビルシキミ酸−3−リン酸シンターゼ遺伝子をターゲッティングする改変ジンクフィンガータンパク質
US7919605B1 (en) 2010-08-30 2011-04-05 Amyris, Inc. Nucleic acids, compositions and methods for the excision of target nucleic acids

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5272065A (en) 1983-10-20 1993-12-21 Research Foundation Of State University Of New York Regulation of gene expression by employing translational inhibition of MRNA utilizing interfering complementary MRNA
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
ATE222289T1 (de) 1995-06-07 2002-08-15 Invitrogen Corp Rekombinatorische klonierung in vitro unter verwendung genmanipulierter rekombinationsorte
JP4206154B2 (ja) 1997-11-13 2009-01-07 大日本住友製薬株式会社 変異型loxP配列とその応用
DE69833457T2 (de) 1997-11-18 2006-09-14 Pioneer Hi-Bred International, Inc. Neuartige methode zur integration von fremd-dna ins eukaryotische genom
US5929301A (en) 1997-11-18 1999-07-27 Pioneer Hi-Bred International Nucleic acid sequence encoding FLP recombinase
AU760113C (en) 1997-11-18 2004-04-22 Pioneer Hi-Bred International, Inc. Compositions and methods for genetic modification of plants
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US7398262B1 (en) 1999-06-18 2008-07-08 Multex.Com, Inc. Method and system for referencing, archiving and retrieving symbolically linked information
CA2379115C (en) 1999-07-23 2011-04-26 The Regents Of The University Of California Dna recombination in eukaryotic cells by the bacteriophage phic31 recombination system
AU6529900A (en) 1999-08-09 2001-03-05 Monsanto Technology Llc Novel cloning methods and vectors
AU7447000A (en) 1999-09-30 2001-04-30 Izumu Saito Dna containing variant frt sequences
EP2210948A3 (en) * 1999-12-10 2010-10-06 Life Technologies Corporation Use of multiple recombination sites with unique specificity in recombinational cloning
AU2001257331A1 (en) 2000-04-28 2001-11-12 Sangamo Biosciences, Inc. Methods for designing exogenous regulatory molecules
US20030082561A1 (en) 2000-07-21 2003-05-01 Takashi Sera Zinc finger domain recognition code and uses thereof
US7273923B2 (en) 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
AT5356U1 (de) 2001-07-16 2002-06-25 Uv & P Umweltman Verfahrenstec Verfahren zur immobilisierung von verbrennungsrückständen
AU2002319696B2 (en) 2001-07-27 2007-11-01 The Government Of The United States Of America As Represented By The Secretary Of Health And Human Services Systems for in vivo site-directed mutagenesis using oligonucleotides
WO2009095742A1 (en) 2008-01-31 2009-08-06 Cellectis New i-crei derived single-chain meganuclease and uses thereof
DE60316124T3 (de) 2002-03-15 2018-03-22 Cellectis Hybride and einzelkettige meganukleasen und deren anwendungen
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
AU2003290518A1 (en) 2002-09-06 2004-04-23 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
DK2927318T3 (da) 2003-08-08 2020-08-03 Sangamo Therapeutics Inc Fremgangsmåde og sammensætninger til målrettet spaltning og rekombination
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
WO2007034262A1 (en) 2005-09-19 2007-03-29 Cellectis Heterodimeric meganucleases and use thereof
WO2006097784A1 (en) 2005-03-15 2006-09-21 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
US20110158974A1 (en) 2005-03-15 2011-06-30 Cellectis Heterodimeric Meganucleases and Use Thereof
WO2007060495A1 (en) 2005-10-25 2007-05-31 Cellectis I-crei homing endonuclease variants having novel cleavage specificity and use thereof
WO2007049095A1 (en) 2005-10-25 2007-05-03 Cellectis Laglidadg homing endonuclease variants having mutations in two functional subdomains and use thereof
WO2007140339A2 (en) * 2006-05-26 2007-12-06 Amyris Biotechnologies, Inc. Production of isoprenoids
CA2660485C (en) 2006-08-11 2016-04-12 Sangamo Biosciences, Inc. Zinc finger nuclease-mediated homologous recombination
WO2009001159A1 (en) 2007-06-25 2008-12-31 Cellectis Method for enhancing the cleavage activity of i-crei derived meganucleases
WO2008152524A2 (en) 2007-06-06 2008-12-18 Cellectis Method for enhancing the cleavage activity of i-crei derived meganucleases
JP2010539931A (ja) 2007-09-27 2010-12-24 サンガモ バイオサイエンシーズ, インコーポレイテッド ジンクフィンガーヌクレアーゼを使用したゼブラフィッシュにおけるゲノム編集
EP2205752B1 (en) 2007-10-25 2016-08-10 Sangamo BioSciences, Inc. Methods and compositions for targeted integration
WO2010001189A1 (en) 2008-07-03 2010-01-07 Cellectis The crystal structure of i-dmoi in complex with its dna target, improved chimeric meganucleases and uses thereof
EP2329017A2 (en) 2008-08-04 2011-06-08 Cellectis Novel method to generate meganucleases with altered characteristics
BRPI0922187B1 (pt) 2008-11-19 2021-05-04 Amyris, Inc Métodos para gerar um polinucleotídeo e para gerar uma célula hospedeira
ES2627552T3 (es) 2008-12-04 2017-07-28 Sigma Aldrich Company Edición de genoma en ratas usando nucleasas con dedos de cinc
KR20100080068A (ko) * 2008-12-31 2010-07-08 주식회사 툴젠 신규한 징크 핑거 뉴클레아제 및 이의 용도
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
CN102770539B (zh) * 2009-12-10 2016-08-03 明尼苏达大学董事会 Tal效应子介导的dna修饰
BR112013025567B1 (pt) * 2011-04-27 2021-09-21 Amyris, Inc Métodos para modificação genômica

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6503712B1 (en) 2000-05-10 2003-01-07 Amgen Inc. Methods and compositions for preparing a genomic library for knockout targeting vectors
WO2004067753A2 (en) 2003-01-28 2004-08-12 Cellectis Use of meganucleases for inducing homologous recombination ex vivo and in toto in vertebrate somatic tissues and application thereof.
US20100212035A1 (en) * 2007-06-01 2010-08-19 Omt, Inc. Compositions and Methods for Producing Transgenic Mammals Having Recombinant Immunoglobulin Loci
JP2010539930A (ja) 2007-09-27 2010-12-24 ダウ・アグロサイエンス・エル・エル・シー 5−エノールピルビルシキミ酸−3−リン酸シンターゼ遺伝子をターゲッティングする改変ジンクフィンガータンパク質
EP2180058A1 (en) 2008-10-23 2010-04-28 Cellectis Meganuclease recombination system
US7919605B1 (en) 2010-08-30 2011-04-05 Amyris, Inc. Nucleic acids, compositions and methods for the excision of target nucleic acids

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
Current Gene Therapy, Vol.7, pp.49-66 (2007)
Current Genetics, Vol.44, pp.339-347 (2004)*
Journal of Nucleic Acids, Vol.2011, Article ID 947212 (2011.02.13.)
Microbiology and Molecular Biology Reviews, Vol.62, No.2, pp.349-404 (1999)*
Molecular and Cellular Biology, Vol.15, No.4, pp.1968-1973 (1995)
Nucleic Acid Research, Vol.37, No.16, pp.5405-5419 (2009)
Nucleic Acids Research, Vol.34, No.21, pp.6205-6214 (2006)
Nucleic Acids Research, Vol.39, No.14, pp.6315-6325 (2011.03.31.)
PNAS, Vol.108, No.8, pp.3108-3115 (2011.02.22.)

Also Published As

Publication number Publication date
CN103492578A (zh) 2014-01-01
AU2012249390A1 (en) 2013-12-12
BR112013025567B1 (pt) 2021-09-21
US20120277120A1 (en) 2012-11-01
AU2017204456A1 (en) 2017-07-20
US8685737B2 (en) 2014-04-01
CA2834375C (en) 2020-07-14
AU2017204456B2 (en) 2019-08-15
MX2013012479A (es) 2014-01-31
US9701971B2 (en) 2017-07-11
PT2702160T (pt) 2020-07-30
JP2017042173A (ja) 2017-03-02
EP2702160B1 (en) 2020-05-27
MX351043B (es) 2017-09-29
JP2014513535A (ja) 2014-06-05
JP6158170B2 (ja) 2017-07-12
US20140186942A1 (en) 2014-07-03
US20170240923A1 (en) 2017-08-24
JP6527126B2 (ja) 2019-06-05
SG194089A1 (en) 2013-11-29
WO2012149470A1 (en) 2012-11-01
CA2834375A1 (en) 2012-11-01
BR112013025567A2 (pt) 2020-11-17
EP2702160A1 (en) 2014-03-05
KR20140027354A (ko) 2014-03-06
ZA201307225B (en) 2014-12-23
AU2012249390B2 (en) 2017-03-30
CN103492578B (zh) 2016-10-19

Similar Documents

Publication Publication Date Title
KR102068107B1 (ko) 게놈 변형 방법
AU2020223681B2 (en) Plant regulatory elements and uses thereof
KR20200124702A (ko) 신규한 cas9 오르소로그
AU2021221448B2 (en) Modified plant
JP7093310B2 (ja) 外因性ランディングパッドへの核酸のゲノム組込みのための組成物および方法
KR20170124565A (ko) 변경된 PAM 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제
KR20150043540A (ko) Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
KR20170087521A (ko) 진균 게놈 변형 시스템 및 사용 방법
KR20150132310A (ko) 아세틸-코엔자임 a 유래 화합물을 생산하기 위한 포스포케톨라제 및 포스포트랜스아세틸라제의 용도
KR20210018219A (ko) 발효 및 생산 중 곰팡이 형태를 제어하기 위한 신호 전달에 포함된 유전자의 조작
WO1998037205A1 (en) Mutations in atp-dependent transposition proteins that reduce target-site specificity
WO1998037205A9 (en) Mutations in atp-dependent transposition proteins that reduce target-site specificity
CN111542610A (zh) 精确基因组编辑的新策略
Wong et al. Sumoylation in Aspergillus nidulans: sumO inactivation, overexpression and live-cell imaging
CN113832043A (zh) 具有提高的乳酸产生能力的重组耐酸酵母
CN106471008B (zh) 棕榈Mantle表型检测
CN107574178B (zh) 真菌人工染色体、组成、方法和用途
Gatherar et al. Identification of a novel gene hbrB required for polarised growth in Aspergillus nidulans
JPH11514885A (ja) キチンシンターゼ1
US20050244861A1 (en) Nucleic acids essential for expression of hyphal-specific genes and methods for using the same
JPH08266275A (ja) Dna修復酵素
JP2002153273A (ja) 酵母染色体に外来遺伝子を挿入する方法

Legal Events

Date Code Title Description
AMND Amendment
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant