KR20230152124A - 생체내 dna 조립 및 분석 - Google Patents

생체내 dna 조립 및 분석 Download PDF

Info

Publication number
KR20230152124A
KR20230152124A KR1020237033307A KR20237033307A KR20230152124A KR 20230152124 A KR20230152124 A KR 20230152124A KR 1020237033307 A KR1020237033307 A KR 1020237033307A KR 20237033307 A KR20237033307 A KR 20237033307A KR 20230152124 A KR20230152124 A KR 20230152124A
Authority
KR
South Korea
Prior art keywords
oligonucleotide
recipient
donor
plasmid
dna
Prior art date
Application number
KR1020237033307A
Other languages
English (en)
Inventor
사샤 레비
시아난 리우
다케시 마츠이
다라치 밀러
웨이이 리
Original Assignee
더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티
더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티, 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 filed Critical 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티
Publication of KR20230152124A publication Critical patent/KR20230152124A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본원에는, 무엇보다, 생체내에서 올리고뉴클레오타이드 단편을 조립하기 위한 방법 및 조성물이 제공된다. 방법은 비효율적인 클로닝 방법 및 값비싼 효소에 대한 요구사항을 우회한다. 방법은 추가로 긴 DNA 단편을 조립하기 위해 사용될 수 있다. 방법은 변이체 라이브러리 및 조합 라이브러리를 생성하기 위해 사용될 수 있고 생물학적 과정을 추적하기 위해 사용될 수 있다. 또한 본원에는, 무엇보다, 올리고뉴클레오타이드 서열의 생체내 DNA 바코딩 방법이 제공된다. 본원에 제공된 방법은 예컨대 혼합물로부터 올리고뉴클레오타이드 서열을 확인하고 단리하기 위한 고유한 바코드-올리고뉴클레오타이드 융합 서열을 생성하는 것으로 고려된다. 따라서, 올리고뉴클레오타이드의 혼합물로부터 올리고뉴클레오타이드를 확인하는 방법이 또한 제공된다.

Description

생체내 DNA 조립 및 분석
관련 출원
본 출원은 2021년 3월 5일에 출원된 미국 가출원 번호 제 63/157,497호, 및 2021년 3월 5일에 출원된 미국 가출원 번호 제 63/157,498호에 대한 35 U.S.C. §119(e) 하의 우선권의 혜택을 주장하며, 이들 출원의 각각의 전체 내용은 전체가 참조로 본원에 포함된다.
서열 목록의 참조에 의한 포함
2022년 2월 15일에 생성되고, 크기가 24,576 바이트인, "41243-570001WO_Sequence_Listing_ST25.txt"란 명칭의 서열 목록 텍스트 파일의 내용이 전체가 참조로 본원에 포함된다.
연방정부가 지원하는 연구 및 개발에 따라 이루어진
발명에 대한 권리에 관한 진술
본 발명은 에너지부가 부여한 DOE FWP# 100582 및 국립표준기술연구소가 부여한 NIST IAA P18-630-0001 하에 정부 지원으로 이루어졌다. 정부는 발명에 대해 특정 권리를 갖는다.
배경 기술
재조합 올리고뉴클레오타이드 기술의 최근의 진전은 전통적인 생물학 및 생명공학 분야의 연구를 점화시켰다. 그러나, 올리고뉴클레오타이드 조립 과정은 값비싸고 시간 소모적이며, 다수의 정제 단계 및 다양한 효소를 필요로 하였다. 더욱이, 현재 분자 생물학 방법은 조합될 수 있는 DNA 요소의 크기 및 조성에 한계가 있다. 그러므로, 이들 한계를 해결하고 수많은 값비싼 효소(예컨대, 결찰효소, 등)에 대한 필요성을 우회하기 위해 DNA 요소(예컨대 프로모터, 유전자 단편, 등)를 함께 조립하는 방법이 필요하다.
서열분석 기술의 진전은 DNA의 긴 단편의 확인을 허용한다. 그러나, 복잡한 혼합물에서 고유한 DNA 서열을 확인 및 단리하는 것은 다른 문제들 중에서도 복잡한 정제 요구사항, 낮은 샘플 회수율 또는 비효율적인 서열분석 작업 흐름으로 인해 여전히 어려운 것으로 남아 있다.
본원에는, 무엇보다, 기술분야의 이런 및 다른 문제에 대한 해결책이 제시된다.
본원에는, 무엇보다, DNA 요소의 생체내 조립 및 올리고뉴클레오타이드 서열의 DNA 바코딩을 위한 방법 및 조성물이 제공된다.
본 발명은 복수의 DNA 요소를 수령체 세포 내에서 조립된 DNA 요소로 조립하는 방법을 제공하며, 방법은: (a) (i) 제1 공여체 플라스미드를 콘쥬게이션에 의해 제1 공여체 세포로부터 수령체 세포로 전달하고 (ii) 제1 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하는 조건 하에서 제1 공여체 플라스미드를 포함하는 제1 공여체 세포를 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키는 단계, 여기서 제1 공여체 플라스미드는, 순차적으로, 선택적인 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 제1 DNA 요소 단편(올리고1)을 포함하는 제1 올리고뉴클레오타이드, 2개의 상동 재조합 영역(HR2.1, HR2.2)을 포함하는 제2 상동 재조합 영역(HR2) 및 선택적인 제3 엔도뉴클레아제 부위(C3)를 포함하며; 수령체 올리고뉴클레오타이드는 HR1에 상동인 제3 상동 재조합 영역(HR3) 및 HR2.2에 상동인 제4 상동 재조합 영역(HR4)을 포함하고; 이에 의해 HR1과 HR3 및 HR2.2와 HR4의 상동 재조합 후에, 제1 DNA 요소 단편을 포함하는 제1 재조합 수령체 올리고뉴클레오타이드를 제공하는 단계; (b) (i) 제2 공여체 플라스미드를 콘쥬게이션에 의해 제2 공여체 세포로부터 제1 수령체 세포로 전달하고 (ii) 제2 공여체 플라스미드 및 제1 재조합 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하여 제2 재조합 수령체 올리고뉴클레오타이드를 형성하는 조건 하에서 제2 공여체 플라스미드를 포함하는 제2 공여체 세포를 제1 재조합 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키는 단계; 여기서 제2 공여체 플라스미드는, 순차적으로, 선택적인 제5 엔도뉴클레아제 부위(C5), HR2.1에 상동인 제5 상동 재조합 영역(HR5), 제2 DNA 요소 단편(올리고2)을 코딩하는 제2 올리고뉴클레오타이드, 2개의 상동 재조합 영역(HR6.1, HR6.2)을 포함하는 제6 상동 재조합 영역(HR6), 및 선택적인 제6 엔도뉴클레아제 부위(C6)를 포함하며; 이에 의해 HT5와 HR2.1 및 HR6.2와 HR4의 상동 재조합 후에, DNA 어셈블리를 형성하는 제1 및 제2 DNA 요소 단편(올리고1, 올리고2)을 포함하는 제2 재조합 수령체 올리고뉴클레오타이드를 제공하는 단계를 포함한다. 구현예에서, HR2.1 및 HR2.2는 하나(C2) 또는 2개의 엔도뉴클레아제 부위(C2.1, C2.2)를 포함하는 비상동 영역의 측면에 있으며; 선택적으로 HR3 및 HR4는 하나(C4) 또는 2개의 엔도뉴클레아제 부위(C4.1, C4.2)를 포함하는 비상동 영역의 측면에 있다. 구현예에서, HR6.1 및 HR6.2는 하나(C7) 또는 2개의 엔도뉴클레아제 부위(C7.1, C7.2)를 포함하는 비상동 영역의 측면에 있다. 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있다. 구현예에서, DNA 어셈블리는 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, 가이드 RNA(gRNA), 또는 이들의 조합의 적어도 일부를 포함한다.
구현예에서, 단계 (b)는 양립성 HR 영역 및 제3 또는 후속 DNA 요소 단편(올리고3, 올리고4, . . . 올리고N)을 코딩하는 제3 또는 후속 올리고뉴클레오타이드를 포함하는 제3 또는 후속 공여체 플라스미드를 포함하는 제3 또는 후속 공여체 세포로 1회 이상의 반복을 위해 반복됨으로써, 함께 DNA 어셈블리를 형성하는 제1, 제2, 및 제3 또는 후속 DNA 요소 단편을 포함하는 제3 또는 후속 재조합 수령체 올리고뉴클레오타이드가 형성된다.
구현예에서, 단계 (a)는 각각이 상이한 제1 공여체 플라스미드를 포함하고 있는 복수의 제1 공여체 세포를 포함하고; 단계 (b)는 각각이 상이한 제2, 제3, 또는 후속 공여체 플라스미드를 포함하고 있는 복수의 제2, 제3, 또는 후속 공여체 세포를 포함하며; 선택적으로 각각의 제1 공여체 세포는 제1 정렬된 어레이의 위치에 있고 각각의 제2, 제3, 또는 후속 공여체 세포는 제2, 제3, 또는 후속 정렬된 어레이의 위치에 있으며; 선택적으로 방법은 복수의 상이한 조립된 DNA 요소를 포함하는 조합 라이브러리를 생성한다.
구현예에서, 제1, 제3, 및/또는 제4 엔도뉴클레아제 부위를 표적화하는 제1 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 제1 공여체 플라스미드 상에 존재하고/거나 수령체 세포에 존재한다. 구현예에서, 제2, 제5, 및/또는 제6 엔도뉴클레아제 부위를 표적화하는 제2 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 제2 공여체 플라스미드 상에 존재하고/거나 수령체 세포에 존재한다. 구현예에서, 제1 및/또는 제2 엔도뉴클레아제의 발현은 유도성이고 방법은 제1 및/또는 제2 엔도뉴클레아제를 유도하는 단계를 추가로 포함한다. 구현예에서, 제1 및/또는 제2 엔도뉴클레아제는 RNA 가이드 엔도뉴클레아제, 호밍(homing) 엔도뉴클레아제, 전사 활성화 인자 유사 이펙터 뉴클레아제, 및 아연 핑거 뉴클레아제로부터 선택된다.
구현예에서, 제1, 제2 또는 후속 공여체 플라스미드는 제1 올리고뉴클레오타이드, 제2 올리고뉴클레오타이드 또는 후속 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하며; 선택적으로 선택성 마커는 HR2.1과 HR2.2 사이 및/또는 HR6.1과 HR6.2 사이, 및/또는 후속 HR 영역 사이의 비상동 영역 내에 있다. 구현예에서, 수령체 올리고뉴클레오타이드는 제1, 제2, 제3, 또는 후속 올리고뉴클레오타이드를 포함하지 않는 수령체 세포에 대해 선택하는 역선택성 마커를 포함하고; 선택적으로 역선택성 마커는 HR2.1과 HR2.2 사이 및/또는 HR6.1과 HR6.2 사이, 및/또는 후속 HR 영역 사이의 비상동 영역 내에 있다.
구현예에서, 공여체 플라스미드는 전달 기점을 포함한다.
구현예에서, 공여체 플라스미드는 조건부 복제 기점을 포함한다. 구현예에서, 조건부 복제 기점은 올리고뉴클레오타이드의 존재 또는 세포 성장 조건에 따라 달라진다. 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 유도성 고복사 복제 기점을 포함한다.
구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 30 킬로베이스보다 긴 길이의 플라스미드를 복제할 수 있는 레플리콘을 포함한다.
구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 효모 인공 염색체(YAC), 포유류 인공 염색체(MAC), 인간 인공 염색체(HAC), 또는 식물 인공 염색체이다.
구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 바이러스 벡터이다.
구현예에서, 공여체 플라스미드는 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드를 포함한다.
구현예에서, 공여체 플라스미드 또는 수령체 세포는 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드를 포함하고; 선택적으로 하나 이상의 상동 DNA 복구 유전자의 발현은 유도성이다.
구현예에서, 공여체 플라스미드 또는 수령체 세포는 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드를 포함한다.
구현예에서, 공여체 세포 및 수령체 세포는 독립적으로 박테리아 세포이고; 선택적으로 박테리아 세포는 대장균(E. coli), 비브리오 나트리겐스(Vibrio natriegens) 또는 콜레라균(V. cholerae)이다.
구현예에서, 조립된 DNA 요소는 100개 뉴클레오타이드 내지 500,000개 뉴클레오타이드 길이이다.
구현예에서, 제1, 제2 또는 후속 상동 재조합(HR) 영역 및 수령체 올리고뉴클레오타이드 상의 상응하는 HR 영역은 각각 약 20개 염기쌍 내지 약 500개 염기쌍; 선택적으로 약 50개 내지 100개 염기쌍을 포함한다.
구현예에서, 전술한 방법 중 임의의 방법은 수령체 세포를 용해하는 단계; 조립된 DNA 요소를 증폭시키는 단계; 조립된 DNA 요소를 단리하는 단계; 수령체 올리고뉴클레오타이드를 단리하는 단계; 조립된 DNA 요소를 서열분석하는 단계; 및 수령체 올리고뉴클레오타이드를 서열분석하는 단계 중 하나 이상의 단계를 추가로 포함할 수 있다.
구현예에서, 제1 및 제2 또는 후속 공여체 세포를 제1 수령체 세포와 접촉시키는 단계는 동시에 수행되며; 선택적으로 최종 공여체 플라스미드만이 선택성 마커를 포함하거나 또는 각각의 공여체 플라스미드는 수령체 올리고뉴클레오타이드에 존재하지 않는 선택성 마커를 포함한다.
전술한 방법 중 어느 하나의 구현예에서, 조립된 DNA 요소의 일부를 형성하기 위해 마지막 DNA 요소를 포함하는 공여체 플라스미드는 각각이 조립된 DNA 요소, BHR, 및 추가 HR을 포함하는 재조합 수령체 올리고뉴클레오타이드를 함유한 수령체 세포를 생성하기 위해 바코드 상동 재조합(BHR) 영역을 포함하며; 방법은 (i) 각각이 BHR에 상동인 HR, 고유한 바코드 올리고뉴클레오타이드, 및 재조합된 수령체 올리고뉴클레오타이드의 추가 HR에 상동인 제2 HR을 포함하는 바코드 공여체 플라스미드를 함유하는 바코드 공여체 세포의 어레이를 구성 또는 획득하는 단계; (ii) (a) 바코드 공여체 플라스미드를 콘쥬게이션에 의해 바코드 공여체 세포로부터 수령체 세포로 전달하고 (b) 바코드 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하는 조건 하에서 바코드 공여체 세포의 어레이를 수령체 세포의 어레이와 접촉시킴으로써 바코딩된 어셈블리를 포함하는 수령체 세포 어레이를 생성하는 단계를 추가로 포함한다.
전술한 방법 중 어느 하나의 구현예에서, 각각의 공여체 플라스미드는 바코드 상동 재조합(BHR) 영역의 측면에 있는 고유한 엔도뉴클레아제 부위 CX, CY의 추가 쌍을 포함하며, 방법은 각각이 DNA 어셈블리를 포함하고 있는 수령체 세포의 어레이를, 각각이 고유한 바코드 올리고뉴클레오타이드 측면에 있는 BHR에 상동인 한 쌍의 HR 영역을 포함하는 바코드 공여체 플라스미드를 함유하고 있는 바코드 공여체 세포의 어레이와 접촉시킴으로써 바코딩된 어셈블리를 포함하는 수령체 세포 어레이를 생성하는 단계를 추가로 포함한다.
전술한 방법 중 어느 하나의 구현예에서, 방법은 리셋 공여체 플라스미드를 포함하는 리셋 공여체 세포를 재조합 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키고, 여기서 리셋 공여체 플라스미드는, 순차적으로, DNA 어셈블리의 말단 서열에 상동인 상동 재조합 영역(HRt), 리셋 엔도뉴클레아제 부위, 선택성 마커, 리셋 엔도뉴클레아제 부위, 상동 재조합 영역(HRX), 및 전달 기점을 포함하며; 재조합 수령체 올리고뉴클레오타이드는, 순차적으로, 리셋 엔도뉴클레아제 부위, DNA 어셈블리, HRX에 상동인 상동 재조합 영역(HRXa) 및 리셋 엔도뉴클레아제 부위를 포함하고; 이에 의해 HRt와 DNA 어셈블리의 말단 서열 사이 및 HRX와 HRXa 사이의 상동 재조합에 후속하여, 전달 기점 및 DNA 어셈블리를 포함하는 리셋 플라스미드를 제공하는 단계를 추가로 포함한다. 구현예에서, 리셋 플라스미드는 공여체 세포에 있다. 구현예에서, 리셋 플라스미드는 공여체 세포 및 수령체 세포 둘 다에서 기능하는 제한된 복제 기점을 함유한다. 구현예에서, 리셋 공여체 플라스미드는 상동 재조합 영역 HRt, HRX, 측면의 두 엔도뉴클레아제 부위(C1, C2) 및 역선택성 마커(CM), HRt-C1-CM-C2-HRX를 포함하는 올리고뉴클레오타이드 삽입물; 또는 그러한 올리고뉴클레오타이드 삽입물의 라이브러리를 도입하여 엔도뉴클레아제가 엔도뉴클레아제 부위를 절단하는 것을 허용하는 단계 및 상동 재조합을 사용하여 절단 부위에 역선택성 마커를 도입하는 단계를 포함하는 방법에 의해 구성된다.
전술한 방법 중 임의의 방법의 구현예에서, 수령체 올리고뉴클레오타이드는 효모 세포, 식물 세포, 포유류 세포, 또는 다른 박테리아 세포를 포함한 다른 세포 유형에 DNA 어셈블리를 전달할 수 있는 이동성 유전 요소를 포함한다.
전술한 방법 중 임의의 방법의 구현예에서, 방법은 DNA 라이브러리를 구성하기 위하여 양립성 상동 재조합 영역을 가진 2 이상의 수령체 올리고뉴클레오타이드를 활용하는 단계를 포함한다.
전술한 방법 중 임의의 방법의 구현예에서, 공여체 플라스미드의 올리고뉴클레오타이드는 제1 DNA 어셈블리의 말단 서열에 상동인 제1 링커 올리고뉴클레오타이드 및 제2 올리고뉴클레오타이드에 상동인 제2 링커 올리고뉴클레오타이드를 포함한다. 구현예에서, 링커 올리고뉴클레오타이드는 제1 DNA 어셈블리 또는 제2 DNA 올리고뉴클레오타이드에 상동하지 않는 추가의 DNA 요소 단편을 추가로 포함한다. 구현예에서, 방법은 돌연변이유발 라이브러리를 조립하기 위하여; 상이한 종으로부터의 유전자, 프로모터, 터미네이터, 및 조절 영역과 같은 유전자 영역을 조합하기 위하여; 유전자 조절 경로를 구성 및/또는 조합하기 위하여; 조합 gRNA 라이브러리를 구성하기 위하여; 또는 스크리닝 검정을 위해 플라스미드를 함유하는 박테리아의 어레이를 조립하기 위하여 사용된다.
전술한 방법 중 임의의 방법의 구현예에서, 단계 (a) 및 (b) 전에, 제1 및 제2 DNA 요소 단편을 포함하는 제1 및 제2 올리고뉴클레오타이드가 제1 및 제2 공여체 플라스미드에 삽입된다.
발명은 또한 바코드를 올리고뉴클레오타이드에 콘쥬게이션하는 방법을 제공하며, 방법은 (a) 올리고뉴클레오타이드 혼합물의 각각의 올리고뉴클레오타이드를 공여체 플라스미드에 삽입하는 단계로, 각각의 공여체 플라스미드는, 순차적으로, 선택적으로 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 제2 상동 재조합 영역(HR2), 및 선택적으로 제2 엔도뉴클레아제 부위(C2)를 포함하고; 각각의 올리고뉴클레오타이드는 HR1과 HR2 사이에 삽입됨으로써, 공여체 올리고뉴클레오타이드를 포함하는 복수의 공여체 플라스미드가 제공되며, 각각의 공여체 플라스미드는 올리고뉴클레오타이드 혼합물: C1-HR1-올리고-HR2-C2로부터의 단일 공여체 올리고뉴클레오타이드를 포함하는 것인 단계; (b) 각각의 세포가 공여체 플라스미드를 포함하도록 복수의 세포를 복수의 공여체 플라스미드로 형질전환시킴으로써 복수의 공여체 세포를 형성하는 단계; (c) 복수의 공여체 세포를 각각 제1 정렬된 어레이의 고유한 위치에 플레이팅하고 배양함으로써, 공여체 세포의 제1 정렬된 어레이를 제공하는 단계; (d) 복수의 수령체 세포를 제2 정렬된 어레이로 제공하는 단계로, 각각의 수령체 세포는, 순차적으로, 제2 정렬된 어레이에서 수령체 세포의 위치를 확인하는 고유한 바코드 서열, HR1에 상동인 제3 상동 재조합 영역(HR3), 선택적으로 제3 엔도뉴클레아제 부위(C3), 및 HR2에 상동인 제4 상동 재조합 영역(HR4)을 포함하는 수령체 올리고뉴클레오타이드를 포함하는 것인 단계; (e) (i) 공여체 플라스미드를 콘쥬게이션에 의해 공여체 세포로부터 어레이 상의 상응하는 위치의 수령체 세포로 전달하고, (ii) 선택적으로 제1, 제2, 및 제3 엔도뉴클레아제 부위를 절단하며, (iii) 올리고뉴클레오타이드를 상동 재조합에 의하여 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 공여체 세포의 제1 정렬된 어레이를 수령체 세포의 제2 정렬된 어레이와 접촉시킴으로써, 각각이 고유한 바코드 서열 및 올리고뉴클레오타이드 혼합물로부터의 공여체 올리고뉴클레오타이드를 포함하고 있는 융합 올리고뉴클레오타이드의 제3 어레이를 형성하는 단계; 및 (f) 선택적으로 융합 올리고뉴클레오타이드를 서열분석함으로써, 바코드 서열에 의해 어레이에서 각각의 올리고뉴클레오타이드를 확인하는 단계를 포함한다. 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있다. 구현예에서, 공여체 플라스미드는 HR1과 HR2 사이에 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하고; 선택적으로 공여체 플라스미드는 역선택성 마커를 포함한다. 구현예에서, 수령체 세포 올리고뉴클레오타이드는 제4 엔도뉴클레아제 부위(C4)를 포함한다.
발명은 또한 복수의 올리고뉴클레오타이드로부터 올리고뉴클레오타이드를 확인하는 방법을 제공하며, 방법은 (a) 복수의 공여체 세포를 제1 정렬된 어레이로 제공하는 단계로, 각각의 공여체 세포는 공여체 플라스미드를 포함하고, 각각의 공여체 플라스미드는, 순차적으로, 선택적으로 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 고유한 바코드 서열, 제2 상동 재조합 영역(HR2), 및 선택적으로 제2 엔도뉴클레아제 부위(C2)를 포함하며, 고유한 바코드 서열은 제1 정렬된 어레이에서 숙주 세포의 위치를 확인하는 것인 단계; (b) 복수의 수령체 세포를 제공하는 단계로, 각각의 수령체 세포는 순차적으로, 복수의 올리고뉴클레오타이드로부터의 올리고뉴클레오타이드, HR1에 상동인 제3 상동 재조합 영역(HR3), 선택적으로 제3 엔도뉴클레아제 부위(C3), 및 HR2에 상동인 제4 상동 재조합 영역(HR4)을 포함하는 수령체 플라스미드를 포함하는 것인 단계; (c) 복수의 수령체 세포를 각각 제2 정렬된 어레이의 고유한 위치에 플레이팅하고 배양함으로써, 수령체 세포의 제2 정렬된 어레이를 제공하는 단계; (d) (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 공여체 세포로부터 어레이 상의 상응하는 위치의 수령체 세포로 전달하고, (ii) 제1, 제2, 및 제3 엔도뉴클레아제 부위를 절단하며, (iii) 바코드 서열을 상동 재조합에 의하여 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 제1 정렬된 어레이를 제2 정렬된 어레이와 접촉시킴으로써, 각각이 고유한 바코드 서열 및 올리고뉴클레오타이드 혼합물로부터의 올리고뉴클레오타이드를 포함하고 있는 융합 올리고뉴클레오타이드의 제3 어레이를 형성하는 단계; 및 (e) 융합 올리고뉴클레오타이드를 서열분석함으로써, 바코드 서열에 의해 어레이에서 각각의 올리고뉴클레오타이드를 확인하는 단계를 포함한다. 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있다. 구현예에서, 공여체 플라스미드는 HR1과 HR2 사이에 바코드 서열의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하고; 선택적으로 공여체 플라스미드는 역선택성 마커를 포함한다. 구현예에서, 수령체 세포 올리고뉴클레오타이드는 제4 엔도뉴클레아제 부위(C4)를 포함한다. 구현예에서, 제1 엔도뉴클레아제 부위, 제2 엔도뉴클레아제 부위, 및 제3 엔도뉴클레아제 부위는 동일하거나 또는 상이하다. 구현예에서, 공여체 플라스미드는 전달 기점, 및/또는 조건부 복제 기점을 선택하고; 선택적으로 전달 기점은 이동성 요소로부터 유래되며; 추가로 선택적으로 조건부 복제 기점은 올리고뉴클레오타이드의 존재 또는 세포 성장 조건에 따라 달라진다. 구현예에서, 공여체 플라스미드 또는 수령체 플라스미드는 적어도 30 킬로베이스 길이의 플라스미드를 복제할 수 있는 레플리콘을 포함하며, 선택적으로 레플리콘은 P1 유래 인공 염색체 또는 박테리아 인공 염색체로부터 유래된다. 구현예에서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 유도성 고복사 복제 기점을 포함한다. 구현예에서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 효모 인공 염색체(YAC), 포유류 인공 염색체(MAC), 인간 인공 염색체(HAC), 또는 식물 인공 염색체를 포함한다. 구현예에서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 바이러스 벡터를 포함한다. 구현예에서, 엔도뉴클레아제 부위는 수령체 세포에서 하나 이상의 올리고뉴클레오타이드에 의해 코딩되고/거나 공여체 플라스미드에서 코딩된 하나 이상의 엔도뉴클레아제에 의해 절단되며; 선택적으로 하나 이상의 엔도뉴클레아제는 호밍 엔도뉴클레아제 또는 RNA 가이드 DNA 엔도뉴클레아제이고; 추가로 선택적으로 엔도뉴클레아제는 HO이다. 구현예에서, 공여체 세포 또는 수령체 세포는 (i) 플라스미드 콘쥬게이션을 가능하게 하거나; (ii) 하나 이상의 상동 DNA 복구 유전자를 코딩하거나; 또는 (iii) 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 세포, 수령체 세포, 또는 재조합 수령체 세포는 제3 정렬된 어레이, 제4 정렬된 어레이, 또는 후속 정렬된 어레이 상의 위치로 전달된다. 구현예에서, 공여체 세포 및 수령체 세포는 독립적으로 박테리아 세포이고 선택적으로 박테리아 세포는 대장균, 비브리오 나트리겐스 또는 콜레라균이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이이며, 선택적으로 바코드 서열은 약 30개 뉴클레오타이드 길이이다. 구현예에서, 올리고뉴클레오타이드의 혼합물은 화학적 커플링, 중합효소 뉴클레오타이드 콘쥬게이트를 사용하는 주형 독립적인 효소적 합성, 중합효소 연쇄 조립(중합효소 순환 조립), 깁슨(Gibson) 조립(츄백(chew back), 어닐링 및 복구), 결찰효소 연쇄 반응/결찰효소 순환 반응, Phi29 중합효소, 롤링 서클(rolling circle), 루프 매개 등온(LAMP), 가닥 치환(SDA), 나선효소 의존성(HAD), 재조합효소 중합효소(RPA), 핵산 서열 기반 증폭(NASBA), 골든 게이트 클로닝(Golden Gate cloning), MoClo 클로닝, 바이오브릭스(BioBricks) 또는 조립된 바이오브릭스, 열역학적으로 균형잡힌 인사이드 아웃 합성, DNA 클로닝, 결찰 독립적인 클로닝, 선택 클로닝에 의한 결찰, 리컴비니어링(recombineering), 효모 조립, PCR, 분자 반전 프로브 또는 LASSO 프로브에 의한 포획, DropSynth, 및 효소적 DNA 합성으로부터 선택된 DNA 합성 또는 조립 기술의 생성물이다. 구현예에서, 올리고뉴클레오타이드 혼합물은 오류가 발생하기 쉬운 PCR, 축퇴성 올리고를 사용하는 PCR, 및 정규 PCR을 포함한 중합효소 연쇄 반응 기술, 화학적 또는 광(light) 돌연변이유발, 편집 올리고 라이브러리를 사용하는 시험관내 합성, 생체내 편집, 예를 들면 MAGE, MAGESTIC, CRISPR, 프라임 편집, 레트론 편집, 및 CRISPR, TALEN 및 아연 핑거 뉴클레아제를 사용하는 염기 변형으로부터 선택된 풀링된 돌연변이유발 기술의 생성물이다. 구현예에서, 올리고뉴클레오타이드 혼합물은 적어도 게놈 DNA, cDNA, 소기관 DNA, 또는 천연 플라스미드 DNA의 단편을 포함한다. 구현예에서, 올리고뉴클레오타이드 혼합물은 gDNA, cDNA 또는 소기관 DNA로부터, 예를 들어 균형잡힌 cDNA 라이브러리, 멀티플렉스 PCR 생성물과 같은 PCR 생성물, LASSO 프로브를 포함한 분자 반전 프로브, 어닐링 또는 감산 혼성화(subtractive hybridization)에 의한 포획, 공동 형질전환 및 상동 재조합, 롤링 서클 증폭, 또는 LAMP로부터 기원하는 포획된 또는 증폭된 DNA를 포함한다. 구현예에서, 올리고뉴클레오타이드 혼합물은 플라스미드 또는 플라스미드 라이브러리로부터, 예를 들어 오픈 리딩 프레임(ORF) 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 인트론 라이브러리, BAC 라이브러리, PAC 라이브러리, 렌티바이러스 라이브러리, gRNA 라이브러리, PCR 생성물, 제한 소화 생성물, 또는 GATEWAY 셔틀링 생성물로부터의 포획된 또는 증폭된 DNA를 포함한다. 구현예에서, 올리고뉴클레오타이드 혼합물의 올리고뉴클레오타이드는 공여체 플라스미드에 공동 형질전환 및 리컴비니어링; 형질전환 및 리컴비니어링; 또는 콘쥬게이션 및 리컴비니어링을 포함하는 방법에 의해 통합된다. 구현예에서, 공동 형질전환 및 리컴비니어링의 방법은 선택성 마커 및 각각이 혼합물 중의 올리고뉴클레오타이드의 말단에 있는 서열에 상동인 2개의 상동 재조합 영역을 포함하는 선형 또는 원형 공여체 플라스미드를 구성하는 단계; 공여체 플라스미드 및 올리고뉴클레오타이드를 세포에 공동 형질전환시키는 단계; 상동 재조합을 유도하는 단계; 및 선택성 마커를 선택하는 단계를 포함하며; 선택적으로 방법은 공여체 플라스미드 및/또는 올리고뉴클레오타이드의 라이브러리 또는 풀(pool)로 수행된다. 구현예에서, 형질전환 및 리컴비니어링의 방법은 선택성 마커 및 각각 혼합물 중의 올리고뉴클레오타이드의 말단에 있는 서열에 상동인 2개의 상동 재조합 영역을 포함하는 선형 또는 원형 공여체 플라스미드를 구성하는 단계로, 올리고뉴클레오타이드는 숙주 세포 내의 플라스미드 상에 있는 것인 단계; 숙주 세포를 공여체 플라스미드로 형질전환시키는 단계; 상동 재조합을 유도하는 단계; 및 선택성 마커를 선택하는 단계를 포함한다. 구현예에서, 콘쥬게이션 및 리컴비니어링의 방법은 2개의 선택적인 엔도뉴클레아제 부위 및 2개의 상동 재조합(HR) 영역이 측면에 있는 역선택성 마커(-1)를 포함하는 선형 또는 원형 공여체 플라스미드를 구성하는 단계로; 여기서 공여체 플라스미드는 콘쥬게이션을 유도할 수 있지만 콘쥬게이션을 할 수 없는 손상된 F 플라스미드를 함유한 공여체 세포 내에 있고, 혼합물의 올리고뉴클레오타이드는 수령체 세포 내의 플라스미드 상에 있으며, 각각은 공여체 플라스미드의 HR 영역에 상동성이고 각각의 올리고뉴클레오타이드의 공여체 플라스미드로의 재조합을 선택하기 위해 적어도 하나의 선택성 마커(+1)에 인접한 HR 영역이 측면에 있는 것인 단계; 상동 재조합효소 및 선택적으로 하나 이상의 엔도뉴클레아제를, 수령체 세포 내 또는 공여체 플라스미드에 의해 코딩된 것을 제공하는 단계; (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 공여체 세포로부터 수령체 세포로 전달하고 (ii) 공여체 플라스미드와 수령체 플라스미드를 상동 재조합에 의해 재조합하는 조건 하에서 공여체 세포와 수령체 세포를 접촉시키는 단계; 및 선택성 마커를 포함하지만 역선택성 마커를 포함하지 않는 세포를 선택하는 단계를 포함한다. 구현예에서, 방법은 공여체 및/또는 수령체 플라스미드의 라이브러리로 수행된다. 구현예에서, 올리고뉴클레오타이드는 ORF 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 인트론 라이브러리, BAC 라이브러리, PAC 라이브러리, 렌티바이러스 라이브러리, gRNA 라이브러리, gDNA 라이브러리, cDNA 라이브러리, 단백질 도메인 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 조절 요소의 라이브러리, 구조 요소의 라이브러리, 또는 DNA 돌연변이유발로부터 유래된 DNA 변이체의 라이브러리와 같은 라이브러리를 포함한다. 구현예에서, 올리고뉴클레오타이드 혼합물은 플라스미드 라이브러리, 예를 들어 gRNA 라이브러리, gDNA 라이브러리, cDNA 라이브러리, 오픈 리딩 프레임(ORF) 라이브러리, 단백질 도메인 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 조절 요소의 라이브러리, 구조 요소의 라이브러리, 또는 DNA 돌연변이유발로부터 유래된 DNA 변이체의 라이브러리를 포함하는 세포의 어레이를 포함한다. 구현예에서, 올리고뉴클레오타이드 혼합물은 청구항 제1항 내지 제35항 중 어느 하나의 항의 방법에서 사용하기 위한 DNA 요소 단편을 포함하는 세포의 어레이를 포함한다.
도 1. 본원에 기술된 DNA 조립을 위한 방법의 구현예의 개략도로, 공여체 플라스미드 및 수령체 올리고뉴클레오타이드 요소를 음영 상자로서 도시한다. 도면은 3 "라운드"의 "DNA 스티칭(stitching)"을 도시하는데, 각각의 라운드에서 DNA 요소 단편을 포함하는 새로운 올리고뉴클레오타이드가 수령체 올리고뉴클레오타이드에 첨가된다. 도면 전체에서, DNA 요소 단편은 재조합 전에 입력 DNA 1, 입력 DNA 2, 등으로, 그리고 재조합 후에는 DNA1, DNA2, 등으로; 또는 대안적으로 올리고1, 올리고2, 등으로 다양하게 도시되거나, 또는 보다 일반적으로 "DNA 블록"으로서 언급될 수 있다. C1, C2, 등으로 표시된 상자는 엔도뉴클레아제 부위를 나타내고; HR1, HR2, 등으로 표시된 상자는 상동 재조합 영역을 나타내며; 올리고1, 올리고2, 등으로 표시된 상자는 숫자로 표시된 DNA 요소 단편 상자를 포함하는 올리고뉴클레오타이드를 나타내고 플러스 또는 마이너스 기호는 선택 가능한(+) 및 역선택 가능한(-) 마커를 나타낸다. 개략적으로 도시된 모든 요소가 본원에서 기술된 방법의 모든 구현예에 필요한 것은 아니다; 예를 들어, C2.1, C2.2, C7.1, C7.2로 표시된 마커 및 엔도뉴클레아제 부위는 선택적이다.
도 2a-b. 패널 A는 본원에 기술된 방법에 사용된 예시의 수령체 올리고뉴클레오타이드(플라스미드 형태임)의 개략적 지도이다. 패널 B는 예시의 공여체 플라스미드 및 헬퍼 플라스미드의 2개의 개략적 지도를 도시한다.
도 3. CRISPR/Cas9는 본원에서 "스티칭"으로도 언급되는 DNA 조립 효율을 향상시킨다. 선택 플레이트 상에서 6 x 106 세포당 콜로니 수. 하나만이 기능적 gRNA를 발현하는 2개의 공여체 플라스미드가 3개의 수령체 스트레인: (1) BW28705(λ 레드 및 Cas9 없음), (2) BW28705/pML300(λ 레드는 있지만 Cas9 없음),(3) BW28705/pSL359(Cas9 및 λ 레드)의 각각에 형질전환되었다.
도 4. 본원에 기술된 생체내 DNA 조립 또는 "스티칭" 방법에 사용될 수 있는 예시의 플라스미드의 개략적인 지도. 공여체 세포에서, 콘쥬게이션 적격 헬퍼 플라스미드는 플라스미드 전달을 위한 유전자(Tra 오페론)를 함유할 수 있다. 콘쥬게이션 플라스미드 자체를 고정시키기 위하여, 전달 기점(oriT)이 선택성 마커(+6)로 대체된다. 공여체 플라스미드는 교환(swapping) 카세트(+1/-1 또는 +2/-2), 2개의 상동성 영역(H2 및 H3), 4개의 엔도뉴클레아제 절단 부위(1로 표지된 2개의 원형, 및 2로 표지된 2개의 원형), 백본 선택성 마커(+4), 공여체 게놈(pir1-116)의 대립유전자에 따라 달라지는 조건부 복제 기점(R6K), oriT 서열, 및 gRNA 발현 카세트(gRNA1 또는 gRNA2)를 함유한다.
도 5. 본원에 기술된 생체내 스티칭 방법에 사용될 수 있는 예시의 플라스미드의 개략적인 지도. 수령체 세포에서, 헬퍼 플라스미드는 람노스 유도성 레드 오페론(PrhaBAD-레드), 아라비노스 유도성 Cas9(ParaBAD-Cas9), 상동 재조합을 부스팅하기 위한 대장균 RecA 유전자, 백본 선택성 마커(+5), 및 경화 가능한(curable) 복제 기점(pSC101 oriTS)을 함유한다. 수령체 플라스미드에는 2개의 엔도뉴클레아제 절단 부위(1로 표지된 2개의 원형), 교환 카세트(+2/-2), 2개의 상동성 영역(H2 및 H3), 및 복제 기점(ColE1)이 포함된다. +1: HygR; +2: NsrR; -1: SacB; -2: PheS; +3: GmR; +4: KanR; +5: SpR; +6: TcR.
도 6. 생체내 스티칭의 예시의 방법의 개략적인 개요. DNA 단편을 운반하는 공여체 플라스미드(위쪽 또는 아래쪽 줄무늬 직사각형)가 공여체 플라스미드 및 공여체 세포에 도입된다. 공여체 플라스미드는 수령체 세포에 콘쥬게이션되고 DNA 단편은 공여체 플라스미드로부터 수령체 플라스미드로 전달된다. 플라스미드는 아라비노스에 의해 유도된 CRISPR/Cas9를 사용하여 절단된다. 공여체 플라스미드 상의 가이드 RNA(gRNA1 또는 gRNA2, 조립 라운드 사이에서 교대됨)는 절단을 위해 인식 서열을 특정한다("1" 및 "2" 원형, 조립 라운드 사이에서 교대됨). 합성된 올리고 및 플라스미드 백본 둘 다에 있는 상동성 영역(라운드 1에서 H1 및 H3)은 람노스에 의해 유도되는 재조합을 촉진하고, 유전자 조립을 위해 함께 올리고를 원활하게 스티칭한다. 공여체 플라스미드 상의 교대의 선택 가능한(+1 및 +2) 및 역선택 가능한(-1 및 -2) 마커는 허용될 수 있는 최대 플라스미드 크기에 의해 이론적으로 설정된 최대 유전자 길이로 반복적인 DNA 전달을 허용한다. R6K 및 ColE1은 복제 기점이다. +3 및 +4는 플라스미드 유지를 위해 사용된 선택성 마커이다.
도 7a-i. DNA 조립의 예. 패널 A는 각각 mEGFP의 일부를 운반하며, 순차적으로 콘쥬게이션되어 수령체 플라스미드로 조립되는 3개의 공여체 플라스미드(3 스티치)를 도시한다. 패널 B는 액체에서 3 라운드의 조립 후에 음성 대조군, 양성 대조군, 및 생체내 스티칭 생성물로부터의 콜로니의 형광을 도시한다. 콜로니는 독립적인 콘쥬게이션 및 재조합 사건을 나타내고 100% 형광이다. 패널 C는 96- 및 384 위치 방식의 mEGFP의 배열된 어셈블리를 도시한다. 패널 D는 제2 mEGFP 단편에 대해 상이한 길이의 상동성을 가진 제3 mEGFP 단편을 사용하는 최종 라운드의 액체 조립 후 형광 콜로니의 백분율을 도시한다. 패널 E는 조립 동안 아가로부터 스크래핑한 다양한 플라스미드를 함유하는 콜로니의 대표적인 제한 소화를 도시한다. 비재조합 수령체 플라스미드로부터의 예상된 생성물은 재조합페에 대한 선택 또는 헬퍼 플라스미드의 경화(화살표 지점) 후에는 관찰될 수 없다. 패널 F는 mEGFP의 조립 후에 96개의 콜로니의 Sanger 서열분석으로부터의 결과의 개략적인 분석을 도시한다. 서열분석 생성물은 각각의 콜로니에 접촉된 피펫 선단의 콜로니 PCR로부터 도출된다. 한 개의 콜로니가 중간 생성물(제1 라운드 조립 생성물)을 함유하였고 한 개의 콜로니가 스티칭 오류(큰 결실)를 함유하였다. 패널 G는 2개의 형광 유전자인 mPapaya 및 sfGFP, 및 4개의 재조합효소 유전자의 5 라운드의 조립 후 생체내 스티칭 생성물로부터의 콜로니의 형광을 도시한다. 콜로니는 독립적인 콘쥬게이션 및 재조합 사건을 나타낼 수 있다. 모든 mPapaya 및 sfGFP 콜로니는 형광이다. 패널 H는 5 라운드의 조립 후 mPapaya 생체내 스티칭 생성물의 Sanger 서열분석으로부터의 추적 파일이다. 예상된 서열에 대한 정렬은 어셈블리가 100% 정확하고 순수한 것을 보여준다. 패널 I는 약 9 kb의 총 어셈블리 길이에 대해, 3개의 약 3 kb 단편의 조립으로부터의 결과를 도시한다. 조립의 다양한 단계에서의 수령체 플라스미드가 제한 효소로 소화되어 스티칭 생성물이 벡터 백본으로부터 분리되었다. 소화된 생성물은 그런 후 아가로스 겔 전기영동에 적용되어 스티칭 생성물의 크기가 조사되었다(레인 1-3). 스티칭 생성물에 상응하는 겔 밴드가 화살표로 표시된다. 스티칭 생성물이 없는 선형화된 벡터 백본은 레인 5-6에 보인다. 교환 카세트의 선택 가능한 및 역선택성 마커는 조립 라운드간에 상이하며, 제1 및 제3 조립 라운드에서의 교환 카세트는 원래의 수령체 플라스미드 또는 제2 조립 라운드의 교환 카세트보다 약 1.5 kb 더 길다.
도 8a-b. DNA 스티칭의 제1 라운드를 시작할 때 예시의 공여체 및 수령체 플라스미드의 개략도. 패널 A는 공여체 플라스미드가 제1 올리고뉴클레오타이드(1)를 함유하고 있는 예시의 두 플라스미드에 대한 개략도를 도시한다. 패널 B는 게놈, 양성 선택성 마커, 음성 선택성 마커, 전달 기점(oriT), gRNA 발현 단위(gRNA), 위치 바코드, 재조합 도메인에 대한 상동성(H), 유도성 람다 레드 오페론(λ레드), 유도성 I-SceI 엔도뉴클레아제, 플라스미드, 유도성 엔도뉴클레아제(Cas9), gRNA 표적 부위, I-SceI 표적 부위, 콘쥬게이션 Tra 오페론, 결실된 oriT(ori△::TcR), 온도 민감성 기점(pSC101 ori), 조건부 복제 기점(R6K), 및 복제 기점의 수령체(ColE1)에 상응하고 예시하는 서열을 예시하기 위해 사용된 모양의 설명을 도시한다. 도 8b의 모양의 동일한 설명이 도 9-35에 대해 사용된다.
도 9. 본원에 기술된 방법에 사용하기 위한 예시의 초기 플라스미드의 개략도: 제1 올리고(1)를 함유하는 공여체 플라스미드, 수령체 플라스미드, 및 공여체 플라스미드의 수령체 세포에의 콘쥬게이션을 매개하는 oriT를 함유한 플라스미드.
도 10. 도 9에서 도시된 공여체 및 수령체 플라스미드를 사용하는 예시의 DNA 스티칭 방법의 후속 단계의 개략도: gRNA1은 수령체 세포에서 공여체 및 수령체 플라스미드 상에 부위 특정 이중 가닥 절단(아래쪽 화살표로 표시됨)을 생성하도록 Cas9를 안내한다.
도 11. 도 9-10에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 여기서 진한 음영 서열 요소는 람다 레드 매개 상동 재조합을 위한 상동성 영역으로서 사용될 것이다.
도 12. 도 9-11에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: λ 레드 시스템의 도움으로, 공여체 플라스미드로부터의 서열이 수령체 플라스미드로 삽입될 위치 및 그것의 방향을 보여주는 플라스미드 사이의 상동 재조합.
도 13. 도 9-12에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제1 올리고뉴클레오타이드를 함유한 단편이 도시된 것과 같이 수령체 플라스미드에 통합된다.
도 14. 도 9-13에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 플라스미드가 +2 양성 선택성 마커 획득에 대해 선택될 것이다.
도 15. 도 9-14에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 플라스미드가 이전의 역선택성 마커 상실에 대해 역선택될 것이다.
도 16. 도 9-15에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 플라스미드가 원래의 수령체 백본 상의 +3 양성 선택성 마커 보유에 대해 추가로 선택될 것이다.
도 17. 도 9-16에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제2 올리고뉴클레오타이드를 함유한 제2 공여체 플라스미드가 제1 올리고뉴클레오타이드를 함유하고 있는 이전의 결찰 생성물(새로운 수령체 플라스미드)로 조립될 준비가 된다.
도 18. 도 9-17에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: oriT가 공여체 플라스미드의 콘쥬게이션을 지시한다.
도 19. 도 9-18에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제2 gRNA 발현이 아래쪽 화살표로 표시된 부위에서 이중 가닥 절단을 생성하도록 Cas9를 안내한다.
도 20. 도 9-19에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 강조된 영역(더 진한 음영 영역)은 재조합을 위한 상동성 영역이다.
도 21. 도 9-20에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제1 올리고뉴클레오타이드를 함유한 단편이 도시된 것과 같이 수령체 플라스미드에 통합된다.
도 22. 도 9-21에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제2 올리고뉴클레오타이드가 수령체 플라스미드의 3' 단부에 인접하여 조립되어 새로운 수령체 플라스미드가 생성된다.
도 23. 도 9-22에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제1 및 제2 올리고뉴클레오타이드를 함유한 플라스미드가 +1 양성 선택성 마커 획득에 대해 선택될 것이다.
도 24. 도 9-23에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제1 및 제2 올리고뉴클레오타이드를 함유한 플라스미드가 -2 역선택성 마커 상실에 대해 선택될 것이다.
도 25. 도 9-24에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제1 및 제2 올리고뉴클레오타이드를 함유한 플라스미드가 또한 백본 선택성 마커 보유에 대해 선택될 것이다.
도 26. 도 9-25에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제3 라운드의 DNA 스티칭을 개시하기 위하여 올리고뉴클레오타이드 3을 함유한 공여체 플라스미드 및 올리고뉴클레오타이드 1을 함유한 수령체 플라스미드에 대한 개략도.
도 27. 도 9-26에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: oriT 플라스미드가 콘쥬게이션을 시작한다.
도 28. 도 9-27에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: gRNA1이 공여체 및 수령체 플라스미드 상에 부위 특정 이중 가닥 절단(아래쪽 화살표로 표시됨)을 생성하도록 Cas9를 안내한다.
도 29. 도 9-28에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 여기서 강조된 서열이 람다 레드 매개 상동 재조합을 위한 상동성 영역으로서 사용될 것이다.
도 30. 도 9-29에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 수령체 플라스미드에 삽입될 공여체 플라스미드로부터의 서열의 위치 및 방향을 보여주는 후 상동 재조합.
도 31. 도 9-30에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 제3 올리고뉴클레오타이드가 수령체 플라스미드의 제2 올리고뉴클레오타이드의 3' 단부에 인접하여 조립되어 새로운 수령체 플라스미드가 생성된다.
도 32. 도 9-31에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: DNA 스티칭의 라운드 1과 유사하게, 플라스미드가 +2 양성 선택성 마커 획득에 대해 선택될 것이다.
도 33. 도 9-32에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 플라스미드가 -1 역선택성 마커 상실에 대해 역선택될 것이다.
도 34. 도 9-33에서 도시된 예시의 DNA 스티칭 방법의 후속 단계의 개략도: 플라스미드가 백본 선택성 마커 보유에 대해 선택될 것이다.
도 35a-b. 패널 A는 후속 올리고뉴클레오타이드가 2회의 콘쥬게이션, 이중 가닥 절단 처리, 조립, 및 선택 가능한/역선택 가능한/백본 선택 처리 사이에서 교대로, 동일한 양식으로 통합될 수 있는(총 서열 길이에 대한 크기 상한에 도달할 때까지) 구현예를 예시하는 도 9-34에서 예시된 방법의 단계를 도시한다. 패널 B는 2개의 DNA 요소 단편(도면에서 재조합 전에는 입력 DNA 1, 입력 DNA 2로, 재조합 후에는 DNA1, DNA2로 도시되며; 또한 본원에서 올리고1, 올리고2, 등으로, 또는 보다 일반적으로는 "DNA 블록"으로도 언급될 수 있음)이 콘쥬게이션의 단일 라운드에서 첨가되는 예시의 생체내 조립의 개략적인 개요이다. 각각의 웰에서, 수령체 세포가 제1 공여체 플라스미드를 포함하는 제1 공여체 세포에 의해 먼저 콘쥬게이션되고 제2 공여체 플라스미드를 포함하는 제2 공여체 세포에 의해 두 번째로 콘쥬게이션된다. 제2 공여체 플라스미드에 의해 도입된 선택성 마커 및 수령체 플라스미드 상에 있고 선택적으로 제1 공여체 플라스미드 상에 있는 역선택성 마커는 두 공여체 플라스미드 모두에 의해 도입된 올리고뉴클레오타이드를 함유한 생성물의 선택을 가능하게 한다.
도 36a-d. 패널 A는 본원에 기술된 것과 같이, 생체내 DNA 분석을 위한 예시의 방법의 개략적인 개요이다. 이 예에서, 인덱싱 바코드는 수령체 플라스미드 상에 위치한다. 패널 B는 본원에 기술된 것과 같이, 생체내 DNA 분석을 위한 또 다른 예시의 방법의 개략적인 개요이다. 이 예에서, 인덱싱 바코드는 공여체 플라스미드 상에 위치하고 어셈블리 생성물의 단부에서 상동성 영역을 사용하여 생체내 DNA 조립 생성물에 첨가된다. 이 예에서, 사용된 엔도뉴클레아제 부위는 생체내 DNA 조립에 대해 사용된 것과 동일하다. 패널 C는 본원에 기술된 것과 같이, 생체내 DNA 분석을 위한 또 다른 예시의 방법의 개략적인 개요이다. 이 예에서, 인덱싱 바코드는 공여체 플라스미드 상에 위치하고 생체내 DNA 조립 생성물에 첨가된다. 이 예에서, 엔도뉴클레아제 표적 부위(C) 및 상동성 영역(C에 인접한 상자)은 생체내 DNA 조립에 사용된 것과 상이하다. 이 예는 조립되는 동안 다수의 단계에서 DNA 분석을 가능하게 한다. 패널 D는 더 큰 DNA 블록으로 추가 라운드의 조립을 가능하게 하기 위하여 DNA 어셈블리를 수령체 플라스미드로부터 공여체 플라스미드로 이동시키는 플라스미드 리셋을 포함하는 방법의 개략적인 개요이다. 패널 D의 파트 A에서, 수령체 플라스미드 상의 DNA 어셈블리 시작 부분과 상동성을 갖는 공여체 세포의 리셋 공여체 플라스미드가 수령체 세포에 콘쥬게이션된다. 부위 특정 엔도뉴클레아제는 리셋 공여체 플라스미드 및 수령체 플라스미드 둘 다에서 "D" 엔도뉴클레아제 표적 부위에서 절단한다. "D" 엔도뉴클레아제 표적 부위에 인접한 영역에서 상동 재조합은 DNA 어셈블리 카세트를 수령체 플라스미드로부터 리셋 공여체 플라스미드로 이동시킨다. 리셋 공여체 플라스미드는 수령체 세포로부터 정제되고 새로운 공여체 세포에 형질전환되어 그곳에서 추가 라운드의 조립을 위해 이용될 수 있다. 패널 D의 파트 B에서, 긴 DNA 구성물의 조립을 위한 작업흐름이 개략적으로 도시된다. 작은 DNA 블록은 4 라운드의 DNA 스티칭을 사용하여 큰 DNA 블록으로 조립될 수 있다. 큰 블록은 리셋 공여체 플라스미드를 사용하여 공여체 플라스미드 및 공여체 세포로 이동된다. 그런 후 큰 블록은 추가 라운드의 스티칭으로 더 큰 블록으로도 조립될 수 있다.
도 37은 생체내 DNA 분석에 사용하기 위한 예시의 플라스미드의 개략적 지도를 도시한다. 공여체 세포에서, 콘쥬게이션 적격 헬퍼 플라스미드는 플라스미드 전달을 위한 유전자(Tra 오페론)를 함유한다. 헬퍼 플라스미드 자체를 고정시키기 위하여, 전달 기점(oriT)이 선택성 마커(+6)로 대체된다. 공여체 플라스미드는 교환 카세트(+ 및 -), 2개의 상동성 영역(H1 및 H4), 표적화된 플라스미드 절단을 위한 2개의 부위(타원형), 백본 선택성 마커(+4), 공여체의 게놈의 대립유전자(pir1-116)에 좌우되는 조건부 복제 기점(R6K), 및 oriT 서열을 함유한다. 수령체 세포에서, 헬퍼 플라스미드는 lac-유도성 레드 오페론(Plac-레드), 상동 재조합을 부스팅하기 위한 대장균 RecA 유전자, 백본 선택성 마커(+5), 및 경화 가능한 온도 민감서 복제 기점(pSC101 oriTS)을 함유한다. 수령체 플라스미드에는 2개의 엔도뉴클레아제 절단 부위(2개의 타원형), 음성 선택성 마커(-3), 및 2개의 상동성 영역(H1 및 H4)이 포함된다. 2개의 플라스미드 외에, 수령체 세포는 또한 표적 플라스미드 상에서 DNA 절단을 생성하기 위하여 통합된 아라비노스 유도성 엔도뉴클레아제 I-SceI(ParaBAD-I-SceI)를 가지고 있다. +: HygR 또는 NsrR; -: SacB 또는 PheS; +3: GmR; -3: relE; +4: KanR; +5: SpR; +6: TcR.
도 38은 생체내 DNA 분석에 사용하기 위한 예시의 플라스미드의 개략적인 지도를 도시한다. 선택성 마커: HygR, KanR, GmR, SpR. 역선택성 마커: SacB, relE.
도 39a-b는 DNA 파싱을 위해 사용된 예시의 공여체 플라스미드 및 수령체 플라스미드의 개략적인 지도를 도시한다. 패널 A는 공여체 플라스미드가 제1 올리고뉴클레오타이드를 함유하고 있는 플라스미드를 개략적으로 도시한다. 패널 B는 게놈, 양성 선택성 마커, 음성 선택성 마커, 전달 기점(oriT), gRNA 발현 단위(gRNA), 위치 바코드, 재조합 도메인에 대한 상동성(H), 유도성 람다 레드 오페론(λ레드), 유도성 I-SceI 엔도뉴클레아제, 플라스미드, 유도성 엔도뉴클레아제(Cas9), gRNA 표적 부위, I-SceI 표적 부위, 콘쥬게이션 Tra 오페론, 결실된 oriT(ori△::TcR), 온도 민감성 기점(pSC101 ori), 조건부 복제 기점(R6K), 및 복제 기점의 수령체(ColE1)에 상응하는 서열을 예시하기 위해 사용된 모양의 설명을 나타낸다. 패널 B의 설명은 또한 도 40-46에도 적용된다.
도 40은 본원에서 기술된 예시의 방법에 사용하기 위한 공여체 및 수령체 플라스미드의 다이아그램을 도시한다.
도 41은 도 40의 예시의 방법의 제2 단계를 보여주는 이미지이다: gRNA1은 수령체 세포에서 Cas9를 공여체 및 수령체 플라스미드(아래쪽 화살표로 표시됨) 상에서 부위 특정 이중 가닥 절단을 생성하도록 안내한다. SceI는 I-SceI, 호밍 엔도뉴클레아제이다.
도 42는 도 40 및 41의 예시의 방법의 단계의 이미지를 도시한다: 여기서 H1 및 H4 서열이 람다 레드 매개 상동 재조합을 위한 상동성 영역으로서 사용될 것이다.
도 43은 도 40-42의 예시의 방법의 단계를 보여주는 이미지이다: 상동 재조합은 공여체 플라스미드로부터의 서열이 수령체 플라스미드에 삽입될 위치와 방향을 보여준다.
도 44는 도 40-43의 예시의 방법의 단계를 보여주는 이미지이다: 플라스미드가 + 양성 선택성 마커 획득에 대해 선택될 것이다.
도 45는 도 40-44의 예시의 방법의 단계의 이미지를 도시한다: 플라스미드가 이전의 역선택성 마커 상실에 대해 역선택될 것이다.
도 46은 도 40-45의 예시의 방법의 단계를 보여주는 이미지이다: 플라스미드가 원래의 수령체 백본 상의 +3 양성 선택성 마커 보유에 대해 추가적으로 선택될 것이다.
도 47a-d. 패널 A는 각각의 위치에서 고유한 DNA 바코드를 함유하고 있는 배열된 공여체 세포 플레이트의 각 위치에 있는 서열을 정확하게 확인하기 위한 생체내 분석의 능력을 결정하기 위한 실험 결과를 도시한다. 각각의 배열된 바코드 공여체가 2개 또는 3개의 바코드 수령체 플레이트와 짝이 지어지고 각각 공여체 및 수령체 바코드를 모두 포함하는 재조합 세포 콜로니가 아가 패드 상에서 선택되었다. 플레이트로부터의 재조합 세포가 모아졌고 이중 바코드가 Illumina 플랫폼 상에서 서열분석되었다. 서열분석 데이터는 1, 2, 또는 3개의 분리된 바코드 수령체 어레이에 콘쥬게이션되었을 때 정확하게 인덱싱될 수 있는 배열된 바코드 공여체의 퍼센트(회수율)를 결정하기 위해 사용되었다. 잘못된 위치에 부정확하게 할당된 바코드 공여체는 없었다. 패널 B는 oPool로서 IDT로부터 주문된 100개의 244개 염기 올리고뉴클레오타이드의 풀을 인덱싱하고 서열을 확인하기 위한 실험 결과를 도시한다. 올리고뉴클레오타이드 풀은 공여체 플라스미드에 통합되었고, 그런 후에 공여체 세포에 형질전환되었다. 공여체 세포는 384 웰 플레이트에 웰당 하나 미만의 세포의 예상 빈도로 무작위로 배열되었다. 공여체 세포는 바코딩된 수령체 세포 어레이에 콘쥬게이션되었고, 재조합 올리고뉴클레오타이드-바코드 수령체 플라스미드는 Oxford 나노포어(Nanopore) 서열분석기를 사용하여 서열분석되었다. 2개의 384 웰 플레이트의 분석 결과가 도시된다. 음영은 웰이 배열된 입력 DNA를 가졌는지, 서열이 oPool의 244 염기 서열 중 하나와 100% 매칭되었는지, 그리고 웰이 순수한지(즉 하나의 244 염기 서열만이 웰에서 검출될 수 있는지)를 나타낸다. "100% 매칭된 순수 웰"로서 표시된 위치는 전형적으로 하류 DNA 조립을 위해 사용될 수 있을 것이다. 패널 C는 패널 B의 실험으로부터의 데이터를 사용하여, Oxford 나노포어 서열분석에 의해 결정된 공통 서열과 공통 서열에 가장 가까운 oPool의 예상 DNA 서열 사이의 오류 분포를 보여주는 히스토그램이다. 대부분의 웰은 oPool의 서열 중 하나와 동일한 올리고뉴클레오타이드를 함유한다. 패널 D는 패널 B의 실험으로부터의 데이터를 사용하여, 각각의 올리고뉴클레오타이드에 대해 회수된 독립적인 클론의 카운트 분포를 보여주는 히스토그램이다.
도 48은 입력 올리고뉴클레오타이드 세트로부터 지시된 조합 라이브러리를 구축하기 위한 DNA 조립 작업흐름의 개략적인 개요이다. 다수의 공급원으로부터의 입력 DNA의 풀이 공여체 플라스미드에 통합되고 정렬된 어레이로 파싱된다. 정렬된 어레이는 다수의 공여체 플레이트 상의 사용자 정의된 위치로 재배열된다. 공여체 플레이트는 순차적으로 수령체 플레이트에 콘쥬게이션되어 원하는 구성물이 조립된다. 입력 올리고뉴클레오타이드는 그 올리고뉴클레오타이드를 함유하는 공여체 세포를 공여체 플레이트 상의 다수의 위치에 재배열함으로써 다수의 어셈블리에 사용될 수 있다.
도 49는 분지형 DNA 어셈블리의 개략적인 개요이다. 상동성 영역이 존재한다면 부분적인 DNA 어셈블리가 다수의 DNA 블록으로 연장될 수 있다. 상동성 영역이 존재하지 않는다면, "DNA 링커"가 먼저 부분 DNA 어셈블리에 첨가되어야 한다. DNA 링커는 부분 DNA 어셈블리의 단부 및 연결될 후속 DNA 블록의 시작 부분에 대한 상동성을 함유하고 있다.
I. 정의 및 관련된 구현예
달리 정의되지 않는 한, 본원에서 사용된 모든 기술적이고 과학적인 용어는 본 발명이 속하는 기술분야에 숙련된 사람에 의해 일반적으로 이해되는 의미를 가진다. 다음의 참고문헌은 본 발명에서 사용된 용어 중 많은 용어의 일반적인 정의를 숙련된 사람에게 제공한다: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology(Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); 및 Hale & Marham, The Harper Collins Dictionary of Biology (1991). 본원에서 사용되는 바, 다음의 용어는 달리 명시되지 않는 한 해당 용어에 부여된 의미를 가진다.
본 개시 및 이어지는 청구범위에서 단수 부정관사 또는 정관사(예컨대, "a", "an", "the" 등)로 수식된 용어의 사용은 특정 경우에 맥락으로부터 용어가 그 특정 경우에 구체적으로 하나만을 의미하는 것으로 의도되는 것이 분명하지 않는 한 "적어도 하나"를 의미하는 특허에서의 전통적인 접근법을 따른다. 마찬가지로, 용어 "포함하는"은 추가적인 항목, 특징, 구성요소, 등을 배제하지 않는 개방 단부이다. 본원에서 확인된 참고문헌은 달리 표시되지 않는 한 그것의 전체 내용이 참조로 본원에 분명하게 포함된다.
"선택적인" 또는 "선택적으로"는 후속해서 기술되는 사건 또는 상황이 일어날 수 있거나 일어나지 않을 수 있고, 설명에 사건 또는 상황이 일어난 경우와 그렇지 않은 경우가 포함되는 것을 의미한다.
용어 "약"은 숫자 표시, 예컨대, 온도, 시간, 양, 농도, 및 범위를 포함한 다른 표시 앞에서 사용될 때 (+) 또는 (-) 10%, 5%, 1%, 또는 그 사이의 임의의 하위범위 또는 하위값만큼 달라질 수 있는 근사값을 나타낸다. 바람직하게, 용어 "약"은 값이 +/- 10%만큼 달라질 수 있음을 의미한다.
본원에서 사용되는 바, 용어 "포함하는" 또는 "포함하다"는 조성물 및 방법에 인용된 요소가 포함되며, 다른 것을 배제하지 않는 것을 의미하는 것으로 의도된다. "본질적으로 이루어지는"은 조성물 및 방법을 정의하기 위해 사용될 때, 명시된 목적에 대해 조합에 임의의 본질적으로 중요한 다른 요소를 배제하는 것을 의미한다. 그러므로, 본원에서 정의된 요소로 본질적으로 이루어지는 조성물은 청구된 발명의 기본적이고 신규한 특징(들)에 실질적으로 영향을 미치지 않는 다른 물질 또는 단계를 배제하지 않을 것이다. "이루어지는"은 다른 성분의 미량 요소 및 실질적인 방법 단계를 배제하는 것을 의미한다. 이들 이행 용어의 각각에 의해 정의된 구현예들은 본 개시의 범주 내에 있다.
본원에서 사용될 수 있는 것과 같이, 용어 "핵산", "핵산 분자", "핵산 서열", 및 "폴리뉴클레오타이드"는 상호교환적으로 사용되며, 한정하는 것은 아니지만, 다양한 길이를 가질 수 있으며 함께 공유 결합된 뉴클레오타이드, 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드의 중합체 형태, 유사체, 유도체 또는 그것들의 변형을 포함하는 것으로 의도된다. 상이한 폴리뉴클레오타이드는 상이한 3차원 구조를 가질 수 있고, 알려졌거나 또는 미지의 다양한 기능을 수행할 수 있다. 폴리뉴클레오타이드의 비제한적인 예로는 유전자, 유전자 단편, 엑손, 인트론, 유전자간 DNA(제한 없이, 이종염색질 DNA 포함), 메신저 RNA(mRNA), 전달 RNA, 리보솜 RNA, 리보자임, cDNA, sgRNA, 가이드 RNA, tracrRNA, 재조합 폴리뉴클레오타이드, 분지된 폴리뉴클레오타이드, 플라스미드, 벡터, 서열의 단리된 DNA, 서열의 단리된 RNA, PCR 생성물, 핵산 프로브, 및 프라이머를 들 수 있다. 개시의 방법에 유용한 폴리뉴클레오타이드는 천연 핵산 서열 및 그것의 변이체, 인공 핵산 서열, 또는 그러한 서열들의 조합을 포함할 수 있다.
"핵산"은 단일, 이중 또는 다중 가닥 형태의 뉴클레오타이드(예컨대, 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드) 및 중합체, 또는 그것의 보체; 또는 뉴클레오사이드(예컨대, 데옥시리보뉴클레오사이드 또는 리보뉴클레오사이드)를 지칭한다. 구현예에서, "핵산"에는 뉴클레오사이드가 포함되지 않는다. 용어 "폴리뉴클레오타이드", "올리고뉴클레오타이드", "올리고" 등은, 일반적이고 관례적인 의미로, 뉴클레오타이드의 선형 서열을 지칭한다. 용어 "뉴클레오사이드"는, 일반적이고 관례적인 의미로, 핵염기 및 5-탄소 당(리보스 또는 데옥시리보스)을 포함한 글리코실아민을 지칭한다. 뉴클레오사이드의 비제한적인 예로는 시티딘, 우리딘, 아데노신, 구아노신, 티미딘 및 이노신을 들 수 있다. 용어 "뉴클레오타이드"는, 일반적이고 관례적인 의미로, 폴리뉴클레오타이드의 단일 단위, 즉, 단량체를 지칭한다. 뉴클레오타이드는 리보뉴클레오타이드, 데옥시리보뉴클레오타이드, 또는 그것의 변형된 버전일 수 있다. 본원에서 고려된 폴리뉴클레오타이드의 예로는 단일 및 이중 가닥 DNA, 단일 및 이중 가닥 RNA, 및 단일 및 이중 가닥 DNA 및 RNA의 혼합물을 갖는 하이브리드 분자를 들 수 있다. 본원에서 고려된 핵산, 예컨대 폴리뉴클레오타이드의 예로는 임의의 유형의 RNA, 예컨대 mRNA, siRNA, miRNA, 및 가이드 RNA 및 임의의 유형의 DNA, 게놈 DNA, 플라스미드 DNA, 및 미니서클 DNA, 및 이것들의 임의의 단편을 들 수 있다. 폴리뉴클레오타이드의 맥락에서 용어 "듀플렉스"는, 일반적이고 관례적인 의미로, 이중 꼬임을 지칭한다. 핵산은 선형이거나 분지형일 수 있다. 예를 들어, 핵산은 뉴클레오타이드의 선형 사슬일 수 있거나 핵산은 분지형일 수 있어서, 예컨대, 핵산은 하나 이상의 팔(arm) 또는 가지를 포함할 수 있다. 선택적으로, 분지된 핵산은 반복적으로 분지되어 덴드리머 등과 같은 고차 구조를 형성한다.
예컨대, 포스포티오에이트 백본을 가진 핵산을 포함한 핵산에는 하나 이상의 반응성 모이어티가 포함될 수 있다. 본원에서 사용되는 바, 용어 반응성 모이어티에는 또 다른 분자, 예컨대, 핵산 또는 폴리펩타이드와 공유, 비공유 또는 다른 상호작용을 통해 반응할 수 있는 임의의 기가 포함된다. 예를 들자면, 핵산에는 단백질 또는 폴리펩타이드 상의 아미노산과 공유, 비공유 또는 다른 상호작용을 통해 반응하는 아미노산 반응성 모이어티가 포함될 수 있다.
용어는 또한 참조 핵산과 유사한 결합 특성을 가지며, 참조 뉴클레오타이드와 유사한 방식으로 대사되는 합성, 자연적으로 발생하는, 및 자연적으로 발생하지 않는 알려진 뉴클레오타이드 유사체 또는 변형된 백본 잔기 또는 결합을 포함하는 핵산을 포함한다. 그러한 유사체의 예로는, 제한 없이, 예컨대, 포스포라미데이트, 포스포로다이아미데이트, 포스포로티오에이트(또한 포스페이트에서 산소를 대체하는 이중 결합된 황을 갖는 포스포티오에이트로도 알려져 있음), 포스포로다이티오에이트, 포스포노카르복실산, 포스포노카르복실레이트, 포스포노아세트산, 포스포노포름산, 메틸 포스포네이트, 붕소 포스포네이트, 또는 O-메틸포스포로아미다이트 결합(Eckstein, OLIGONUCLEOTIDES AND ANALOGUES: A PRACTICAL APPROACH, Oxford University Press 참고)뿐만 아니라 5-메틸 시티딘 또는 슈도우리딘에서와 같은 뉴클레오타이드 염기에 대한 변형; 및 펩타이드 핵산 백본 및 결합을 포함한 포스포다이에스테르 유도체를 들 수 있다. 다른 유사체 핵산에는 미국 특허 제 5,235,033호 및 제 5,034,506호, 및 참고문헌[Chapters 6 and 7, ASC Symposium Series 580, CARBOHYDRATE MODIFICATIONS IN ANTISENSE RESEARCH, Sanghui & Cook, eds]에 기술된 것들을 포함하여, 양성 백본; 비이온성 백본, 변형 당, 및 비리보스 백본을 가진 것들(예컨대 기술분야에 알려진 것과 같이 포스포로다이아미데이트 모르폴리노 올리고 또는 잠겨진(locked) 핵산(LNA))이 포함된다. 하나 이상의 탄소고리형 당이 포함되어 있는 핵산은 또한 핵산의 한 정의 내에 포함된다. 리보스-포스페이트 백본의 변형은 다양한 이유로, 예컨대, 생리적 환경에서 또는 바이오칩 상의 프로브로서 그러한 분자의 안정성 및 반감기를 증가시키기 위하여 이루어질 수 있다. 자연적으로 발생하는 핵산 및 유사체의 혼합물이 만들어질 수 있다; 대안적으로, 상이한 핵산 유사체의 혼합물, 및 자연적으로 발생하는 핵산 및 유사체의 혼합물이 만들어질 수 있다. 구현예에서, DNA의 뉴클레오타이드간 결합은 포스포다이에스테르, 포스포다이에스테르 유도체, 또는 이들 두 가지의 조합이다.
"바코드"는 바코드와 연관된 세포 또는 복수의 세포를 확인하기 위해 사용되는 하나 이상의 뉴클레오타이드 서열을 지칭한다. 바코드는 3-1000개 또는 그 이상의 뉴클레오타이드 길이, 바람직하게는 3-250개 뉴클레오타이드 길이, 보다 바람직하게는 4-40개 뉴클레오타이드 길이일 수 있고, 이들 범위 사이의 임의의 길이, 예컨대 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000개 뉴클레오타이드 길이를 포함한다. 바코드는 바코드가 (통계학적으로) 세포 집단에서 약 1개의 세포에 존재할 때 "고유"하다. 바코드를 함유한 세포는 그런 후에 복수의 클론 세포를 만들기 위해 팽창될 수 있어서, 복수의 세포의 각 세포는 동일한 바코드를 함유한다. 예를 들어, "각각의 바코딩된 세포가 단일한, 고유한 바코드를 포함하는 복수의 바코딩된 세포"는 (통계학적으로) 주어진 바코드 또는 바코드의 고유한 조합을 함유하고 있는 단일한 세포를 함유하는 세포 집단을 지칭할 수 있다. 대안적으로, 그것은 복수의 클론성 세포 집단을 함유하는 세포 집단을 지칭할 수 있으며, 각각의 클론 집단의 각 세포는 동일한 바코드를 함유하지만, 상이한 클론 집단의 세포는 상이한 바코드를 함유한다.
본원에서 사용되는 바, 용어 "보체"는 상보적인 뉴클레오타이드 또는 뉴클레오타이드 서열과 염기쌍을 형성할 수 있는 뉴클레오타이드(예컨대, RNA 또는 DNA) 또는 뉴클레오타이드 서열을 지칭한다. 본원에서 기술되고 기술분야에서 일반적으로 알려진 것과 같이 아데노신의 상보적인(매칭) 뉴클레오타이드는 티미딘이고 구아노신의 상보적인(매칭) 뉴클레오타이드는 시토신이다. 그러므로, 보체에는 제2 핵산 서열의 상응하는 상보적인 뉴클레오타이드와 염기쌍을 형성하는 뉴클레오타이드의 서열이 포함될 수 있다. 보체의 뉴클레오타이드는 부분적으로 또는 완전하게 제2 핵산 서열의 뉴클레오타이드와 매칭될 수 있다. 보체의 뉴클레오타이드가 제2 핵산 서열의 각각의 뉴클레오타이드와 완전하게 매칭되는 경우, 보체는 제2 핵산 서열의 각각의 뉴클레오타이드와 염기쌍을 형성한다. 보체의 뉴클레오타이드가 제2 핵산 서열의 각각의 뉴클레오타이드와 부분적으로 매칭되는 경우에는 보체의 뉴클레오타이드의 일부만이 제2 핵산 서열의 뉴클레오타이드와 염기쌍을 형성한다.
본원에서 기술되는 것과 같이 서열의 상보성은 부분적일 수 있고, 이 경우 핵산의 일부만이 염기쌍에 따라 매칭되고, 또는 완전할 수 있으며, 이 경우 모든 핵산이 염기쌍에 따라 매칭된다. 그러므로, 서로에 대해 상보적인 2개의 서열은 동일한 뉴클레오타이드의 명시된 백분율(즉, 명시된 영역에 대해 약 60% 동일성, 바람직하게는 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 동일성)을 가질 수 있다.
본원에서 사용되는 바, 용어 "유전자"는 그것의 평이한 일반적인 의미에 따라 사용되며 단백질 생성에 관여하는 DNA의 분절을 지칭한다; 그것에는 코딩 영역의 앞과 뒤의 영역(리더 및 트레일러)뿐만 아니라 개별 코딩 분절(엑손) 사이의 개재 서열(인트론)이 포함된다. 리더, 트레일러뿐만 아니라 인트론에는 유전자의 전사 및 번역 중에 필요한 조절 요소가 포함된다. 추가로, "단백질 유전자 생성물"은 특정 유전자로부터 발현된 단백질이다.
용어 "발현 벡터"는 유전자 및/또는 유전자의 발현에 필요한 조절 요소를 코딩하는 핵산 분자를 지칭한다. 플라스미드의 형태일 수 있는 벡터로부터의 유전자의 발현은 시스 또는 트랜스로 일어날 수 있다. 만약 유전자가 시스로 발현되면, 유전자 및 조절 요소는 동일한 플라스미드에 의해 코딩된다. 트랜스 발현은 유전자 및 조절 요소가 별도의 플라스미드에 의해 코딩되는 경우를 지칭한다.
본원에서 사용되는 바, 용어 "벡터"는 그것이 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터는 "플라스미드"의 형태일 수 있고, 본 맥락에서 추가적인 DNA 분절이 결찰될 수 있는 선형 또는 원형 이중 가닥 DNA 루프를 지칭한다. 또 다른 유형의 벡터는 바이러스 벡터로, 추가적인 DNA 분절이 바이러스 게놈에 결찰될 수 있다. 특정 벡터는 그것이 도입되는 숙주 세포에서 자율적인 복제를 할 수 있다(예컨대, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜성 포유류 벡터). 다른 벡터(예컨대, 비에피솜성 포유류 벡터)는 숙주 세포에 도입될 때 숙주 세포의 게놈에 통합되며, 이에 의해 숙주 게놈을 따라 복제된다. 더욱이, 특정 벡터는 그것이 작동 가능하게 연결되는 유전자의 발현을 지시할 수 있다. 그러한 벡터는 본원에서 "발현 벡터"로서 지칭된다. 일반적으로, 재조합 DNA 기법에서 유용한 발현 벡터는 자주 플라스미드의 형태이다. 본 명세서에서, "플라스미드" 및 "벡터"는 플라스미드가 가장 일반적으로 사용되는 벡터 형태이기 때문에 상호교환적으로 사용될 수 있다. 그러나, 발명은 그러한 다른 형태의 발현 벡터, 예컨대 동등한 기능을 수행하는 바이러스 벡터(예컨대, 복제 결핍 레트로바이러스, 아데노바이러스 및 아데노 관련 바이러스)를 포함하는 것으로 의도된다. 추가적으로, 일부 바이러스 벡터는 특정 세포 유형을 특이적으로 또는 비특이적으로 표적화할 수 있다. 복제 불능 바이러스 벡터 또는 복제 결핍 바이러스 벡터는 그것의 표적 세포를 감염시키고 그것의 바이러스 페이로드를 전달할 수 있지만, 그런 후에는 전형적인 용해 경로를 지속시키지 못하여 세포 용해 및 사멸로 이어질 수 있는 바이러스 벡터를 지칭한다.
본원에 기술된 방법에 따르면, 올리고뉴클레오타이드, 플라스미드 또는 벡터는 적어도 하나의 선택성 마커를 함유할 수 있다. 본원에 기술된 방법에 사용하기 위한 선택성 마커는 임의의 적합한 선택성 마커일 수 있다. 구현예에서, 제한 없이, 선택성 마커는 HygR, NsrR, ZeoR, TetA, CmR, SpR, GmR, mFabI, TmR, neoR, 또는 kanR이다. 구현예에서, 선택성 마커는 HygR이다. 구현예에서, 선택성 마커는 NsrR이다. 구현예에서, 선택성 마커는 ZeoR이다. 구현예에서, 선택성 마커는 TetA이다. 구현예에서, 선택성 마커는 CmR이다. 구현예에서, 선택성 마커는 SpR이다. 구현예에서, 선택성 마커는 GmR이다. 구현예에서, 선택성 마커는 mFabI이다. 구현예에서, 선택성 마커는 TmR이다. 구현예에서, 선택성 마커는 neoR이다. 구현예에서, 선택성 마커는 kanR이다.
본원에 기술된 방법에 따르면, 올리고뉴클레오타이드, 플라스미드 또는 벡터는 적어도 하나의 역선택성 마커, 예컨대, 본원에 기술된 DNA 요소를 조립하는 방법에서 제2 또는 후속 올리고뉴클레오타이드의 재조합된 수령체 올리고뉴클레오타이드로의 통합을 선택하는 마커를 함유할 수 있다. 본원에 기술된 방법에 사용하기 위한 역선택성 마커는 임의의 적합한 역선택성 마커일 수 있다. 구현예에서, 제한 없이, 역선택성 마커는 PheS, SacB rpsL, tolC, galK, ccdB, tetA, thyA, lacY, gata-1, URA3, relE, mqsR, chpB, vhaV, 또는 tse2이다. 구현예에서, 역선택성 마커는 PheS이다. 구현예에서, 역선택성 마커는 SacB이다. 구현예에서, 역선택성 마커는 rpsL이다. 구현예에서, 역선택성 마커는 tolC이다. 구현예에서, 역선택성 마커는 galK이다. 구현예에서, 역선택성 마커는 ccdB이다. 구현예에서, 역선택성 마커는 ccdB이다. 구현예에서, 역선택성 마커는 tetA이다. 구현예에서, 역선택성 마커는 thyA이다. 구현예에서, 역선택성 마커는 lacY이다. 구현예에서, 역선택성 마커는 gata-1이다. 구현예에서, 역선택성 마커는 URA3이다. 구현예에서, 역선택성 마커는 relE이다. 구현예에서, 역선택성 마커는 mqsR이다. 구현예에서, 역선택성 마커는 chpB이다. 구현예에서, 역선택성 마커는 vhaV이다. 구현예에서, 역선택성 마커는 tse2이다.
용어 "형질감염", "형질도입", "형질감염시키는" 또는 "형질도입시키는"은 상호교환적으로 사용될 수 있고 핵산 분자 및/또는 단백질을 세포에 도입시키는 과정으로서 정의된다. 핵산은 비바이러스 또는 바이러스 기반 방법을 사용하여 세포에 도입될 수 있다. 핵산 분자는 완전한 단백질 또는 그것의 기능성 부분을 코딩하는 서열일 수 있다. 전형적으로, 핵산 벡터는 단백질 발현에 필요한 요소(예컨대, 프로모터, 전사 시작 부위, 등)를 포함한다. 형질감염의 비바이러스 방법에는 핵산 분자를 세포에 도입하기 위한 전달 시스템으로서 바이러스 DNA 또는 바이러스 입자를 사용하지 않는 임의의 적절한 방법이 포함된다. 예시의 비바이러스 형질감염 방법에는 칼슘 포스페이트 형질감염, 리포솜성 형질감염, 뉴클레오펙선(nucleofection), 소노포레이션(sonoporation), 열 충격을 통한 형질감염, 마그네티펙션(magnetifection) 및 전기천공이 포함된다. 바이러스 기반 방법의 경우, 임의의 유용한 바이러스 벡터가 본원에 기술된 방법에 사용될 수 있다. 바이러스 벡터의 예로는, 한정하는 것은 아니지만, 레트로바이러스, 아데노바이러스, 렌티바이러스 및 아데노 관련 바이러스 벡터를 들 수 있다. 일부 측면으로, 핵산 분자는 기술분야에 잘 알려져 있는 표준 과정을 따라 레트로바이러스 벡터를 사용하여 세포에 도입된다. 용어 "형질감염" 또는 "형질도입"은 또한 단백질을 외부 환경으로부터 세포에 도입시키는 것을 지칭한다. 전형적으로, 단백질의 형질도입 또는 형질감염은 관심의 단백질에 세포막을 가로지를 수 있는 펩타이드 또는 단백질의 부착에 의존한다. 예컨대, 참고문헌[Ford et al. (2001) Gene Therapy 8:1-4 및 Prochiantz (2007) Nat. Methods 4:119-20]을 참고한다.
본원에서 사용된 용어 "프로모터"는 특정 유전자의 전사를 개시하는 DNA 영역을 지칭한다. 프로모터는 전형적으로 DNA에서 유전자의 전사 시작 부위 가까이에, 유전자의 상류에 및 동일 가닥 상에(즉, 센스 가닥 상의 5'에) 위치한다. 프로모터는, 예컨대, 약 100 내지 약 1000개 염기쌍 길이일 수 있다.
뉴클레오타이드 염기 "위치"는 5' 단부에 대한 위치를 토대로 참조 서열에서 각각의 아미노산(또는 뉴클레오타이드 염기)을 순차적으로 확인하는 숫자로 표시된다. 최적 정렬을 결정할 때 고려해야 하는 결실, 삽입, 절단, 융합, 등으로 인해, 일반적으로 단순히 5' 단부로부터 계수함으로써 결정된 테스트 서열의 아미노산 잔기 번호는 반드시 참조 서열의 상응하는 위치의 숫자와 동일하지는 않을 것이다. 예를 들어, 변이체가 정렬된 참조 서열에 비해 결실을 가지는 경우에, 결실 부위에서 참조 서열의 위치에 상응하는 변이체의 뉴클레오타이드 염기는 없을 것이다. 정렬된 참조 서열에 삽입이 있는 경우, 그 삽입은 참조 서열의 넘버링된 뉴클레오타이드 위치에 상응하지 않을 것이다. 절단 또는 융합의 경우에 참조 서열이나 정렬된 서열에 상응하는 서열의 임의의 뉴클레오타이드에 상응하지 않는 뉴클레오타이드 구간이 있을 수 있다.
용어 "를 참조로 하여 넘버링된" 또는 "에 상응하는"은, 주어진 폴리뉴클레오타이드 서열의 넘버링의 맥락에서 사용될 때, 주어진 폴리뉴클레오타이드 서열이 참조 서열에 비교될 때 명시된 참조 서열의 잔기의 넘버링을 지칭한다.
본원에서 사용되는 바, 용어 "바이러스" 또는 "바이러스 입자"는 바이러스 형질도입의 맥락 내에서 그것의 평이한 일반적인 의미에 따라 사용된다. 바이러스 벡터로의 형질도입은 포유류 세포에서 유전자를 삽입 또는 변형시키기 위해 사용될 수 있다.
본원에서 사용되는 바, 용어 "유전적 변형", "유전자 변형", "유전자 편집", "유전적 편집", "게놈 편집", "게놈 조작" 등은 DNA가 세포의 게놈의 하나 이상의 특정 위치에서 삽입, 결실, 변형 또는 대체되는 유전자 조작 유형을 지칭한다. 유전자 편집에서 한 가지 핵심 단계는 유전자 또는 게놈 내의 특정 지점에서 이중 가닥 절단을 생성하는 것이다. 이런 단계를 성취하는 뉴클레아제와 같은 유전자 편집 도구의 예로는 한정하는 것은 아니지만, 아연 핑거 뉴클레아제(ZFN), 전사 활성화 인자 유사 이펙터 뉴클레아제(TALEN), 메가뉴클레아제, 및 클러스터링된 규칙적인 간격의 짧은 회문 반복 시스템(CRISPR/Cas)을 들 수 있다.
본원에서 사용되는 바, "DNA 요소"는 세포 사이에, 예컨대 공여체 세포와 수령체 세포 사이에 전달될 수 있는 임의의 DNA 서열을 지칭한다. 그러므로, DNA 요소에는, 한정하는 것은 아니지만, 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, 또는 gRNA가 포함된다. DNA 요소는 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, 또는 gRNA의 단편일 수 있다. DNA 요소는 조합 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, gRNA, 및 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, 및 gRNA의 단편일 수 있다. 구현예에서, DNA 요소는 공여체 플라스미드에 있다. 다른 구현예에서, DNA 요소는 수령체 올리고뉴클레오타이드로 이동되거나 수령체 올리고뉴클레오타이드에 있다. 다른 구현예에서, DNA 요소는 수령체 올리고뉴클레오타이드로부터 리셋 공여체 플라스미드로 이동된다.
본원에서 사용되는 바, 용어 "유전자 편집 시약"은 유전자 편집 도구에 필요한 구성요소를 지칭하며 효소, 리보단백질, 용액, 보조 인자 등이 포함될 수 있다. 예를 들어, 유전자 편집 시약에는 아연 핑거 뉴클레아제(ZFN), 전사 활성화 인자 유사 이펙터 뉴클레아제(TALEN), 메가뉴클레아제, 및 클러스터링된 규칙적인 간격의 짧은 회문 반복 시스템(CRISPR/Cas) 유전자 편집에 필요한 하나 이상의 구성요소가 포함된다.
본원에서 사용되는 바, 용어 "엔도뉴클레아제"는 폴리뉴클레오타이드 절단을 위한 핵내 분해 촉매 활성을 가진 엔도뉴클레아제 시스템의 효소 또는 구성요소(예컨대, gRNA를 포함한 CRISPR의 임의의 구성요소)를 지칭한다. 예를 들어, 엔도뉴클레아제 또는 그것의 구성요소는 올리고뉴클레오타이드 또는 폴리뉴클레오타이드의 포스포다이에스테르 결합을 절단할 수 있다. 엔도뉴클레아제는 적어도 4 bp 길이에 걸쳐 있는 인식 부위 서열 내의 또는 인접한 포스포다이에스테르 결합에서 절단한다. 엔도뉴클레아제의 유형에는, 한정하는 것은 아니지만, 제한 효소, AP 엔도뉴클레아제, T7 엔도뉴클레아제, T4 엔도뉴클레아제, Bal 31 엔도뉴클레아제, 엔도뉴클레아제 I, 미세구균 뉴클레아제, 엔도뉴클레아제 II, 뉴로스포라 엔도뉴클레아제, S1 엔도뉴클레아제, P1-뉴클레아제, 녹두 뉴클레아제 I, DNAse I, RNA 가이드 DNA 엔도뉴클레아제(예컨대 임의의 CRISPR 구성요소, 예컨대 Cas 단백질, gRNA, 등을 포함한 CRISPR), 동주성(Homothallic) 전환 엔도뉴클레아제, TALEN, 아연 핑거 뉴클레아제, 및 Endo R이 포함된다.
"절단"은 DNA 분자의 공유 백본의 절단을 의미한다. 절단은, 한정하는 것은 아니지만, 포스포다이에스테르 결합의 효소적 또는 화학적 가수분해를 포함한 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단 및 이중 가닥 절단이 모두 가능하며, 이중 가닥 절단은 2개의 뚜렷한 단일 가닥 절단 사건의 결과로서 일어날 수 있다. DNA 절단은 평활 단부 또는 점착성 단부의 생성을 초래할 수 있다. 일부 구현예에서, 가이드 RNA 및 부위 특정 변형 효소를 포함하는 복합체가 표적화된 이중 가닥 DNA 절단에 사용된다.
본원에서 사용되는 바, 용어 "CRISPR" 또는 "클러스터링된 규칙적인 간격의 짧은 회문 반복부"는 그것의 평이한 일반적인 의미에 따라 사용되며 박테리아가 바이러스에 대해 보호하기 위한 획득된 면역의 유형으로서 사용하는 유전 요소를 지칭한다. CRISPR에는 바이러스 게놈으로부터 기원하고 박테리아 게놈으로 통합된 짧은 서열이 포함된다. Cas(CRISPR 관련 단백질)는 이들 서열을 처리하고 매칭 바이러스 DNA 서열을 절단한다. 그러므로, CRISPR 서열은 Cas가 CRISPR 서열에 적어도 부분적으로 상보적인 DNA를 인식하고 절단하게 하는 가이드로서 기능한다. Cas 유전자 및 특이적으로 구성된 CRISPR을 포함하는 플라스미드를 진핵 세포에 도입시킴으로써, 진핵 게놈은 임의의 원하는 위치에서 절단될 수 있다.
본원에서 사용되는 바, 용어 "Cas9" 또는 "CRISPR 관련 단백질 9"는 그것의 평이한 일반적인 의미에 따라 사용되며 CRISPR 서열을 CRISPR 서열에 적어도 부분적으로 상보적인 DNA의 특정 가닥을 인식하고 절단하게 하는 가이드로서 사용하는 효소를 지칭한다. Cas9 효소는 CRISPR 서열과 함께 유기체 내에서 유전자를 편집하기 위해 사용될 수 있는 CRISPR-Cas9로서 알려진 기술의 기초를 형성한다. 이 편집 과정은 기본적인 생물학적 연구, 생명공학 제품의 개발, 및 질환의 치료를 포함한 광범위한 적용분야를 가진다.
본원에서 언급된 "CRISPR 관련 단백질 9", "Cas9", "Csn1" 또는 "Cas9 단백질"에는 Cas9 엔도뉴클레아제 효소 활성을 유지하는(예컨대 Cas9와 비교하여 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 내에서) Cas9 엔도뉴클레아제 또는 그것의 변이체 또는 상동체의 재조합 또는 자연적으로 발생하는 형태 중 임의의 것이 포함된다. 측면에서, 변이체 또는 상동체는 자연적으로 발생하는 Cas9 단백질과 비교하여 전체 서열 또는 서열의 일부분(예컨대 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 가진다. 측면에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2 또는 그것과 실질적인 동일성을 가진 변이체 또는 상동체에 의해 확인된 단백질에 실질적으로 동일하다. 측면에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2에 의해 확인된 단백질의 아미노산 서열에 대해 적어도 75% 서열 동일성을 가진다. 측면에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2에 의해 확인된 단백질의 아미노산 서열에 대해 적어도 80% 서열 동일성을 가진다. 측면에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2에 의해 확인된 단백질의 아미노산 서열에 대해 적어도 85% 서열 동일성을 가진다. 측면에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2에 의해 확인된 단백질의 아미노산 서열에 대해 적어도 90% 서열 동일성을 가진다. 측면에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2에 의해 확인된 단백질의 아미노산 서열에 대해 적어도 95% 서열 동일성을 가진다.
본원에서 언급된 "CRISPR 관련 엔도뉴클레아제 Cas12a", "Cas12a", "Cas12" 또는 "Cas12 단백질"에는 Cas12 엔도뉴클레아제 효소 활성을 유지하는(예컨대 Cas12와 비교하여 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 내에서) Cas12 엔도뉴클레아제 또는 그것의 변이체 또는 상동체의 재조합 또는 자연적으로 발생하는 형태 중 임의의 것이 포함된다. 측면에서, 변이체 또는 상동체는 자연적으로 발생하는 Cas12 단백질과 비교하여 전체 서열 또는 서열의 일부분(예컨대 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 가진다. 측면에서, Cas12 단백질은 UniProt 참조 번호 A0Q7Q2 또는 그것과 실질적인 동일성을 가진 변이체 또는 상동체에 의해 확인된 단백질에 실질적으로 동일하다.
본원에서 언급된 "CRISPR 관련 엔도리보뉴클레아제 Cas13a", "Cas13a", "Cas13" 또는 "Cas13 단백질"에는 Cas13 엔도리보뉴클레아제 효소 활성을 유지하는(예컨대 Cas13과 비교하여 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 내에서) Cas13 엔도리보뉴클레아제 또는 그것의 변이체 또는 상동체의 재조합 또는 자연적으로 발생하는 형태 중 임의의 것이 포함된다. 측면에서, 변이체 또는 상동체는 자연적으로 발생하는 Cas13 단백질과 비교하여 전체 서열 또는 서열의 일부분(예컨대 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 가진다. 측면에서, Cas13 단백질은 UniProt 참조 번호 P0DPB8 또는 그것과 실질적인 동일성을 가진 변이체 또는 상동체에 의해 확인된 단백질에 실질적으로 동일하다.
본원에서 사용되는 바, "TALEN" 또는 "전사 활성화 인자 유사 이펙터 뉴클레아제"는 DNA 결합 도메인(예컨대 TAL 이펙터 DNA 결합 도메인)의 뉴클레아제(예컨대 FokI)에의 부착에 의해 생성된 제한 효소를 지칭한다. TALEN에는 전형적으로 TAL 또는 TALE로 명명되는, 다수의 분자가 포함되는 자연적으로 발생하는 DNA-결합 도메인이 포함된다. 그러므로, 가변적인 두 잔기를 포함하는 TAL은 DNA 결합 특이성을 부여한다.
본원에서 제공되는 "가이드 RNA" 또는 "gRNA"는 표적 서열과 혼성화하고 표적 서열에 대한 CRISPR 복합체의 서열 특정 결합을 지시하기 위하여 표적 폴리뉴클레오타이드 서열과의 충분한 상보성을 갖는 RNA 서열을 지칭한다. 예를 들어, gRNA는 Cas를 표적 폴리뉴클레오타이드로 향하게 할 수 있다. 구현예에서, gRNA에는 crRNA 및 tracrRNA가 포함된다. 예를 들어, gRNA에는 염기쌍 형성에 의해 혼성화된 crRNA 및 tracrRNA가 포함된다. 그러므로, 구현예에서, 2개의 RNA가 2개의 RNA 분자로서 crRNA 및 tracrRNA에 의해 별도로 코딩될 수 있고 나중에 crRNA와 tracrRNA 사이에서 상보적인 염기쌍 형성으로 인해 RNA/RNA 복합체를 형성할 수 있다. 측면에서, 가이드 RNA 서열과 상응하는 표적 서열 사이의 상보성 정도는, 적합한 정렬 알고리즘을 사용하여 최적으로 정렬될 때, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 그 이상이다. 측면에서, 가이드 RNA 서열과 상응하는 표적 서열 사이의 상보성 정도는, 적합한 정렬 알고리즘을 사용하여 최적으로 정렬될 때, 적어도 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%이다.
CRISPR 효소의 비제한적인 예로는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas10, Cas12, Cas13, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이것들의 상동체, 또는 이것들의 변형된 버전을 들 수 있다. 구현예에서, CRISPR 효소는 Cas9 효소이다. 구현예에서, Cas9 효소는 스트렙토코커스 뉴모니에(S. pneumoniae), 스트렙토코커스 피오게네스(S. pyogenes) 또는 스트렙토코커스 써모필루스(S. thermophilus) Cas9, 또는 이들 유기체에서 유래된 돌연변이체이다. 구현예에서, CRISPR 효소는 진핵 세포에서 발현을 위해 코돈 최적화된다. 구현예에서, CRISPR 효소는 표적 서열의 위치에서 하나 또는 2개 가닥의 절단을 지시한다. 구현예에서, CRISPR 효소는 DNA 가닥 절단 활성이 결핍되어 있다.
본원에서 사용되는 바, "아연 핑거"는 결합된 아연 양이온 주위에서 접힌 폴리펩타이드 구조 모티프이다. 구현예에서, 아연 핑거의 폴리펩타이드는 식 X3-Cys-X2-4-Cys-X12-His-X3-5-His-X4의 서열을 가지며, 식에서 X는 임의의 아미노산이다(예컨대, X2-4는 2-4개 아미노산 길이의 올리고펩타이드를 나타냄). 그러므로, 본원에서 사용된 "아연 핑거 뉴클레아제"는 아연 핑거 모티프 및 표적 DNA에서 절단을 유도할 수 있는 도메인을 포함한 뉴클레아제를 지칭한다.
용어 "상동 재조합"은 본원에서 "상동(성) 영역"으로서 언급될 수 있는 2개의 유사하거나 동일한 핵산 서열 사이에서 정보가 교환되는 유전자 재조합 유형을 지칭한다. 본원에 기술된 방법의 일부 구현예에서, 상동성 영역은, 예를 들어, 비상동 영역의 측면에 있을 수 있는 2개의 상동성 영역을 포함할 수 있다. 본원에 기술된 방법의 구현예에서, 대장균 RecA 유전자가 상동 재조합을 부스팅하기 위해 사용될 수 있다. "RecA"는 박테리아에서 ATP 의존적 상동 재조합을 매개하는 편재성 38 kD 상동 DNA 복구 단백질 패밀리의 박테리아 상동체를 지칭한다. 구현예에서, 본원에 기술된 방법의 공여체 세포 또는 수령체 세포에는 하나 이상의 상동 DNA 복구 유전자, 예컨대 RecA를 코딩하는 올리고뉴클레오타이드가 포함된다. 구현예에서, 상동 DNA 복구 유전자 발현은 유도성이다. 구현예에서, 상동 DNA 복구 유전자는 RecA이다. 구현예에서, 상동 DNA 복구 유전자는 리컴비니어링 유전자 레드α, 레드β, 및 레드γ이다. 다양한 뉴클레아제 시스템을 사용하는 상동 재조합 및 유전자 편집 방법의 비제한적인 예는, 예를 들어, 미국 특허 제 8945839호, 국제 PCT 출원 공개 제 WO2013/163394호 및 미국 특허 출원 2016/0060657호, 2012/0192298A1호 및 US2007/0042462호에서 찾아볼 수 있다. 상동 재조합에 대한 이들 및 다른 알려진 방법은 본원에 기술된 방법과 함께 사용될 수 있다.
본원에서 사용되는 바, 용어 "형질감염"은 그것의 평이한 일반적인 의미에 따라 사용되며 네이키드 또는 정제된 핵산을 진핵 세포에 의도적으로 도입시키는 과정을 지칭한다. 경우에 따라, "형질감염"은 다른 방법 및 세포 유형을 지칭할 수 있지만, 다른 용어가 바람직한 경우가 많다. 예를 들어, 용어 "형질전환"은 전형적으로 박테리아 및 식물 세포를 포함한, 동물이 아닌 진핵 세포에서 비바이러스 DNA 전달을 기술하기 위해 사용된다. 동물 세포에서는, 형질감염이 바람직한 용어이다. 예를 들어, 용어 "형질도입"은 자주 진핵 세포로의 바이러스 매개 유전자 전달을 기술하기 위해 사용된다.
용어 "박테리아 콘쥬게이션" 및 "박테리아 짝짓기(mating)"는 상호교환 가능하며 박테리아 간의 유전적 교환 방식을 지칭한다. 전형적으로, 박테리아 콘쥬게이션은 세포 중 하나(공여체)의 게놈의 단지 일부 및 그것의 파트너(수령체 세포)의 완전한 게놈을 포함한다. 그러므로, 박테리아 콘쥬게이션에서 유전자 전달은 전형적으로 부분적이다. 구현예에서, 박테리아 콘쥬게이션은 공여체 세포로부터 비게놈 박테리아 DNA의 수령체 세포로의 전달이다. 경우에 따라, 박테리아 콘쥬게이션은 플라스미드를 통해 일어난다. 경우에 따라, 박테리아 콘쥬게이션은 박테리아에서 외인성 DNA를 통해 일어난다. 구현예에서, 공여체 세포 및 수령체 세포는 박테리아 콘쥬게이션이 일어나도록 접촉된다. 구현예에서, 공여체 세포 및 수령체 세포에는 박테리아 콘쥬게이션이 일어나기 위해 연결 가교(예컨대 선모)가 포함된다.
구현예에서, 수령체 세포 또는 공여체 세포에는 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드가 포함된다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 공여체 세포 게놈에 있다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 헬퍼 플라스미드에 있다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 Tra 오페론에 있다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는: IncF1 Tra(traA, traB, traC, traD, traE, traF, traG, traH, traI, traJ, traK, traL, traM, traN, traO, traP, traQ, traR, traS, traT), IncP Tra 오페론: (trbA, trbB, trbC, trbD, trbE, trbF, trbG, trbH, trbI, trbJ, trbK, trbL, traA, traB, traC, traD, traE, traF, traG, traH, traI, traJ, traK, traL, traM, traN, traO), IncI1 tra 오페론: (traE, traF, traG, traH, traI, traJ, traK, traL, traM, traN, traO, traP, traQ, traS, traT, traU, traV, traW, traY), pTiC58 tra 유전자: (traA, traF, traB, traC, traG, traD, traR, traI), 및 pIJ101: clt, korB로부터 선택된다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 IncF1 Tra(traA, traB, traC, traD, traE, traF, traG, traH, traI, traJ, traK, traL, traM, traN, traO, traP, traQ, traR, traS, traT)이다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 IncP Tra 오페론: (trbA, trbB, trbC, trbD, trbE, trbF, trbG, trbH, trbI, trbJ, trbK, trbL, traA, traB, traC, traD, traE, traF, traG, traH, traI, traJ, traK, traL, traM, traN, traO)이다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 IncI1 tra 오페론: (traE, traF, traG, traH, traI, traJ, traK, traL, traM, traN, traO, traP, traQ, traS, traT, traU, traV, traW, traY)이다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 pTiC58 tra 유전자: (traA, traF, traB, traC, traG, traD, traR, traI)이다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 pIJ101: clt, korB이다.
본원에서 사용되는 바, "공여체 세포"는 유전 물질을 또 다른 세포(예컨대 박테리아 세포, 식물 세포, 등)에 전달하는 세포(예컨대 박테리아 세포)를 지칭한다. 전달된 유전 물질을 받은 세포는 본원에서 "수령체 세포"로서 언급된다.
본원에서 사용된 바, 용어 "공여체 플라스미드"는 공여체 세포로부터 수령체 세포(예컨대 박테리아 세포, 효모 세포, 식물 세포, 등)로 전달될 올리고뉴클레오타이드 서열(예컨대 공여체 DNA, DNA 요소를 포함한 올리고뉴클레오타이드)을 포함한 공여체 세포(예컨대 박테리아 세포)로부터의 DNA를 지칭한다. 전형적으로, 공여체 플라스미드는 게놈 DNA와 별개의 원형 이중 가닥 DNA이다. 그러므로, 용어 "수령체 플라스미드"는 공여체 DNA를 받는 수령체 세포로부터의 DNA를 지칭한다. 구현예에서, 공여체 플라스미드로부터의 DNA는 수령체 플라스미드로부터의 DNA 이외의 DNA에 의해 수령된다. 그러므로, 구현예에서, 공여체 DNA는 게놈 DNA에 통합될 수 있다.
구현예에서, 공여체 플라스미드에는 전달 기점이 포함된다. 구현예에서, 전달 기점은 이동성 요소로부터 유래된다. 구현예에서, 이동성 요소는 플라스미드이다. 구현예에서, 플라스미드는 IncFI 플라스미드, IncPα 플라스미드, IncI1 플라스미드, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)로부터의 pTiC58, pAD1 플라스미드, Inc18 플라스미드, 또는 IncH 플라스미드이다. 구현예에서, 플라스미드는 IncFI 플라스미드이다. 구현예에서, 플라스미드는 IncPα 플라스미드이다. 구현예에서, 플라스미드는 IncI1 플라스미드이다. 구현예에서, 플라스미드는 아그로박테리움 투메파시엔스로부터의 pTiC58이다. 구현예에서, 플라스미드는 pAD1 플라스미드이다. 구현예에서, 플라스미드는 Inc18 플라스미드이다. 구현예에서, 플라스미드는 IncH 플라스미드이다. 플라스미드는 참고문헌[Ippen-Ihler, K.A., and Minkley, E.G., Jr., (1986). The conjugation system of F, the fertility factor of Escherichia coli. Ann. Rev. Genet. 20:593-624.; Guiney, D. G., and Lanka, E., (1989), Conjugative transfer of IncP plasmids, in: Promiscuous Plasmids of Gram-negative Bacteria (C.M. Thomas, ed.), Academic Press, London, pp. 27-56.; Catherine E.D. Rees, David E. Bradley, Brian M. Wilkins, (1987) Organization and regulation of the conjugation genes of IncI1 plasmid ColIb-P9. Plasmid. 18: 223-236.; von Bodman SB, McCutchan JE, Farrand SK. (1989) Characterization of conjugal transfer functions of Agrobacterium tumefaciens Ti plasmid pTiC58. J. Bacteriol. 171(10):5281-5289.; Clewell DB, Weaver KE. (1989) Sex pheromones and plasmid transfer in Enterococcus faecalis. Plasmid. 21(3):175-84.; Kohler V, Vaishampayan A, Grohmann E. (2018) Broad-host-range Inc18 plasmids: Occurrence, spread and transfer mechanisms. Plasmid. 99:11-21.; Andreas Schluter, Patrice Nordmann, Remy A. Bonnin, Yves Millemann, Felix G. Eikmeyer, Daniel Wibberg, Alfred Puhler, Laurent Poirel. (2014) IncH-Type Plasmid Harboring bla CTX-M-15, bla DHA-1, and qnrB4 Genes Recovered from Animal Isolates. Antimicrobial Agents and Chemotherapy 58(7):3768-3773]에서 보다 상세하게 논의된다. 이들 참고문헌의 전체 내용은 모든 목적에 대해 전체 내용이 참조로 본원에 포함된다.
구현예에서, 전달 기점은 이동성 요소로부터 유래된다. 구현예에서, 이동성 요소는 접합성 트랜스포존으로부터 유래된다. 구현예에서, 접합성 트랜스포존은 엔테로코쿠스 페칼리스(Enterococcus faecalis)로부터의 Tn916 또는 박테로이데스(Bacteroides)로부터의 CTnDOT이다. 구현예에서, 접합성 트랜스포존은 엔테로코쿠스 페칼리스로부터의 Tn916이다. 구현예에서, 접합성 트랜스포존은 박테로이데스로부터의 CTnDOT이다. 구현예에서, 이동성 요소는 통합 접합성 요소로부터 유래된다. 구현예에서, 이동성 요소는 콜레라균(Vibrio cholerae)으로부터의 SXT 또는 프로비덴시아 레트게리(Providencia rettgeri)로부터의 R391이다. 구현예에서, 이동성 요소는 콜레라균으로부터의 SXT이다. 구현예에서, 이동성 요소는 프로비덴시아 레트게리로부터의 R391이다. 요소는 참고문헌[Rice L. B. (1998). Tn916 family conjugative transposons and dissemination of antimicrobial resistance determinants. Antimicrobial agents and chemotherapy, 42(8), 1871-1877.; Cheng Q, Paszkiet BJ, Shoemaker NB, Gardner JF, Salyers AA. (2000) Integration and excision of a Bacteroides conjugative transposon, CTnDOT. J Bacteriol. 182(14):4035-43.; Bianca Hochhut and Matthew K. Waldor. (1999) Site-specific integration of the conjugal Vibrio cholerae SXT element into prfC. Mol. Microbiology. 32(1):99-110.; Boltner D, MacMahon C, Pembroke JT, Strike P, Osborn AM. R391: a conjugative integrating mosaic comprised of phage, plasmid, and transposon elements. J Bacteriol. 2002;184(18):5158-5169]에서 보다 상세하게 기술되고, 이들 참고문헌의 각각은 전체 내용이 참조로 본원에 포함된다.
구현예에서, 공여체 플라스미드에는 조건부 복제 기점이 포함된다. 구현예에서, 조건부 레플리콘은 R6K-pir, RSF1010 oriV - RepA/B/C, ColE2 P9 - RepA, RP4 oriV-trfA, pPS10 oriV-RepA, pSC101 ori - RepCTS., RK2 oriV, 박테리오파지 P1 ori, 플라스미드 pSC101 복제 기점, 박테리오파지 람다 ori, pBR322 플라스미드, pSU739 플라스미드, 또는 pSU300 플라스미드이다. 구현예에서, 조건부 레플리콘은 R6K-pir이다. 구현예에서, 조건부 레플리콘은 RSF1010 oriV - RepA/B/C이다. 구현예에서, 조건부 레플리콘은 ColE2 P9 - RepA이다. 구현예에서, 조건부 레플리콘은 RP4 oriV-trfA이다. 구현예에서, 조건부 레플리콘은 pPS10 oriV-RepA이다. 구현예에서, 조건부 레플리콘은 pSC101 ori - RepCTS이다. 구현예에서, 조건부 레플리콘은 RK2 oriV이다. 구현예에서, 조건부 레플리콘은 박테리오파지 P1 ori이다. 구현예에서, 조건부 레플리콘은 플라스미드 pSC101 복제 기점이다. 구현예에서, 조건부 레플리콘은 박테리오파지 람다 ori이다. 구현예에서, 조건부 레플리콘은 pBR322 플라스미드이다. 구현예에서, 조건부 레플리콘은 pSU739 플라스미드이다. 구현예에서, 조건부 레플리콘은 pSU300 플라스미드이다. 플라스미드는 참고문헌[Metcalf WW, Jiang W, Daniels LL, Kim SK, Haldimann A, Wanner BL. (1996) Conditionally replicative and conjugative plasmids carrying lacZ alpha for cloning, mutagenesis, and allele replacement in bacteria. Plasmid. 35(1):1-13.; Scherzinger E, Bagdasarian MM, Scholz P, Lurz R, Ruckert B, Bagdasarian M. (1984) Replication of the broad host range plasmid RSF1010: requirement for three plasmid-encoded proteins. Proc Natl Acad Sci U S A.81(3):654-8.; ColE2-P9: Yagura M, Nishio SY, Kurozumi H, Wang CF, Itoh T. (2006) Anatomy of the replication origin of plasmid ColE2-P9. J Bacteriol. 188(3):999-1010.; Ayres EK, Thomson VJ, Merino G, Balderes D, Figurski DH. Precise deletions in large bacterial genomes by vector-mediated excision (VEX). (1993) The trfA gene of promiscuous plasmid RK2 is essential for replication in several gram-negative hosts. J Mol Biol. 5;230(1):174-85.; Maestro B, Sanz JM, Diaz-Orejas R, Fernandez-Tresguerres E. (2003) Modulation of pPS10 host range by plasmid-encoded RepA initiator protein. J Bacteriol.185(4):1367-75.; Hashimoto-Gotoh, T., & Sekiguchi, M. (1977). Mutations of temperature sensitivity in R plasmid pSC101. Journal of bacteriology, 131(2), 405-412.; Ayres EK, Thomson VJ, Merino G, Balderes D, Figurski DH. Precise deletions in large bacterial genomes by vector-mediated excision (VEX). (1993) The trfA gene of promiscuous plasmid RK2 is essential for replication in several gram-negative hosts. J Mol Biol. 5;230(1):174-85. Stenzel TT, Patel P, Bastia D. (1987) The integration host factor of Escherichia coli binds to bent DNA at the origin of replication of the plasmid pSC101. Cell. 5;49(5):709-17.; Sugiura S, Ohkubo S, Yamaguchi K. (1993) Minimal essential origin of plasmid pSC101 replication: requirement of a region downstream of iterons. J Bacteriol.175(18):5993-6001.; Pal SK, Mason RJ, Chattoraj DK. (1986) P1 plasmid replication. Role of initiator titration in copy number control. J Mol Biol. 20;192(2):275-85.; LeBowitz JH, McMacken R. (1984) The bacteriophage lambda O and P protein initiators promote the replication of single-stranded DNA. Nucleic Acids Res. 12(7):3069-3088.; Grindley ND, Kelley WS. (1976) Effects of different alleles of the E. coli K12 pol A gene on the replication of non-transferring plasmids. Mol Gen Genet. 2;143(3):311-8.; Francia, M. V., & Garcia Lobo, J. M. (1996). Gene integration in the Escherichia coli chromosome mediated by Tn21 integrase (Int21). Journal of bacteriology, 178(3), 894-898.; Mendiola MV, de la Cruz F. (1989) Specificity of insertion of IS91, an insertion sequence present in alpha-haemolysin plasmids of Escherichia coli. Mol Microbiol. 3(7):979-84]에서 기술된다. 참고문헌은 전체 내용이 본원에 포함된다.
구현예에서, 조건부 복제 기점은 올리고뉴클레오타이드의 존재에 의존적이다. 구현예에서, 올리고뉴클레오타이드는 pir1, pir1-116, repA/repB/repC(RSF1010 레플리콘), repA(ColE2-P9 레플리콘), trfA(RP4 레플리콘), RepA(pSP10 레플리콘), RepCTS(pSC101 레플리콘), 또는 이들의 조합을 코딩한다. 구현예에서, 올리고뉴클레오타이드는 pir1을 코딩한다. 구현예에서, 올리고뉴클레오타이드는 pir1-116을 코딩한다. 구현예에서, 올리고뉴클레오타이드는 repA/repB/repC(RSF1010 레플리콘)를 코딩한다. 구현예에서, 올리고뉴클레오타이드는 repA(ColE2-P9 레플리콘)를 코딩한다. 구현예에서, 올리고뉴클레오타이드는 trfA(RP4 레플리콘)를 코딩한다. 구현예에서, 올리고뉴클레오타이드는 RepA(pSP10 레플리콘)를 코딩한다. 구현예에서, 올리고뉴클레오타이드는 RepCTS(pSC101 레플리콘)를 코딩한다.
구현예에서, 조건부 복제 기점은 세포 성장 조건에 따라 달라진다. 구현예에서, 조건은 온도이다.
본원에 제공된 방법의 경우, 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드에는 20 또는 30 킬로베이스의 길이의 플라스미드를 복제할 수 있는 레플리콘이 포함된다.
본원에 제공된 방법의 경우, 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드에는 30 킬로베이스보다 긴 길이의 플라스미드를 복제할 수 있는 레플리콘이 포함된다. 구현예에서, 레플리콘은 약 30 킬로베이스 내지 약 500 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 30 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 50 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 70 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 90 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 100 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 120 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 140 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 160 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 180 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 200 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 220 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 240 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 260 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 280 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 300 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 400 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 구현예에서, 레플리콘은 약 500 킬로베이스의 길이의 플라스미드를 복제할 수 있다. 길이는 종점을 포함한 표시된 범위 내의 임의의 값 또는 하위범위일 수 있다.
구현예에서, 레플리콘은 P1 유래 인공 염색체 또는 박테리아 인공 염색체로부터 유래된다. 구현예에서, 레플리콘은 P1 유래 인공 염색체로부터 유래된다. 구현예에서, 레플리콘은 박테리아 인공 염색체로부터 유래된다. 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드에는 유도성 고복사 복제 기점이 포함된다. 구현예에서, 공여체 플라스미드에는 유도성 고복사 복제 기점이 포함된다. 구현예에서, 수령체 올리고뉴클레오타이드에는 유도성 고복사 복제 기점이 포함된다.
구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 효모 인공 염색체(YAC), 포유류 인공 염색체(MAC), 인간 인공 염색체(HAC), 또는 식물 인공 염색체이다. 구현예에서, 공여체 플라스미드는 효모 인공 염색체(YAC)이다. 구현예에서, 공여체 플라스미드는 포유류 인공 염색체(MAC)이다. 구현예에서, 공여체 플라스미드는 인간 인공 염색체(HAC)이다. 구현예에서, 공여체 플라스미드는 식물 인공 염색체이다. 구현예에서, 수령체 올리고뉴클레오타이드는 효모 인공 염색체(YAC)이다. 구현예에서, 수령체 올리고뉴클레오타이드는 포유류 인공 염색체(MAC)이다. 구현예에서, 수령체 올리고뉴클레오타이드는 인간 인공 염색체(HAC)이다. 구현예에서, 수령체 올리고뉴클레오타이드는 식물 인공 염색체이다.
구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 콘쥬게이션 적격 벡터를 포함하고, 그것은 바이러스 벡터일 수 있다. 구현예에서, 공여체 플라스미드는 바이러스 벡터이다. 구현예에서, 수령체 올리고뉴클레오타이드는 바이러스 벡터이다. 구현예에서, 바이러스 벡터는 레트로바이러스이다. 구현예에서, 바이러스 벡터는 렌티바이러스이다. 구현예에서, 바이러스 벡터는 아데노바이러스이다. 구현예에서, 바이러스 벡터는 아데노 관련 바이러스이다. 구현예에서, 바이러스 벡터는 담배 모자이크 바이러스이다. 구현예에서, 바이러스 벡터는 배큘로바이러스이다. 구현예에서, 바이러스 벡터는 헤르페스 단순 바이러스이다. 구현예에서, 바이러스 벡터는 폭스바이러스이다. 구현예에서, 바이러스 벡터는 감마레트로바이러스이다. 구현예에서, 바이러스 벡터는 센다이 바이러스이다.
본원에서 사용되는 바, 용어 "대조군" 또는 "대조군 실험"은 그것의 평이한 일반적인 의미에 따라 사용되며 실험의 대상체 또는 시약이 실험의 과정, 시약, 또는 변수가 생략된 것을 제외하고 병렬 실험에서와 같이 처리되는 실험을 지칭한다. 일부 경우에, 대조군은 실험 효과의 평가에서 비교 표준으로서 사용된다.
"대조군" 샘플 또는 값은 테스트 샘플과의 비교를 위한 참조, 보통 알려져 있는 참조로서 작용하는 샘플을 지칭한다. 예를 들어, 테스트 샘플은 테스트 조건으로부터, 예컨대 테스트 화합물의 존재 하에 취해질 수 있고, 알려진 조건으로부터의 샘플과, 예컨대 테스트 화합물의 부재 하에(음성 대조군), 또는 알려진 화합물의 존재 하에(양성 대조군) 비교될 수 있다. 대조군은 또한 많은 테스트 또는 결과로부터 수집된 평균 값을 나타낸다. 기술분야의 숙련자는 대조군이 임의의 수의 매개변수의 평가를 위해 설계될 수 있음을 인지할 것이다. 예를 들어, 대조군은 약리학적 데이터(예컨대, 반감기) 또는 치료적 측정(예컨대, 부작용의 비교)을 토대로 치료적 이점을 비교하기 위해 고안될 수 있다. 기술분야의 숙련자는 주어진 상황에서 어떤 대조군이 의미있고 대조군 값에 대한 비교를 토대로 데이터를 분석할 수 있는지를 이해할 것이다. 대조군은 또한 데이터의 유의미성을 결정하는데 가치가 있다. 예를 들어 만약 주어진 매개변수에 대한 값이 대조군에서 광범위하게 변동한다면, 테스트 샘플에서의 변동은 유의미한 것으로 간주되지 않을 것이다.
본원에서 사용되는 바, 용어 "접촉"은 그것의 평이한 일반적인 의미에 따라 사용되며 적어도 2개의 구별되는 종(예컨대 생물분자 또는 세포를 포함하는 화학적 화합물)이 반응하거나, 상호작용하거나 또는 물리적으로 접촉하기 위해 충분히 가까워지도록 허용하는 과정을 지칭한다. 그러나, 결과적인 반응 생성물은 첨가된 시약 사이의 반응으로부터 또는 반응 혼합물에서 생성될 수 있는 첨가된 시약 중 하나 이상으로부터의 중간체로부터 직접 생성될 수 있다는 것이 인정되어야 한다.
용어 "발현"에는 한정하는 것은 아니지만, 전사, 전사 후 변형, 번역, 번역 후 변형, 및 분비를 포함한, 폴리펩타이드의 생성에 관여하는 임의의 단계가 포함된다. 발현은 단백질을 검출하기 위한 종래 기법(예컨대, ELISA, 웨스턴 블롯팅, 유세포 분석, 면역형광, 면역조직화학, 등)을 사용하여 검출될 수 있다.
용어 "재조합"은, 예컨대, 세포, 또는 핵산, 단백질, 또는 벡터를 참조하여 사용될 때 세포, 핵산, 단백질, 또는 벡터가 이종성 핵산 또는 단백질의 도입에 의해 또는 천연 핵산 또는 단백질의 변경에 의해 변형되었거나, 또는 세포가 그렇게 변형된 세포로부터 유래되는 것을 나타낸다. 그러므로, 예를 들어, 재조합 세포는 세포의 천연(비재조합) 형태 내에서는 발견되지 않는 유전자를 발현하거나 또는 그렇지 않으면 비정상적으로 발현되거나, 과소 발현되거나 또는 전혀 발현되지 않는 천연 유전자를 발현한다. 형질도입 세포 및 식물은 전형적으로 재조합 방법의 결과로서 이종성 유전자 또는 코딩 서열을 발현하는 것들이다.
본원에서 사용되는 바, 용어 "전달 기점" 또는 "oriT"는 박테리아 콘쥬게이션 동안 박테리아 숙주 및 수령체로부터의 DNA 전달에 필요한 짧은 서열(최대 500 bp)을 지칭한다.
본원에서 사용되는 바, "경화 가능한 복제 기점"은 세포가 특정 화학물질의 존재 또는 환경 조건 하에 성장될 때 복제하지 않는 복제 기점을 지칭한다. 이들 조건 하에서, 경화 가능한 복제 기점을 함유한 플라스미드는 세포로부터 상실된다. 예를 들어, pSC101 oriTS는 고온에서는 기능하지 않고 상실된다.
본원에서 사용되는 바, 용어 "이동성 요소"는 게놈 내에서 이동할 수 있거나, 또는 심지어 종 사이에서도 게놈간에 전달될 수 있는 유전 물질의 한 유형이다.
본원에서 사용되는 바, 용어 "접합성 트랜스포존"은 자체적으로 절개되어 동일 세포에 재통합되거나 또는 수령체 세포에의 콘쥬게이션을 통해 전달될 수 있는 공유적으로 폐쇄된 원형 중간체를 형성하는 통합된 DNA 요소를 지칭한다.
본원에서 사용되는 바, 용어 "통합 접합성 요소"는 염색체로 통합된, 자가 전달 가능한 유전 요소의 그룹을 지칭한다.
본원에서 사용되는 바, 용어 "P1 유래 인공 염색체"는 P1 박테리오파지로부터 기원하는 DNA 구성물을 지칭한다.
본원에서 사용되는 바, 용어 "박테리아 인공 염색체"는 DNA 서열을 박테리아에 클로닝하기 위해 사용된 조작된 DNA 서열을 지칭한다.
용어 "재조합 매개 유전자 조작 유전자" 또는 "리컴비니어링 유전자"는 DNA 서열에서 유전자 변형을 생성하는 것을 보조하는 유전자를 지칭한다. 경우에 따라, 재조합 매개 유전자 조작 유전자는 시험관내 유전자 조작 기법 없이 세포(예컨대 박테리아 세포)에서 구성물의 생체내 구성을 허용한다. 경우에 따라, 재조합 매개 유전자 조작 유전자는 유전자 변형이 결찰효소 및 제한 효소를 포함한 효소의 도입 없이 일어나는 것을 허용한다. 예를 들어, 유전자는 기술분야에 알려져 있는 전통적인 분자 생물학 기법 없이 박테리아의 자연적인 상동 재조합 과정에 연루될 수 있다. 구현예에서, 리컴비니어링 유전자는 람다 레드 유전자이다. 리컴비니어링 유전자는 레드α, 레드β, 및 레드γ이다. 예를 들어, 유전자는 박테리아에서 상동 재조합을 고비율로 유도할 수 있다. 공여체 세포 또는 수령체 세포에서, 하나 이상의 리컴비니어링 유전자의 발현은 유도성일 수 있다. 구현예에서, 공여체 세포 또는 수령체 세포에는 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드가 포함된다. 구현예에서, 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드는 공여체 세포 플라스미드에 있다. 구현예에서, 재조합 매개 유전자 조작 유전자는 유도성이다. 구현예에서, 재조합 매개 유전자 조작 유전자는 레드α, 레드β, 및 레드γ이다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 수령체 세포 게놈에 있다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 헬퍼 플라스미드에 있다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 수령체 올리고뉴클레오타이드에 있고, 플라스미드의 형태로 있을 수 있다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 수령체 세포 게놈에 있다.
본원에서 사용되는 바, 용어 "유도성 고복사 복제 기점"은 환경 조건, 예컨대 온도 변화에 의해 유도될 수 있는 높은 수의 복제 기점(예를 들어, 대장균 플라스미드 pUC에 150 내지 200개의 복사물)을 함유한 플라스미드 또는 벡터를 지칭한다.
본원에서 사용되는 바, 용어 "헬퍼 플라스미드"는 박테리아가 명시된 기능을 수행하기 위해 필요한 유전자 또는 다른 DNA 요소를 함유한 플라스미드이다. 헬퍼 플라스미드는 외래 DNA를 게놈에 전달하거나, 플라스미드를 또 다른 세포로 전달하거나, 또는 상동 재조합을 수행하기 위한 요소인 엔도뉴클레아제를 함유할 수 있다. 구현예에서, 헬퍼 플라스미드는 IncF1 플라스미드, IncPα 플라스미드, IncI1 플라스미드, 아그로박테리움 투메파시엔스로부터의 pTiC58, cAD1 플라스미드, Inc18 플라스미드, 스트렙토미세스(Streptomyces)로부터의 pIJ101, 또는 IncH 플라스미드이다. 구현예에서, 헬퍼 플라스미드는 IncF1 플라스미드이다. 구현예에서, 헬퍼 플라스미드는 IncPα 플라스미드이다. 구현예에서, 헬퍼 플라스미드는 IncI1 플라스미드이다. 구현예에서, 헬퍼 플라스미드는 아그로박테리움 투메파시엔스로부터의 pTiC58이다. 구현예에서, 헬퍼 플라스미드는 cAD1 플라스미드이다. 구현예에서, 헬퍼 플라스미드는 Inc18 플라스미드이다. 구현예에서, 헬퍼 플라스미드는 스트렙토미세스로부터의 pIJ101이다. 구현예에서, 헬퍼 플라스미드는 IncH 플라스미드이다. 구현예에서, 헬퍼 플라스미드는 기능적 전달 기점이 결핍되어 있다. 구현예에서, 헬퍼 플라스미드에는 공여체 세포에서 헬퍼 플라스미드의 보유를 선택하는 선택성 마커가 포함된다.
본원에서 사용되는 바, 용어 "호밍 엔도뉴클레아제"는 인트론 서열을 가진 독립 유전자로서, 숙주 단백질과의 융합으로서, 또는 자가 스플라이싱 단백질로서 코딩되는 엔도뉴클레아제를 지칭한다. 호밍 엔도뉴클레아제는 II 그룹 제한 효소와 비교할 때 더 긴 이식 부위에서 DNA의 가수분해를 촉매할 수 있다. 호밍 엔도뉴클레아제의 예로는, 한정하는 것은 아니지만, LAGLIDAG, GIY-YIG, His-Cys 박스, H-N-H, PD-(D/E)xK, 및 Vsr-like/EDxHD를 들 수 있다. 구현예에서, 호밍 엔도뉴클레아제는 I-ScaI, PI-SceI, I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I, 또는 I-Vdi141I이다. 구현예에서, 호밍 엔도뉴클레아제는 I-ScaI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-SceI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-AniI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CeuI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-ChuI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CpaI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CpaII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CreI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-DmoI이다. 구현예에서, 호밍 엔도뉴클레아제는 H-DreI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-HmuI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-HmuII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-LlaI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-MsoI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-PfuI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-PkoII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-PorI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-PpoI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-PspI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceIII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceIV이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceV이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceVI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceVII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-Ssp6803I이다. 구현예에서, 호밍 엔도뉴클레아제는 I-TevI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-TevII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-TevIII이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-TliI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-TliII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-Tsp061I, 또는 I-Vdi141I이다. 구현예에서, 호밍 엔도뉴클레아제는 I-Vdi141I이다.
본원에서 사용되는 바, 용어 "RNA 가이드 DNA 엔도뉴클레아제"는 헬퍼 또는 가이드 RNA 분자에 의해 표적 DNA 서열로 안내된 임의의 DNA 엔도뉴클레아제를 지칭한다. RNA 가이드 DNA 엔도뉴클레아제의 예로는, 한정하는 것은 아니지만, Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(또한 Csn1 및 Csx12로도 알려져 있음), Cas10, Cas12, Cas13, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, 및 Csf4, 이것들의 모든 변이체 및 상동체를 들 수 있다.
본원에서 사용되는 바, 용어 "HO" 또는 "동주성 전환 엔도뉴클레아제"는 짝짓기형 상호전환의 개시를 담당하는 사카로미세스 세레비시에(Saccharomyces cerevisiae)의 아연 핑거 뉴클레아제를 지칭한다.
본원에서 사용되는 바, "세포"는 게놈 DNA를 보존하거나 복제하기에 충분한 대사 또는 다른 기능을 수행하는 세포를 지칭한다. 세포는 예를 들어, 온전한 막의 존재, 특정 염료에 의한 염색, 자손 생산 능력 또는, 생식자(gamete)의 경우, 생존 가능한 자손을 생산하기 위해 제2 생식자와 조합하는 능력을 포함한, 기술분야에 잘 알려져 있는 방법에 의해 확인될 수 있다. 세포에는 원핵 및 진핵 세포가 포함될 수 있다. 원핵 세포에는, 한정하는 것은 아니지만 박테리아가 포함된다. 진핵 세포에는, 한정하는 것은 아니지만 효모 세포 및 식물 및 동물로부터 유래된 세포, 예를 들어 포유류, 곤충(예컨대 스포도프테라(spodoptera)) 및 인간 세포가 포함된다. 세포는 자연적으로 비부착성이거나, 예를 들어 트립신화에 의해 표면에 부착하지 않도록 처리되었을 때 유용할 수 있다.
본원에서 사용되는 바, "공여체 세포"는 유전 물질을 또 다른 세포(예컨대 박테리아 세포, 식물 세포, 등)에 전달하는 세포(예컨대 박테리아 세포)를 지칭한다. 전달된 유전 물질을 받는 세포는 본원에서 "수령체 세포"로서 언급된다.
본원에서 사용되는 용어 "공여체 플라스미드"는 공여체 세포로부터 수령체 세포(예컨대 박테리아 세포, 효모 세포, 식물 세포, 등)로 전달될 올리고뉴클레오타이드 서열(예컨대 공여체 DNA, DNA 요소 또는 그것의 단편을 포함한 올리고뉴클레오타이드)을 포함한, 공여체 세포(예컨대 박테리아 세포)로부터의 DNA를 지칭한다. 전형적으로, 공여체 플라스미드는 게놈 DNA와는 별개의 원형 이중 가닥 DNA이다. 그러므로, 용어 "수령체 올리고뉴클레오타이드"는 공여체 DNA를 받은(예컨대 공여체 DNA의 수령체로의 상동 재조합에 의해) 수령체 세포의 플라스미드 DNA를 지칭하거나; 또는 용어 "수령체 올리고뉴클레오타이드"는 공여체 DNA를 받는 수령체 세포의 임의의 올리고뉴클레오타이드, 예를 들어 수령체 세포의 게놈 DNA를 지칭할 수 있다. 구현예에서, 공여체 플라스미드로부터의 DNA는 수령체 플라스미드로부터의 DNA 이외의 DNA에 의해 수령된다. 그러므로, 구현예에서, 공여체 DNA는 게놈 DNA에 통합될 수 있다.
용어 "단리된"은 핵산 또는 단백질에 적용될 때, 핵산 또는 단백질이 본질적으로 그것과 자연적인 상태에서 결합되는 다른 세포 구성요소가 없는 것을 나타낸다. 그것은, 예를 들어, 균질한 상태일 수 있고 건조한 또는 수성 용액일 수 있다. 순도 및 균질성은 전형적으로 폴리아크릴아미드 겔 전기영동 또는 고성능 액체 크로마토그래피와 같은 분석적 화학 기법을 사용하여 결정된다. 조제물에 존재하는 주된 종인 단백질은 실질적으로 정제된다.
본원에 기술된 예 및 구현예는 단지 예시의 목적이며 이에 비추어 다양한 수정 또는 변화가 기술분야에 숙련된 사람에게 제시될 것이며 본 출원의 사상 및 범위 및 첨부된 청구범위의 범주 내에 포함될 것으로 이해된다. 본원에서 인용된 모든 출판물, 특허, 및 특허 출원은 모든 목적에 대해 전체 내용이 참조로 본원에 포함된다.
본원에 기술된 방법의 구현예에서, 공여체 세포 또는 수령체 세포에는 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드가 포함된다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 제1, 제2, 또는 후속 공여체 플라스미드에 있다. 구현예에서, 상동 DNA 복구 유전자 발현은 유도성이다. 구현예에서, 상동 DNA 복구 유전자는 RecA이다.
본원에 기술된 방법의 구현예에서, 공여체 세포 또는 수령체 세포에는 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드가 포함된다. 구현예에서, 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드는 공여체 세포 플라스미드에 있다.
본원에 기술된 방법의 구현예에서, 재조합 매개 유전자 조작 유전자는 유도성이다. 구현예에서, 재조합 매개 유전자 조작 유전자는 레드α, 레드β, 및 레드γ이다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 수령체 세포 게놈에 있다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 헬퍼 플라스미드에 있다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 수령체 올리고뉴클레오타이드에 있고, 플라스미드의 형태일 수 있다. 구현예에서, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드는 수령체 세포 게놈에 있다.
본원에 기술된 방법의 구현예에서, 공여체 세포, 수령체 세포, 또는 재조합 수령체 세포는 정렬된 어레이에, 또는 제1 또는 제2 정렬된 어레이에 있을 수 있다. 구현예에서, 공여체 세포, 수령체 세포, 또는 재조합 수령체 세포는 제3 정렬된 어레이, 제4 정렬된 어레이, 또는 후속 정렬된 어레이 상의 위치로 전달될 수 있다.
본원에 기술된 방법의 구현예에서, 공여체 세포 및 수령체 세포는 박테리아 세포이다. 구현예에서, 수령체 세포는 박테리아 세포가 아니다. 구현예에서, 수령체 세포는 식물 세포이다. 구현예에서, 수령체 세포는 효모 세포이다. 구현예에서, 수령체 세포는 포유류 세포이다.
II. DNA 요소의 조립 방법
발명은 복수의 DNA 요소를 수령체 세포 내에서 조립된 DNA 요소로 조립하는 방법을 제공하며, 방법은: (a) (i) 제1 공여체 플라스미드를 콘쥬게이션에 의해 제1 공여체 세포로부터 수령체 세포로 전달하고 (ii) 제1 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하는 조건 하에서 제1 공여체 플라스미드를 포함하는 제1 공여체 세포를 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키는 단계, 여기서 제1 공여체 플라스미드는, 순차적으로, 선택적인 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 제1 DNA 요소 단편(올리고1)을 포함하는 제1 올리고뉴클레오타이드, 2개의 상동 재조합 영역(HR2.1, HR2.2)을 포함하는 제2 상동 재조합 영역(HR2) 및 선택적인 제3 엔도뉴클레아제 부위(C3)를 포함하며; 수령체 올리고뉴클레오타이드는 HR1에 상동인 제3 상동 재조합 영역(HR3) 및 HR2.2에 상동인 제4 상동 재조합 영역(HR4)을 포함하고; 이에 의해 HR1과 HR3 및 HR2.2와 HR4의 상동 재조합 후에, 제1 DNA 요소 단편을 포함하는 제1 재조합 수령체 올리고뉴클레오타이드를 제공하는 단계; (b) (i) 제2 공여체 플라스미드를 콘쥬게이션에 의해 제2 공여체 세포로부터 제1 수령체 세포로 전달하고 (ii) 제2 공여체 플라스미드 및 제1 재조합 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하여 제2 재조합 수령체 올리고뉴클레오타이드를 형성하는 조건 하에서 제2 공여체 플라스미드를 포함하는 제2 공여체 세포를 제1 재조합 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키는 단계; 여기서 제2 공여체 플라스미드는, 순차적으로, 선택적인 제5 엔도뉴클레아제 부위(C5), HR2.1에 상동인 제5 상동 재조합 영역(HR5), 제2 DNA 요소 단편(올리고2)을 코딩하는 제2 올리고뉴클레오타이드, 2개의 상동 재조합 영역(HR6.1, HR6.2)을 포함하는 제6 상동 재조합 영역(HR6), 및 선택적인 제6 엔도뉴클레아제 부위(C6)를 포함하며; 이에 의해 HT5와 HR2.1 및 HR6.2와 HR4의 상동 재조합 후에, DNA 어셈블리를 형성하는 제1 및 제2 DNA 요소 단편(올리고1, 올리고2)을 포함하는 제2 재조합 수령체 올리고뉴클레오타이드를 제공하는 단계를 포함한다. 구현예에서, HR2.1 및 HR2.2는 하나(C2) 또는 2개의 엔도뉴클레아제 부위(C2.1, C2.2)를 포함하는 비상동 영역의 측면에 있으며; 선택적으로 HR3 및 HR4는 하나(C4) 또는 2개의 엔도뉴클레아제 부위(C4.1, C4.2)를 포함하는 비상동 영역의 측면에 있다. 구현예에서, HR6.1 및 HR6.2는 하나(C7) 또는 2개의 엔도뉴클레아제 부위(C7.1, C7.2)를 포함하는 비상동 영역의 측면에 있다. 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있다. 구현예에서, DNA 어셈블리는 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, 가이드 RNA(gRNA), 또는 이들의 조합의 적어도 일부를 포함한다. 구현예에서, 단계 (b)는 양립성 HR 영역 및 제3 또는 후속 DNA 요소 단편(올리고3, 올리고4, . . . 올리고N)을 코딩하는 제3 또는 후속 올리고뉴클레오타이드를 포함하는 제3 또는 후속 공여체 플라스미드를 포함하는 제3 또는 후속 공여체 세포로 1회 이상의 반복을 위해 반복됨으로써, 함께 DNA 어셈블리를 형성하는 제1, 제2, 및 제3 또는 후속 DNA 요소 단편을 포함하는 제3 또는 후속 재조합 수령체 올리고뉴클레오타이드가 형성된다. 구현예에서, 단계 (a)는 각각이 상이한 제1 공여체 플라스미드를 포함하고 있는 복수의 제1 공여체 세포를 포함하고; 단계 (b)는 각각이 상이한 제2, 제3, 또는 후속 공여체 플라스미드를 포함하고 있는 복수의 제2, 제3, 또는 후속 공여체 세포를 포함하며; 선택적으로 각각의 제1 공여체 세포는 제1 정렬된 어레이의 위치에 있고 각각의 제2, 제3 또는 후속 공여체 세포는 제2, 제3, 또는 후속 정렬된 어레이에 위치하며; 선택적으로 방법은 복수의 상이한 조립된 DNA 요소를 포함하는 조합 라이브러리를 생성한다.
구현예에서, 조립된 DNA 요소의 일부를 형성하기 위해 마지막 DNA 요소를 포함하는 공여체 플라스미드는 각각이 조립된 DNA 요소, BHR, 및 추가 HR을 포함하는 재조합 수령체 올리고뉴클레오타이드를 함유한 수령체 세포를 생성하기 위해 바코드 상동 재조합(BHR) 영역을 포함하며; 방법은 (i) 바코드 공여체 세포의 어레이를 구성 또는 획득하는 단계, 각각은 BHR에 상동인 HR, 고유한 바코드 올리고뉴클레오타이드, 및 재조합된 수령체 올리고뉴클레오타이드의 추가 HR에 상동인 제2 HR을 포함하는 바코드 공여체 플라스미드를 함유하는 것인 단계; (ii) (a) 바코드 공여체 플라스미드를 콘쥬게이션에 의해 바코드 공여체 세포로부터 수령체 세포로 전달하고 (b) 바코드 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하는 조건 하에서 바코드 공여체 세포의 어레이를 수령체 세포의 어레이와 접촉시킴으로써 바코딩된 어셈블리를 포함하는 수령체 세포 어레이를 생성하는 단계를 추가로 포함한다.
구현예에서, 각각의 공여체 플라스미드는 바코드 상동 재조합(BHR) 영역의 측면에 있는 고유한 엔도뉴클레아제 부위 CX, CY의 추가 쌍을 포함하며, 방법은 각각이 DNA 어셈블리를 포함하고 있는 수령체 세포의 어레이를, 각각이 고유한 바코드 올리고뉴클레오타이드 측면에 있는 BHR에 상동인 한 쌍의 HR 영역을 포함하는 바코드 공여체 플라스미드를 함유하고 있는 바코드 공여체 세포의 어레이와 접촉시킴으로써 바코딩된 어셈블리를 포함하는 수령체 세포 어레이를 생성하는 단계를 추가로 포함한다.
구현예에서, DNA 조립 방법은 리셋 공여체 플라스미드를 포함하는 리셋 공여체 세포를 재조합 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키고, 여기서 리셋 공여체 플라스미드는, 순차적으로, DNA 어셈블리의 말단 서열에 상동인 상동 재조합 영역(HRt), 리셋 엔도뉴클레아제 부위, 선택성 마커, 리셋 엔도뉴클레아제 부위, 상동 재조합 영역(HRX), 및 전달 기점을 포함하며, 재조합 수령체 올리고뉴클레오타이드는, 순차적으로, 리셋 엔도뉴클레아제 부위, DNA 어셈블리, HRX에 상동인 상동 재조합 영역(HRXa) 및 리셋 엔도뉴클레아제 부위를 포함하며, 이에 의해 HRt와 DNA 어셈블리의 말단 서열 사이 및 HRX와 HRXa 사이의 상동 재조합에 후속하여, 전달 기점 및 DNA 어셈블리를 포함하는 리셋 플라스미드를 제공하는 단계를 추가로 포함할 수 있다. 구현예에서, 리셋 플라스미드는 공여체 세포에 있다. 구현예에서, 리셋 플라스미드는 공여체 세포 및 수령체 세포 둘 다에서 기능하는 제한된 복제 기점을 함유한다. 구현예에서, 리셋 공여체 플라스미드는 상동 재조합 영역 HRt, HRX, 측면의 두 엔도뉴클레아제 부위(C1, C2) 및 역선택성 마커(CM), HRt-C1-CM-C2-HRX를 포함하는 올리고뉴클레오타이드 삽입물; 또는 그러한 올리고뉴클레오타이드 삽입물의 라이브러리를 도입하여 엔도뉴클레아제가 엔도뉴클레아제 부위를 절단하는 것을 허용하는 단계 및 상동 재조합을 사용하여 절단 부위에 역선택성 마커를 도입하는 단계를 포함하는 방법에 의해 구성된다.
발명은 또한 바코드를 올리고뉴클레오타이드에 콘쥬게이션하는 방법을 제공하며, 방법은 (a) 올리고뉴클레오타이드 혼합물의 각각의 올리고뉴클레오타이드를 공여체 플라스미드에 삽입하는 단계로, 각각의 공여체 플라스미드는, 순차적으로, 선택적으로 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 제2 상동 재조합 영역(HR2), 및 선택적으로 제2 엔도뉴클레아제 부위(C2)를 포함하고; 각각의 올리고뉴클레오타이드는 HR1과 HR2 사이에 삽입됨으로써, 공여체 올리고뉴클레오타이드를 포함하는 복수의 공여체 플라스미드가 제공되며, 각각의 공여체 플라스미드는 올리고뉴클레오타이드 혼합물: C1-HR1-올리고-HR2-C2로부터의 단일 공여체 올리고뉴클레오타이드를 포함하는 것인 단계; (b) 각각의 세포가 공여체 플라스미드를 포함하도록 복수의 세포를 복수의 공여체 플라스미드로 형질전환시킴으로써 복수의 공여체 세포를 형성하는 단계; (c) 복수의 공여체 세포를 각각 제1 정렬된 어레이의 고유한 위치에 플레이팅하고 배양함으로써, 공여체 세포의 제1 정렬된 어레이를 제공하는 단계; (d) 복수의 수령체 세포를 제2 정렬된 어레이로 제공하는 단계로, 각각의 수령체 세포는, 순차적으로, 제2 정렬된 어레이에서 수령체 세포의 위치를 확인하는 고유한 바코드 서열, HR1에 상동인 제3 상동 재조합 영역(HR3), 선택적으로 제3 엔도뉴클레아제 부위(C3), 및 HR2에 상동인 제4 상동 재조합 영역(HR4)을 포함하는 수령체 올리고뉴클레오타이드를 포함하는 것인 단계; (e) (i) 공여체 플라스미드를 콘쥬게이션에 의해 공여체 세포로부터 어레이 상의 상응하는 위치의 수령체 세포로 전달하고, (ii) 선택적으로 제1, 제2, 및 제3 엔도뉴클레아제 부위를 절단하며, (iii) 올리고뉴클레오타이드를 상동 재조합에 의하여 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 공여체 세포의 제1 정렬된 어레이를 수령체 세포의 제2 정렬된 어레이와 접촉시킴으로써, 각각이 고유한 바코드 서열 및 올리고뉴클레오타이드 혼합물로부터의 공여체 올리고뉴클레오타이드를 포함하고 있는 융합 올리고뉴클레오타이드의 제3 어레이를 형성하는 단계; 및 (f) 선택적으로 융합 올리고뉴클레오타이드를 서열분석함으로써, 바코드 서열에 의해 어레이에서 각각의 올리고뉴클레오타이드를 확인하는 단계를 포함한다. 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있다. 구현예에서, 공여체 플라스미드는 HR1과 HR2 사이에 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하고; 선택적으로 공여체 플라스미드는 역선택성 마커를 포함한다. 구현예에서, 수령체 세포 올리고뉴클레오타이드는 제4 엔도뉴클레아제 부위(C4)를 포함한다.
추가의 측면으로 DNA 요소를 조립하는 방법이 제공된다. 방법은: (a) 순차적으로: (i) 제1 엔도뉴클레아제 표적 부위, (ii) 제1 상동 재조합 영역, (iii) 선택적으로 제1 DNA 요소 단편을 포함한 제1 올리고뉴클레오타이드, (iv) 제2 상동 재조합 영역, (v) 제2 엔도뉴클레아제 표적 부위, 및 (vi) 제3 엔도뉴클레아제 표적 부위를 포함하는 제1 공여체 플라스미드를 포함하는 제1 숙주 세포를 제공하는 단계, (b) 수령체 세포를 제공하는 단계로, 수령체 세포는: (i) 제1 상동 재조합 영역에 상동인 제3 상동 재조합 영역, (ii) 제4 엔도뉴클레아제 표적 부위, 및 (iii) 제2 상동 재조합 영역에 상동인 제4 상동성 영역을 포함하는 수령체 올리고뉴클레오타이드를 포함하는 것인 단계; 및 (c) (i) 제1 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 제1 숙주 세포로부터 수령체 세포에 전달하고, (ii) 제1 엔도뉴클레아제를 제1 엔도뉴클레아제 표적 부위, 제3 엔도뉴클레아제 표적 부위, 또는 제4 엔도뉴클레아제 표적 부위 중 적어도 하나로 향하게 함으로써, 제1 공여체 플라스미드 및 수령체 올리고뉴클레오타이드에서 이중 가닥 절단을 생성하며 (iii) 제1 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 제1 및 제2 상동 재조합 영역을 통해 제3 및 제4 상응하는 상동 재조합 영역과 상동 재조합에 의해 재조합하는 조건 하에서 제1 숙주 세포를 수령체 세포와 접촉시킴으로써, 재조합된 수령체 올리고뉴클레오타이드를 형성하는 단계를 포함한다. 방법은: (d) 순차적으로: (i) 제5 엔도뉴클레아제 표적 부위, (ii) 제2 상동성 영역에 상동인 제5 상동 재조합 영역, (iii) 제2 DNA 요소 단편을 포함하는 제2 올리고뉴클레오타이드, (iv) 제4 상동성 영역에 상동인 제6 상동 재조합 영역, 및 (v) 제6 엔도뉴클레아제 표적 부위를 포함하는 제2 공여체 플라스미드를 포함하는 제2 숙주 세포를 제공하는 단계; (e) (i) 제2 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 제2 숙주 세포로부터 수령체 세포에 전달하고, (ii) 제2 엔도뉴클레아제를 발현하며, (iii) 제2 엔도뉴클레아제를 제2 엔도뉴클레아제 표적 부위, 제5 엔도뉴클레아제 표적 부위 및/또는 제6 엔도뉴클레아제 표적 부위로 향하게 함으로써 이중 가닥 절단을 생성하고, (iv) 제2 공여체 플라스미드와 재조합된 수령체 올리고뉴클레오타이드를 수령체 세포에서 제5 및 제6 상동 재조합 부위를 통해 상응하는 제2 및 제4 상동 재조합 부위와의 상동 재조합에 의해 재조합하는 조건 하에서 제2 숙주 세포를 재조합 수령체 올리고뉴클레오타이드를 함유하고 있는 수령체 세포와 접촉시킴으로써 조립된 DNA 요소를 포함하는 제2 재조합 수령체 올리고뉴클레오타이드를 형성하는 단계를 추가로 포함할 수 있다. 구현예에서, 제2 상동 재조합 영역에 상동인 제4 상동성 영역의 부분과 비교하여, 제4 상동성 영역의 상이한 부분은 제6 상동 재조합 영역에 상동성이다.
구현예에서, 단계 (a)는 복수의 제1 숙주 세포를 포함하며, 여기서 각각의 세포는 고유한 제1 올리고뉴클레오타이드를 포함한다. 구현예에서, 단계 (d)는 복수의 제2 숙주 세포를 포함하며, 여기서 각각의 세포는 고유한 제2 올리고뉴클레오타이드를 포함한다. 구현예에서, 각각의 제1 숙주 세포는 고유한 플라스미드를 포함한다. 구현예에서, 각각의 제2 숙주 세포는 고유한 플라스미드를 포함한다. 구현예에서, 각각의 제1 숙주 세포는 제1 정렬된 어레이에 있다. 구현예에서, 복수의 제1 숙주 세포는 제1 정렬된 어레이의 위치에 있음으로써, 제1 정렬된 어레이에서 제1 숙주 세포의 풀을 형성한다. 구현예에서, 각각의 제2 숙주 세포는 제2 정렬된 어레이의 위치에 있다. 구현예에서, 복수의 제2 숙주 세포는 제2 정렬된 어레이의 위치에 있음으로써, 제2 정렬된 어레이의 각각의 위치에서 제2 숙주 세포의 풀을 형성한다.
구현예에서, 제1 공여체 세포는 제1 정렬된 어레이에 있고, 제2 공여체 세포는 제2 정렬된 어레이에 있으며, 하나 이상의 후속 공여체 세포는 하나 이상의 후속 어레이에 있다. 그러므로, 구현예에서, 본원에 제공된 방법은 복수의 상이한 조립된 DNA 요소를 포함하는 변이체 라이브러리를 생성한다. 구현예에서, 변이체 라이브러리는 1) 제1, 제2 어레이, 또는 후속 어레이의 위치에서 제1 숙주 세포, 제2 숙주 세포, 또는 후속 숙주 세포를 독립적으로 사용하여 각각의 변이체 라이브러리를 제조함으로써 또는 2) 제1, 제2 어레이, 또는 후속 어레이의 위치에서 복수의 제1 숙주 세포, 제2 숙주 세포, 또는 후속 숙주 세포를 사용하여 변이체 풀을 생성함으로써 생성된다. 구현예에서, 변이체 라이브러리는 제1, 제2 어레이, 또는 후속 어레이의 위치에서 제1 숙주 세포, 제2 숙주 세포, 또는 후속 숙주 세포를 독립적으로 사용하여 각각의 변이체 라이브러리를 제조함으로써 생성된다. 구현예에서, 변이체 라이브러리는 제1, 제2 어레이, 또는 후속 어레이의 위치에서 복수의 제1 숙주 세포, 제2 숙주 세포, 또는 후속 숙주 세포를 사용하여 변이체 풀을 생성함으로써 생성된다. 예를 들어, 구현예를 포함한 본원에 제공된 방법에 대해, 제1 DNA 요소 및/또는 제2 DNA 요소는 DNA 바코드 또는 복수의 DNA 바코드일 수 있다. 구현예에서, 방법은 반복적인 바코딩 플랫폼을 생성한다. 예를 들어, 제1 DNA 요소 및/또는 제2 DNA 요소가 DNA 바코드 또는 복수의 DNA 바코드인 구현예에서, 방법은 세포 계통의 추적에 사용될 수 있다.
예를 들어, 제1 DNA 요소 및/또는 DNA 요소는 gRNA 또는 복수의 gRNA일 수 있다. 그러므로, 구현예에서, 방법은 조합 gRNA 라이브러리의 생성 단계를 포함한다.
구현예에서, 제1 엔도뉴클레아제는 제1 엔도뉴클레아제 표적 부위를 표적으로 한다. 구현예에서, 제1 엔도뉴클레아제는 제3 엔도뉴클레아제 표적 부위를 표적으로 한다. 구현예에서, 제1 엔도뉴클레아제는 제4 엔도뉴클레아제 표적 부위를 표적으로 한다. 구현예에서, 제2 엔도뉴클레아제는 제2 엔도뉴클레아제 표적 부위를 표적으로 한다. 구현예에서, 제2 엔도뉴클레아제는 제5 엔도뉴클레아제 표적 부위를 표적으로 한다. 구현예에서, 제2 엔도뉴클레아제는 제6 엔도뉴클레아제 표적 부위를 표적으로 한다.
구현예에서, DNA 요소는 유전자이다. 구현예에서, DNA 요소는 프로모터이다. 구현예에서, DNA 요소는 인핸서이다. 구현예에서, DNA 요소는 터미네이터이다. 구현예에서, DNA 요소는 인트론이다. 구현예에서, DNA 요소는 유전자간 영역이다. 구현예에서, DNA 요소는 바코드이다. 구현예에서, DNA 요소는 번역 개시 부위이다. 구현예에서, DNA 요소는 gRNA이다. 구현예에서, DNA 요소는 전술한 것들 중 임의의 것의 단편이다.
구현예에서, 수령체 올리고뉴클레오타이드는 수령체 플라스미드에 있다. 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 게놈에 있다.
구현예에서, 제2 공여체 플라스미드는 (d) iii)과 (d) iv)의 구성요소 사이에 제7 상동 재조합 영역 및 제7 엔도뉴클레아제 표적 부위를 추가로 포함한다. 구현예에서, 제1 엔도뉴클레아제는 제7 엔도뉴클레아제 부위를 표적으로 한다.
구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드 를 포함하고, 수령체 세포는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 세포 게놈은 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 플라스미드는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 헬퍼 플라스미드는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 공여체 플라스미드는 유도성 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 게놈은 유도성 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 플라스미드는 유도성 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 gRNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 헬퍼 플라스미드는 유도성 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다.
구현예에서, 수령체 세포는 유도성 gRNA를 포함한다. 구현예에서, 공여체 세포는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 수령체 세포는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, RNA 가이드 DNA의 발현은 구성적이다. 구현예에서, RNA 가이드 DNA의 발현은 유도성이다.
구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas9이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas10이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cpf1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 C2c1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 C2c2이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 C2c3이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12c1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12a이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12b이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12c2이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12g이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12e이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12i1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12i2이다.
본원에 제공된 방법에 대해, 구현예에서, 제1 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 공여체 플라스미드에 있다. 구현예에서, 제1 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 수령체 올리고뉴클레오타이드이다. 구현예에서, 제1 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 수령체 세포 헬퍼 플라스미드에 있다. 구현예에서, 제1 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 수령체 게놈에 있다. 구현예에서, 제1 엔도뉴클레아제의 발현은 유도성이다. 구현예에서, 제2 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 공여체 플라스미드에 있다. 구현예에서, 제2 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 수령체 올리고뉴클레오타이드에 있다. 구현예에서, 제2 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 수령체 세포 헬퍼 플라스미드에 있다.
구현예에서, 제1 엔도뉴클레아제 및/또는 제2 엔도뉴클레아제는 호밍 엔도뉴클레아제이다. 구현예에서, 호밍 엔도뉴클레아제는 I-ScaI, PI-SceI, I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I, 또는 I-Vdi141I이다. 구현예에서, 호밍 엔도뉴클레아제는 I-ScaI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-SceI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-AniI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CeuI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-ChuI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CpaI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CpaII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-CreI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-DmoI이다. 구현예에서, 호밍 엔도뉴클레아제는 H-DreI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-HmuI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-HmuII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-LlaI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-MsoI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-PfuI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-PkoII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-PorI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-PpoI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-PspI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceIII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceIV이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceV이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceVI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-SceVII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-Ssp6803I이다. 구현예에서, 호밍 엔도뉴클레아제는 I-TevI이다. 구현예에서, 호밍 엔도뉴클레아제는 I-TevII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-TevIII이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-TliI이다. 구현예에서, 호밍 엔도뉴클레아제는 PI-TliII이다. 구현예에서, 호밍 엔도뉴클레아제는 I-Tsp061I, 또는 I-Vdi141I이다. 구현예에서, 호밍 엔도뉴클레아제는 I-Vdi141I이다.
구현예에서, 엔도뉴클레아제는 전사 활성화 인자 유사 이펙터 뉴클레아제이다. 구현예에서, 엔도뉴클레아제는 아연 핑거 뉴클레아제이다.
본원에 제공된 방법에 대해, 구현예에서, 단계 (d) 내지 (e)는 1회 이상의 반복을 위해 반복됨으로써 하나 이상의 후속 조립된 DNA 요소를 형성한다. 구현예에서, 제1, 제2 또는 후속 공여체 플라스미드는 제1 올리고뉴클레오타이드, 제2 올리고뉴클레오타이드 또는 후속 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다. 구현예에서, 제1 공여체 플라스미드는 제1 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다. 구현예에서, 제2 공여체 플라스미드는 제2 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다. 구현예에서, 후속 공여체 플라스미드는 후속 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다.
구현예에서, 제1 공여체 플라스미드는 제1 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다. 구현예에서, 선택성 마커는 (a) (v)와 (a) (iv)의 구성요소 사이에 있다. 구현예에서, 제2 공여체 플라스미드는 제2 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다.
구현예에서, 수령체 세포 올리고뉴클레오타이드는 제1 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 역선택성 마커를 포함한다. 구현예에서, 재조합된 수령체 세포 올리고뉴클레오타이드는 제2 또는 후속 올리고뉴클레오타이드의 재조합된 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 역선택성 마커를 포함한다. 본원에 기술된 방법에 사용하기 위한 역선택성 마커는 위에서 기술된다.
구현예에서, 또한 DNA 어셈블리로도 언급될 수 있는 조립된 DNA 요소가 서열분석된다. 구현예에서, 수령체 올리고뉴클레오타이드가 서열분석된다. 구현예에서, 재조합 수령체 올리고뉴클레오타이드가 서열분석된다. 구현예에서, 재조합 수령체 올리고뉴클레오타이드는 플라스미드이고, 플라스미드는 선형화되고, 서열분석 어댑터에 결찰되고 서열분석된다. 구현예에서, 조립된 DNA 요소는 PCR에 의해 증폭되고 서열분석된다. 구현예에서, (a) 수령체 세포가 용해되고, (b) 올리고뉴클레오타이드가 엔도뉴클레아제 또는 복수의 엔도뉴클레아제로 소화되며, (c) 조립된 DNA 요소가 단리되고, 그리고 (d) 조립된 DNA 요소 또는 복수의 조립된 유전자가 서열분석 어댑터에 결찰되고 서열분석된다. 구현예에서, 재조합 수령체 올리고뉴클레오타이드가 단리된다.
구현예에서, 조립된 DNA 요소는 약 100개 뉴클레오타이드 내지 약 500,000개 뉴클레오타이드 길이이다. 길이는 종점을 포함하여, 표시된 범위 내 임의의 값 또는 하위범위일 수 있다.
구현예에서, 조립된 DNA 요소는 약 100개 뉴클레오타이드, 약 1000개 뉴클레오타이드, 약 10,000개 뉴클레오타이드, 약 20,000개 뉴클레오타이드, 약 40,000개 뉴클레오타이드, 약 60,000개 뉴클레오타이드, 약 80,000개 뉴클레오타이드, 약 100,000개 뉴클레오타이드, 약 120,000개 뉴클레오타이드, 약 140,000개 뉴클레오타이드, 약 160,000개 뉴클레오타이드, 약 180,000개 뉴클레오타이드, 약 20,000개 뉴클레오타이드, 약 240,000개 뉴클레오타이드, 약 260,000개 뉴클레오타이드, 약 280,000개 뉴클레오타이드, 약 300,000개 뉴클레오타이드, 약 320,000개 뉴클레오타이드, 약 340,000개 뉴클레오타이드, 약 360,000개 뉴클레오타이드, 약 380,000개 뉴클레오타이드, 약 400,000개 뉴클레오타이드, 약 420,000개 뉴클레오타이드, 약 440,000개 뉴클레오타이드, 약 460,000개 뉴클레오타이드, 약 480,000개 뉴클레오타이드, 또는 약 500,000개 뉴클레오타이드 길이이다. 길이는 종점을 포함하여, 표시된 범위 내 임의의 값 또는 하위범위일 수 있다.
구현예에서, 제1, 제2 또는 후속 상동성 영역 및 상응하는 제1, 제2 또는 후속 상동성 영역은 약 20개 염기쌍 내지 약 500개 염기쌍 길이이다. 길이는 종점을 포함하여, 표시된 범위 내 임의의 값 또는 하위범위일 수 있다.
구현예에서, 제1, 제2 또는 후속 상동성 영역 및 상응하는 제1, 제2 또는 후속 상동성 영역은 약 20개 염기쌍, 40개 염기쌍, 60개 염기쌍, 80개 염기쌍, 100개 염기쌍, 120개 염기쌍, 140개 염기쌍, 160개 염기쌍, 180개 염기쌍, 200개 염기쌍, 220개 염기쌍, 240개 염기쌍, 260개 염기쌍, 280개 염기쌍, 300개 염기쌍, 320개 염기쌍, 340개 염기쌍, 360개 염기쌍, 380개 염기쌍, 400개 염기쌍, 420개 염기쌍, 440개 염기쌍, 460개 염기쌍, 480개 염기쌍 또는 500개 염기쌍 길이이다. 구현예에서, 제1, 제2 또는 후속 상동성 영역 및 상응하는 제1, 제2 또는 후속 상동성 영역은 약 50 염기쌍 길이이다. 길이는 종점을 포함하여, 표시된 범위 내 임의의 값 또는 하위범위일 수 있다.
III. 분석 방법
한 측면으로 올리고뉴클레오타이드 혼합물로부터 올리고뉴클레오타이드를 확인하는 방법이 제공된다. 방법은: (a) 올리고뉴클레오타이드 혼합물을 제공하는 단계, (b) 각각의 올리고뉴클레오타이드를 공여체 플라스미드에 삽입하는 단계로, 각각의 공여체 플라스미드는, 순차적으로: i) 제1 엔도뉴클레아제 절단 부위, ii) 제1 상동 재조합 영역, iii) 제2 상동 재조합 영역, 및 iv) 제2 엔도뉴클레아제 절단 부위를 포함하고, 올리고뉴클레오타이드는 제1 상동 재조합 영역과 제2 상동 재조합 영역 사이에 삽입됨으로써, 각각의 공여체 플라스미드가 올리고뉴클레오타이드 혼합물로부터의 단일 올리고뉴클레오타이드를 포함하고 있는 복수의 공여체 플라스미드를 생성하는 단계; (c) 각각의 숙주 세포가 공여체 플라스미드를 포함하도록 복수의 숙주 세포를 복수의 공여체 플라스미드로 형질전환시킴으로써, 복수의 형질전환된 숙주 세포를 형성하는 단계; (d) 복수의 형질전환된 숙주 세포를 제1 정렬된 어레이 상에 플레이팅하고 배양하는 단계로, 각각의 형질전환된 숙주 세포는 제1 정렬된 어레이에서 클론의 콜로니를 생성하는 것인 단계; (e) 제2 정렬된 어레이로 복수의 수령체 세포를 제공하는 단계로, 각각의 수령체 세포는, 순차적으로: (i) 제2 정렬된 어레이에서 수령체 세포의 위치를 확인하는 고유한 바코드 서열, (ii) 상응하는 제1 상동 재조합 영역에 상동인 상응하는 제1 상동 재조합 영역, (iii) 제3 엔도뉴클레아제 절단 부위, 및 (iv) 상응하는 제2 상동 재조합 영역에 상동인 상응하는 제2 상동 재조합 부위를 포함하는 수령체 올리고뉴클레오타이드를 포함하며, 여기서 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 엔도뉴클레아제에 의해 절단될 수 있는 것인 단계; (f) (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 클론의 콜로니로부터 수령체 세포로 전달하고, (ii) 엔도뉴클레아제에 의해 제1, 제2, 및 제3 엔도뉴클레아제 절단 부위를 절단하며, (iii) 올리고뉴클레오타이드를 상동 재조합에 의해 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 제1 정렬된 어레이로부터의 클론의 각각의 콜로니를 제2 정렬된 어레이의 상응하는 부위의 수령체 세포와 겁촉시킴으로써, 바코드 서열 및 올리고뉴클레오타이드를 포함하는 융합 서열을 생성하는 단계; (g) 융합 서열을 서열분석하고; 공여체 세포 및/또는 수령체 세포의 제1 및/또는 제2 정렬된 어레이에서 서열분석된 올리고뉴클레오타이드를 바코드 서열의 확인에 의해 확인하는 단계를 포함한다.
구현예에서, 세포를 플레이팅하고 배양하는 단계는 표면에서 세포를 플레이팅하고 배양하는 것을 포함한다. 예를 들어, 표면은 고체 배지일 수 있다. 그러므로, 구현예에서, 클론의 콜로니는 고체 배지 상의 세포의 콜로니이다. 구현예에서, 세포를 플레이팅하고 배양하는 단계는 액체 배지에서 세포를 플레이팅하고 배양하는 것을 포함한다. 예를 들어, 단일 세포는 액체 배지에서 플레이팅되고 배양될 수 있다. 그러므로, 구현예에서, 클론의 콜로니는 액체 배지의 세포의 콜로니이다.
구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드에 있다. 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 게놈에 있다. 구현예에서, 공여체 플라스미드는 제1 상동 재조합 영역과 제2 상동 재조합 영역 사이에 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다. 구현예에서, 수령체 세포 올리고뉴클레오타이드는 단계 (e) (iii)에서 2개의 엔도뉴클레아제 절단 부위를 포함한다. 구현예에서, 방법은 2개의 엔도뉴클레아제 절단 부위 사이에 역선택성 마커를 추가로 포함하며, 역선택성 마커는 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택한다.
한 측면으로 올리고뉴클레오타이드 혼합물로부터 올리고뉴클레오타이드를 확인하는 방법이 제공된다. 방법은: (a) 복수의 숙주 세포를 제1 정렬된 어레이로 제공하는 단계로, 각각의 숙주 세포는 공여체 플라스미드를 포함하고, 각각의 공여체 플라스미드는, 순차적으로: i) 제1 엔도뉴클레아제 부위, ii) 제1 상동 재조합 영역, iii) 고유한 바코드 서열, iv) 제2 상동 재조합 영역, 및 v) 제2 엔도뉴클레아제 부위를 포함하며, 고유한 바코드 서열은 제1 정렬된 어레이에서 숙주 세포의 위치를 확인하는 것인 단계; (b) 복수의 수령체 세포를 제공하는 단계로, 각각의 수령체 세포는 복수의 올리고뉴클레오타이드로부터의 올리고뉴클레오타이드를 포함하는 수령체 올리고뉴클레오타이드를 포함하고, 각각의 수령체 플라스미드는, 순차적으로: i) 올리고뉴클레오타이드 서열, ii) 상응하는 제1 상동 재조합 영역에 상동인 상응하는 제1 상동 재조합 영역, iii) 제3 엔도뉴클레아제 부위, 여기서 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 엔도뉴클레아제에 의해 절단되며, iv) 상응하는 제2 상동 재조합 영역에 상동인 상응하는 제2 상동 재조합 영역을 포함하는 수령체 플라스미드를 포함하는 것인 단계; (c) 복수의 수령체 세포를 제2 정렬된 어레이 상에 플레이팅하고 배양하는 단계로, 각각의 수령체 세포는 제2 정렬된 어레이에서 클론의 콜로니를 생성하는 것인 단계; (d) (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 공여체 세포로부터 클론의 콜로니로 전달하고, (ii) 엔도뉴클레아제에 의해 제1, 제2, 및 제3 엔도뉴클레아제 절단 부위를 절단하며, (iii) 바코드 서열을 공여체 플라스미드로부터 상동 재조합에 의해 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 제1 정렬된 어레이로부터의 공여체 세포를 제2 정렬된 어레이의 상응하는 부위의 클론의 각각의 콜로니와 겁촉시킴으로써, 바코드 서열 및 올리고뉴클레오타이드를 포함하는 융합 서열을 생성하는 단계; (e) 융합 서열을 서열분석하는 단계; 및 (f) 수령체 세포의 제1 및/또는 제2 정렬된 어레이에서 서열분석된 올리고뉴클레오타이드를 바코드 서열의 확인에 의해 확인하는 단계를 포함한다.
구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드에 있다.
구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 게놈에 있다. 구현예에서, 공여체 플라스미드는 제1 상동 재조합 영역과 제2 상동 재조합 영역 사이에 바코드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다. 구현예에서, 수령체 올리고뉴클레오타이드는 단계 (b)(iii)에서 2개의 엔도뉴클레아제 절단 부위를 포함한다. 구현예에서, 방법은 2개의 엔도뉴클레아제 절단 부위 사이에 바코드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 역선택성 마커를 추가로 포함한다.
본원에 제공된 방법에 대해, 구현예에서, 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 동일한 엔도뉴클레아제 절단 부위이다. 구현예에서, 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 상이한 엔도뉴클레아제 절단 부위이다. 구현예에서, 엔도뉴클레아제는 다수의 엔도뉴클레아제를 포함한다.
구현예에서, 엔도뉴클레아제는 수령체 세포에서 올리고뉴클레오타이드에 의해 코딩된다. 구현예에서, 올리고뉴클레오타이드는 수령체 세포 게놈에 있다. 구현예에서, 올리고뉴클레오타이드는 수령체 플라스미드에 있다. 구현예에서, 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 헬퍼 플라스미드에 있다. 구현예에서, 엔도뉴클레아제는 공여체 플라스미드에서 올리고뉴클레오타이드에 의해 코딩된다. 구현예에서, 엔도뉴클레아제는 공여체 플라스미드에서 올리고뉴클레오타이드에 의해 코딩된다. 구현예에서, 엔도뉴클레아제의 발현은 유도성이다.
구현예에서, 엔도뉴클레아제는 전사 활성화 인자 유사 이펙터 뉴클레아제이다. 구현예에서, 엔도뉴클레아제는 아연 핑거 뉴클레아제이다. 구현예에서, 엔도뉴클레아제는 HO이다.
구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 CRISPR 시스템이다. 구현예에서, 엔도뉴클레아제는 RNA 가이드 DNA 엔도뉴클레아제이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas9이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas10이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cpf1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 C2c1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 C2c2이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 C2c3이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12c1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12a이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12b이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12c2이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12g이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12e이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12i1이다. 구현예에서, RNA 가이드 DNA 엔도뉴클레아제는 Cas12i2이다.
본원에 제공된 방법에 대해, 구현예에서, 공여체 플라스미드는 가이드 RNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 게놈은 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 가이드 RNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 플라스미드는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 가이드 RNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 헬퍼 플라스미드는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 공여체 플라스미드는 가이드 RNA를 코딩하는 올리고뉴클레오타이드를 포함하고, 수령체 플라스미드는 유도성 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다.
구현예에서, 수령체 세포는 유도성 gRNA를 포함한다. 구현예에서, 공여체 세포는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 수령체 세포는 RNA 가이드 DNA 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드를 포함한다. 구현예에서, RNA 가이드 DNA의 발현은 구성적이다. 구현예에서, RNA 가이드 DNA의 발현은 유도성이다.
구현예에서, 방법은 공여체 플라스미드를 단리하는 단계를 추가로 포함한다. 구현예에서, 방법은 수령체 플라스미드를 단리하는 단계를 추가로 포함한다. 구현예에서, 방법은 재조합 수령체 플라스미드를 단리하는 단계를 추가로 포함한다. 구현예에서, 방법은 서열분석된 올리고뉴클레오타이드를 단리하는 단계를 추가로 포함한다. 구현예에서, 방법은 공여체 세포, 수령체 세포, 재조합 수령체 세포, 수령체 올리고뉴클레오타이드, 또는 재조합 수령체 올리고뉴클레오타이드 중 하나 이상을 단리하는 단계를 추가로 포함한다.
구현예에서, 방법은 콜로니의 하나 이상의 하위세트를 조합하는 단계를 포함한다. 그러므로, 구현예에서, 방법은 콜로니의 하나 이상의 하위세트를 조합하는 단계 및 콜로니의 하위세트로부터 복수의 공여체 플라스미드를 단리하는 단계를 포함한다. 구현예에서, 방법은 콜로니의 하나 이상의 하위세트를 조합하는 단계 및 콜로니의 하위세트로부터 복수의 수령체 플라스미드를 단리하는 단계를 포함한다. 구현예에서, 방법은 콜로니의 하나 이상의 하위세트를 조합하는 단계 및 콜로니의 하위세트로부터 복수의 재조합 수령체 플라스미드를 단리하는 단계를 포함한다. 구현예에서, 방법은 복수의 서열분석된 올리고뉴클레오타이드를 단리하는 단계를 추가로 포함한다.
구현예에서, 수령체 세포 또는 공여체 세포는 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드를 포함한다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 공여체 세포 게놈에 있다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 헬퍼 플라스미드에 있다. 구현예에서, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드는 Tra 오페론이다. 플라스미드 콘쥬게이션을 가능하게 하는 다른 올리고뉴클레오타이드는 위에서 기술된다.
구현예에서, 공여체 세포, 수령체 세포, 또는 재조합 수령체 세포는 제3 정렬된 어레이, 제4 정렬된 어레이, 또는 후속 정렬된 어레이 상의 위치에 전달된다.
구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 8개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 12개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 16개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 20개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 24개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 28개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 32개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 36개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이이다. 바코드의 길이는 종점을 포함하여, 제공된 범위 내 임의의 값 또는 하위범위일 수 있다.
구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 36개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 32개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 28개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 24개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 20개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 16개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 12개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 8개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드, 8개 뉴클레오타이드, 12개 뉴클레오타이드, 16개 뉴클레오타이드, 20개 뉴클레오타이드, 24개 뉴클레오타이드, 28 개뉴클레오타이드, 32개 뉴클레오타이드, 36개 뉴클레오타이드, 또는 40개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 15개 뉴클레오타이드 길이이다. 구현예에서, 바코드 서열은 약 40개 뉴클레오타이드 길이이다. 바코드의 길이는 종점을 포함하여, 제공된 범위 내 임의의 값 또는 하위범위일 수 있다.
추가 구현예
발명은 다음의 추가 구현예에 의해 추가로 기술된다.
구현예 1: DNA 요소를 조립하는 방법으로서, 방법은: (1) 순차적으로: 제1 엔도뉴클레아제 표적 부위, 제1 상동 재조합 영역, 선택적으로 제1 DNA 요소 단편을 포함하는 제1 올리고뉴클레오타이드, 제2 상동 재조합 영역, 제2 엔도뉴클레아제 표적 부위, 및 제3 엔도뉴클레아제 표적 부위를 포함하는 제1 공여체 플라스미드를 포함하는 제1 숙주 세포를 제공하는 단계; (2) 수령체 세포를 제공하는 단계로, 수령체 세포는: 제1 상동 재조합 영역에 상동인 제3 상동 재조합 영역, 제4 엔도뉴클레아제 표적 부위, 및 제2 상동 재조합 영역에 상동인 제4 상동 재조합 영역을 포함하는 수령체 올리고뉴클레오타이드를 포함하는 것인 단계; 및 (3) (i) 제1 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 제1 숙주 세포로부터 수령체 세포에 전달하고, (ii) 제1 엔도뉴클레아제를 제1 엔도뉴클레아제 표적 부위, 제3 엔도뉴클레아제 표적 부위, 또는 제4 엔도뉴클레아제 표적 부위 중 적어도 하나로 향하게 함으로써, 제1 공여체 플라스미드 및 수령체 올리고뉴클레오타이드에서 이중 가닥 절단을 생성하며 (iii) 제1 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 제1 및 제2 상동 재조합 영역을 통해 제3 및 제4 상응하는 상동 재조합 영역과 상동 재조합에 의해 재조합하는 조건 하에서 제1 숙주 세포를 수령체 세포와 접촉시킴으로써, 재조합된 수령체 올리고뉴클레오타이드를 형성하는 단계; (4) 순차적으로: 제5 엔도뉴클레아제 표적 부위, 제2 상동성 영역에 상동인 제5 상동 재조합 영역, 제2 DNA 요소 단편을 코딩하는 제2 올리고뉴클레오타이드, 제4 상동성 영역에 상동인 제6 상동 재조합 영역, 및 제6 엔도뉴클레아제 표적 부위를 포함하는 제2 공여체 플라스미드를 포함하는 제2 숙주 세포를 제공하는 단계; 및 (5) (i) 제2 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 제2 숙주 세포로부터 수령체 세포에 전달하고, (ii) 제2 엔도뉴클레아제를 발현하며, (iii) 제2 엔도뉴클레아제를 제2 엔도뉴클레아제 표적 부위, 제5 엔도뉴클레아제 표적 부위 및/또는 제6 엔도뉴클레아제 표적 부위로 향하게 함으로써 이중 가닥 절단을 생성하고, (iv) 제2 공여체 플라스미드와 재조합된 수령체 올리고뉴클레오타이드를 수령체 세포에서 제5 및 제6 상동 재조합 부위를 통해 상응하는 제2 및 제4 상동 재조합 부위와의 상동 재조합에 의해 재조합하는 조건 하에서 제2 숙주 세포를 재조합 수령체 올리고뉴클레오타이드를 함유하고 있는 수령체 세포와 접촉시킴으로써 조립된 DNA 요소를 포함하는 제2 재조합 수령체 올리고뉴클레오타이드를 형성하는 단계를 포함한다.
추가의 구현예에서, 단계 (a)는 복수의 제1 숙주 세포를 포함하며, 각각의 세포는 상이한 제1 올리고뉴클레오타이드를 포함하고/거나 단계 (d)는 복수의 제2 숙주 세포를 포함하고, 각각의 세포는 상이한 제2 올리고뉴클레오타이드를 포함한다.
추가의 구현예에서, 각각의 제1 숙주 세포는 제1 정렬된 어레이의 위치에 있다.
추가의 구현예에서, 복수의 제1 숙주 세포는 제1 정렬된 어레이의 위치에 있음으로써, 제1 정렬된 어레이에서 제1 숙주 세포의 풀을 형성한다.
추가의 구현예에서, 각각의 제2 숙주 세포는 제2 정렬된 어레이의 위치에 있다.
추가의 구현예에서, 복수의 제2 숙주 세포는 제2 정렬된 어레이의 위치에 있음으로써, 제2 정렬된 어레이에서 제2 숙주 세포의 풀을 형성한다.
추가의 구현예에서, 제1 공여체 세포는 제1 정렬된 어레이에 있고, 제2 공여체 세포는 제2 정렬된 어레이에 있으며, 하나 이상의 후속 공여체 세포는 하나 이상의 후속 어레이에 있다.
추가의 구현예에서, 방법은 복수의 상이한 조립된 DNA 요소를 포함하는 조합 라이브러리를 생성한다.
추가의 구현예에서, 제1 엔도뉴클레아제는 제1, 제3, 또는 제4 엔도뉴클레아제 표적 부위를 표적으로 한다.
추가의 구현예에서, 제2 엔도뉴클레아제는 제2, 제5, 또는 제6 엔도뉴클레아제 표적 부위를 표적으로 한다.
추가의 구현예에서, DNA 요소는 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, 또는 gRNA이다.
추가의 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 플라스미드에 있다.
추가의 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 게놈에 있다.
추가의 구현예에서, 제2 공여체 플라스미드는 (d) iii)과 (d) iv) 사이에 제7 상동 재조합 영역 및 제7 엔도뉴클레아제 표적 부위를 추가로 포함한다.
추가의 구현예에서, 제1 엔도뉴클레아제는 제7 엔도뉴클레아제 부위를 표적으로 한다.
추가의 구현예에서, 제1 및 제2 엔도뉴클레아제는 RNA 가이드 DNA 엔도뉴클레아제, 호밍 엔도뉴클레아제, 전사 활성화 인자 유사 이펙터 뉴클레아제, 및 아연 핑거 뉴클레아제로부터 독립적으로 선택된다.
추가의 구현예에서, 제1 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는는 공여체 세포 또는 수령체 세포에 있다.
추가의 구현예에서, 제1 및/또는 제2 엔도뉴클레아제의 발현은 유도성이다.
추가의 구현예에서, 제2 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드는 공여체 세포 또는 수령체 세포에 있다.
추가의 구현예에서, 단계 (d) 내지 (e)는 1회 이상의 반복을 위해 반복됨으로써 하나 이상의 후속 조립된 DNA 요소를 형성한다.
추가의 구현예에서, 제1, 제2 또는 후속 공여체 플라스미드는 제1 올리고뉴클레오타이드, 제2 올리고뉴클레오타이드 또는 후속 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다.
추가의 구현예에서, 제1 공여체 플라스미드는 제1 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하며, 선택적으로 선택성 마커는 제2 및 제3 엔도뉴클레아제 표적 부위 사이에 있다. 구현예에서, 제2 공여체 플라스미드는 제2 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다.
추가의 구현예에서, 수령체 세포 올리고뉴클레오타이드는 제1 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 역선택성 마커를 포함한다.
추가의 구현예에서, 공여체 플라스미드는 전달 기점을 포함하며, 선택적으로 전달 기점은 이동성 요소로부터 유래된다.
추가의 구현예에서, 공여체 플라스미드는 조건부 복제 기점을 포함하며; 선택적으로 조건부 복제 기점은 올리고뉴클레오타이드의 존재 또는 세포 성장 조건에 따라 달라진다.
추가의 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 30 킬로베이스보다 긴 길이의 플라스미드를 복제할 수 있는 레플리콘을 포함한다.
추가의 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 유도성 고복사 복제 기점을 포함한다.
추가의 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 효모 인공 염색체(YAC), 포유류 인공 염색체(MAC), 인간 인공 염색체(HAC), 또는 식물 인공 염색체이다. 추가의 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 바이러스 벡터이다.
추가의 구현예에서, 공여체 세포는 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드를 포함한다.
추가의 구현예에서, 공여체 세포 또는 수령체 세포는 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드를 포함하고; 선택적으로 상동 DNA 복구 유전자 발현은 유도성이다.
추가의 구현예에서, 공여체 세포 또는 수령체 세포는 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드를 포함한다.
추가의 구현예에서, 공여체 세포 및 수령체 세포는 독립적으로 박테리아 세포이다.
추가의 구현예에서, 조립된 DNA 요소가 서열분석되고/거나, 수령체 올리고뉴클레오타이드가 서열분석되고/거나 재조합 수령체 올리고뉴클레오타이드가 서열분석된다.
추가의 구현예에서, 재조합 수령체 올리고뉴클레오타이드는 플라스미드이며, 플라스미드는 선형화되고, 서열분석 어댑터에 결찰되어 서열분석된다.
추가의 구현예에서, 조립된 DNA 요소는 PCR에 의해 증폭되고 서열분석되며; 선택적으로 (a) 수령체 세포는 용해되고, (b) 올리고뉴클레오타이드는 엔도뉴클레아제 또는 복수의 엔도뉴클레아제로 소화되며, (c) 조립된 DNA 요소는 단리되고, (d) 조립된 DNA 요소 또는 복수의 조립된 유전자는 서열분석 어댑터에 결찰되어 서열분석된다.
추가의 구현예에서, 조립된 DNA 요소 또는 재조합 수령체 올리고뉴클레오타이드는 단리된다.
추가의 구현예에서, 조립된 DNA 단편은 100개 뉴클레오타이드 내지 500,000개 뉴클레오타이드 길이이다.
추가의 구현예에서, 제1, 제2 또는 후속 상동성 영역 및 상응하는 제1, 제2 또는 후속 상동성 영역은 약 20 염기쌍 내지 약 500 염기쌍 길이이다.
추가의 구현예에서, 제1, 제2 또는 후속 상동성 영역 및 상응하는 제1, 제2 또는 후속 상동성 영역은 약 50 염기쌍 길이이다.
구현예에서, 본원에 올리고뉴클레오타이드 혼합물로부터 올리고뉴클레오타이드를 확인하는 방법이 제공되며, 방법은: (a) 올리고뉴클레오타이드 혼합물을 제공하는 단계, (b) 각각의 올리고뉴클레오타이드를 공여체 플라스미드에 삽입하는 단계로, 각각의 공여체 플라스미드는, 순차적으로: (i) 제1 엔도뉴클레아제 절단 부위, (ii) 제1 상동 재조합 영역, (iii) 제2 상동 재조합 영역, 및 (iv) 제2 엔도뉴클레아제 절단 부위를 포함하고, 올리고뉴클레오타이드는 제1 상동 재조합 영역과 제2 상동 재조합 영역 사이에 삽입됨으로써, 각각의 공여체 플라스미드가 올리고뉴클레오타이드 혼합물로부터의 단일 올리고뉴클레오타이드를 포함하고 있는 복수의 공여체 플라스미드를 생성하는 단계; (c) 각각의 숙주 세포가 공여체 플라스미드를 포함하도록 복수의 숙주 세포를 복수의 공여체 플라스미드로 형질전환시킴으로써, 복수의 형질전환된 숙주 세포를 형성하는 단계; (d) 복수의 형질전환된 숙주 세포를 제1 정렬된 어레이 상에 플레이팅하고 배양하는 단계로, 각각의 형질전환된 숙주 세포는 제1 정렬된 어레이에서 클론의 콜로니를 생성하는 것인 단계; (e) 제2 정렬된 어레이로 복수의 수령체 세포를 제공하는 단계로, 각각의 수령체 세포는, 순차적으로: (i) 제2 정렬된 어레이에서 수령체 세포의 위치를 확인하는 고유한 바코드 서열, (ii) 상응하는 제1 상동 재조합 영역에 상동인 상응하는 제1 상동 재조합 영역, (iii) 제3 엔도뉴클레아제 절단 부위, 및 (iv) 상응하는 제2 상동 재조합 영역에 상동인 상응하는 제2 상동 재조합 부위를 포함하는 수령체 올리고뉴클레오타이드를 포함하며, 여기서 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 엔도뉴클레아제에 의해 절단될 수 있는 것인 단계; (f) (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 클론의 콜로니로부터 수령체 세포로 전달하고, (ii) 엔도뉴클레아제에 의해 제1, 제2, 및 제3 엔도뉴클레아제 절단 부위를 절단하며, (iii) 올리고뉴클레오타이드를 상동 재조합에 의해 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 제1 정렬된 어레이로부터의 클론의 각각의 콜로니를 제2 정렬된 어레이의 상응하는 부위의 수령체 세포와 겁촉시킴으로써, 바코드 서열 및 올리고뉴클레오타이드를 포함하는 융합 서열을 생성하는 단계; (g) 융합 서열을 서열분석하는 단계; 및 (h) 공여체 세포 및/또는 수령체 세포의 제1 및/또는 제2 정렬된 어레이에서 서열분석된 올리고뉴클레오타이드를 바코드 서열의 확인에 의해 확인하는 단계를 포함한다.
추가의 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드에 있다.
추가의 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 게놈에 있다.
추가의 구현예에서, 방법은 공여체 플라스미드가 제1 상동 재조합 영역과 제2 상동 재조합 영역 사이에 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하는 것을 제공한다.
추가의 구현예에서, 본원의 방법은 수령체 세포 올리고뉴클레오타이드가 단계 (e) (iii)에서 2개의 엔도뉴클레아제 절단 부위를 포함하는 것을 제공한다.
본원의 구현예에서, 방법은 2개의 엔도뉴클레아제 절단 부위 사이에 역선택성 마커를 추가로 포함하며, 역선택성 마커는 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택한다.
구현예에서, 본원에는 복수의 올리고뉴클레오타이드로부터 올리고뉴클레오타이드를 확인하는 방법이 제공되며, 방법은: (a) 복수의 숙주 세포를 제1 정렬된 어레이로 제공하는 단계로, 각각의 숙주 세포는 공여체 플라스미드를 포함하고, 각각의 공여체 플라스미드는, 순차적으로: (i) 제1 엔도뉴클레아제 절단 부위, (ii) 제1 상동 재조합 영역, (iii) 고유한 바코드 서열, (iv) 제2 상동 재조합 영역, 및 (v) 제2 엔도뉴클레아제 절단 부위를 포함하며; 고유한 바코드 서열은 제1 정렬된 어레이에서 숙주 세포의 위치를 확인하는 것인 단계; (b) 복수의 수령체 세포를 제공하는 단계로, 각각의 수령체 세포는 복수의 올리고뉴클레오타이드로부터의 올리고뉴클레오타이드를 포함하는 수령체 올리고뉴클레오타이드를 포함하며, 각각의 수령체 플라스미드는, 순차적으로: i) 올리고뉴클레오타이드 서열, ii) 상응하는 제1 상동 재조합 영역에 상동인 상응하는 제1 상동 재조합 영역, iii) 제3 엔도뉴클레아제 절단 부위, 여기서 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 엔도뉴클레아제에 의해 절단될 수 있으며, iv) 상응하는 제2 상동 재조합 영역에 상동인 상응하는 제2 상동 재조합 영역을 포함하는 것인 단계; (c) 복수의 수령체 세포를 제2 정렬된 어레이 상에 플레이팅하고 배양하는 단계로, 각각의 수령체 세포는 제2 정렬된 어레이에서 클론의 콜로니를 생성하는 것인 단계; (d) (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 공여체 세포로부터 클론의 콜로니에 전달하고, (ii) 엔도뉴클레아제에 의해 제1, 제2, 및 제3 엔도뉴클레아제 절단 부위를 절단하며, (iii) 바코드 서열을 상동 재조합에 의하여 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 제1 정렬된 어레이로부터의 공여체 세포를 제2 정렬된 어레이의 상응하는 부위의 클론의 콜로니와 접촉시킴으로써, 바코드 서열 및 올리고뉴클레오타이드를 포함하고 있는 융합 서열을 생성하는 단계; (e) 융합 서열을 서열분석하는 단계; 및 (f) 공여체 세포 및/또는 수령체 세포의 제1 및/또는 제2 정렬된 어레이에서 서열분석된 올리고뉴클레오타이드를 바코드 서열의 확인에 의해 확인하는 단계를 포함한다.
구현예에서, 방법은 수령체 올리고뉴클레오타이드가 수령체 세포 플라스미드에 있는 것을 제공한다.
추가의 구현예에서, 수령체 올리고뉴클레오타이드는 수령체 세포 게놈에 있다.
구현예에서, 공여체 플라스미드는 제1 상동 재조합 영역과 제2 상동 재조합 영역 사이에 바코드의 수령체 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함한다.
추가의 구현예에서, 수령체 올리고뉴클레오타이드는 단계 (b) (iii)에서 2개의 엔도뉴클레아제 절단 부위를 포함한다.
추가의 구현예에서, 방법은은 2개의 엔도뉴클레아제 절단 부위 사이에 바코드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 역선택성 마커를 포함한다.
추가의 구현예에서, 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 동일한 엔도뉴클레아제 절단 부위이다.
추가의 구현예에서, 제1 엔도뉴클레아제 절단 부위, 제2 엔도뉴클레아제 절단 부위, 및 제3 엔도뉴클레아제 절단 부위는 상이한 엔도뉴클레아제 절단 부위이다.
추가의 구현예에서, 엔도뉴클레아제는 다수의 엔도뉴클레아제를 포함한다.
추가의 구현예에서, 공여체 플라스미드는 전달 기점을 포함한다.
추가의 구현예에서, 전달 기점은 이동성 요소로부터 유래된다.
추가의 구현예에서, 공여체 플라스미드는 조건부 복제 기점을 포함한다.
추가의 구현예에서, 조건부 복제 기점은 올리고뉴클레오타이드의 존재에 따라 달라진다.
추가의 구현예에서, 조건부 복제 기점은 세포 성장 조건에 따라 달라진다.
추가의 구현예에서, 공여체 플라스미드 또는 수령체 플라스미드는 적어도 30 킬로베이스 길이의 플라스미드를 복제할 수 있는 레플리콘을 포함한다.
추가의 구현예에서, 레플리콘은 P1 유래 인공 염색체 또는 박테리아 인공 염색체로부터 유래된다.
추가의 구현예에서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 유도성 고복사 복제 기점을 포함한다.
추가의 구현예에서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 효모 인공 염색체(YAC), 포유류 인공 염색체(MAC), 인간 인공 염색체(HAC), 또는 식물 인공 염색체이다.
추가의 구현예에서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 바이러스 벡터이다.
추가의 구현예에서, 엔도뉴클레아제는 수령체 세포의 올리고뉴클레오타이드에 의해 코딩된다.
추가의 구현예에서, 엔도뉴클레아제는 공여체 플라스미드의 올리고뉴클레오타이드에 의해 코딩된다.
추가의 구현예에서, 엔도뉴클레아제는 호밍 엔도뉴클레아제이다.
추가의 구현예에서, 엔도뉴클레아제는 RNA 가이드 DNA 엔도뉴클레아제이다.
추가의 구현예에서, 엔도뉴클레아제는 HO이다.
추가의 구현예에서, 방법은 공여체 플라스미드를 단리하는 단계를 추가로 포함한다.
추가의 구현예에서, 방법은 수령체 플라스미드를 단리하는 단계를 추가로 포함한다.
추가의 구현예에서, 방법은 재조합 수령체 플라스미드를 단리하는 단계를 추가로 포함한다.
추가의 구현예에서, 방법은 서열분석된 올리고뉴클레오타이드를 단리하는 단계를 추가로 포함한다.
추가의 구현예에서, 공여체 세포 또는 수령체 세포는 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드를 포함한다.
추가의 구현예에서, 공여체 세포 또는 수령체 세포는 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드를 포함한다.
추가의 구현예에서, 공여체 세포 또는 수령체 세포는 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드를 포함한다.
추가의 구현예에서, 공여체 세포, 수령체 세포, 또는 재조합 수령체 세포는 제3 정렬된 어레이, 제4 정렬된 어레이, 또는 후속 정렬된 어레이 상의 위치로 전달된다.
추가의 구현예에서, 공여체 세포 및 수령체 세포는 독립적으로 박테리아 세포이다.
추가의 구현예에서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 40개 뉴클레오타이드 길이이다.
추가의 구현예에서, 바코드 서열은 약 15개 뉴클레오타이드 길이이다.
본원에 기술된 예 및 구현예는 단지 예시의 목적이며 이에 비추어 다양한 수정 또는 변화가 기술분야에 숙련된 사람에게 제시될 것이며 본 출원의 사상 및 범위 및 첨부된 청구범위의 범주 내에 포함될 것으로 이해된다. 본원에서 인용된 모든 출판물, 특허, 및 특허 출원은 모든 목적에 대해 전체 내용이 참조로 본원에 포함된다.
실시예
실시예 1: 생체내 DNA 스티칭 방법
박테리아 스트레인: BUN20[△lac-169 rpoS(Am) robA1 creC510 hsdR514 △uidA(MluI):pir-116 endA(BT333) recA1 F'(lac+ pro+ △oriT:tet)]를 공여체 스트레인으로서 사용하였다(Li, M. et al. Nat. Genet. 37, 311-319 (2005)). BW23474: [△lac-169 rpoS(Am) robA1 creC510 hsdR514 △uidA(MluI):pir-116 endA(BT333) recA1]를 모든 공여체 플라스미드의 클로닝 및 증식을 위한 숙주 스트레인으로서 사용하였다(Haldimann, A. et al. Proc. Natl. Acad. Sci. 93, 14361(1996)). BW28705[lacIQ rrnB3 △lacZ4787 hsdR514 △(araBAD)567 △(rhaBAD)568 galU95 △endA9:FRT △recA635:FRT] 또는 RE1133(Egbert et al., Nucleic Acids Research, vol. 47(6), 08 April 2019, Pages 3244-3256) [cmR::mutS pTet2-gam-bet-exo-dam/tetR::bioA/B ilvG+ dnaG.Q576A lacIQ1 Pcp8-araE △araBAD pConst-araC △recJ △xonA Pkm-cymR-Cas9::bioC]을 생체내 스티칭을 위한 수령체 스트레인으로서 사용하였다. DH5α 및 DH10β를 수령체 플라스미드를 클로닝하는데 사용하였다.
제1 및 제2 단계 PCR에 사용된 DNA 올리고뉴클레오타이드를 표 1 및 2에 제공한다.
배지 및 화학물질: 복합 배지로서 루리아-베르타니(LB) 브로스(1% 중량/부피 트립톤, 0.5% 중량/부피 효모 추출물, 1% 중량/부피 NaCl)를 공여체 및 수령체 플라스미드의 클로닝 및 성장을 위해 일상적으로 사용하였다. 플라스미드를 유지하기 위하여, 항생물질을 표 3에 열거된 농도로 첨가하였다. 하이그로마이신을 포함한 LB 배지의 경우, 하이그로마이신이 염 민감성이기 때문에 0.5% 중량/부피 염화 나트륨을 사용하였다. L-아라비노스(0.2% 중량/부피), L-람노스(0.2% 중량/부피) 안하이드로테트라사이클린(100 ng/ml), 4-아이소프로필벤조산(쿠메이트; 15 ug/ml), 및 아이소프로필 β-d-1-티오갈락토피라노시드(IPTG; 500 uM)를 사용하여 ParaBAD, PrhaBAD, PTet2, Pkm-cymR, 및 PlacIQ 프로모터를 각각 유도하였다. 수크로스 아가 플레이트(0.5% 중량/부피 효모 추출물, 1% 중량/부피 트립톤, 6% 중량/부피 수크로스, 1.5% 아가) 및 적절한 양의 항생물질을 사용하여 SacB 역선택성 마커에 대해 선택하였다. Cl-Phe 아가 플레이트(0.5% 중량/부피 효모 추출물, 1% 중량/부피 NaCl, 0.4% 중량/부피 글리세롤, 2% 중량/부피 아가, 10 mM D, L-p-Cl-Phe) 및 적절한 양의 항생물질을 PheS Gly294의 역선택에 사용하였다. YEG 아가 플레이트(0.5% 중량/부피 효모 추출물, 1% 중량/부피 NaCl, 0.4% 중량/부피 글루코스, 2% 중량/부피 아가) 및 적절한 양의 항생물질을 PheS Gly294 단편을 함유한 수령체 플라스미드의 하위클로닝에 사용하였다.
생체내 DNA 스티칭에 사용된 플라스미드 서열은 표 4에서 찾아볼 수 있다.
생체내 DNA 스티칭 시스템의 구성: 헬퍼 플라스미드 및 숙주 수령체 스트레인의 구성. 관련된 MAGIC 클로닝 시스템(Li, M. et al. Nat. Genet. 37, 311-319 (2005))에서, 수령체 세포는 유도성 λ 레드 및 온도 민감성 복제 기점(pSC101-oriTS)을 가지고 있는 헬퍼 플라스미드 pML300을 함유하고 있다. MAGIC 수령체 세포는 또한 게놈으로 통합된 유도성 I-SceI 엔도뉴클레아제 대립유전자를 가진다. 반복적인 절단 및 상동 재조합을 실행하기 위하여, λ 레드 및 Cas9를 함유하고 있는 상이한 헬퍼 플라스미드가 필요하다. 그러한 헬퍼 플라스미드를 구성하기 위하여, pML300을 먼저 소화시키고 HindIII 및 NheI를 통해 다중 클로닝 부위(MCS)에 결찰시켜 pSL270을 초래하였다. araC-ParaBaAD-Cas9를 함유하고 있는 1개의 DNA 단편을 Gibson 조립을 사용하여 구성한 후, PacI 및 XhoI 제한 부위를 사용하여 pSL270에 클로닝하여 헬퍼 플라스미드 pSL359를 생성하였다. 이 플라스미드는 람노스 유도성 λ 레드 재조합 시스템(PrhaBAD 레드), 아라비노스 유도성 엔도뉴클레아제(ParaBAD-Cas9), pSC101-orits, 및 스펙티노마이신 내성 마커(SpR)를 함유한다. 그런 후 pSL359를 BW28705에 형질전환시켜서 수령체 숙주 세포 BW28705/pSL359를 생성하였다. 대체 수령체 스트레인으로서, RE1133(Egbert et al. Nucleic Acids Research, vol. 47(6) 08 April 2019, Pages 3244-3256) [cmR::mutS pTet2-gam-bet-exo-dam/tetR::bioA/B ilvG+ dnaG.Q576A lacIQ1 Pcp8-araE △araBAD pConst-araC △recJ △xonA Pkm-cymR-Cas9::bioC]을 헬퍼 플라스미드 없이 사용하였다. RE1133은 테트라사이클린 유도성 λ 레드 재조합 시스템(pTet2-gam-bet-exo-dam/tetR::bioA/B) 및 쿠메이트 유도성 Cas9 엔도뉴클레아제(Pkm-cymR-Cas9::bioC)를 함유한다.
교환 카세트의 구성: 교환 카세트는 공여체 및 수령체 플라스미드 상에서 DNA 교환에 참여하는 DNA 구간으로서 정의된다: 수령체 플라스미드 상의 카세트는 상동 재조합을 통해 공여체 플라스미드 상에서 원래 발견되는 카세트에 의해 대체된다. 생체내에서 카세트 교환을 반복적으로 선택하기 위하여, 각각의 카세트는 선택 가능한 및 역선택성 마커 모두를 함유하도록 조작된다. 공여체 카세트의 선택성 마커 및 수령체 카세트의 역선택성 마커는 모든 라운드에서 필요하다. 그러한 이중 선택 전략을 실행하기 위하여, 2개의 상이한 선택 카세트를 다음의 공급원으로부터 표준 클로닝 방법에 의해 구성하였다: 1) PheS Gly294(D,L-p-Cl-Phe 민감성)(Kast, P. Gene 138, 109-114 (1994)), 2) SacB(수크로스 민감성)(Pelicic, V. et al. J. Bacteriol. 178, 1197-1199 (1996)), 3) EM7 박테리아 프로모터와 함께 HygR(하이그로마이신 내성)(Gritz, L et al. Gene 25, 179-188 (1983)), 4) NsrR(누르세오트리신 내성) Gene 62, 209-217(1988). 한 카세트는 PheS Gly294 및 NsrR을 함유하도록 구성하였고, 제2 카세트는 HygR 및 SacB를 함유하도록 구성하였다. 생체내 시스템을 특성화하기 위하여 많은 실험을 수행하기 위하여 여러 다른 선택 카세트를 또한 구성하였다: 5) ZeoR(제오신 내성)(Drocourt, D. Nucleic Acids Res. 18, 4009-4009 (1990)), 6) ampR(암피실린 내성), 및 7) CmR(클로람페니콜 내성). 일부 경우에, 한 카세트는 PheS Gly294 및 NsrR을 함유하도록 구성하였고, 제2 카세트는 HygR 및 SacB를 함유하도록 구성하였다.
공여체 및 수령체 벡터를 위한 백본의 구성: 공여체 벡터를 다음의 중요한 구성요소를 함유하도록 구성하였다: kanR, oriT, R6K oriγ, 및 강력한 박테리아 프로모터 J23119에 의해 구동되는 구성성 gRNA 발현 카세트(Standage-Beier, K. Et al ACS Synth. Biol. 4, 1217-1225 (2015)). 교환 영역을 T1(F)-H1-T2(R)-T2(F)-H3-T1(R) 단편이 생성되도록 재구성하였고, 여기서 T1(5'-GGGGCCACTAGGGACAGGATtgg-3'(서열 번호: 37)) 및 T2(5'-CAGGCGGGCTCACCTCCGTGtgg-3'(서열 번호: 38))는 CRISPR-Cas9 절단을 위한 2개의 고유한 표적 서열이고, H1(5'-CGAGGGCTAGAATTACCTACCGGCCTCCACCATGCCTGCG-3'(서열 번호: 39)), 및 H3(5'-GTACGGGCAACCCGAGAAGGCTGAGCCTGGACTCAACGGGTTGCTGGGTGGACTCCAGACTCGGGGCGACGACTCTTCACGCGCAGAGCAAGGGCGTCGAGCGGTCGTGAAAGTCTTAGTACCGCACGTGCCGACTCACTGGGGATATTGCCTGGAGCTGTACCGTTCTAGGGGGGGGAGGTTGGAGACCTCCTCTTCTCACGACTGGACCCGCGAGGGCCGCGTTGCCGGTTCCCCCAGAGGCTGAAGAACAAGGGCTTACTGTGGGCAGGGGGACGCCCATTCAGCGGCTGGCGCTTT-3'(서열 번호: 40))은 상동 재조합을 위한 상동성 부위이며, (F) 및 (R)은 DNA 단편이 정방향 또는 역방향(역보체)으로 포함되는지의 여부를 나타낸다. 선택 카세트(HygR-SacB 또는 NsrR-PheS)는 T2(R)와 T2(F) 사이에 삽입되어 스티칭 준비가 된 공여체 플라스미드를 생성한다. 일부 경우에, 공여체 플라스미드의 교환 영역을 T1(R)과 T1(F) 사이에 삽입된 선택 카세트(HygR-SacB 또는 NsrR-PheS)가 있는 T2(F)-T1(R)-T1(F)-H3-T2(R) 단편을 생성하도록 재구성하였다. gRNA 표적 부위는 둘 다 이중 가닥 절단 유전자좌와 상동성 영역 사이의 거리가 가능한 짧은 것을 보장하기 위하여 적절한 방향으로 위치한다. H3은 모든 조립 라운드에서 하나의 상동성 팔(arm)로서 사용되는 300 bp 합성 DNA 단편이다. H1은 생체내 스티칭의 제1 라운드에서 사용되는 상동성 영역이며 공여체 백본에 통합되거나 스티칭된 제1 올리고뉴클레오타이드의 부분으로서 도입될 수 있다. 다른 상동성 영역(H2, H4, H5, 등)은 공여체 플라스미드에 후속 올리고뉴클레오타이드의 일부로서 도입되고, 어셈블리의 이전 올리고뉴클레오타이드의 상동성 영역과 중첩되어 매끄러운 스티칭을 가능하게 한다. 진입 수령체 벡터는 선택성 마커(GmR) 복제 기점(ColE1)을 함유한다. 교환 영역은 H1-T1(R)-T1(F)-H3 구성으로 변형되고 선택 카세트(HygR-SacB 또는 NsrR-PheS)는 T1(R)과 T1(F) 사이로 클로닝되었다.
엔도뉴클레아제 절단 및 상동 재조합 효율의 테스트: CRISPR/Cas9 시스템이 정확한 DNA 절단을 제공하고 상동 재조합을 촉진하는지의 여부를 테스트하기 위하여, 스티칭 작동을 표적화 gRNA, Cas9, 및 λ레드의 존재 또는 부재 하에 완료하였다. 수령체 플라스미드, pSL402를 3개의 상이한 수령체 숙주 세포에 형질전환하여: 1) BW28705/pSL402(-λ레드/-Cas9), 2) BW28705/pML300/pSL402(+λ레드/-Cas9), 3) BW28705/pSL359/pSL402(+λ레드/+Cas9)를 구성하였다. 그런 후 2개의 상이한 공여체 플라스미드, pSL414 및 pSL415를 BUN20에 형질전환하여, 각각 기능성 및 mock gRNA 단위를 함유하는 BUN20/pSL414 및 BUN20/pSL415를 생성하였다. 2개의 공여체 스트레인의 각각을 위에서 기술된 3개의 상이한 유형의 수령체 세포의 각각 하나와 짝을 지었다. 그런 후 세포를 희석하고 선택 플레이트(Cl-Phe + Gm + Cm + 0.2% 글루코스) 상에 플레이팅하여 37℃에서 밤새 재조합 클론을 회수하였다. 콜로니를 계수하여 재조합 사건을 정량화하였다.
액체에서 mEGFP 유전자의 조립: mEGFP 유전자의 3개의 단편을 PCR에 의해 생성하였다. 구성성 프로모터 pJ23100, 리보솜 결합 부위, 및 뉴클레오타이드 1-251을 함유한 제1 단편을 공여체 백본에 클로닝하여 pSL485를 생성하였다. 뉴클레오타이드 198 - 517을 함유한 제2 단편을 공여체 벡터에 클로닝하여 pSL486을 생성하였다. 뉴클레오타이드 454 - 720 및 rrnB T1 터미네이터를 함유한 제3 단편을 공여체 벡터에 클로닝하여 pSL488을 생성하였다. 전부 3개의 공여체 벡터를 BUN20에 형질전환하고 LB + Kan 플레이트 상에서 밤새 37℃에서 성장시켰다. 진입 수령체 벡터 pSL398을 BW28705/pSL359에 형질전환하고 겐타마이신, 스펙티노마이신 및 글루코스를 함유한 LB 아가 플레이트 상에서 성장시켰다. 공여체 BUN20/pSL485(D1) 및 수령체 BW28705/pSL359/pSL398(R0)의 클론을 적절한 액체 배지에서 각각 37℃ 및 30℃에서 밤새 성장시켰다. 그런 후, 공여체 및 수령체 모두로부터 세포(1 ml)를 회전시키고, 혼합하고, 1 ml의 사전 가온된 LB + Ara + Rha 액체 배지에 재현탁하였다. 약 4시간 동안 30℃에서 흔들림 없이 인큐베이션한 후에, 짝짓기 배양에서 연속 희석을 수행하였고 세포를 6% Suc + Carb + Gm + Sp + 0.2% 글루코스 상에 플레이팅하여 재조합체(R1)를 선택하였다. 콜로니 PCR을 수행하여 정확한 R1 클론을 확인한 후, 그것으로 LB + Gm + Sp + 0.2% 글루코스에 30℃에서 밤새 접종하였다. 그런 후, pSL486(D2)을 함유한 새롭게 배양된 공여체 세포를 회전시키고, 혼합하고, R1과 함께 액체 짝짓기 배지에 30℃에서 약 4시간 동안 재현탁하였다. 재조합 클론을 Cl-Phe + Hyg + Gm + Sp + 0.2% 글루코스 상에 플레이팅함으로써 선택하였다. 콜로니 PCR에 의해 확인된 정확한 클론(R2)을 LB + Gm + Sp + 0.2% 글루코스에서 30℃에서 밤새 성장시켰다. 이전 라운드에서와 같이, D3(BUN20/pSL488) 및 R2 세포를 혼합하여 액체 짝짓기 배지에 재현탁하였다. 연속 희석을 수해하고 세포를 6% Suc + Carb + Gm + Sp + 0.2% 글루코스 상에 플레이팅하였다. 각각의 조립 라운드로부터의 플레이트를 UV 광 하에 이미지화하여 GFP 형광 콜로니의 비율을 계산하였다. 각각의 조립 라운드 후에, 선택된 콜로니를 취하고 플라스미드를 진단적 제한 소화 및 Sanger 서열분석을 위해 정제하였다.
스티칭에 미치는 상동성 길이의 영향의 테스트: 스티칭 정확성에 미치는 상동성 길이의 영향을 테스트하기 위하여, 일련의 플라스미드를 pSL486에서 제2 mEGFP 단편에 대해 상이한 크기로 상동성이 되도록 구성하였다: 1) pSL684(0 bp), 2) pSL685(10 bp), 3) pSL510(20 bp), 4) pSL511(30 bp), 5) pSL512(40 bp), 6) pSL681(53 bp). 이들 플라스미드를 pSL488(63 bp)과 함께 공여체 숙주 세포에 형질전환하여 R2를 함유하는 수령체 세포와 짝을 이루는 D3의 그룹을 구성하였다. 각각의 짝짓기 쌍으로부터의 세포를 희석하여 선택 플레이트(6% Suc + Carb + Gm + Sp + 0.2% 글루코스) 상에 플레이팅하였다. 콜로니를 밤새 회수하고 UV 광 하에서 조사하여 형광을 관찰하였다. 형광 및 비형광 콜로니의 수를 계수하여 정확한 어셈블리의 백분율을 계산하였다.
mEGFP의 배열된 어셈블리: 모든 스트레인을 384 포맷으로 아가 플레이트 상에 배열하였다. 먼저, BUN20/pSL1065(D1) 및 BW28705/pSL359/pSL1060(R0)을 배열하고 SINGER ROTOR HDA를 사용하여 사전 가온된 짝짓기 플레이트(LB + Ara + Rha) 상에서 함께 혼합하고, 30℃에서 약 5시간 동안 성장시켰다. 그런 후 짝을 이룬 세포를 제1 선택 플레이트(Cl-Phe + Hyg + Gm + Sp + 0.2% 글루코스) 상으로 전달하였다. 재조합 클론(R1)을 30℃에서 밤새 풍부하게 한 후, 사전-짝짓기 플레이트(LB + Hyg + Gm + Sp + 0.2% 글루코스) 상으로 전달하였는데, 그것은 다음 라운드를 위해 조립된 플라스미드의 성장을 최적화한다. 그런 후 BUN20/pSL1062(D2)의 신선한 밤샘 어레이를 짝짓기 플레이트 상에서 R1과 짝을 이루도록 하였다. 그런 후 짝을 이룬 세포를 제1 선택(LB + Nat + Gm + Sp + 0.2% 글루코스)으로 전달하여 30℃에서 밤새 재조합 클론을 선택하였다. 그런 후 선택된 클론(R2)을 사전-짝짓기 플레이트(6% Suc + Nat + Gm + Sp + 0.2%글루코스) 상에 저달하였다. 그런 후 BUN20/pSL1066(D3)의 신선한 밤샘 어레이를 짝짓기 플레이트 상에서 R2와 짝을 이루도록 하였다. 조립 생성물(R3)을 Cl-Phe + Hyg + Gm + Sp + 0.2% 글루코스 상에서의 선택 후 LB + Hyg + Gm + Sp + 0.2% 글루코스 상에서의 선택에 따라 선택하였다. 각각의 조립 라운드로부터의 플레이트를 UV 광 하에 UV 투과조명기 상에서 이미지화하여 GFP 형광을 모니터링하였다. 조립 과정 동안, 선택된 클론을 취하고 플라스미드를 진단적 제한 소화 및 Sanger 서열분석을 위해 정제하였다.
풀링된 올리고뉴클레오타이드를 사용한 12개 유전자의 배열된 어셈블리: 9개의 상이한 세린/티로신 재조합효소 및 3개의 상이한 형광단(mPapaya, mPlum, sfGFP)을 조립을 위해 선택하였다. 각각의 유전자 조립에 필요한 올리고뉴클레오타이드의 목록을 생성하기 위하여, 합성된 올리고뉴클레오타이드 길이, 인접한 올리고 사이의 최소 상동성 중첩 길이, 및 최대 상동성 중첩 길이를 포함하는 사용자 정의 변수와 함께, 합성될 유전자를 함유한 FASTA 파일을 입력하고 상업적 공급처(IDT oPool)로부터 주문될 올리고뉴클레오타이드 목록을 출력하는 파이썬 스크립트(python script)를 작성하였다. DNA 헤어핀 및/또는 반복부는 상동 재조합 기계를 간섭하고 조립 충실도를 감소시킬 수 있지만, 이 효과에 대한 정량적 연구가 알려진 것은 없다. 그러므로, 각각의 유전자에 대해, 이들 영역을 Primer3 파이썬 연장(Untergasser, A. et al. Nucleic Acids Res. 35, W71-W74 (2007)) 및 뉴클레오타이드 분포 균일성 계량기를 사용하여 확인하였다. 각각의 뉴클레오타이드 위치에 점수를 매기고, 만약 더 작은 상동성 영역이 간섭 요소를 함유할 가능성이 있다면 사용자 정의 한계값을 사용하여 상동성 영역을 연장시킨다. 각각의 유전자 조립에 필요한 올리고뉴클레오타이드를 결정한 후에는, 각각의 단부 상에 올리고뉴클레오타이드를 공여체 벡터 및 라운드 특이적 프라이밍 부위에 클로닝하기 위해 사용되는 제한 부위(NotI 및 AscI)를 첨가한다. 프라이밍 부위는 특정 라운드의 병렬 유전자 조립으로부터의 올리고뉴클레오타이드가 함께 증폭되고 생체내 파싱 플랫폼에 의해 파싱되는 것을 허용한다. 라운드 특이적 프라이머는 큰 올리고뉴클레오타이드 풀에서 사용될 때 이전에 프라이머간 교차 반응성의 가능성을 감소시키도록(바람직하지 않은 PCR 생성물의 수를 저하시키도록) 설계되었던 프라이머 목록으로부터 선택된다(Kosuri, S. et al. Nat. Biotechnol. 28, 1295-1299 (2010)). 이 파이썬 스크립트를 사용하여, 각각의 유전자를 후속 올리고뉴클레오타이드 사이에서 50-70 bp의 상동성을 가지는 5개의 약 300 bp 올리고뉴클레오타이드로 나누었다. PCR 증폭된 올리고뉴클레오타이드를 제한 소화 및 결찰을 사용하여 공여체 플라스미드에 삽입하였다. 각각의 유전자의 제1 라운드의 조립을 위해, 올리고뉴클레오타이드를 증폭시키고 진입 수령체 플라스미드 pSL1060의 출발 영역에 상동인 40 bp 출발 H1 영역을 포함하고 있는 공여체 백본 pSL1064에 클로닝하였다. 추가의 홀수 라운드의 스티칭(예컨대 3, 5, 7, 9)에 첨가될 올리고뉴클레오타이드를, H1 상동성 영역이 없는 것을 제외하고 pSL1064와 동일한 요소를 함유하고 있는 pSL1063에 클로닝하였다. 짝수 라운드의 스티칭(예컨대 2, 4, 6, 8)에 첨가될 올리고뉴클레오타이드를 pSL1071에 클로닝하였다. PCR 증폭된 올리고뉴클레오타이드 및 공여체 플라스미드를 AscI 및 NotI로 4시간 동안 37℃에서 소화시켰다. 그런 후 소화된 생성물을 크기별로 선택하고 Zymoclean Gel DNA 회수 키트를 사용하여 겔 추출을 통해 정제하였다. 0.02 pmol의 소화된 공여체 플라스미드 및 0.06 pmol의 소화된 올리고뉴클레오타이드를 1 ul의 T4 결찰효소와 혼합하고 22℃에서 1시간 동안 인큐베이션함으로써 결찰시켰다. 결찰된 공여체 플라스미드을 표준 박테리아 형질전환 프로토콜을 사용하여 BUN20 공여체 스트레인에 전달하였다. 2 ul의 결찰 생성물을 50 ul의 화학적으로 적격인 BUN20 공여체 스트레인에 첨가하였다. 그런 후 혼합물을 얼음에서 30분 동안 인큐베이션하고, 42℃에서 30초 동안 열충격을 가하고, 얼음에서 다시 3분 동안 인큐베이션하였다. 세포를 950 ml의 NEB SOC 회수 배지에 재현탁하고 37℃에서 1시간 동안 회수하였다. 그런 후 세포를 선택 플레이트(홀수 라운드의 공여체 플라스미드의 경우 LB + Hyg, 짝수 라운드의 공여체 플라스미드의 경우 LB + Nat) 상에 플레이팅하고 37℃에서 밤새 인큐베이션하였다. 결과적으로 생성된 클로닝된 올리고뉴클레오타이드를 함유한 콜로니를 무작위로 선택하여 96 웰 플레이트에 배열하였다. 배열된 올리고뉴클레오타이드 라이브러리를 파싱하고 생체내 DNA 파싱 시스템을 사용하여 서열을 검증하였다. 각각의 플레이트를 2개의 상이한 수령체 바코드 플레이트와 짝을 이루었다. 홀수 조립 라운드의 올리고뉴클레오타이드 플레이트의 경우, 공여체 백본(pSL1063 또는 pSL1064)은 HygR-SacB 카세트를 함유한다. LB + Ara + IPTG 아가 상에서 약 3시간 동안 37℃에서 BPS 수령체 어레이와 짝을 이룬 후, 재조합 플라스미드를 LB + Hyg + Gm + Rha + Ara 플레이트 상에서 37℃에서 밤새 선택하였다. NsrR-PheS 카세트를 함유한 짝수 라운드 올리고뉴클레오타이드 어레이의 경우, 재조합 플라스미드를 BPS 수집과 짝을 이룬 후 LB + Nat + Gm + Rha + Ara 플레이트 상에서 37℃에서 밤새 선택하였다. 12개의 유전자를 조립하기 위하여, 제1 라운드 올리고뉴클레오타이드를 운반하는 BUN20 공여체 스트레인을 먼저 pSL1086 수령체 플라스미드를 운반하는 RE1133 수령체 스트레인과 짝을 이루었다. 50 ul의 각각의 밤샘 배양을 혼합하고, 8000 rpm에서 1분 동안 회전시키고, 50 ul의 LB에 재현탁하고, 37℃에서 30분 동안 인큐베이션하였다. 그런 후 짝을 이룬 세포를 LB+aTC+쿠메이트 플레이트 상에 플레이팅하고 4시간 동안 37℃에서 인큐베이션하여 Cas9 및 λ 레드를 유도하였다. 제1 라운드 올리고뉴클레오타이드와 함께 재조합 수령체 플라스미드를 포함하는 세포를 단리하기 위하여, 짝을 이룬 세포를 LB+Hyg+Gm+IPTG 아가 플레이트 상에 스트리킹하여 밤새 37℃에서 인큐베이션하였다. 임의의 재조합되지 않은 공여체 플라스미드는 공여체 플라스미드 상의 R6Kγ 기점이 pir+ RE1133 수령체 스트레인 배경에서는 비기능적이기 때문에 빠르게 제거한다. 선택 플레이트로부터의 콜로니를 LB+Hyg+Gm+IPTG+4CP 상에서 선택함으로써 추가로 정제하여 남아 있는 비재조합 pSL1086 수령체 플라스미드를 제거하였다. 제2 라운드의 올리고뉴클레오타이드를 조립하기 위하여, 제1 라운드 올리고뉴클레오타이드와 함께 재조합 수령체 플라스미드를 운반하는 정제된 콜로니를 그 다음으로 제2 라운드 올리고뉴클레오타이드를 운반하는 BUN20 공여체 스트레인과 짝을 이루게 하였다. 재조합 수령체 플라스미드를 운반하는 세포를 LB+Nat+Gm+IPTG 상에서 선택하고 LB+Nat+Gm+IPTG+6% 수크로스 상에서 추가로 정제하는 것을 제외하고 제1 조립과 동일한 과정을 사용하였다. 모든 후속 조립 단계에 대해, 홀수 라운드 조립을 위한 선택에 대해 LB+Hyg+Gm+IPTG+6% 수크로스를 사용하고 짝수 라운드 조립을 위한 선택에 대해 LB+Nat+Gm+IPTG를 사용하면서 동일한 조립 과정을 사용하였다. 이 과정을 12개의 모든 유전자가 완전히 조립될 때까지 5회 반복하였다(도 7g). 조립된 생성물의 서열을 Sanger 서열분석(도 7h) 및 Oxford 나노포어 MinION 서열분석기를 사용하여 정확한 서열인 것으로 검증하였다.
9 kb 단편의 조립: BY4741 사카로미세스 세레비시에 스트레인의 염색체 II 위치 41489 내지 50489로부터의 9 kb DNA 블록을 조립하였다. 12개 유전자의 조립을 위해 사용된 것과 동일한 파이썬 스크립트를 사용하여, 9 kb 블록을 후속 DNA 블록 사이에 50-75 bp의 상동성을 가진 3개의 약 3 kb DNA 블록으로 나누었다. 이들 3개의 DNA 블록을 DNA 주형으로서 효모 스트레인 BY4741로부터의 게놈 DNA를 사용하여 PCR 증폭시켰다. 게놈 DNA를 MasterPure 효모 DNA 정제 키트를 사용하여 추출하였다. 제1, 제2, 및 제3 DNA 블록을 AscI/NotI 제한 소화 및 T4 결찰을 사용하여 각각 공여체 플라스미드 pSL1064, pSL1063, 및 pSL1107에 삽입하였다. 결과적으로 생성된 결찰된 생성물을 그런 후 표준 박테리아 형질전환 프로토콜을 사용하여 BUN20 공여체 스트레인에 형질전환하였다. 공여체 플라스미드를 Sanger 서열분석을 사용하여 서열 검정한 후, DNA 블록을 RE1133/pSL1086 수령체 스트레인에서 조립하였다. 제1 DNA 블록을 운반하는 공여체 스트레인은 RE1133/pSL1086과 짝을 이루었고 LB+aTC+쿠메이트 상에서 37℃에서 4시간 동안 성장시켰다. 재조합 수령체 플라스미드를 운반하는 세포를 LB+Hyg+Gm+IPTG 상에서 선택하고 LB+Hyg+Gm+IPTG+6%수크로스 상에서 추가로 정제하였다. 결과적으로 생성된 콜로니를 그런 후에 제2 블록을 운반하는 공여체 스트레인과 짝을 이루어, LB+Nat+Gm+IPTG 상에서 재조합 수령체 플라스미드에 대해 선택하고, LB+Nat+Gm+IPTG+4CP 상에서 정제하였다. 마지막으로, 결과적으로 생성된 콜로니를 제3 DNA 블록을 운반하는 공여체 스트레인과 짝을 이루고, LB+Hyg+Gm+IPTG 상에서 재조합 수령체 플라스미드에 대해 선택하고, LB+Hyg+Gm+IPTG+6% 수크로스 상에서 정제하였다. 그런 후 조립된 생성물의 서열을 Oxford 나노포어 MinION 서열분석기 및 겔 전기영동(도 7i)을 사용하여 예상된 서열인 것으로 검증하였다.
올리고뉴클레오타이드 라이브러리를 파싱하기 위한 암플리콘 서열분석: 재조합 플라스미드를 추출하기 위하여, 세포를 선택 플레이트로부터 스크래핑하고 플라스미드 플러스 미니 키트(QIAGEN)를 사용하여 미니를 제조하였다(mini prepped). 그런 후 플라스미드 DNA를 정량화하고 약 1 ng/μl로 희석하였는데, 이것은 96 배열된 짝짓기 플레이트 상에서 고유한 바코드-바코드 쌍당 대략 1.5e6 복사물이다. 2 단계 PCR을 변형을 포함하여 기술된 것과 같이 수행하였다(Levy, S. F. et al. Nature 519, 181-186 (2015)). 먼저, OneTaq 중합효소(New England Biolabs)를 포함한 4-5 사이클의 PCR을 표 1에 열거된 정방향(pBPS_fwr) 및 역방향(pBPS_rev) 프라이머를 사용하여 수행하였다. 약 1 ng의 재조합 플라스미드 DNA를 단일 50 μl PCR 반응에서 증폭시켰다. 제1 단계 PCR에 대한 프라이머는 이 일반 구성을 가진다:
pBPS_fwr:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNXXXXXXttcggttagagcggatgtg(서열 번호: 41)
pBPS_rev:
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCNNNNNNNNXXXXXXXXXaggtaacccatatgcatggc(서열 번호: 42).
이들 서열에서 N은 임의의 무작위 뉴클레오타이드에 상응하며 PCR 잭팟팅(jack-potting)에 의해 유발된 카운트에서의 왜곡을 제거하기 위해 하류 분석에서 사용된다. X는 여러 다중화 태그(예를 들어, 위의 표 1에서의 다중화 태그) 중 하나에 상응하며, 동일한 서열분석 유동 세포 상에 로딩될 때 상이한 샘플이 구별되는 것을 허용한다. 다중화 태그의 예는 표 1에서 밑줄이 그어진 서열이다. 소문자 서열은 재조합 플라스미드 상의 프라이밍 부위에 상응한다. 대문자 서열은 Illumina Read 1 또는 Read 2 서열분석 프라이머에 상응한다. PCR 생성물을 NucleoSpin 칼럼(Macherey-Nagel)을 사용하여 정제하고 33 μl 물에 용출하였다. 제2의 23-25 사이클 PCR을 PrimeStar HS 중합효소(Takara)를 사용하여 수행하였으며, 제1 PCR로부터의 33 μl의 세정된 생성물을 주형으로서 사용하였고 튜브당 총 부피는 50 μl였다. 이 반응에 대한 프라이머는 표 2에 열거된 표준 Illumina TruSeq 이중 인덱스 프라이머(D501-D508 및 D701-D712)였다. 그런 후 PCR 생성물을 NucleoSpin 칼럼을 사용하여 세정하였다. 각각의 짝짓기 플레이트로부터의 암플리콘을 Illumina 표준 인덱스뿐만 아니라 맞춤형 다중화 태그로 고유하게 표지화하였다. 이 4중 인덱싱된 전략은 서열분석 라이브러리의 다중화 용량을 증가시킬뿐만 아니라 암플리콘 키메라에 대한 하류 분석에도 유익할 것이다. 세정된 암플리콘을 모아서 25% PhiX DNA 스파이크인과 함께 Illumina MiSeq(2 X 300 bp) 상에서 쌍을 이룬 단부를 서열분석하였다. 서열분석 판독을 바텐더(Bartender)를 사용함으로써 바코드로 클러스터링하였다(Zhao, L., Bioinformatics 34, 739-747 (2017)).
반복적인 생체내 스티칭 기술의 설계: 생체내 스티칭 시스템은 박테리아 콘쥬게이션 기계 및 람다 레드 상동 재조합의 장점을 취한다. 공여체 벡터는 유전자 pir1 또는 그것의 이완된 복사물 수 제어 버전인 pir1-116(Metcalf, W. Gene 138, 1-7 (1994))에 의해 코딩된 기능적 트랜스 작용 인자 π에 따라 달라지는 R6K oriγ로부터의 조건부 복제 기점을 함유한다. 이 특수한 기점은 플라스미드가 게놈상으로 통합된 pir116 대립유전자(예컨대 BUN20)를 가지고 있는 공여체 숙주 세포에서 유지되는 것을 허용하지만, 이 대립유전자가 없는 수령체 세포에서는 그렇지 않다. 공여체 벡터의 다른 중요한 특징에는 oriT, 백본 마커(kanR), 구성적 gRNA 발현 카세트(gRNAT1 또는 gRNAT2), 및 교환 영역이 포함된다. 교환 영역 내에는, 각각의 스티칭 라운드를 위한 2 쌍의 고유한 gRNA 표적 부위, 이중 선택 가능한 카세트, 및 공통의 긴 상동성 서열(300 bp)이 있다.
진입 수령체 벡터는 복제 기점(ColE1 또는 pLacIQ-p15A), 백본 마커(GmR), 및 상동성 서열, 2개의 gRNA 표적 부위 및 이중 선택 가능한 카세트로 이루어진 교환 영역을 함유한다. 일부 수령체 숙주 세포는 람노스 유도성 λ 레드 재조합 시스템 및 아라비노스 유도성 Cas9 엔도뉴클레아제를 함유한 헬퍼 플라스미드를 가진다. 복제 기점의 온도 민감성 돌연변이 유도체(pSC101-oriTS)는 조립이 완성될 때 42℃에서 헬퍼 플라스미드를 경화시키는 편리한 수단을 제공한다(Hashimoto, T. J. Bacteriol. 127, 1561-1563 (1976)). 다른 수령체 숙주 세포(RE1133)는 게놈 상으로 통합된 테트라사이클린 유도성 λ 레드 재조합 시스템 및 쿠메이트-유도성 Cas9 엔도뉴클레아제를 함유한다.
각각의 라운드에서, 공여체 벡터가 수령체 세포에 전달된 후, λ 레드 및 Cas9 모두는 수령체 세포에 따라 아라비노스 및 람노스 또는 쿠메이트 및 테트라사이클린의 존재 하에 유도된다. 구성적으로 발현된 gRNAT1은이중 가닥 절단을 생성하기 위해 Cas9를 공여체 및 수령체 플라스미드 모두에게 안내한다. DNA 절단은 상동 재조합을 크게 자극하는 것으로 나타났다(아래 참고)(Kuzminov, A. Microbiol. Mol. Biol. Rev. 63, 751 (1999)). 공여체로부터의 단편은 관심의 DNA, 다음 라운드의 조립을 위한 2개의 상이한 gRNA 표적 부위, 이중 선택성 마커, 및 H3 상동성 영역을 함유한다. 조립을 위한 DNA는 수령체 플라스미드 상에 정착된 조립된 서열의 처음 50 bp가 마지막 50 bp와 상동하도록 설계된다. 이 50 bp는 이중 교차 상동 재조합을 위한 하나의 상동성 팔로서 작용하며, 다른 것은 H3이다. 이 교환 사건은 공여체로부터의 새로운 DNA를 함유하는 재조합된 수령체 플라스미드를 초래한다. 재조합의 정확성을 보장하기 위해 3회의 상이한 선택이 실행된다: 1) 역선택성 마커(PheS 또는 SacB)에 대한 선택, 2) 양성 선택성 마커(HygR 또는 NsrR)에 대한 선택, 및 3) 수령체 백본 상의 마커(GmR)에 대한 선택. 헬퍼 플라스미드 뿐만 아니라 ParaBAD 및 PrhaBAD 프로모터 또는 Pkm-cymR 및 PTet2 프로모터의 억제에 대한 선택이 또한 과도한 재조합 및 원치 않는 DNA 절단을 방지하기 위해 실행된다. 2개의 상이한 gRNA 및 2개의 상이한 이중 선택 가능한 카세트의 교대 사용은 새로운 DNA 단편을 선형 양식으로 효율적으로 조립하기 위한 반복적인 생체내 스티칭을 가능하게 하여, 원하는 서열을 초래하며 이론적 한계는 허용되는 플라스미드 크기일 뿐이다. 액체 취급 및 다중화된 고정 로봇으로, 이 플랫폼은 고도로 확장 가능하여, 라운드당 수천 개의 병렬 조립을 허용한다.
CRISPR-Cas9는 생체내 스티칭을 효율적으로 자극할 수 있다: CRISPR/Cas9 시스템이 정확한 DNA 절단을 제공하고 상동 재조합을 촉진하는지의 여부를 테스트하기 위하여, 표적화 gRNA, Cas9, 및 λ 레드의 존재 또는 부재 하에 생체내 스티칭을 완료하였다. 전부 3개가 존재할 때 재조합 플라스미드를 회수하였는데(도 3), 이것은 CRISPR/Cas9가 DNA 이중 가닥 절단을 용이하게 하여 λ 레드 재조합 효율을 향상시키는 것을 나타낸다.
액체에서 기능성 형광 유전자의 조립: 다중 단편을 생체내 스티칭 시스템을 사용하여 기능성 유전자로 조립하는 능력을 입증하기 위하여, 3 조각의 mEGFP 유전자를 PCR에 의해 구성하고 적절한 공여체 백본에 클로닝하였다. 그런 후 3개의 단편을 진입 수령체 벡터에 순차적으로 조립하였다. 각각의 라운드 후에, 회수된 클론을 제한 소화 및 Sanger 서열분석 모두에 의해 조사하여 다음 라운드 전에 조립 정확성을 확인하였다. 헬퍼 플라스미드가 각각의 라운드에서 유지된 것을 보장하기 위하여, 콜로니 접촉 PCR 및 플라스미드 추출 모두를 수행하였다. 녹색 형광을 최종 조립 라운드에서 선택 플레이트 상의 모든 콜로니(약 300)에서 관찰하였고, 이것은 조립 충실도가 높은 것을 나타낸다(도 7a-i).
스티칭 충실도에 미치는 상동성 길이의 영향: 생체내 스티칭의 충실도가 단편 사이의 상동성의 길이에 따라 어떻게 달라지는지를 테스트하기 위하여, 제2 단편에 대해 상이한 길이의 상동성을 가진 mEGFP 어셈블리의 제3 단편을 함유한 7개의 공여체 벡터를 구성하였다. 콘쥬게이션 및 재조합 후에, 상이한 콘쥬게이션/재조합 사건으로부터 유래된 세포를 선택 배지 상에 플레이팅하고 형광 콜로니의 분율을 계수하였다. 결과는, 이 실시예에서는, 40 bp의 상동성이 오류가 없는 융합 생성물을 생성할 가능성이 있음을 보여준다(도 7a-7i).
아가 상에서 기능적 형광 유전자의 다중화된 조립: 아가 플레이트 상에서 기능적 유전자를 조립하는 능력을 입증하기 위하여, 3 조각의 mEGFP 유전자를 PCR에 의해 구성하고 적절한 공여체 백본에 클로닝하였다. 그런 후 3개의 단편을 96- 또는 384 핀 방식으로 진입 수령체 벡터에 순차적으로 조립하였다. 최종 조립 라운드 후에 녹색 형광을 96 핀 방식에서 96/96 위치에서 및 384 핀 방식에서 383/384 위치에서 관찰하였고, 이것은 아가 상의 스티칭 충실도가 액체에서와 비슷한 것을 나타낸다(도 7a-7i). 조립 과정에 걸쳐, 플라스미드를 다양한 콜로니로부터 회수하였고(전체 콜로니를 스크래핑함) 제한 소화에 의해 조사하여 조립 정확성 및/또는 헬퍼 플라스미드의 유지를 확인하였다. 조립 최종 생성물의 전형적인 소화 패턴은 임의의 관찰 가능한 원치 않는 생성물(예컨대 비재조합 플라스미드)이 없는 깨끗한 재조합 플라스미드를 나타냈다. 스티칭 충실도를 추가로 특성화하기 위하여, 384 위치 어셈블리로부터 96 위치를 Sanger 서열분석에 의해 서열분석하였다. 서열분석 생성물은 각각의 콜로니에 접촉된 피펫 팁의 콜로니 PCR로부터 유래한다. 94/96 콜로니가 정확한 mEGFP 서열을 함유하는 것으로 나타났다. 한 개의 콜로니는 중간 생성물(제1 라운드 조립 생성물)을 함유하였고 한 개는 스티칭 오류(큰 결실)를 함유하였다.
올리고뉴클레오타이드 풀로부터의 유전자의 다중화된 조립. 올리고뉴클레오타이드 풀로부터 다양한 DNA 구성물을 조립하는 능력을 입증하기 위하여, 본 발명자들은 IDT(oPools)로부터 구입한 300 bp 올리고뉴클레오타이드의 풀로부터 9개의 구별되는 세린/티로신 재조합효소 및 3개의 구별되는 형광단(mPapaya, mPlum, sfGFP)을 구성하였다. 각각의 유전자를 함께 연속적으로 스티칭된 5개의 올리고뉴클레오타이드로부터 조립하였다. 올리고뉴클레오타이드 풀을 적절한 공여체 플라스미드에 통합시키고, 공여체 박테리아에 형질전환하고, 박테리아 풀을 실시예 2에서 기술된 방법: 생체내 DNA 분석 방법을 사용하여 서열 검증된 정렬 어레이에 파싱하였다. 공여체 세포 어레이를 연속적으로 수령체 세포에 콘쥬게이션하여 적어도 3배 복제로 각각의 유전자를 조립하였다. 각각의 어셈블리를 Sanger 서열분석에 의해 정확한 DNA 서열을 함유하는 것으로 결정하였다(도 7G).
긴 DNA의 조립. 긴 DNA 블록과 조립하고 긴 어셈블리를 생성하는 능력을 입증하기 위하여, 본 발명자들은 3개의 3 kb 블록으로부터 사카로미세스 세레비시에 게놈의 9 kb 분절을 재구성하였다. 3 kb 블록을 게놈 DNA로부터 증폭시키고, 적절한 공여체 플라스미드에 통합시키고, 공여체 박테리아에 형질전환하고, 서열을 검증하였다. 공여체 세포를 연속적으로 수령체 세포에 콘쥬게이션하였다. 각각의 조립 단계에서 정확한 조립 생성물을 확인하기 위하여, 재조합 수령체 플라스미드를 수령체 세포로부터 정제하여, 제한 효소로 선형화하고, 겔 전기영동에 의해 분석하였다(도 7h). 조립 생성물을 또한 Sanger 서열분석에 의해 서열이 정확한 것으로 검증하였다.
실시예 2: 생체내 DNA 분석 방법
플라스미드 서열: 생체내 DNA 파싱에 사용한 플라스미드에 대한 정보를 표 5 및 도 37에서 찾아볼 수 있다.
바코딩된 공여체 플라스미드의 구성: 공여체 벡터를 표준 클로닝 방법을 사용하여 구성하였다. 그것은 1) KanR(카나마이신 내성), 2) oriT(전달 기점), 3) R6K oriγ(파지 유래 pir1 발현에 따라 조건부 복제 기점), 및 4) 교환 영역, I-SceI-H1-H4-I-SceI 구성을 함유하며, 여기서 I-SceI는 엔도뉴클레아제 SceI의 인식 부위이고, H1(5'-ttgccctctctcttcattcagggtcatgagaggcacgccattcaaggggagaagtgagatc-3'(서열 번호: 43)) 및 H4(5'-aagaacttttctatttctgggtaggcatcatcaggagcagga-3'(서열 번호: 44))는 재조합을 위한 상동성 영역이다. 공여체 벡터의 교환 영역에서, 선택 카세트(HygR-SacB 또는 NsrR-PheS)를 H1과 H4 사이에 클로닝하여 파싱을 위한 공여체 백본 플라스미드를 생성하였다. 무작위 바코드를 공여체 백본(pSL438 및 pSL439)에 삽입하기 위하여, NotI 제한 부위, 무작위 15개 뉴클레오타이드를 포함한 바코드 영역, 및 두 공여체 백본 모두에 상동인 영역을 함유한 올리고뉴클레오타이드(pXL633)를 IDT로부터 주문하였다. pXL585와 쌍을 이룬 pXL633을 사용하여 주형으로서 pSL438 또는 pSL439의 약 1 ng으로 PCR 바코딩하였다. 결과적으로 생성된 PCR 생성물을 제한 소화시키고 NotI 및 XmaI 부위를 통해 상응하는 공여체 벡터에 결찰시켰다. 위와 동일한 클로닝 프로토콜 후에, 결찰 생성물을 적격 공여체 세포 BUN20에 형질전환시키고 바코딩된 공여체 클론을 50 μg/ml 카나마이신(Kan)을 함유하고 있는 LB 아가 플레이트 상에서 37℃에서 선택하였다. 그런 후 형질전환체를 무작위로 선택하고 배열하여 2개의 96 웰 바코딩된 공여체 수집: pSL438_BC 및 pSL439_BC를 생성하였다. 배열된 공여체 수집에서 바코드 서열을 확인하기 위하여, 바코드를 함유한 영역을 콜로니 접촉 PCR에 의해 프라이머로서 pXL583 및 pXL584를 사용하여 증폭시켰다. 그런 후 암플리콘을 정제하고 pXL583을 사용하여 Sanger 서열분석하였다. 그런 후 바코드를 추출하여 알려진 공여체 바코드 수집의 두 목록을 편집하였다.
바코딩된 수령체 플라스미드의 구성: 배열되고 바코딩된 수령체 수집을 생성하기 위하여 무작위 바코드를 삽입하기 위한 백본으로서 사용되는 플라스미드인 pSL937을 표준 방법에 의해 다음 공급원으로부터 구성하였다: 1) pBR322로부터의 플라스미드 백본/복제 기점, 2) pUC18-미니-Tn7T-Gm3으로부터의 GmR(겐타마이신 내성 마커), 3) H1-I-SceI-I-SceI-H4 구성의 상동성 서열 H1 및 H4, 및 2개의 I-SceI 인식 부위, 4) pSLC-2174로부터의 람노스 유도성 독소 relE(PrhaBAD-relE)가 2개의 SceI 부위 사이에 클로닝되었다. 무작위 바코드를 함유한 올리고뉴클레오타이드를 IDT에 의해 합성하고 제한 소화 및 결찰을 통해 pSL937에 삽입하였다.
무작위 바코드를 수령체 백본(pSL937)에 삽입하기 위하여, XhoI 제한 부위, 20개의 무작위 뉴클레오타이드를 포함한 바코드 영역, 및 pSL937에 상동하는 영역을 함유한 올리고뉴클레오타이드(pXL631)를 IDT로부터 주문하였다. pXL154와 쌍을 이룬 pXL631을 사용하여 주형으로서 약 1 ng의 pSL937을 사용하여 PCR을 통해 바코드를 생성하였다. 결과적으로 생성된 PCR 생성물을 소화시키고 MluI 및 XhoI 제한 부위를 사용하여 pSL937에 결찰시켰다. 바코드 삽입물과 벡터 사이의 결찰 반응을 3:1 몰비로 밤새 16℃에서 수행하였다. 그런 후 결찰 생성물을 스펙티노마이신 내성 헬퍼 플라스미드 pML1041를 함유한 적격 BUN21 세포에 형질전환하였다. 바코딩된 수령체 클론을 50 μg/ml 스펙티노마이신(Sp), 20 μg/ml 겐타마이신(Gm), 및 2% 글루코스를 함유하고 있는 LB 아가 플레이트 상에서 30℃에서 선택하였다. 그런 후 형질전환체를 무작위로 선택하고 96 웰 플레이트에 배열하였다. 배열된 수령체 수집에서 각각의 위치에 있는 바코드 서열을 서열분석에 의해 확인하였다. 총 841개의 바코드를 충실하게 확인할 수 있었다. 이들 바코드를 각각의 위치에 고유한 바코드가 있도록 8개의 새로운 96 웰 플레이트에 재배열하였다.
배열된 짝짓기: 각각의 바코딩된 공여체 플레이트(2개의 96 위치 플레이트)를 각각의 바코딩된 수령체 플레이트(8개의 96 위치 플레이트)에 짝을 지어줬다. 공여체 바코드 수집을 LB + Kan 플레이트에서 밤새 37℃에서 성장시키고; 수령체 어레이를 LB + Sp + Gm + 2% 글루코스에서 밤새 30℃에서 성장시켰다. 배열된 짝짓기용 아가 배지는 0.2% 아라비노스(Ara) 및 0.1 mM IPTG를 함유하였고, 37℃에서 1시간 동안 사전 가온하였다. 공여체 및 수령체 클론 모두를 SINGER ROTOR HDA 핀 패드를 사용하여 짝짓기 플레이트 상에 전달하고 약 3시간 동안 37℃에서 성장시켰다. 각각의 수령체 플레이트는 2개의 공여체 바코딩된 플레이트(pSL438_BC 및 pSL439_BC)와 짝을 이루었다. 그런 후 짝을 이룬 세포를 0.2% 아라비노스, 0.2% 람노스(Rha), 25 μg/ml 겐타마이신, 및 50 μg/ml 하이그로마이신(Hyg)을 함유한 선택 LB 플레이트(LB + Ara + Rha + Gm + Hyg) 상에 전달하였다. 그런 후 재조합 클론을 37℃에서 밤새 선택하였다.
암플리콘 서열분석: 재조합 플라스미드를 추출하기 위하여, 세포를 선택 플레이트로부터 스크래핑하고 플라스미드 플러스 미니 키트(QIAGEN)를 사용하여 미니를 제조하였다. 플라스미드 DNA를 정량화하고 약 1 ng/μl로 희석하였는데, 이것은 96 어레이 플레이트당 각각의 고유한 바코드-바코드 쌍의 대략 1.5 x 106 복사물이다. 2-단계 PCR을 수행하였다. 먼저, OneTaq 중합효소(New England Biolabs)를 사용하는 4 내지 5 사이클의 PCR을 표 1에 열거된 정방향(pBPS_fwr) 및 역방향(pBPS_rev) 프라이머를 사용하여 수행하였다. 약 1 ng의 재조합 플라스미드 DNA를 단일 50 μl PCR 반응으로 증폭시켰다. 서열분석 샘플의 다중화를 증가시키기 위하여, 제1 PCR 및 제2 PCR 프라이머(표 1 및 2 참고)의 고유한 쌍을 사용하여 특정 쌍의 짝을 이룬 플레이트로부터의 플라스미드 DNA를 증폭시켜서, 하나의 서열분석 라이브러리에서 다수의 짝을 이룬 플레이트를 함께 모으는 것을 가능하게 한다. 제1 단계를 위한 사이클 조건은 다음 표 6과 같다:
제1 단계 PCR을 위한 프라이머는 다음의 일반 구성을 가진다:
pBPS_fwr:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNXXXXXXttcggttagagcggatgtg(서열 번호: 45)
pBPS_rev:
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCNNNNNNNNXXXXXXXXXaggtaacccatatgcatggc(서열 번호: 46).
이들 서열에서 N은 임의의 무작위 뉴클레오타이드에 상응하며 PCR 잭팟팅에 의해 유발된 카운트에서의 왜곡을 제거하기 위해 하류 분석에서 사용된다. X는 여러 다중화 태그중 하나에 상응하며, 동일한 서열분석 유동 세포 상에 로딩될 때 상이한 샘플이 구별되는 것을 허용한다. 소문자 서열은 재조합 플라스미드 상의 프라이밍 부위에 상응한다. 대문자 서열은 Illumina Read 1 또는 Read 2 서열분석 프라이머에 상응한다. PCR 생성물을 NucleoSpin 칼럼(Macherey-Nagel)을 사용하여 정제하고 33 μl 물에 용출하였다. 제2의 23-25 사이클 PCR을 PrimeStar HS 중합효소(Takara)를 사용하여 수행하였으며, 제1 PCR로부터의 33 μl의 세정된 생성물을 주형으로서 사용하였고 튜브당 총 부피는 50 μl였다. 이 반응에 대한 프라이머는 표 1 및 표 2에 열거된 표준 Illumina TruSeq 이중 인덱스 프라이머(D501-D508 및 D701-D712)였다. 제2 단계에 대한 사이클 조건은 다음 표 7과 같다:
그런 후 PCR 생성물을 NucleoSpin 칼럼을 사용하여 세정하였다. 각각의 짝짓기 플레이트로부터의 암플리콘을 표준 Illumina 인덱스(제2 PCR)뿐만 아니라 맞춤형 프라이머 인덱스(제1 PCR)로 고유하게 표지화하였다. 이 4중 인덱싱된 전략은 서열분석에 대한 다중화 용량을 증가시킨다. 세정된 암플리콘을 모아서 25% PhiX 게놈 DNA 스파이크인과 함께 Illumina MiSeq, HiSeq 또는 NextSeq 상에서 바코드-바코드당 약 800개 판독으로 쌍을 이룬 단부를 서열분석하였다.
서열 분석: 공여체-수령체 이중 바코드 암플리콘 서열분석 데이터를 맞춤형 파이썬 스크립트 및 바텐더에 의해 다음 단계를 사용하여 분석하였다. 먼저, Illumina 판독을 Illumina 인덱스를 사용하여 역다중화하였다. 2개의 Illumina 인덱스에 대해 정확하게 매칭되지 않는 임의의 서열은 폐기하였다. 바코드를 정규식 "\D*?(.GGC|T.GC|TG.C|TGG.)\D{4,7}?AA\D{4,7}?TT\D{4,7}?(.CGG|G.GG|GC.G|GCG.)\D*"(공여체 바코드) 및 "\D*?(.ACA|G.CA|GA.A|GAC.)\D{4,7}?AA\D{4,7}?AA\D{4,7}?TT\D{4,7}?(.TCG|C.CG|CT.G|CTC.)\D*"(수령체 바코드)를 사용하여 역다중화된 서열로부터 추출하였다. 고유한 분자 식별자(UMI, pBPS_fwr 및 pBPS_rev에서 N)F를 또한 Illumina 판독에서의 예상된 위치를 토대로 추출하였다. 진정한 바코드 서열과 PCR 또는 서열분석으로부터 비롯된 오류를 함유하고 있는 서열의 혼합을 함유하는 바코드 판독을 다음으로 바텐더를 사용하여 공통 서열로 클러스터링하였다. 다음에 각각의 바코드 클러스터를 바텐더를 사용하여 복제 UMI(PCR 복제물을 나타냄)에 대해 조사하였고, 모든 복제물을 제거하여 각각의 바코드 쌍의 최종 카운트를 생성하였다. 20개 미만의 판독을 가진 이중 바코드를 배제하였는데, 그들 중 많은 것이 PCR 키메라(PCR 증폭에 의해 융합된 바코드)일 것으로 예상된다. 나머지 판독을 사용하여 각각의 상응하는 수령체 바코드로부터 각각의 공여체 바코드의 위치를 확인하였다.
Oxford 나노포어 플랫폼 상에서의 전체 플라스미드 서열분석: 위치 지정 바코드 및 올리고뉴클레오타이드를 함유하는 재조합 플라스미드를 암플리콘 서열분석 섹션에서 이전에 기술된 것과 같이 추출하였다. 원형 플라스미드를 제한 효소 PmlI(NEB)에 의해 37℃에서 2시간 동안 선형화하였다. 선형화된 생성물을 1.2% 아가로스 겔을 실행시킴으로써 크기를 선택하고 Zymoclean 겔 DNA 회수 키트(Zymoresearch)를 사용하여 회수하였다. 결찰 서열분석 키트(SQK-LSK110, Nanoporetech)를 사용하여 Oxford 나노포어 플랫폼을 위한 서열분석 라이브러리를 구성하였다. 300 ng(약 100 fmol)의 선형화된 재조합 플라스미드 라이브러리를 NEBNext FFPE 복구 혼합 및 NEBNext 울트라 II 단부 복구/dA-테일링 모듈(NEB)을 사용하여 단부를 복구하였다. 나노포어 서열분석 어댑터(AMX-F)를 NEBNext Quick T4 DNA 결찰효소(NEB)에 의해 결찰시켰다. 30 ng(약 10 fmol)의 라이브러리를 Flongle 유동 세포(R9.4.1, Oxford Nanopore)에 로딩하여 재조합 플라스미드를 위한 판독을 생성하였다. 유동 세포를 Miniknow 서열분석기 제어 소프트웨어(버전: 21.11.7, Oxford Nanopore)를 사용하여 16시간 동안 실행시켰다.
Oxford 나노포어 서열 분석: (2) 서열분석 어댑터를 Guppy 버전 6.0.1+652ffd179로부터의 "guppy_바코더"를 사용하여 샘플 다중화 바코드에 의해 확인 및 제거하고 파일을 분리하였다; (3) "minimap2" 버전 2.22-r1110-dirty를 사용하는 문제의 오염 서열(공여체 및/또는 헬퍼 플라스미드에 대한 복제 기점 또는 전달 기점의 서열)에 대한 정렬을 이들 오염에 대해 정렬된 원치 않는 서열을 제거하기 위해 사용하였다; (4) 재조합된 수령체 플라스미드의 예상된 백본 서열에 대한 정렬을 "minimap2" 버전 2.22-r1110-dirty를 사용하여 생성하고, 맞춤 파이썬 스크립트를 사용하여 각각의 판독으로부터 동일한 백본 서열을 정돈하였다; (5) 위치 특이적 바코드를 이 서열로부터 "itermae" 버전 0.6.0.1을 사용하여 바코드 주변의 서열에 대해 퍼지 정규식을 사용하여 추출한 후, "starcode" 버전 1.4의 메시지 전달 레벤슈타인(Levenshtein) 거리 접근법을 사용하여 클러스터링하였다; (6) 이들 바코드를 사용하여 플라스미드 벡본에서 제거된 서열을 각각의 역다중화된 샘플 및 클러스터링된 바코드 서열에 대해, 맞춤 쉘/awk 스크립트를 사용하여 별도의 파일로 분리하였다; (7) 각 샘플에서 각각의 바코드에 대한 서열을 사용하여 다중 서열 정렬을 "kalign3" 버전 3.3.1을 사용하여 생성하였다; (8) 맞춤 파이썬 스크립트를 사용하여 다중 서열 정렬로부터 보우팅 과정에 의해 단일 초안 공통 서열을 생성하였다; (9) 이 초안 공통 서열을 "racon" 버전 1.5.0을 사용함으로써 폴리싱하여 판독 동의 및 서열 품질을 토대로 공통을 업데이트하였다; (10) 이 공통 서열을 "medaka" 버전 1.5.0을 사용하여 추가로 폴리싱하여 각 샘플에서 각각의 위치 지정 바코드당 폴리싱된 서열을 생성하였다; (11) 재배열 프로젝트의 의도된 목표인 페이로드 서열을 다시 "itermae" 버전 0.6.0.1을 사용하여 상이한 정규식으로 폴리싱된 영역으로부터 추출하였다. 폴리싱되고 위치 지정된 페이로드를 미가공 백본 서열 제거된 영역을 폴리싱된 영역에 대해 정렬함으로써, 폴리싱된 영역으로부터 추출된 페이로드를 의도된 표적 서열에 대해 정렬함으로써, 그리고 미가공 백본 서열 제거된 영역을 데이터세트에서 생성된 모든 폴리싱된 영역에 대해 정렬함으로써 분석하였다. 정렬을 "minimap" 버전 2.22-r1110-dirty 또는 맞춤 파이썬 스크립트로 BioPython 쌍별 정렬 기능을 사용하여 실시하였다. 맞춤 R 스크립트를 사용하여 판독을 "정확한 것": 그 샘플 및 바코드(즉 웰)에 대해 생성된 폴리싱된 영역에 대해 90%보다 큰 동일성을 갖는 것으로서 확인하였다. 웰을 90%를 초과하는 미가공 판독이 폴리싱된 공통 서열에 대해 "정확한 것"이었다면 "순수한"으로 분류하였다. 서열을 폴리싱된 페이로드의 길이 및 의도된 표적 서열에 대한 정렬과 비교하였고, 만약 폴리싱된 페이로드가 의도된 표적 서열 중 하나와 완벽하게 동일하였다면 "정확한"으로 정의하였다.
올리고뉴클레오타이드 풀을 함유하는 공여체 플라스미드 라이브러리의 구성: NsrR-PheS 카세트, 2개의 I-SceI 부위, 및 재조합을 위한 2개의 상동성 영역(H1 및 H4)을 함유한 플라스미드 pSL1071을 올리고뉴클레오타이드 풀을 삽입하기 위한 백본으로서 사용하였다. 한 쪽에 300 bp 올리고뉴클레오타이드를 함유한 올리고뉴클레오타이드 풀을 설계에 따라 IDT로부터 주문하였다:
GCTTATTCGTGCCGTGTTATGGCGCGCCNN??NNGCGGCCGCGGGCACAGCAATCAAAAGTA(서열 번호: 47),
여기서 GCTTATTCGTGCCGTGTTAT 및 GGGCACAGCAATCAAAAGTA(서열 번호: 48)는 올리고뉴클레오타이드 풀을 증폭시키기 위한 정방향 및 역방향 프라이머에 대한 프라이밍 부위이며; GGCGCGCC(서열 번호: 49) 및 GCGGCCGC(서열 번호: 50)는 제한 효소 AscI 및 NotI에 대한 인식 부위이고; NN...NN은 인간 게놈 어셈블리 GRCh38로부터 무작위로 선택된 244-nt 서열을 나타낸다. 올리고뉴클레오타이드 풀의 증폭을 7 ng의 주형 DNA 및 KAPA HiFi 중합효소(Roche)로 표 8에 기술된 사이클 조건을 사용하여 수행하였다.
PCR 생성물을 DNA 세정 및 농축기-5(Zymoresearch)를 사용하여 정제하였다. PCR 생성물을 공여체 플라스미드 pSL1071에 클로닝하기 위하여, AscI 및 NotI 제한 효소 인식 부위를 사용하였다. PCR 생성물 및 pSL1071의 소화 반응을 37℃에서 4시간 동안 수행하였다. 그런 후 소화된 생성물을 1.2% 아가로스 겔을 실행시킴으로써 크기를 선택하고 Zymoclean 겔 DNA 회수 키트(Zymoresearch)를 사용하여 회수하였다. 결찰 반응을 25 ng의 소화된 벡터 및 3.8 ng의 삽입물로 T4 DNA 결찰효소(NEB)를 사용하여 16℃에서 15시간 동안 수행하였다. 결찰 생성물을 BUN20에 형질전환하고, 바코딩된 수령체 플라스미드의 어레이(위에서 기술됨)에 콘쥬게이션하여 공여체 어레이의 각각의 위치에서 구성물의 서열을 결정하였다.
결과: 바코드 어레이의 위치 지정. 파싱 및 위치지정의 정확성을 검증하기 위하여, 2개의 알려져 있는 공여체 바코드 96 웰 플레이트(pSL438_BC 및 pSL439_BC)의 각각을 8개의 96 웰 수령체 플레이트와 짝을 이루었다. 이들 1536개의 짝짓기 사건으로부터의 데이터를 사용하여, 1, 2, 및 3개의 사건을 사용하여 각각 공여체의 93.82%±0.34%, 95.59%±0.27%, 및 96.04%±0.21%에서 정확한 위치를 확인할 수 있었고 서열을 확인할 수 있는 것으로 나타났다(도 47a-47d). 모든 누락은 서열분석 데이터의 부족으로 인한 것이었다. 서열분석 데이터에서 공여체에 대해 부정확한 위치는 전혀 확인되지 않았다. 유사한 결과가 공여체 바코드로부터 수령체 바코드의 위치를 결정할 때 나타났다.
결과: 올리고뉴클레오타이드 풀의 파싱
파싱의 정확성을 추가로 검증하기 위하여, 본 발명자들은 100개 올리고뉴클레오타이드의 풀을 배열하고 서열을 확인하였다. 이 풀은 인간 게놈으로부터 무작위로 선택된 244개 뉴클레오타이드 서열을 함유하였고, IDT(Integrated DNA Technologies)로부터 "oPool"로서 합성되었으며 결찰을 사용하여 본 발명자들의 공여체 플라스미드 pSL1071에 삽입하였다. 이들 플라스미드를 운반하는 BUN20 형질전환체를 모은 후, 총 20개의 384 웰 플레이트에 무작위로 배열하였다. 그런 후 이들 박테리아의 배열된 플레이트를 수령체 바코드 스트레인(바코드 위치가 알려져 있음)의 배열된 수집에 콘쥬게이션하였다. 재조합 올리고뉴클레오타이드-바코드 플라스미드를 함유한 수령체 세포를 모았다. 플라스미드를 Nanopore 서열분석을 사용하여 서열분석하였다. 서열분석 결과를 사용하여 각 플레이트의 각각의 웰에 대해: 만약 공통 서열이 올리고뉴클레오타이드 풀의 예상된 서열과 동일하다면 올리고뉴클레오타이드의 공통 서열과, 임의의 다른 올리고뉴클레오타이드 서열이 낮은 빈도로 존재하는지(오염)의 여부를 결정하였다(도 47b, 도 47c, 도 47d). 공통 서열을 모든 플레이트에서 활용 가능한 7,680개 웰 중에서 5,101개의 웰(66.4%)에 대해 생성하였다. 이들 공통 서열 웰 중에서, 2,329개 웰(45.6%)이 순수하였고 표적 올리고에 완벽하게 매칭되었다. 이들 2,329개의 완벽하게 매칭된 올리고는 풀에 있을 것으로 예상되는 올리고뉴클레오타이드의 82%를 나타냈다.
SEQUENCE LISTING <110> The Board of Trustees of the Leland Stanford Junior University <120> IN VIVO DNA ASSEMBLY AND ANALYSIS <130> 41243-570001WO <150> 63/157,497 <151> 2021-03-05 <150> 63/157,498 <151> 2021-03-05 <160> 49 <170> PatentIn version 3.5 <210> 1 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr_1 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 1 acactctttc cctacacgac gctcttccga tctnnnnnnn ncgatgtttc ggttagagcg 60 gatgtg 66 <210> 2 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwar_2 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 2 acactctttc cctacacgac gctcttccga tctnnnnnnn nacagtgttc ggttagagcg 60 gatgtg 66 <210> 3 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr_3 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 3 acactctttc cctacacgac gctcttccga tctnnnnnnn ntgaccattc ggttagagcg 60 gatgtg 66 <210> 4 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr_4 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 4 acactctttc cctacacgac gctcttccga tctnnnnnnn ngccaatttc ggttagagcg 60 gatgtg 66 <210> 5 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr_5 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 5 acactctttc cctacacgac gctcttccga tctnnnnnnn natcacgttc ggttagagcg 60 gatgtg 66 <210> 6 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr_6 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 6 acactctttc cctacacgac gctcttccga tctnnnnnnn nggctacttc ggttagagcg 60 gatgtg 66 <210> 7 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr7 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 7 acactctttc cctacacgac gctcttccga tctnnnnnnn ntagcttttc ggttagagcg 60 gatgtg 66 <210> 8 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr_8 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 8 acactctttc cctacacgac gctcttccga tctnnnnnnn ntctcccttc ggttagagcg 60 gatgtg 66 <210> 9 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev_1 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 9 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn ntatatacgc aggtaaccca 60 tatgcatggc 70 <210> 10 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev_2 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 10 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn ncgctctatc aggtaaccca 60 tatgcatggc 70 <210> 11 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev_3 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 11 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn ngagacgtct aggtaaccca 60 tatgcatggc 70 <210> 12 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev_4 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 12 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn natactgcgt aggtaaccca 60 tatgcatggc 70 <210> 13 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev5 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 13 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn nactagcaga aggtaaccca 60 tatgcatggc 70 <210> 14 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev_6 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 14 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn nctgctactc aggtaaccca 60 tatgcatggc 70 <210> 15 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev7 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 15 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn nccgtacaca aggtaaccca 60 tatgcatggc 70 <210> 16 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev8 <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <400> 16 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn natctgcaaa ggtaacccat 60 atgcatggc 69 <210> 17 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D501 <400> 17 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 18 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D502 <400> 18 aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 19 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D503 <400> 19 aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 20 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D504 <400> 20 aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 21 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D505 <400> 21 aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 22 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D506 <400> 22 aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 23 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D507 <400> 23 aatgatacgg cgaccaccga gatctacacc aggacgtaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 24 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D508 <400> 24 aatgatacgg cgaccaccga gatctacacg tactgacaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 25 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D701 <400> 25 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 26 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D702 <400> 26 caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 27 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D703 <400> 27 caagcagaag acggcatacg agataatgag cggtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 28 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D704 <400> 28 caagcagaag acggcatacg agatggaatc tcgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 29 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D705 <400> 29 caagcagaag acggcatacg agatttctga atgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 30 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D706 <400> 30 caagcagaag acggcatacg agatacgaat tcgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 31 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D707 <400> 31 caagcagaag acggcatacg agatagcttc aggtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 32 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D708 <400> 32 caagcagaag acggcatacg agatgcgcat tagtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 33 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D709 <400> 33 caagcagaag acggcatacg agatcatagc cggtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 34 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D710 <400> 34 caagcagaag acggcatacg agatttcgcg gagtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 35 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D711 <400> 35 caagcagaag acggcatacg agatgcgcga gagtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 36 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D712 <400> 36 caagcagaag acggcatacg agatctatcg ctgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 37 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> T1 fragment <400> 37 ggggccacta gggacaggat tgg 23 <210> 38 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> T2 fragment <400> 38 caggcgggct cacctccgtg tgg 23 <210> 39 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> H1 fragment <400> 39 cgagggctag aattacctac cggcctccac catgcctgcg 40 <210> 40 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> H3 fragment <400> 40 gtacgggcaa cccgagaagg ctgagcctgg actcaacggg ttgctgggtg gactccagac 60 tcggggcgac gactcttcac gcgcagagca agggcgtcga gcggtcgtga aagtcttagt 120 accgcacgtg ccgactcact ggggatattg cctggagctg taccgttcta ggggggggag 180 gttggagacc tcctcttctc acgactggac ccgcgagggc cgcgttgccg gttcccccag 240 aggctgaaga acaagggctt actgtgggca gggggacgcc cattcagcgg ctggcgcttt 300 <210> 41 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <220> <221> misc_feature <222> (42)..(47) <223> multiplex_tag <400> 41 acactctttc cctacacgac gctcttccga tctnnnnnnn nnnnnnnttc ggttagagcg 60 gatgtg 66 <210> 42 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev <220> <221> misc_feature <222> (34)..(41) <223> n is a, c, g, or t <220> <221> misc_feature <222> (42)..(50) <223> multiplex_tag <400> 42 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn nnnnnnnnnn aggtaaccca 60 tatgcatggc 70 <210> 43 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Hi primer <400> 43 ttgccctctc tcttcattca gggtcatgag aggcacgcca ttcaagggga gaagtgagat 60 c 61 <210> 44 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> H4 primer <400> 44 aagaactttt ctatttctgg gtaggcatca tcaggagcag ga 42 <210> 45 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> pBPS_fwr <220> <221> misc_feature <222> (34)..(41) <223> any amino acid <220> <221> misc_feature <222> (42)..(48) <223> multiplexing tag <400> 45 acactctttc cctacacgac gctcttccga tctnnnnnnn nnnnnnnttc ggttagagcg 60 gatgtg 66 <210> 46 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> pBPS_rev <220> <221> misc_feature <222> (34)..(41) <223> any amino acid <220> <221> misc_feature <222> (42)..(50) <223> multiplexing tag <400> 46 gtgactggag ttcagacgtg tgctcttccg atcnnnnnnn nnnnnnnnnn aggtaaccca 60 tatgcatggc 70 <210> 47 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide pool <220> <221> misc_feature <222> (29)..(272) <223> 244 sequence randomly seleted from human genome assembly GRCh38 <400> 47 gcttattcgt gccgtgttat ggcgcgccnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nngcggccgc gggcacagca atcaaaagta 300 <210> 48 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> priming site <400> 48 gcttattcgt gccgtgttat 20 <210> 49 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> priming site <400> 49 gggcacagca atcaaaagta 20

Claims (65)

  1. 복수의 DNA 요소를 수령체 세포 내에서 조립된 DNA 요소로 조립하는 방법으로서, 방법은:
    (a) (i) 제1 공여체 플라스미드를 콘쥬게이션에 의해 제1 공여체 세포로부터 수령체 세포로 전달하고 (ii) 제1 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하는 조건 하에서 제1 공여체 플라스미드를 포함하는 제1 공여체 세포를 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키고, 여기서
    제1 공여체 플라스미드는, 순차적으로, 선택적인 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 제1 DNA 요소 단편(올리고1)을 포함하는 제1 올리고뉴클레오타이드, 2개의 상동 재조합 영역(HR2.1, HR2.2)을 포함하는 제2 상동 재조합 영역(HR2) 및 선택적인 제3 엔도뉴클레아제 부위(C3)를 포함하며;
    수령체 올리고뉴클레오타이드는 HR1에 상동인 제3 상동 재조합 영역(HR3) 및 HR2.2에 상동인 제4 상동 재조합 영역(HR4)을 포함하고;
    이에 의해 HR1과 HR3 및 HR2.2와 HR4의 상동 재조합 후에, 제1 DNA 요소 단편을 포함하는 제1 재조합 수령체 올리고뉴클레오타이드를 제공하는 단계;
    (b) (i) 제2 공여체 플라스미드를 콘쥬게이션에 의해 제2 공여체 세포로부터 제1 수령체 세포로 전달하고 (ii) 제2 공여체 플라스미드 및 제1 재조합 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하여 제2 재조합 수령체 올리고뉴클레오타이드를 형성하는 조건 하에서 제2 공여체 플라스미드를 포함하는 제2 공여체 세포를 제1 재조합 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키고, 여기서
    제2 공여체 플라스미드는, 순차적으로, 선택적인 제5 엔도뉴클레아제 부위(C5), HR2.1에 상동인 제5 상동 재조합 영역(HR5), 제2 DNA 요소 단편(올리고2)을 코딩하는 제2 올리고뉴클레오타이드, 2개의 상동 재조합 영역(HR6.1, HR6.2)을 포함하는 제6 상동 재조합 영역(HR6), 및 선택적인 제6 엔도뉴클레아제 부위(C6)를 포함하며;
    이에 의해 HR5와 HR2.1 및 HR6.2와 HR4의 상동 재조합 후에, DNA 어셈블리를 형성하는 제1 및 제2 DNA 요소 단편(올리고1, 올리고2)을 포함하는 제2 재조합 수령체 올리고뉴클레오타이드를 제공하는 단계를 포함하고;
    선택적으로 HR2.1 및 HR2.2는, 하나(C2) 또는 2개의 엔도뉴클레아제 부위(C2.1, C2.2)를 포함하는 비상동 영역의 측면에 있으며;
    선택적으로 HR3 및 HR4는, 하나(C4) 또는 2개의 엔도뉴클레아제 부위(C4.1, C4.2)를 포함하는 비상동 영역의 측면에 있고;
    선택적으로 HR6.1 및 HR6.2는, 하나(C7) 또는 2개의 엔도뉴클레아제 부위(C7.1, C7.2)를 포함하는 비상동 영역의 측면에 있으며;
    선택적으로 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있고;
    선택적으로 DNA 어셈블리는 유전자, 프로모터, 인핸서, 터미네이터, 인트론, 유전자간 영역, 바코드, 가이드 RNA(gRNA), 또는 이들의 조합의 적어도 일부를 포함하는, 복수의 DNA 요소를 수령체 세포 내에서 조립된 DNA 요소로 조립하는 방법.
  2. 제1항에 있어서, 단계 (b)는, 양립성 HR 영역 및 제3 또는 후속 DNA 요소 단편(올리고3, 올리고4, ... 올리고N)을 코딩하는 제3 또는 후속 올리고뉴클레오타이드를 포함하는 제3 또는 후속 공여체 플라스미드를 포함하는 제3 또는 후속 공여체 세포로 1회 이상의 반복을 위해 반복되고, 이에 의해, 함께 DNA 어셈블리를 형성하는 제1, 제2, 및 제3 또는 후속 DNA 요소 단편을 포함하는 제3 또는 후속 재조합 수령체 올리고뉴클레오타이드를 형성하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 단계 (a)는, 상이한 제1 공여체 플라스미드를 각각 포함하고 있는 복수의 제1 공여체 세포를 포함하고; 단계 (b)는, 상이한 제2, 제3, 또는 후속 공여체 플라스미드를 각각 포함하고 있는 복수의 제2, 제3, 또는 후속 공여체 세포를 포함하며; 선택적으로 각각의 제1 공여체 세포는 제1 정렬된 어레이의 위치에 있고 각각의 제2, 제3, 또는 후속 공여체 세포는 제2, 제3, 또는 후속 정렬된 어레이의 위치에 있으며; 선택적으로 방법은 복수의 상이한 조립된 DNA 요소를 포함하는 조합 라이브러리를 생성하는 것인 방법.
  4. 제1항 내지 제3항 중 어느 하나의 항에 있어서, 제1, 제3, 및/또는 제4 엔도뉴클레아제 부위를 표적화하는 제1 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드가 제1 공여체 플라스미드 상에 존재하고/거나 수령체 세포에 존재하는 것인 방법.
  5. 제1항 내지 제4항 중 어느 하나의 항에 있어서, 제2, 제5, 및/또는 제6 엔도뉴클레아제 부위를 표적화하는 제2 엔도뉴클레아제를 코딩하는 올리고뉴클레오타이드가 제2 공여체 플라스미드 상에 존재하고/거나 수령체 세포에 존재하는 것인 방법.
  6. 제4항 또는 제5항에 있어서, 제1 및/또는 제2 엔도뉴클레아제의 발현은 유도성이고, 방법은 제1 및/또는 제2 엔도뉴클레아제의 발현을 유도하는 단계를 추가로 포함하는 것인 방법.
  7. 제4항 내지 제6항 중 어느 하나의 항에 있어서, 제1 및/또는 제2 엔도뉴클레아제는 RNA 가이드 엔도뉴클레아제, 호밍 엔도뉴클레아제, 전사 활성화 인자 유사 이펙터 뉴클레아제, 및 아연 핑거 뉴클레아제로부터 선택되는 것인 방법.
  8. 제1항 내지 제7항 중 어느 하나의 항에 있어서, 제1, 제2 또는 후속 공여체 플라스미드는, 제1 올리고뉴클레오타이드, 제2 올리고뉴클레오타이드 또는 후속 올리고뉴클레오타이드의 수령체 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하며; 선택적으로 선택성 마커는 HR2.1과 HR2.2 사이 및/또는 HR6.1과 HR6.2 사이, 및/또는 후속 HR 영역 사이의 비상동 영역 내에 있는 것인 방법.
  9. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 수령체 올리고뉴클레오타이드는, 제1, 제2, 제3, 또는 후속 올리고뉴클레오타이드를 포함하지 않는 수령체 세포에 대해 선택하는 역선택성 마커를 포함하고; 선택적으로 역선택성 마커는 HR2.1과 HR2.2 사이 및/또는 HR6.1과 HR6.2 사이, 및/또는 후속 HR 영역 사이의 비상동 영역 내에 있는 것인 방법.
  10. 제1항 내지 제9항 중 어느 하나의 항에 있어서, 공여체 플라스미드는 전달 기점을 포함하는 것인 방법.
  11. 제1항 내지 제10항 중 어느 하나의 항에 있어서, 공여체 플라스미드는 조건부 복제 기점을 포함하고; 선택적으로 조건부 복제 기점은 올리고뉴클레오타이드의 존재 또는 세포 성장 조건에 의존하는 것인 방법.
  12. 제1항 내지 제11항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 유도성 고복사 복제 기점을 포함하는 것인 방법.
  13. 제1항 내지 제12항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는, 30 킬로베이스보다 긴 길이의 플라스미드를 복제할 수 있는 레플리콘을 포함하는 것인 방법.
  14. 제1항 내지 제13항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 효모 인공 염색체(YAC), 포유류 인공 염색체(MAC), 인간 인공 염색체(HAC), 또는 식물 인공 염색체인 방법.
  15. 제1항 내지 제13항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 올리고뉴클레오타이드는 바이러스 벡터인 방법.
  16. 제1항 내지 제15항 중 어느 하나의 항에 있어서, 공여체 플라스미드는, 플라스미드 콘쥬게이션을 가능하게 하는 올리고뉴클레오타이드를 포함하는 것인 방법.
  17. 제1항 내지 제16항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 세포는, 하나 이상의 상동 DNA 복구 유전자를 코딩하는 올리고뉴클레오타이드를 포함하고; 선택적으로 하나 이상의 상동 DNA 복구 유전자의 발현은 유도성인 방법.
  18. 제1항 내지 제17항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 세포는, 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드를 포함하는 것인 방법.
  19. 제1항 내지 제18항 중 어느 하나의 항에 있어서, 공여체 세포 및 수령체 세포는 독립적으로 박테리아 세포이고; 선택적으로 박테리아 세포는 대장균(E. coli), 비브리오 나트리겐스(Vibrio natriegens) 또는 콜레라균(V. cholerae)인 방법.
  20. 제1항 내지 제19항 중 어느 하나의 항에 있어서, 조립된 DNA 요소는 길이가 100개 뉴클레오타이드 내지 500,000개 뉴클레오타이드인 방법.
  21. 제1항 내지 제20항 중 어느 하나의 항에 있어서, 제1, 제2 또는 후속 상동 재조합(HR) 영역 및 수령체 올리고뉴클레오타이드 상의 이들의 상응하는 HR 영역은 각각 약 20개 염기쌍 내지 약 500개 염기쌍; 선택적으로 약 50개 내지 100개 염기쌍을 포함하는 것인 방법.
  22. 제1항 내지 제21항 중 어느 하나의 항에 있어서, 수령체 세포를 용해하는 단계; 조립된 DNA 요소를 증폭시키는 단계; 조립된 DNA 요소를 단리하는 단계; 수령체 올리고뉴클레오타이드를 단리하는 단계; 조립된 DNA 요소를 서열분석하는 단계; 및 수령체 올리고뉴클레오타이드를 서열분석하는 단계 중 하나 이상의 단계를 추가로 포함하는 방법.
  23. 제1항 내지 제22항 중 어느 하나의 항에 있어서, 제1 및 제2 또는 후속 공여체 세포를 제1 수령체 세포와 접촉시키는 단계는 동시에 수행되며; 선택적으로 최종 공여체 플라스미드만이 선택성 마커를 포함하거나 또는 각각의 공여체 플라스미드가 수령체 올리고뉴클레오타이드에 존재하지 않는 선택성 마커를 포함하는 것인 방법.
  24. 제3항 내지 제23항 중 어느 하나의 항에 있어서, 조립된 DNA 요소의 일부를 형성하기 위해 마지막 DNA 요소를 포함하는 공여체 플라스미드는 바코드 상동 재조합(BHR) 영역을 포함하여, 조립된 DNA 요소, BHR, 및 추가 HR을 포함하는 재조합 수령체 올리고뉴클레오타이드를 각각 함유하는 수령체 세포를 생성하고; 방법은 (i) BHR에 상동인 HR, 고유한 바코드 올리고뉴클레오타이드, 및 재조합 수령체 올리고뉴클레오타이드의 추가 HR에 상동인 제2 HR을 포함하는 바코드 공여체 플라스미드를 각각 함유하는 바코드 공여체 세포의 어레이를 구성 또는 획득하는 단계; (ii) (a) 바코드 공여체 플라스미드를 콘쥬게이션에 의해 바코드 공여체 세포로부터 수령체 세포로 전달하고 (b) 바코드 공여체 플라스미드와 수령체 올리고뉴클레오타이드를 수령체 세포에서 상동 재조합에 의해 재조합하는 조건 하에서 바코드 공여체 세포의 어레이를 수령체 세포의 어레이와 접촉시킴으로써, 바코딩된 어셈블리를 포함하는 수령체 세포의 어레이를 생성하는 단계를 추가로 포함하는 것인 방법.
  25. 제3항 내지 제23항 중 어느 하나의 항에 있어서, 각각의 공여체 플라스미드는, 바코드 상동 재조합(BHR) 영역의 측면에 있는 고유한 엔도뉴클레아제 부위 CX, CY의 추가 쌍을 포함하며, 방법은, DNA 어셈블리를 각각 포함하고 있는 수령체 세포의 어레이를, 고유한 바코드 올리고뉴클레오타이드의 측면에 있는 BHR에 상동인 한 쌍의 HR 영역을 포함하는 바코드 공여체 플라스미드를 각각 함유하고 있는 바코드 공여체 세포의 어레이와 접촉시킴으로써, 바코딩된 어셈블리를 포함하는 수령체 세포의 어레이를 생성하는 단계를 추가로 포함하는 것인 방법.
  26. 제1항 내지 제25항 중 어느 하나의 항에 있어서, 리셋 공여체 플라스미드를 포함하는 리셋 공여체 세포를 재조합 수령체 올리고뉴클레오타이드를 포함하는 수령체 세포와 접촉시키고,
    여기서 리셋 공여체 플라스미드는, 순차적으로, DNA 어셈블리의 말단 서열에 상동인 상동 재조합 영역(HRt), 리셋 엔도뉴클레아제 부위, 선택성 마커, 리셋 엔도뉴클레아제 부위, 상동 재조합 영역(HRX), 및 전달 기점을 포함하며,
    재조합 수령체 올리고뉴클레오타이드는, 순차적으로, 리셋 엔도뉴클레아제 부위, DNA 어셈블리, HRX에 상동인 상동 재조합 영역(HRXa) 및 리셋 엔도뉴클레아제 부위를 포함하고,
    이에 의해 HRt와 DNA 어셈블리의 말단 서열 사이 및 HRX와 HRXa 사이의 상동 재조합에 후속하여, 전달 기점 및 DNA 어셈블리를 포함하는 리셋 플라스미드를 제공하는 단계를 추가로 포함하는 방법.
  27. 제26항에 있어서, 리셋 플라스미드는 공여체 세포에 있는 것인 방법.
  28. 제26항에 있어서, 리셋 플라스미드는, 공여체 세포 및 수령체 세포 둘 다에서 기능하는 제한된 복제 기점을 함유하는 것인 방법.
  29. 제26항 내지 제28항 중 어느 하나의 항에 있어서, 리셋 공여체 플라스미드는, 상동 재조합 영역 HRt, HRX, 측면의 두 엔도뉴클레아제 부위(C1, C2) 및 역선택성 마커(CM)를 포함하는 올리고뉴클레오타이드 삽입물, HRt-C1-CM-C2-HRX; 또는 그러한 올리고뉴클레오타이드 삽입물의 라이브러리를 도입하는 단계; 엔도뉴클레아제가 엔도뉴클레아제 부위를 절단하는 것을 허용하는 단계 및 상동 재조합을 사용하여 절단 부위에 역선택성 마커를 도입하는 단계를 포함하는 방법에 의해 구성되는 것인 방법.
  30. 제1항 내지 제29항 중 어느 하나의 항에 있어서, 수령체 올리고뉴클레오타이드는, 효모 세포, 식물 세포, 포유류 세포, 또는 다른 박테리아 세포를 포함한 다른 세포 유형에 DNA 어셈블리를 전달할 수 있는 이동성 유전 요소를 포함하는 것인 방법.
  31. 제1항 내지 제30항 중 어느 하나의 항에 있어서, 방법은 DNA 라이브러리를 구성하기 위하여 양립성 상동 재조합 영역을 가진 2 이상의 수령체 올리고뉴클레오타이드를 활용하는 단계를 포함하는 것인 방법.
  32. 제1항 내지 제30항 중 어느 하나의 항에 있어서, 공여체 플라스미드의 올리고뉴클레오타이드는, 제1 DNA 어셈블리의 말단 서열에 상동인 제1 링커 올리고뉴클레오타이드 및 제2 올리고뉴클레오타이드에 상동인 제2 링커 올리고뉴클레오타이드를 포함하는 것인 방법.
  33. 제32항에 있어서, 링커 올리고뉴클레오타이드는, 제1 DNA 어셈블리 또는 제2 DNA 올리고뉴클레오타이드에 상동하지 않는 추가의 DNA 요소 단편을 더 포함하는 것인 방법.
  34. 제31항 내지 제33항 중 어느 하나의 항에 있어서, 방법은 돌연변이유발 라이브러리를 조립하기 위하여; 상이한 종으로부터의 유전자, 프로모터, 터미네이터, 및 조절 영역과 같은 유전자 영역을 조합하기 위하여; 유전자 조절 경로를 구성 및/또는 조합하기 위하여; 조합 gRNA 라이브러리를 구성하기 위하여; 또는 스크리닝 검정을 위해 플라스미드를 함유하는 박테리아의 어레이를 조립하기 위하여 사용되는 것인 방법.
  35. 제1항 내지 제34항 중 어느 하나의 항에 있어서, 제1항의 단계 (a) 및 (b) 전에, 제1 및 제2 DNA 요소 단편을 포함하는 제1 및 제2 올리고뉴클레오타이드가 제1 및 제2 공여체 플라스미드에 삽입되는 것인 방법.
  36. 바코드를 올리고뉴클레오타이드에 콘쥬게이션하는 방법으로서, 방법은
    (a) 올리고뉴클레오타이드 혼합물의 각각의 올리고뉴클레오타이드를 공여체 플라스미드에 삽입하는 단계로서, 각각의 공여체 플라스미드는, 순차적으로, 선택적으로 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 제2 상동 재조합 영역(HR2), 및 선택적으로 제2 엔도뉴클레아제 부위(C2)를 포함하고; 각각의 올리고뉴클레오타이드는 HR1과 HR2 사이에 삽입되고, 이에 의해 공여체 올리고뉴클레오타이드를 포함하는 복수의 공여체 플라스미드를 제공하며, 각각의 공여체 플라스미드는 올리고뉴클레오타이드 혼합물로부터의 단일 공여체 올리고뉴클레오타이드: C1-HR1-올리고-HR2-C2를 포함하는 것인 단계;
    (b) 각각의 세포가 공여체 플라스미드를 포함하도록 복수의 세포를 복수의 공여체 플라스미드로 형질전환시킴으로써 복수의 공여체 세포를 형성하는 단계;
    (c) 복수의 공여체 세포를 각각 제1 정렬된 어레이의 고유한 위치에 플레이팅하고 배양함으로써, 공여체 세포의 제1 정렬된 어레이를 제공하는 단계;
    (d) 복수의 수령체 세포를 제2 정렬된 어레이로 제공하는 단계로서, 각각의 수령체 세포는, 순차적으로, 제2 정렬된 어레이에서 수령체 세포의 위치를 확인하는 고유한 바코드 서열, HR1에 상동인 제3 상동 재조합 영역(HR3), 선택적으로 제3 엔도뉴클레아제 부위(C3), 및 HR2에 상동인 제4 상동 재조합 영역(HR4)을 포함하는 수령체 올리고뉴클레오타이드를 포함하는 것인 단계;
    (e) (i) 공여체 플라스미드를 콘쥬게이션에 의해 공여체 세포로부터 어레이 상의 상응하는 위치의 수령체 세포로 전달하고, (ii) 선택적으로 제1, 제2, 및 제3 엔도뉴클레아제 부위를 절단하며, (iii) 올리고뉴클레오타이드를 상동 재조합에 의하여 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 공여체 세포의 제1 정렬된 어레이를 수령체 세포의 제2 정렬된 어레이와 접촉시킴으로써, 고유한 바코드 서열 및 올리고뉴클레오타이드 혼합물로부터의 공여체 올리고뉴클레오타이드를 각각 포함하고 있는 융합 올리고뉴클레오타이드의 제3 어레이를 형성하는 단계; 및
    (f) 선택적으로 융합 올리고뉴클레오타이드를 서열분석함으로써, 바코드 서열에 의해 어레이에서 각각의 올리고뉴클레오타이드를 확인하는 단계를 포함하고;
    선택적으로 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있는, 바코드를 올리고뉴클레오타이드에 콘쥬게이션하는 방법.
  37. 제36항에 있어서, 공여체 플라스미드는 HR1과 HR2 사이에 올리고뉴클레오타이드의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하고; 선택적으로 공여체 플라스미드는 역선택성 마커를 포함하는 것인 방법.
  38. 제36항 또는 제37항에 있어서, 수령체 세포 올리고뉴클레오타이드는 제4 엔도뉴클레아제 부위(C4)를 포함하는 것인 방법.
  39. 복수의 올리고뉴클레오타이드로부터 올리고뉴클레오타이드를 확인하는 방법으로서, 방법은
    (a) 복수의 공여체 세포를 제1 정렬된 어레이로 제공하는 단계로서, 각각의 공여체 세포는 공여체 플라스미드를 포함하고, 각각의 공여체 플라스미드는, 순차적으로, 선택적으로 제1 엔도뉴클레아제 부위(C1), 제1 상동 재조합 영역(HR1), 고유한 바코드 서열, 제2 상동 재조합 영역(HR2), 및 선택적으로 제2 엔도뉴클레아제 부위(C2)를 포함하며, 고유한 바코드 서열은 제1 정렬된 어레이에서 숙주 세포의 위치를 확인하는 것인 단계;
    (b) 복수의 수령체 세포를 제공하는 단계로서, 각각의 수령체 세포는, 순차적으로, 복수의 올리고뉴클레오타이드로부터의 올리고뉴클레오타이드, HR1에 상동인 제3 상동 재조합 영역(HR3), 선택적으로 제3 엔도뉴클레아제 부위(C3), 및 HR2에 상동인 제4 상동 재조합 영역(HR4)을 포함하는 수령체 플라스미드를 포함하는 것인 단계;
    (c) 복수의 수령체 세포를 각각 제2 정렬된 어레이의 고유한 위치에 플레이팅하고 배양함으로써, 수령체 세포의 제2 정렬된 어레이를 제공하는 단계;
    (d) (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 공여체 세포로부터 어레이 상의 상응하는 위치의 수령체 세포로 전달하고, (ii) 제1, 제2, 및 제3 엔도뉴클레아제 부위를 절단하며, (iii) 바코드 서열을 상동 재조합에 의하여 공여체 플라스미드로부터 수령체 세포 올리고뉴클레오타이드로 전달하는 조건 하에서 제1 정렬된 어레이를 제2 정렬된 어레이와 접촉시킴으로써, 고유한 바코드 서열 및 올리고뉴클레오타이드 혼합물로부터의 올리고뉴클레오타이드를 각각 포함하고 있는 융합 올리고뉴클레오타이드의 제3 어레이를 형성하는 단계; 및
    (e) 융합 올리고뉴클레오타이드를 서열분석함으로써, 바코드 서열에 의해 어레이에서 각각의 올리고뉴클레오타이드를 확인하는 단계를 포함하고;
    선택적으로 수령체 올리고뉴클레오타이드는 수령체 세포 플라스미드 또는 수령체 세포 게놈에 있는, 복수의 올리고뉴클레오타이드로부터 올리고뉴클레오타이드를 확인하는 방법.
  40. 제39항에 있어서, 공여체 플라스미드는 HR1과 HR2 사이에 바코드 서열의 수령체 세포 올리고뉴클레오타이드로의 통합을 선택하는 선택성 마커를 포함하고; 선택적으로 공여체 플라스미드는 역선택성 마커를 포함하는 것인 방법.
  41. 제39항 또는 제40항에 있어서, 수령체 세포 올리고뉴클레오타이드는 제4 엔도뉴클레아제 부위(C4)를 포함하는 것인 방법.
  42. 제36항 내지 제41항 중 어느 하나의 항에 있어서, 제1 엔도뉴클레아제 부위, 제2 엔도뉴클레아제 부위, 및 제3 엔도뉴클레아제 부위는 동일하거나 또는 상이한 것인 방법.
  43. 제36항 내지 제42항 중 어느 하나의 항에 있어서, 공여체 플라스미드는 전달 기점, 및/또는 조건부 복제 기점을 포함하고; 선택적으로 전달 기점은 이동성 요소로부터 유래되며; 추가로 선택적으로 조건부 복제 기점은 올리고뉴클레오타이드의 존재 또는 세포 성장 조건에 의존하는 것인 방법.
  44. 제36항 내지 제43항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 플라스미드는, 적어도 30 킬로베이스 길이의 플라스미드를 복제할 수 있는 레플리콘을 포함하며, 선택적으로 레플리콘은 P1 유래 인공 염색체 또는 박테리아 인공 염색체로부터 유래되는 것인 방법.
  45. 제36항 내지 제44항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 유도성 고복사 복제 기점을 포함하는 것인 방법.
  46. 제36항 내지 제44항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 효모 인공 염색체(YAC), 포유류 인공 염색체(MAC), 인간 인공 염색체(HAC), 또는 식물 인공 염색체를 포함하는 것인 방법.
  47. 제36항 내지 제44항 중 어느 하나의 항에 있어서, 공여체 플라스미드 또는 수령체 세포 올리고뉴클레오타이드는 바이러스 벡터를 포함하는 것인 방법.
  48. 제36항 내지 제47항 중 어느 하나의 항에 있어서, 엔도뉴클레아제 부위는, 수령체 세포에서 하나 이상의 올리고뉴클레오타이드에 의해 코딩되고/거나 공여체 플라스미드에서 코딩된 하나 이상의 엔도뉴클레아제에 의해 절단되며; 선택적으로 하나 이상의 엔도뉴클레아제는 호밍 엔도뉴클레아제 또는 RNA 가이드 DNA 엔도뉴클레아제이고; 추가로 선택적으로 엔도뉴클레아제는 HO인 방법.
  49. 제36항 내지 제48항 중 어느 하나의 항에 있어서, 공여체 세포 또는 수령체 세포는, (i) 플라스미드 콘쥬게이션을 가능하게 하거나; (ii) 하나 이상의 상동 DNA 복구 유전자를 코딩하거나; 또는 (iii) 하나 이상의 재조합 매개 유전자 조작 유전자를 코딩하는 올리고뉴클레오타이드를 포함하는 것인 방법.
  50. 제36항 내지 제49항 중 어느 하나의 항에 있어서, 공여체 세포, 수령체 세포, 또는 재조합 수령체 세포는 제3 정렬된 어레이, 제4 정렬된 어레이, 또는 후속 정렬된 어레이 상의 위치로 전달되는 것인 방법.
  51. 제36항 내지 제50항 중 어느 하나의 항에 있어서, 공여체 세포 및 수령체 세포는 독립적으로 박테리아 세포이고, 선택적으로 박테리아 세포는 대장균, 비브리오 나트리겐스 또는 콜레라균인 방법.
  52. 제36항 내지 제51항 중 어느 하나의 항에 있어서, 바코드 서열은 약 4개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이이며, 선택적으로 바코드 서열은 약 30개 뉴클레오타이드 길이인 방법.
  53. 제36항 내지 제52항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드의 혼합물은, 화학적 커플링, 중합효소 뉴클레오타이드 콘쥬게이트를 사용하는 주형 독립적인 효소적 합성, 중합효소 연쇄 조립(중합효소 순환 조립), 깁슨 조립(츄백(Chew back), 어닐링 및 복구), 결찰효소 연쇄 반응/결찰효소 순환 반응, Phi29 중합효소, 롤링 서클, 루프 매개 등온(LAMP), 가닥 치환(SDA), 나선효소 의존성(HAD), 재조합효소 중합효소(RPA), 핵산 서열 기반 증폭(NASBA), 골든 게이트 클로닝, MoClo 클로닝, 바이오브릭스(BioBricks) 또는 조립된 바이오브릭스, 열역학적으로 균형잡힌 인사이드 아웃 합성, DNA 클로닝, 결찰 독립적인 클로닝, 선택 클로닝에 의한 결찰, 리컴비니어링, 효모 조립, PCR, 분자 반전 프로브 또는 LASSO 프로브에 의한 포획, DropSynth, 및 효소적 DNA 합성으로부터 선택된 DNA 합성 또는 조립 기술의 생성물인 방법.
  54. 제36항 내지 제52항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드 혼합물은, 오류가 발생하기 쉬운 PCR, 축퇴성 올리고를 사용하는 PCR, 및 정규 PCR을 포함한 중합효소 연쇄 반응 기술, 화학적 또는 광 돌연변이유발, 편집 올리고 라이브러리를 사용하는 시험관내 합성, 생체내 편집, 예를 들면 MAGE, MAGESTIC, CRISPR, 프라임 편집, 레트론 편집, 및 CRISPR, TALEN 및 아연 핑거 뉴클레아제를 사용하는 염기 변형으로부터 선택된 풀링된 돌연변이유발 기술의 생성물인 방법.
  55. 제36항 내지 제52항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드 혼합물은 적어도 게놈 DNA, cDNA, 소기관 DNA, 또는 천연 플라스미드 DNA의 단편을 포함하는 것인 방법.
  56. 제36항 내지 제52항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드 혼합물은, gDNA, cDNA 또는 소기관 DNA로부터, 예를 들어 균형잡힌 cDNA 라이브러리, 멀티플렉스 PCR 생성물과 같은 PCR 생성물, LASSO 프로브를 포함한 분자 반전 프로브, 어닐링 또는 감산 혼성화에 의한 포획, 공동 형질전환 및 상동 재조합, 롤링 서클 증폭, 또는 LAMP로부터 기원하는 포획된 또는 증폭된 DNA를 포함하는 것인 방법.
  57. 제36항 내지 제52항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드 혼합물은, 플라스미드 또는 플라스미드 라이브러리로부터, 예를 들어 오픈 리딩 프레임(ORF) 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 인트론 라이브러리, BAC 라이브러리, PAC 라이브러리, 렌티바이러스 라이브러리, gRNA 라이브러리, PCR 생성물, 제한 소화 생성물, 또는 GATEWAY 셔틀링 생성물로부터의 포획된 또는 증폭된 DNA를 포함하는 것인 방법.
  58. 제36항 내지 제57항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드 혼합물의 올리고뉴클레오타이드는 공동 형질전환 및 리컴비니어링; 형질전환 및 리컴비니어링; 또는 콘쥬게이션 및 리컴비니어링을 포함하는 방법에 의해 공여체 플라스미드에 통합되는 것인 방법.
  59. 제58항에 있어서, 공동 형질전환 및 리컴비니어링의 방법은, 선택성 마커 및 혼합물 중의 올리고뉴클레오타이드의 말단에 있는 서열에 각각 상동인 2개의 상동 재조합 영역을 포함하는 선형 또는 원형 공여체 플라스미드를 구성하는 단계; 공여체 플라스미드 및 올리고뉴클레오타이드를 세포에 공동 형질전환시키는 단계; 상동 재조합을 유도하는 단계; 및 선택성 마커를 선택하는 단계를 포함하며; 선택적으로 방법은 공여체 플라스미드 및/또는 올리고뉴클레오타이드의 라이브러리 또는 풀(pool)로 수행되는 것인 방법.
  60. 제58항에 있어서, 형질전환 및 리컴비니어링의 방법은, 선택성 마커 및 혼합물 중의 올리고뉴클레오타이드의 말단에 있는 서열에 각각 상동인 2개의 상동 재조합 영역을 포함하는 선형 또는 원형 공여체 플라스미드를 구성하는 단계로서, 올리고뉴클레오타이드가 숙주 세포 내의 플라스미드 상에 있는 것인 단계; 숙주 세포를 공여체 플라스미드로 형질전환시키는 단계; 상동 재조합을 유도하는 단계; 및 선택성 마커를 선택하는 단계를 포함하는 것인 방법.
  61. 제58항에 있어서, 콘쥬게이션 및 리컴비니어링의 방법은, 2개의 선택적인 엔도뉴클레아제 부위 및 2개의 상동 재조합(HR) 영역이 측면에 있는 역선택성 마커(-1)를 포함하는 선형 또는 원형 공여체 플라스미드를 구성하는 단계로서, 공여체 플라스미드는, 콘쥬게이션을 유도할 수 있지만 콘쥬게이션을 할 수 없는 손상된 F 플라스미드를 함유한 공여체 세포 내에 있고, 혼합물의 올리고뉴클레오타이드는 수령체 세포 내의 플라스미드 상에 있으며, 각각은, 공여체 플라스미드의 HR 영역에 상동인 HR 영역이 측면에 있고 각각의 올리고뉴클레오타이드의 공여체 플라스미드로의 재조합을 선택하기 위해 적어도 하나의 선택성 마커(+1)에 인접하는 것인 단계; 상동 재조합효소 및 선택적으로 하나 이상의 엔도뉴클레아제를, 수령체 세포 내 또는 공여체 플라스미드에 의해 코딩된 것을 제공하는 단계; (i) 공여체 플라스미드를 박테리아 콘쥬게이션에 의해 공여체 세포로부터 수령체 세포로 전달하고 (ii) 공여체 플라스미드와 수령체 플라스미드를 상동 재조합에 의해 재조합하는 조건 하에서 공여체 세포와 수령체 세포를 접촉시키는 단계; 및 선택성 마커를 포함하지만 역선택성 마커를 포함하지 않는 세포를 선택하는 단계를 포함하는 것인 방법.
  62. 제60항 또는 제61항에 있어서, 방법은 공여체 및/또는 수령체 플라스미드의 라이브러리로 수행되는 것인 방법.
  63. 제60항 내지 제62항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드는 ORF 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 인트론 라이브러리, BAC 라이브러리, PAC 라이브러리, 렌티바이러스 라이브러리, gRNA 라이브러리, gDNA 라이브러리, cDNA 라이브러리, 단백질 도메인 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 조절 요소의 라이브러리, 구조 요소의 라이브러리, 또는 DNA 돌연변이유발로부터 유래된 DNA 변이체의 라이브러리와 같은 라이브러리를 포함하는 것인 방법.
  64. 제36항 내지 제57항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드 혼합물은, 플라스미드 라이브러리, 예를 들어 gRNA 라이브러리, gDNA 라이브러리, cDNA 라이브러리, 오픈 리딩 프레임(ORF) 라이브러리, 단백질 도메인 라이브러리, 프로모터 라이브러리, 터미네이터 라이브러리, 조절 요소의 라이브러리, 구조 요소의 라이브러리, 또는 DNA 돌연변이유발로부터 유래된 DNA 변이체의 라이브러리를 포함하는 세포의 어레이를 포함하는 것인 방법.
  65. 제36항 내지 제57항 중 어느 하나의 항에 있어서, 올리고뉴클레오타이드 혼합물은, 제1항 내지 제35항 중 어느 하나의 항의 방법에서 사용하기 위한 DNA 요소 단편을 포함하는 세포의 어레이를 포함하는 것인 방법.
KR1020237033307A 2021-03-05 2022-03-04 생체내 dna 조립 및 분석 KR20230152124A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163157497P 2021-03-05 2021-03-05
US202163157498P 2021-03-05 2021-03-05
US63/157,498 2021-03-05
US63/157,497 2021-03-05
PCT/US2022/019012 WO2022187697A1 (en) 2021-03-05 2022-03-04 In vivo dna assembly and analysis

Publications (1)

Publication Number Publication Date
KR20230152124A true KR20230152124A (ko) 2023-11-02

Family

ID=83155603

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237033307A KR20230152124A (ko) 2021-03-05 2022-03-04 생체내 dna 조립 및 분석

Country Status (8)

Country Link
EP (1) EP4301854A4 (ko)
JP (1) JP2024509194A (ko)
KR (1) KR20230152124A (ko)
AU (1) AU2022228362A1 (ko)
CA (1) CA3212642A1 (ko)
DE (1) DE112022001365T5 (ko)
GB (1) GB202315184D0 (ko)
WO (1) WO2022187697A1 (ko)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
CN1263860C (zh) * 2002-09-30 2006-07-12 华南农业大学 多基因载体的构建方法与应用
WO2007005053A1 (en) * 2005-06-30 2007-01-11 Codon Devices, Inc. Hierarchical assembly methods for genome engineering
US7943374B2 (en) 2005-08-21 2011-05-17 Markus Hildinger Super-size adeno-associated viral vector harboring a recombinant genome larger than 5.7 kb
US20120192298A1 (en) 2009-07-24 2012-07-26 Sigma Aldrich Co. Llc Method for genome editing
WO2013163394A1 (en) 2012-04-25 2013-10-31 Regeneron Pharmaceuticals, Inc. Nuclease-mediated targeting with large targeting vectors
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
RU2685914C1 (ru) 2013-12-11 2019-04-23 Регенерон Фармасьютикалс, Инк. Способы и композиции для направленной модификации генома
US9476065B2 (en) * 2013-12-19 2016-10-25 Amyris, Inc. Methods for genomic integration
WO2019046350A1 (en) * 2017-08-30 2019-03-07 President And Fellows Of Harvard College ITERATIVE GENOMIC ASSEMBLY
US20200270632A1 (en) * 2017-09-15 2020-08-27 The Board Of Trustees Of The Leland Stanford Junior University Multiplex production and barcoding of genetically engineered cells
JP2022520063A (ja) * 2019-02-08 2022-03-28 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 組み合わせ遺伝子修飾を有する操作された細胞の産生および追跡

Also Published As

Publication number Publication date
EP4301854A1 (en) 2024-01-10
EP4301854A4 (en) 2024-04-10
WO2022187697A1 (en) 2022-09-09
JP2024509194A (ja) 2024-02-29
DE112022001365T5 (de) 2024-02-15
AU2022228362A1 (en) 2023-09-07
GB202315184D0 (en) 2023-11-15
CA3212642A1 (en) 2022-09-09

Similar Documents

Publication Publication Date Title
US20220033858A1 (en) Crispr oligoncleotides and gene editing
JP7201153B2 (ja) プログラム可能cas9-リコンビナーゼ融合タンパク質およびその使用
US6010907A (en) Eukaryotic use of non-chimeric mutational vectors
US20200048656A1 (en) RNA-Guided Human Genome Engineering
EP1034260B1 (en) Novel dna cloning method relying on the e. coli rece/rect recombination system
CN114375334A (zh) 工程化CasX系统
WO2019051097A1 (en) RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
WO2019006833A1 (zh) 猪全基因组特异性sgrna文库及其制备方法和应用
KR20200119239A (ko) 코리네박테리움에서 crispr을 사용하는 게놈 편집
JP2020503899A (ja) 遺伝子編集技術を用いたインビトロ部位特異的変異導入のための方法
WO2015144045A1 (zh) 包含两个随机标记的质粒库及其在高通量测序中的应用
WO2019173248A1 (en) Engineered nucleic acid-targeting nucleic acids
JP2023528715A (ja) リプログラミングされたtracrRNAを用いたRNA検出及び転写依存性編集
CN116716298A (zh) 一种引导编辑系统和目的基因序列的定点修饰方法
WO2023076952A1 (en) Enzymes with hepn domains
KR20230152124A (ko) 생체내 dna 조립 및 분석
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
JPWO2018015995A1 (ja) 長鎖一本鎖dnaを調製する方法
CN110241135B (zh) 促进基因编辑的化合物筛选和鉴定及其应用
CN117677694A (zh) 体内dna组装和分析
WO2010113031A2 (en) Method of altering nucleic acids
Gelsinger et al. Bacterial genome engineering using CRISPR-associated transposases
WO2024119461A1 (en) Compositions and methods for detecting target cleavage sites of crispr/cas nucleases and dna translocation
US20230123171A1 (en) Dna recombinase mediated assembly of dna long adapter single stranded oligonucleotide (lasso) probes
KR20230156665A (ko) CRISPR-Cas9을 이용한 정교한 다중 유전체 편집 방법 및 이의 용도