KR102451796B1 - 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법 - Google Patents

크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법 Download PDF

Info

Publication number
KR102451796B1
KR102451796B1 KR1020177037797A KR20177037797A KR102451796B1 KR 102451796 B1 KR102451796 B1 KR 102451796B1 KR 1020177037797 A KR1020177037797 A KR 1020177037797A KR 20177037797 A KR20177037797 A KR 20177037797A KR 102451796 B1 KR102451796 B1 KR 102451796B1
Authority
KR
South Korea
Prior art keywords
repeat
crispr
sequence
type
spacer
Prior art date
Application number
KR1020177037797A
Other languages
English (en)
Other versions
KR20180010272A (ko
Inventor
로돌프 바랑고
커트 엠. 셀
Original Assignee
노쓰 캐롤라이나 스테이트 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노쓰 캐롤라이나 스테이트 유니버시티 filed Critical 노쓰 캐롤라이나 스테이트 유니버시티
Priority to KR1020227034331A priority Critical patent/KR20220139447A/ko
Publication of KR20180010272A publication Critical patent/KR20180010272A/ko
Application granted granted Critical
Publication of KR102451796B1 publication Critical patent/KR102451796B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N37/00Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
    • A01N37/44Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing at least one carboxylic group or a thio analogue, or a derivative thereof, and a nitrogen atom attached to the same carbon skeleton by a single or double bond, this nitrogen atom not being a member of a derivative or of a thio analogue of a carboxylic group, e.g. amino-carboxylic acids
    • A01N37/46N-acyl derivatives
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/10Animals; Substances produced thereby or obtained therefrom
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/60Isolated nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/12Applications; Uses in screening processes in functional genomics, i.e. for the determination of gene function

Abstract

본 발명은 박테리아, 고세균, 조류 및/또는 효모를 사멸시키기 위해 박테리아, 고세균, 조류 및/또는 효모에서 필수 및 비-필수 유전자 및 소모 가능한 게놈 섬을 스크리닝하기 위한 용도, 유전자 또는 유전자들의 표현형(phenotype)을 동정하기 위한 용도, 및/또는 박테리아, 고세균, 조류 및/또는 효모에서 감소된 게놈 크기 및/또는 유전자 결실을 스크리닝하기 위한 크리스퍼(CRISPR) 핵산의 용도에 관한 것이다.

Description

크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법
우선권의 선언
본 출원은 35 U.S.C.§119 (e)에 의거하여, 2015년 5월 29일 자로 출원된 미국 가출원 제62/168,355호 및 2016년 2월 18일 자로 출원된 미국 가출원 제62/296,853호에 대하여 이익을 주장하며, 이들 각각의 전체 내용은 본 명세서에 참고로서 통합된다.
본 발명은 박테리아, 고세균, 조류 및/또는 효모를 사멸시키기 위해 박테리아, 고세균, 조류 및/또는 효모에서 필수 및 비-필수 유전자 및 소모 가능한 게놈 섬을 스크리닝하기 위한 용도, 유전자 또는 유전자들의 표현형(phenotype)을 동정하기 위한 용도, 및/또는 박테리아, 고세균, 조류 및/또는 효모에서 감소된 게놈 크기 및/또는 유전자 결실을 스크리닝하기 위한 크리스퍼(CRISPR) 핵산의 용도에 관한 것이다.
주기적 간격으로 분포하는 짧은 회문 구조의 반복(Clustered Regularly Interspaced Short Palindromic Repeats: CRISPR)은, 연관된 서열(cas)과 조합으로, 많은 박테리아에서 적응 면역을 부여하는 크리스퍼-카스(크리스퍼-카스) 시스템을 구성한다. 크리스퍼(CRISPR)-매개 면역은 플라스미드 및 파지와 같은 침입 유전 요소로부터의 DNA의 섭취를 통해 새로운 "스페이서(spacers)"로서 발생한다.
크리스퍼-카스 시스템은, 서열-특이적 표적 및 간섭을 통해, 파지와 플라스미드와 같은 침입(invasive) 유전 요소에 대해 적응 면역을 제공하는, 초가변(hypervariable) 서열에 의해 중간에 위치하는 짧은 DNA 반복 배열로 구성된다 (Barrangou et al. 2007. Science. 315:1709-1712; Brouns et al. 2008. Science 321:960-4; Horvath and Barrangou. 2010. Science. 327:167-70; Marraffini and Sontheimer. 2008. Science. 322:1843-1845; Bhaya et al. 2011. Annu . Rev. Genet. 45:273-297; Terns and Terns. 2011. Curr . Opin . Microbiol . 14:321-327; Westra et al. 2012. Annu . Rev. Genet. 46:311-339; Barrangou R. 2013. RNA. 4:267-278). 전형적으로, 침입 DNA 서열은 새로운 "스페이서"(Barrangou et al., 2007 : Science 315 : 1709-1712)로서 획득되며, 각각 CRISPR 반복과 쌍을 이루며, 상기 CRISPR 유전자좌(locus)에 새로운 반복-스페이서 유닛으로서 삽입된다. 이어서, 상기 반복-스페이서 어레이는 서열-특이적 인식을 유도하는 작은 간섭성 CRISPR RNA(small interfering CRISPR RNAs)(crRNA)로 프로세싱되는 긴 프리-CRISPR RNA(pre-crRNA)로 전사된다(Brouns et al. 2008. Science 321:960-4). 특히, crRNA는 카스 엔도뉴클레아제(Cas endonucleases)에 의해 매개되는 서열-특이적 핵산 절단을 위한 뉴클레아제(nucleases)를 상보적인 표적(complementary target)으로 유도한다(Garneau et al., 2010. Nature 468 : 67-71, Haurwitz et al. 2010. Science 329 : 1355-1358, Sapranauskas et Nucleic Acid Res. 39 : 9275-9282, Jinek et al. 2012. Science 337 : 816-821, Gasiunas et al. 2012. Proc . Natl . Acad . Sci . 109 : E2579-E2586, Magadan et. PLoS One.7 : e40913, Karvelis 등, 2013. RNA Biol.10 : 841-851). 이러한 광범위한 시스템은 거의 절반의 박테리아(~46%)와 대다수의 고세균(~90 %)에서 발생한다.
일반적으로, 카스 유전자 내용, 카스 오페론 구조, 카스 단백질 서열 및 처리 단계(Makarova et al. Biol Direct. 6 : 38 (2011), Makarova and Koonin Methods Mol Biol . 1311 : 47-75 (2015), Barrangou, R. Genome Biology 16 : 247 2015))에 기초하여 5가지 주요 타입 및 16가지 상이한 아형을 포함하는 크리스퍼-카스 시스템의 2가지 주류(Makarova et al. Nat Rev Microbiol .13 : 722-736 (2015)가 있다. 타입 I과 타입 III에서는 상기 전문화된 카스 엔도뉴클레아제가 상기 프리-crRNA를 가공한 다음 crRNA와 상보적인 핵산을 인식하고 절단할 수 있는 대형 멀티-카스 단백질 복합체로 조립한다. 타입 I 시스템은 캐스케이드-유도된(Cascade-driven) 및 PAM-의존적 방식으로 DNA를 표적하며, 시그니쳐 단백질 Cas3을 사용하여 표적 핵산을 파괴하는, 가장 빈번하고 널리 보급된 시스템이다. 타입 II 크리스퍼-카스 시스템에는 다른 프로세스가 관련된다. 여기에서, 상기 프리-CRNA는 트랜스-활성화(trans-activating) crRNA (tracrRNA)가 상기 crRNA의 반복 영역에 혼성화 되는 메카니즘에 의해 처리된다. 혼성화된 crRNA-tracrRNA는 RNase III에 의해 절단되고 각 스페이서의 5 '말단을 제거하는 두 번째 사건 이후, tracrRNA 및 Cas9 둘 모두와 관련되고 남아있는 성숙한(mature) crRNA가 생성된다. 상기 성숙한 복합체는 그 다음에 상기 복합체의 상기 스페이서 서열에 상보적이고 두 개의 가닥 모두를 절단하는 표적 dsDNA 서열('프로토스페이서(protospacer)' 서열)에 위치한다. 타입 II 시스템에서 복합체에 의한 표적 인식 및 절단은 crRNA-tracrRNA 복합체상의 스페이서 서열과 표적 '프로토스페이서' 서열 사이에 상보적인 서열을 필요로 할 뿐만 아니라, 또한 상기 프로토스페이서 서열의 3 '말단에 위치하는 프로토스페이서 인접 모티프(protospacer adjacent motif)(PAM) 서열도 필요로 한다.
본 발명의 일 양상은 필수 유전자, 비-필수 유전자 및/또는 소모 가능한 게놈 섬(expendable genomic islands)을 위한 박테리아 세포의 집단(population)을 스크리닝하는 방법으로서: (5’에서 3’) 반복-스페이서-반복(repeat-spacer-repeat) 서열 또는 적어도 하나의 반복-스페이서(repeat-spacer) 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물(heterologous nucleic acid construct)을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 이에 따라 형질 전환된 박테리아 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 결실의 존재 또는 부재를 결정하는 단계로서, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 존재는 상기 표적 영역이 비-필수 유전자 및/또는 소모 가능한 게놈 섬 내에 포함되는 것을 나타내며, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 부재는 상기 표적 영역이 필수 유전자 내에 포함되는 것을 의미하는 것인 단계를 포함하는 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 Ⅲ, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
본 발명의 제2 양상은 필수 유전자, 비-필수 유전자 및/또는 소모 가능한 게놈 섬을 위한 박테리아(bacterial), 고세균(archaeal), 조류(algal) 또는 효모(yeast) 세포의 집단을 스크리닝하는 방법으로서, 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 도입하여, 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 결실의 존재 또는 부재를 결정하는 단계로서, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 존재는 상기 표적 영역이 비-필수 유전자 및/또는 소모 가능한 게놈 섬 내에 포함되는 것을 나타내며, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 부재는 상기 표적 영역이 필수 유전자 내에 포함되는 것을 의미하는 것인 단계를 포함하는 방법을 제공한다.
본 발명의 제3 양상은 박테리아 세포의 집단 내 하나 이상의 박테리아 세포를 사멸시키는 방법으로서, (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아 세포의 상기 게놈에서 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 이에 따라 상기 박테리아 세포의 집단 내의 상기 표적 영역을 포함하는 하나 이상의 박테리아 세포를 사멸시키는 것인 단계를 포함하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 Ⅲ, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
본 발명의 제4 양상은 박테리아, 고세균, 조류 또는 효모 집단 내의 하나 이상의 세포를 사멸시키는 방법으로서, (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체(chromosomal) 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 도입하여, 상기 게놈 내의 상기 표적 영역을 포함하는 박테리아, 고세균, 조류 또는 효모 세포의 집단 내 하나 이상의 세포를 사멸시키는 것인 단계를 포함하는 것인 방법을 제공한다.
본 발명의 제5 양상은 박테리아 유전자와 연관된 표현형(phenotype)을 동정하는 방법으로서, (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 폴리펩티드 또는 기능성 핵산을 코딩하는 개방형 해독 틀(open reading frame)의 적어도 일 부분을 포함하고, 이에 따라 상기 표적 영역을 포함하는 세포를 사멸시키는 것 및 상기 표적 영역이 없는 형질 전환된 박테리아 세포의 집단을 생산하는 것인 단계; 및 상기 집단의 상기 표현형을 분석하는 단계를 포함하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 Ⅲ, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
본 발명의 제6 양상은 박테리아, 고세균, 조류 또는 효모 유전자의 표현형을 동정하는 방법으로서, (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 도입하여, 상기 게놈 내의 상기 표적 영역을 포함하는 박테리아, 고세균 또는 효모 세포를 사멸시키는 것 및 상기 표적 영역이 없는 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단의 상기 표현형을 분석하는 단계, 및/또는 (i) 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 개별 박테리아, 고세균, 조류 또는 효모 콜로니를 성장시키는 단계 및 (ii) 상기 개별 콜로니의 상기 표현형을 분석하는 단계를 포함하는 것인 방법을 제공한다.
본 발명의 제7 양상은 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 박테리아 세포의 집단으로부터 선별하는 방법으로서, (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물을 박테리아 세포의 집단으로 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역을 포함하는 상기 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 상기 박테리아 세포의 집단으로부터 선별하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 Ⅲ, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
본 발명의 제8 양상은 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 박테리아 세포의 집단으로부터 선별하는 방법으로서, 박테리아 세포의 집단에 하기를 도입하는 단계를 포함하는 것인 방법: (a)(i) 상기 박테리아 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합(homologous recombination)을 위한 비-천연 부위를 포함하는 형질 전환 박테리아 세포의 집단을 생산하는 것; 및 (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 상기 박테리아 세포의 집단으로부터 선별하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 Ⅲ, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
본 발명의 제9 양상은 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 박테리아, 고세균, 조류 또는 효모 세포의 집단(population)으로부터 선별하는 방법으로서, 박테리아, 고세균, 조류 또는 효모 세포의 집단에 (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 및/또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 도입하는 단계로서, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 선별하는 것인 방법을 제공한다.
본 발명의 제10 양상은 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 박테리아, 고세균 또는 효모 세포의 집단(population)으로부터 선별하는 방법으로서, 박테리아, 고세균, 조류 또는 효모 세포의 집단에 하기를 도입하는 단계를 포함하는 것인 방법: (a)(i) 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합(homologous recombination)을 위한 비-천연 부위를 포함하는 형질 전환 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것; 및 (b)(i) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (ii) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (iii) Cas9 폴리펩티드 및/또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물로서, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 선별하는 것인 방법을 제공한다.
본 발명의 제11 양상은 박테리아의 집단에서 그의 게놈에 결실을 가지는 적어도 하나의 분리주(isolate)를 동정하는 방법으로서, (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역을 포함하는 상기 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질 전환된 박테리아 세포의 집단을 생산하는 단계; 및 상기 형질 전환된 박테리아 세포의 집단으로부터 개별 박테리아 콜로니를 성장시키는 단계로서, 이에 따라 상기 박테리아의 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 단계를 포함하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 Ⅲ, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
본 발명의 제12 양상은 박테리아의 집단에서 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 방법으로서, 상기 박테리아 세포의 집단에 하기를 도입하는 단계; (a) (i) 상기 박테리아 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합(homologous recombination)을 위한 비-천연 부위를 포함하는 형질 전환 박테리아 세포의 집단을 생산하는 것; 및 b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질전환된 박테리아 세포의 집단을 생산하는 것; 및 상기 형질 전환된 박테리아 세포의 집단으로부터 개별 박테리아 콜로니를 성장시키는 단계로서, 이에 따라 상기 박테리아의 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 것인 단계를 포함하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 Ⅲ, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
본 발명의 제13 양상은 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 방법으로서, 박테리아, 고세균, 조류 또는 효모 세포의 집단에 하기를 도입하는 단계; (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 개별 박테리아, 고세균, 조류 또는 효모 콜로니를 성장시키는 단계로서, 이에 따라 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 것인 단계를 포함하는 것인 방법을 제공한다.
본 발명의 제14 양상은 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 방법으로서, 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 하기를 도입하는 단계;(a)(i) 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합을 위한 비-천연 부위를 포함하는 형질 전환 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것; 및 (b)(i) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (ii) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (iii) Cas9 폴리펩티드 및/또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물로서, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 개별 박테리아, 고세균 또는 효모 콜로니를 성장시키는 단계로서, 이에 따라 상기 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 것인 단계를 포함하는 것인 방법을 제공한다.
본 발명의 핵산 구조물, 핵산 어레이, 핵산 분자 및/또는 뉴클레오티드 서열을 포함하는 발현 카세트(cassettes), 세포 및 키트가 본 명세서에 추가로 제공된다.
본 발명의 이러한 양상 및 다른 양상은 이하의 본 발명의 설명에서 보다 상세하게 설명된다.
도 1은 각 복합 트랜스포손을 표적하기 위한 SthCRISPR1 및 SthCRISPR3 어레이의 서열을 도시한다.
도 2는 표적하는 플라스미드의 구성을 위한 스플라이싱 오버랩 연장(splicing overlap extension)(SOE) 방법의 개략도를 도시한다.
도 3a-3e는 필수 유전자, 삽입 서열 및 게놈 섬의 지도를 도시한다. (a)추정 필수 ORF (상단 행), 삽입 서열 (제2행) 및 추정 게놈 섬 (제3행)의 위치와 분포. 크리스퍼-카스(제4행) 매개된 결실에 대한 잠재적 표적은 스트렙토코커스 서모필러스(Streptococcus thermophilus) LMD-9의 게놈 내의 다양한 패밀리의 전이(transposable) 요소를 매핑함으로써 확인되었다. 각각에 대하여 상응하는 추정 게놈 섬과 프로토스페이서(protospacer)/PAM 조합의 유전적 구성. (b) 올리고 펩티드 수송(transport) 시스템을 코딩하는, 게놈 섬 1. (c) 세포-외피(cell-envelope) 프로테나아제 PrtS를 포함하는, 게놈 섬 2. (d) ATPase 구리-유출(copper-efflux) 단백질을 암호화하는 게놈 섬 3. (e) Lac 오페론을 포함하여 선별된 ORF를 코딩하는 게놈 섬.
도 4는 S. thermophilus LMD-9의 게놈 전체에 분포된 트랜스포손 코딩 서열의 덴드로그램을 제공한다. 정렬은 Geneious® 소프트웨어를 사용하여 작성되었다. 패밀리(family) 지정은 www-is.biotoul.fr을 사용하여 지정되었다. 각 패밀리에 대한 도 5에서의 문자는 정렬에 상응한다.
도 5a-5e는 S. thermophilus LMD-9 게놈에서 발견되는 각각의 주요 IS 패밀리에 대한 트랜스포손 코딩 서열의 정렬(Geneious® 소프트웨어 사용)을 나타낸다. 다른 패밀리는 길이와 뉴클레오티드 정체성의 보존 수준을 다양하게 나타냈다. (A) Sth6 트랜스포손은 일부 카피에서 내부 결실로 인해 높은 다형성(polymorphic)을 가지며 명백하게 퇴화되었다. 대조적으로, IS1167(b) 및 IS1191(c)는 더 적은 카피를 가지지만 길이 및 동일성에서 높은 정확도(fidelity)를 유지했다. IS1193(d)는 높은 정확도의 카피를 가지고 있었지만 길이에 있어 가장 큰 패밀리-내(intra-family) 다양성을 나타냈다.
도 6a-6c는 크리스퍼-Cas9에 의해 표적되는 DNA의 구조적 기초 및 명백한 세포 독성을 나타낸다. lacZ를 표적으로 하기 위한 SthCRISPR1 (a) 및 SthCRISPR3 (b)의 스페이서 서열은 DNA를 조사하고 tracrRNA::crRNA 이합체(duplex)의 형성을 통해 일어나는 표적에서 Cas9의 안정화와 함께 PAM 서열에 가역적으로 결합한다. Cas9의 활성화는 검정색 쐐기로 표시된 RuvC 및 HNH 도메인에 의한 각 가닥의 동시 절단을 일으킨다. 형질 전환체(transformant)는 대조군과 자기-표적 플라스미드의 전기 천공 후에 회복되었다(C). 평균 클론 ± SD이 시험한 각 플라스미드에 대해 독립적 형질 전환 실험 (n = 4)에 걸쳐 스크리닝 되었다.
도 7a-7d는 Lac 클론의 게놈 서열 분석 및 표현형 분석을 나타낸다. 서열 데이터는 CRISPR3 시스템을 사용하여 lacZ의 (a) 5 '말단 및 (b) 양이온-결합 잔기 코딩 서열을 표적함으로써 독립적으로 생성된 2개의 돌연변이체에서 lacZ를 코딩하는 염색체 단편의 부재를 밝혔다. 결실의 크기는 101,865-102,146 bp 길이이며, S. thermophilus의 게놈의 약 5.5%를 구성한다. (c) 세 가지 독립적인 생물학적 복제물의 평균 ±SD OD 600nm로 나타난 반-합성 엘리커(semi-synthetic Elliker) 배지에서 야생형과 비교하여 큰 결실 균주의 성장. (d) 탈지 우유에서 S. thermophilus 균주의 산성화 능력.
도 8a-8e는 삽입 서열들(IS) 사이의 재조합 이벤트의 도시를 제공한다. (a) 형질 전환체로부터 회수된 gDNA의 PCR 분석에 의해 수득된 큰 결실 앰플리콘(large deletion amplicons)의 겔 전기 영동 이미지. 추정 상실 부위의 상류 및 하류의 IS1193 요소에 인접한 프라이머를 사용하여 스크리닝이 수행되었다. Δ로 표시된 레인은 lacZ의 크리스퍼-카스 매개 표적 후 회수된 Lac- 클론의 gDNA로부터 증폭되었지만, 반면에 WT는 야생형으로부터 된 것이다. (b) 예측 재조합 부위의 서열은 상류(회색) 또는 하류(검정) IS 요소에 상응하는 단일 뉴클레오티드 다형성을 매핑핑함으로써 결정하였다. 상기 세 개의 부위는 두 개 모두의 IS 요소(밝은 회색)에서 보존된 서열을 기반으로 예측된다. 묘사된 부위는 독립적인 클론 유래의 유전형을 나타내며 9개의 서로 다른 재조합 위치에서 관찰된 Lac- 현상을 대표한다. 키메라 IS 요소 풋프린트는 삭제 접합(junction)에서 각 게놈 섬 유전자좌에서 유사하게 발견되었다. (c) IS의 도식은 lacZ를 코딩하는 상기 섬의 염색체 결실 동안 재결합할 것으로 예측된다. (D) 결실을 확인하기 위해 게놈 섬 1, 2 및 3에 인접한 프라이머로 생성된 앰플리콘. (e) 각 CRISPR-유도 결실 배양에서 야생형 서열의 부재를 확인하기 위하여 내부 프라이머로부터 생성된 앰플리콘. Δ로 표시된 레인은 크리스퍼-카스 매개 표적 후 회수된 클론의 gDNA로부터 증폭되었고, WT는 야생형이다.
도 9는 치사율의 표적을 제공하고, 스트렙토코커스 서모필러스(Streptococcus thermophilus) LMD-9의 게놈을 표적으로 하는 것을 통한 타입 II 크리스퍼-카스 시스템-기반 치사율을 평가하기 위하여 정의된 유전자좌의 사용을 나타낸다. 직교 타입 II 시스템(CRISPR1 및 CRISPR3) 모두가 실험되었다; 어두운 회색의 CRISPR1 표적, 밝은 회색의 CRISPR3 표적. (i) 유전자 간 영역(intergenic regions)(INT), (ii) 이동 유전 요소(ISSth7, oppC - GEI1 , prtS - GEI2 , copA - GEI3 , cI, lacZ - GEI4 , epsU), (iii) 필수 유전자(dltA , ltaS), (iv) 레플리코어(replicore)의 극점(OriC, xerS) 및 DNA의 포워드 vs. 리버스 가닥(외부 표적 vs. 내부 표적)을 실험하기 위하여 특이적 유전적 특징이 선별되었다.
도 10은 도 9에 정의된 영역을 표적함으로써 달성된 CRISPR-기반 치사율을 나타낸다. CFU(cell forming units, 세포 형성 단위)의 로그 감소는 비-표적 플라스미드 대조군의 형질 전환과 관련하여 계산되었다; pORI28. 치사율은 염색체 위치, 코딩 순서 또는 중요성에 관계없이 실험된 모든 표적에 대해 2-3 로그 감소 범위였다. ISSth7-삽입 서열 요소, ltaS-리포티코익산 신타아제(ltaS-lipoteichoic acid synthase); prtS-게놈 섬 2; INT-유전자 간 영역; dltA-D-알라닌 리가아제; rheB-chi 부위 결손 좌(locus); oppC- 게놈 섬 1; comS-chi 부위 조밀 좌(locus); 복제의 xerS-말단; copA-게놈 섬 3; cI-프로파지 잔여물; OriC-복제의 기원; Cas9-CRISPR3 Cas9 코딩 서열; epsU-엑소폴리사카라이드 카세트.
도 11은 CRISPR-매개 게놈 섬 결실 균주의 전사 프로파일을 도시한다.
도 12는 게놈 섬 결실 균주, GEI1, GEI2, GEI3 및 GEI4의 log2 형질 전환된 RNA-시퀀싱 판독 범위를 나타낸다.
도 13은 게놈 섬 결실 균주 발현 값(X-축) 대 야생형 발현 값(Y-축)의 XY 플롯을 나타낸다. 각각의 게놈 섬 결실 균주(GEI1-GEI4)에 대해, 각각의 표적 섬(흑색)에 코딩된 유전자의 발현은 최소였다. GEI1에서 코딩된 유전자는 왼쪽 상단 패널에, GEI2로 코딩된 유전자는 오른쪽 상단 패널에, GEI3로 코딩된 유전자는 왼쪽 하단 패널에, GEI4로 코딩된 유전자는 오른쪽 하단 패널에 나타냈다.
도 14a-14b는 스트렙토코커스 서모필러스(Streptococcus thermophiles)에서 프로그램된 세포 사멸을 위한 내인성 시스템을 공동-선택하기 위한 CRISPR 어레이 (타입 II 시스템)를 코딩하는 외인성 파지, 플라스미드 또는 파지미드의 도입을 나타낸다.
도 15. 락토바시러스 카세이(Lactobacillus casei)의 타입 II 가이드. 상단 구조는 상기 예측된 가이드다. 왼쪽 하단의 도면은 RNA 시퀀싱으로 확인된 올바른 이중 가이드 crRNA:tracrRNA 이다. 오른쪽 하단의 도면은 예측된 인공 단일 가이드의 예시이다.
도 16은 락토바실러스 가세리(Lactobacillus gasseri)의 예시적인 타입 II 가이드를 제공한다. 상단 구조는 상기 예측된 가이드다. 왼쪽 하단의 도면은 RNA t시퀀싱으로 확인된 올바른 이중 가이드 crRNA:tracrRNA 이다. 오른쪽 하단의 도면은 예측된 인공 단일 가이드의 예시이다.
도 17은 락토바실러스 펜토서스(Lactobacillus pentosus)의 예시적인 타입 II 가이드를 제공한다. 상단 구조는 상기 예측된 가이드다. 왼쪽 하단의 도면은 RNA 시퀀싱으로 확인된 올바른 이중 가이드 crRNA:tracrRNA 이다. 오른쪽 하단의 도면은 예측된 인공 단일 가이드의 예시이다.
도 18은 락토바실러스 제세니이(Lactobacillus jensenii)의 예시적인 타입 II 가이드를 제공한다. 왼쪽 패널은 RNA 시퀀싱으로 확인된 올바른 이중 가이드 crRNA:tracrRNA 이다. 오른쪽 패널은 예측된 인공 단일 가이드의 예시를 제공한다.
도 19는 천연 엘. 가세리(L. gasseri) Type II CRISPSR 어레이에서 가장 고도로 전사하는 crRNA와 일치하는 프로토스페이서를 함유하는 플라스미드의 형질 전환 결과를 보여준다. 왼쪽에서 오른쪽으로, 네 개의 다른 플라스미드가 엘. 가세리(L gasseri)로 전환되었다: 빈 pTRK563 벡터, 올바른 프로토스페이서를 가졌지만 부정확한 PAM을 가진 구조, 올바른 PAM을 가졌지만 상기 어레이에 없는 프로토스페이서를 가진 구조 및 상기 올바른 프로토 스페이서와 PAM을 가진 구조로서 가장 많은 간섭 표적과 세포 사멸을 보여준 구조. 보고된 값은 3개의 독립적인 복제의 평균 ± SEM을 나타낸다.
도 20은 천연 엘. 펜토서스(L. pentosus) 타입 II CRISPSR 어레이에서 가장 고도로 전사하는 crRNA와 일치하는 프로토스페이서를 포함하는 플라스미드의 형질 전환을 보여준다. 왼쪽에서 오른쪽으로, 네 개의 다른 플라스미드가 엘. 펜토서스(L. pentosus)로 형질 전환되었다: 올바른 프로토스페이서를 가진 구조이지만 부정확한 PAM을 가진 구조(Lpe4 ctGttt), 올바른 PAM를 가진 구조이지만 상기 어레이에 없는 프로토스페이서를 가진 구조(Lpe8 noSPCR), 비어있는 pTRK563 벡터 (pTRK563), 올바른 프로토스페이서 및 올바른 PAM (Lpe1 gttaat)을 가지는 플라스미드. 보고된 값은 3개의 독립적인 복제의 평균 ± SEM을 나타낸다.
도 21은 락토바실러스 카세이(Lactobacillus casei)의 예시적인 I 형 크리스퍼-카스 가이드를 제공한다. 상기 제공된 서열은 락토바실러스 카세이(Lactobacillus casei) NCK 125에서 발견되는 천연 타입 I 리더와 반복 서열이다. 이 인공 어레이는 상기 숙주 게놈에서 상기 16s rDNA 유전자를 표적으로 하는 스페이서를 포함한다.
도 22는 천연 엘. 제세니이(L. jensenii) 타입 II CRISPSR 어레이에서 가장 고도로 전사하는 crRNA와 일치하는 프로토스페이서를 포함하는 플라스미드의 형질 전환을 보여준다. 왼쪽에서 오른쪽으로, 네 개의 다른 플라스미드가 엘. 제세니이(L. jensenii)로 전환되었다: 빈 pTRK563 벡터, 올바른 프로토스페이서를 가졌지만 부정확한 PAM을 가진 구조, 올바른 PAM을 가졌지만 어레이에 없는 프로토스페이서를 가진 구조 및 상기 PAM을 가지는 올바른 프로토스페이서를 가진 구조로서 가장 많은 간섭 표적과 세포 사멸을 보여준 구조.
도 23은 락토바실러스 카세이(Lactobacillus casei) NCK 125에서 천연 타입 I 시스템을 사용하는 표적된 자가-사멸(targeted self-killing)을 나타낸다. 두 표적은 16s rDNA 유전자에서 고안되었다. 상기 PAM 5'-YAA-3 '은 유기체에서 천연 스페이서 서열을 사용하여 예측되었다. 천연 타입 I 리더를 포함하는 인공 배열, 반복 및 선별된 스페이서를 pTRK870에 클로닝하였다. 도입된 구조물은 빈 벡터 (pTRK563)와 두 개의 상이한 인공 배열을 포함하게 도입했다: 하나는 16s 유전자 에서 + 가닥을 표적으로 하는 단일 스페이서를 포함하는 어레이이고(1-2 alt), 다른 어레이는 + 가닥을 표적으로 하고 원래의 스페이서를 포함하지만 16s 유전자에서 - 가닥을 표적으로 하는 추가적인 스페이서를 포함하는 어레이(1, 2-3). 보고된 값은 3개의 독립적인 복제의 평균 ± SEM을 나타낸다.
이하, 본 발명의 실시예가 도시된 첨부 도면 및 실시예를 참조로 하여, 본 명세서에서 본 발명이 기술될 것이다. 본 설명은 본 발명이 구현될 수 있는 모든 상이한 방식들 또는 본 발명에 추가될 수 있는 모든 특징들의 상세한 카탈로그가 되도록 의도되지는 않는다. 예를 들어, 일 실시예와 관련하여 설명된 특징들은 다른 실시예에 통합될 수 있고, 특정 실시예와 관련하여 도시된 특징들은 그 실시예로부터 삭제될 수있다. 따라서, 본 발명은 본 발명의 일부 실시예에서, 본 명세서에 설명된 임의의 특징 또는 특징들의 조합이 배제되거나 생략될 수 있음을 고려한다. 또한, 본 명세서에서 제안된 다양한 실시예에 대한 다수의 변형 및 부가로서, 본 발명의 범위를 벗어나지 않는 것은, 본 개시 내용에 비추어 당업계의 숙련된 기술자에게 명백할 것이다. 따라서, 이하의 설명은 본 발명의 일부 특정 실시예를 예시하기 위한 것이며, 그의 모든 순열, 조합 및 변형을 철저히 기술하지는 않는다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 발명의 설명에 사용된 용어는 특정 실시예만을 설명하기 위한 것이며, 본 발명을 제한하려는 것은 아니다.
본 명세서에서 인용된 모든 간행물, 특허 출원, 특허 및 기타 참고 문헌은 참고가 제시되는 문장 및/또는 단락과 관련된 지시를 위해 그의 전체로 참고로서 통합된다.
문맥이 달리 나타내지 않는 한, 본 명세서에 기술된 본 발명의 다양한 특징이 임의의 조합으로 사용될 수 있음을 구체적으로 의도한다. 또한, 본 발명은 또한 본 발명의 일부 실시예에서, 본 명세서에 설명된 임의의 특징 또는 특징들의 조합이 배제되거나 생략될 수 있음을 고려한다. 예시를 위해, 조성물이 성분 A, B 및 C를 포함하는 것으로 명시된 경우, A, B 또는 C 또는 이들의 조합 중 임의의 성분이 생략되고 단독으로 또는 임의의 조합으로 될 수 있음을 구체적으로 의도한다.
본 발명의 설명 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태 "a", "an"및 "the"는 문맥에 달리 명시되지 않는 한 복수 형태를 포함하는 것으로 의도된다.
또한 본 명세서에서 사용된 바와 같이, "및/또는(and/or)"은 하나 이상의 관련 열거된 항목의 임의의 및 모든 가능한 조합뿐만 아니라, 대안("또는(or)")으로 해석될 때 조합의 부족임을 지칭하고 포함한다.
용어 "약(about)"은 투여량 또는 시간주기 등과 같은 측정 가능한 값을 언급할 때 특정된 양의 ±20 %, ±10 %, ±5 %, ±1 %, ±0.5 % 또는 ±0.1 % 조차의 변동을 지칭한다.
본 명세서에서 사용되는 바와 같이, "X와 Y 사이(between X and Y)" 및 "약 X와 Y 사이(between about X and Y)"와 같은 구는 X 및 Y를 포함하는 것으로 해석되어야만 한다. 본 명세서에서 사용되는 바와 같이, "약 X와 Y 사이(between about X and Y)"와 같은 구는 "약 X와 약 Y 사이(between about X and about Y)"를 의미하고, "X에서 Y까지(from about X to Y)"와 같은 구는 "약 X에서 약 Y까지(from about X to about Y)"를 의미한다.
본 명세서에서 사용된 용어 "comprise," "comprises" 및 "comprising"은, 명시된 특징, 정수, 단계, 동작, 요소 및/또는 구성 요소의 존재를 나타내지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 구성 요소, 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다.
본 명세서에 사용된 바와 같이, "필수적으로 구성된(consisting essentially of)"이라는 과도기적 표현은 청구범위가 상기 청구범위에 명시된 특정 재료 또는 단계 및 본질적으로 기본적 및 신규한 특성(들)에 실질적으로 영향을 주지 않는 것을 포함하는 것으로 해석되어야 하는 것을 의미한다. 따라서, 본 발명의 청구 범위에서 사용되는 경우 "필수적으로 구성된(consisting essentially of)"이라는 용어는 "포함하는(comprising)"과 동등한 것으로 해석되도록 의도된 것이 아니다.
"Cas9 엔도뉴클레아제(cas9 nuclease)"는 CRISPR Cas 시스템에서 이중 가닥 DNA 절단을 촉매하는 엔도뉴클레아제의 거대한 군을 지칭한다. 이러한 폴리펩티드는 당업계에 잘 공지되어 있고 그 구조(서열)의 많은 부분이 특징화되어 있다(예를 들어, WO2013/176772; WO/2013/188638 참조). 이중 가닥 DNA의 절단을 촉매하는 도메인은 RuvC 도메인 및 HNH 도메인이다. RuvC 도메인은 (-) 가닥에 닉을 일으키고(nicking) HNH 도메인은 (+) 가닥에 닉을 일으킨다(예를 들어, Gasiunas et al. PNAS 109(36):E2579-E2586 (September 4, 2012) 참조).
본 명세서에 사용된 바와 같이, "키메라(chimeric)"는 2개 이상의 성분이 상이한 공급원(예를 들어, 상이한 유기체, 상이한 코딩 영역)으로부터 유래된 핵산 분자 또는 폴리펩티드를 지칭한다.
본 명세서에 사용된 "보체(Complement)"는 비교(comparator) 뉴클레오티드 서열과 100% 상보성 또는 동일성을 의미할 수 있거나 또는 100% 미만의 상보성(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 및 등, 상보성)을 의미할 수 있다.
용어 "상보적인(complementary)" 또는 "상보성"은, 본 명세서에서 사용되는 바와 같이, 관대한 염 및 온도 조건 하에서 염기-쌍에 의한 폴리뉴클레오티드의 천연 결합을 의미한다. 예를 들어, 서열 "A-G-T"는 상보적인 서열 "T-C-A"에 결합한다. 2개의 단일-가닥 분자 사이의 상보성은 일부만의 뉴클레오티드가 결합하는 경우에 "부분적(partial)"일 수 있거나, 또는 단일 가닥 분자 간에 완전한 상보성이 존재할 때 완전(complete)할 수 있다. 핵산 가닥 사이의 상보성의 정도는 핵산 가닥 사이의 혼성화의 효율 및 강도에 상당한 영향을 미친다.
본 명세서에 사용된 바와 같이, "접촉(contact)", "접촉하는(contacting)", "접촉된(contacted)" 및 그의 문법적 변형은, 목적하는 반응(예를 들어, 통합, 형질 전환, 스크리닝, 선별, 사멸, 동정, 증폭, 및 등)을 수행하기에 적합한 조건하에 원하는 반응의 성분을 함께 위치시키는 것을 지칭한다. 이러한 반응을 수행하기 위한 방법 및 조건은 당업계에 공지되어 있다(예를 들어, Gasiunas et al. (2012) Proc. Natl . Acad . Sci . 109:E2579-E2586; M.R. Green and J. Sambrook (2012) Molecular Cloning: A Laboratory Manual. 4th Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY 참조).
본 명세서에서 사용된 "결실(deletion)"은 염색체 또는 플라스미드의 일부의 손실(loss) 또는 결실, 유전자의 결실, 또는 염색체 또는 플라스미드로부터의 유전자 또는 유전자의 일부의 결실을 포함할 수 있다. 일 구체예에서, 결실은 하나의 유전자 또는 하나 이상의 유전자를 포함할 수 있다. 일 구체예에서, 결실은 또한 작은 비-코딩 RNA(non-coding RNAs)를 코딩할 수 있는 비-단백질 코딩 영역(non-protein-coding regions)의 손실을 포함할 수 있다. 일 구체예에서, 결실은 전체 플라스미드 또는 전체 이동 유전자 요소(mobile genetic element)의 손실을 포함할 수 있다. 일 구체예에서, 이동성 유전자 요소의 손실은, 예를 들어, 복제 또는 지속의 불능(inability)으로 정의 될 수 있다.
일 구체예에 있어서, 본 발명의 파스미드(phasmid)는 타입 I 크리스퍼-카스 시스템, 타입 II 크리스퍼-카스 시스템, 타입 III 크리스퍼-카스 시스템, 타입 IV 크리스퍼-카스 시스템 및/또는 타입 V 크리스퍼-카스 시스템(Makarova et al. Nature Reviews Biotechnology 13:722736 (2015) 참조) 유래의 CRISPR 어레이를 포함할 수 있다.
따라서, 일 구체예에서, 타입 I crRNA 외에도, 본 발명의 파스미드(phasmid)는 타입 I 폴리펩티드 및/또는 타입 I 캐스케이드 폴리펩티드(즉, 타입 I 크리스퍼-카스 시스템)를 포함할 수 있다.
본 명세서에서 사용된 바와 같이, "타입 I 폴리펩티드"는 Cas3 폴리펩티드, Cas3' 폴리펩티드, Cas3" 폴리펩티드, 그의 융합 변이체 및 항바이러스 방어("캐스케이드") 폴리펩티드를 위한 임의의 하나 이상의 타입 I 주기적 간격으로 분포하는 짧은 회문 구조의 반복(CRISPR)-관련 복합체를 지칭한다. 따라서, 상기 용어 "타입 I 폴리펩티드"는 타입 I-A 크리스퍼-카스 시스템, 타입 I-B 크리스퍼-카스 시스템, 타입 I-C 크리스퍼-카스 시스템, 타입 I-D 크리스퍼-카스 시스템, 타입 I-E 크리스퍼-카스 시스템, 타입 I-F 크리스퍼-카스 시스템 및/또는 타입 I-U 크리스퍼-카스 시스템을 구성하는 폴리펩티드를 지칭한다. 각각의 Type-I 크리스퍼-카스 시스템은 적어도 하나의 Cas3 폴리펩티드를 포함한다. Cas3 폴리펩티드는 일반적으로 헬리카제 도메인 및 HD 도메인 둘 모두를 포함한다. 그러나, 어떤 타입 I 크리스퍼-카스 시스템에서, 헬리카제 및 HD 도메인은 별도의 폴리펩티드, Cas3' 및 Cas3"에서 발견된다. 특히, Cas3'은 헬리카제 도메인을 코딩하고 반면에 Cas3"은 HD 도메인을 코딩한다. 결과적으로, 두 영역 모두 Cas3 기능에 필요하기 때문에, 타입 I 아형(subtype)은 Cas3(I-C, I-D, I-E, I-F, I-U) 또는 Cas3' 및 Cas3"(I-A, I-B)를 코딩한다.
본 명세서에서 사용된 바와 같이, "타입 I 캐스케이드 폴리펩티드"는 타입 -크리스퍼-카스 시스템에서 프리-crRNA의 처리 및 후속적으로 표적 DNA에 대한 결합에 관여하는 폴리펩티드의 복합체를 지칭한다. 이들 폴리펩티드는 타입 I 아형 I-A, I-B, I-C, I-D, I-E 및 I-F 캐스케이드 폴리펩티드를 포함하지만, 이들로 한정되지는 않는다. 타입 I-A 캐스케이드 폴리펩티드의 비-제한적인 예시는 Cas7 (Csa2), Cas8a1 (Csx13), Cas8a2 (Csx9), Cas5, Csa5, Cas6a, Cas3' 및/또는 Cas3"을 포함한다. 타입 I-B 캐스케이드 폴리펩티드의 비-제한적인 예시는 Cas6b, Cas8b (Csh1), Cas7 (Csh2) 및/또는 Cas5를 포함한다. 타입 I-C 캐스케이드 폴리펩티드의 비-제한적인 예시는 Cas5d, Cas8c (Csd1) 및/또는 Cas7 (Csd2)를 포함한다. 타입 I-D 캐스케이드 폴리펩티드의 비-제한적인 예시는 Cas10d (Csc3), Csc2, Csc1 및/또는 Cas6d를 포함한다. 타입 I-E 캐스케이드 폴리펩티드의 비-제한적인 예시는 Cse1 (CasA), Cse2 (CasB), Cas7 (CasC), Cas5 (CasD) 및/또는 Cas6e (CasE)를 포함한다. 타입 I-F 캐스케이드 폴리펩티드의 비-제한적인 예시는 Cys1, Cys2, Cas7 (Cys3) 및/또는 Cas6f (Csy4)를 포함한다. 타입 I-U 캐스케이드 폴리펩티드의 비-제한적인 예시는 Cas8c, Cas7, Cas5, Cas6 및/또는 Cas4를 포함한다.
일 구체예에서, 본 발명의 파스미드(phasmid)는 타입 II crRNA 이외에 타입 II 크리스퍼-카스 시스템을 포함할 수 있다. 타입 II 크리스퍼-카스 시스템은 세 개의 아형을 포함한다: 적응(adaptation) 폴리펩티드, Cas1, Cas2 및 선택적으로, Csn2 및/또는 Cas4 이외에, 다중도메인 단백질, Cas9를 각각 포함하는, 타입 II-A, 타입 II-B 및 타입 II-C. 대부분의 Type II 유전자좌(loci)는 또한 tracrRNA를 코딩한다. 예시적인 타입 II 크리스퍼-카스 시스템을 포함하는 유기체는 레지오넬라 뉴모필라 str. 파리 (Lvegionella pneumophila str. Paris), 스트렙토코커스 서모필러스(Streptococcus thermophilus) CNRZ1066 및 네이세리아 락타미카(Neisseria lactamica) 020-06를 포함한다.
추가적인 구체예에서, 본 발명의 파스미드는 타입 III crRNA 이외에 타입 III 크리스퍼-카스 시스템을 포함할 수 있다. 타입 I 시스템과 유사하게, 타입 III 시스템에서 처리 및 간섭은 다중단백질 CRISPR RNA(crRNA)-이펙터 복합체에 의해 매개된다(Makarova et al. Nature Reviews Biotechnology 13:722736 (2015))-타입 III에서 타입 I의 "CASCADE" 및 "Csm" 또는 "Cmr". 따라서, 일 구체예에서, 타입 III 크리스퍼-카스 시스템은 Csm 복합체(예를 들어, 타입 III-A Csm) 및/또는 Cmr 복합체(예를 들어, 타입 III-B Cmr) 및 선택적으로 Cas6 폴리펩티드를 포함할 수 있다. 대표적인 구체예에서, Csm 복합체는 Cas10 (또는 Csm1), Csm2, Csm3, Csm4, Csm5 및 Csm6 폴리펩티드를 포함할 수 있으며 Cmr 복합체는 Cmr1, Cas10 (또는 Cmr2), Cmr3, Cmr4, Cmr5 및 Cmr6 폴리펩티드를 포함할 수 있다. Csm 복합체 또는 Cmr 복합체 이외에, 타입 III 크리스퍼-카스 시스템은 Cas7 폴리펩티드를 추가로 포함할 수 있다. 타입 III 크리스퍼-카스 시스템의 4가지 아형은, III-A, III-B, III-C, III-D로 특징화되었다. 일 구체예에서, 타입 III-A 크리스퍼-카스 시스템은 Cas6, Cas10, Csm2, Cas7 (Csm3), Cas5 (Csm4), Cas7 (Csm5) 및 Csm6 폴리펩티드를 포함한다. 일 구체예에서, 타입 III-B 크리스퍼-카스 시스템은 Cas7 (Cmr1), Cas10, Cas5 (Cmr3), Cas7 (Cmr4), Cmr5, Cas6 및 Cas7 (Cmr6) 폴리펩티드를 포함한다. 일 구체예에서, 타입 III-C 크리스퍼-카스 시스템은 Cas7 (Cmr1), Cas7 (Cmr6), Cas10, Cas7 (Cmr4), Cmr5 및 Cas5 (Cmr3) 폴리펩티드를 포함한다. 일 구체예에서, 타입 III-D 크리스퍼-카스 시스템은 Cas10, Cas7 (Csm3), Cas5 (Csx10), Csm2, Cas7 (Csm3) 및 all1473 폴리펩티드를 포함한다.
일 구체예에서, 본 발명의 파스미드는 유형 IV crRNA 이외에 유형 IV 크리스퍼-카스 시스템을 포함할 수 있다. 타입 IV 크리스퍼-카스 시스템은 Csf4 폴리펩티드 (dinG) 및/또는 Csf1, Cas7 (Csf2) 및/또는 Cas5 (csf3) 폴리펩티드를 포함할 수 있다(Makarova et al, Nature Reviews Microbiology 13 : 722-736 (2015)).
일 구체예에서, 본 발명의 파스미드는 타입 V crRNA 이외에 타입 V 크리스퍼-카스 시스템을 추가로 포함한다. 타입 V 크리스퍼-카스 시스템은 Cpf1 폴리펩티드 및/또는 Cas1, Cas2 및/또는 Cas4 폴리펩티드를 포함할 수 있다(Makarova 등, Nature Reviews Microbiology 13 : 722-736 (2015)).
본 발명의 뉴클레오티드 서열의 "단편(fragment)" 또는 "부분(portion)"은 참조 핵산 또는 뉴클레오티드와 비교하여 상대적 길이가 감소되고(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상의 뉴클레오티드에 의해 감소된) 참조 핵산 또는 뉴클레오티드와 동일하거나 실질적으로 동일한(예를 들어, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한) 인접한 뉴클리오티드의 뉴클리오티드 서열을 포함하거나, 서열로 필수적으로 구성되거나, 서열로 구성된 뉴클레오티드 서열을 의미하는 것으로 이해될 것이다. 본 발명에 따른 그러한 핵산 단편 또는 부분은, 적절한 경우, 보다 큰 폴리뉴클레오티드에 구성으로 포함될 수 있다. 따라서, 예를 들어, 표적 DNA(예를 들어, 게놈의 표적 영역)의 적어도 일부와 혼성화(또는 혼성화하다 및 이의 다른 문법 변형)는, 표적 DNA의 인접한 뉴클레오티드의 길이와 동일하거나 실질적으로 동일한 뉴클레오티드 서열에 혼성화하는 것을 지칭한다. 일 구체예에서, 반복 스페이서 서열의 반복 또는 반복-스페이서-반복 서열의 반복은 야생형 CRISPR 유전자좌의 반복 서열의 단편 또는 합성 CRISPR 어레이의 반복 서열을 포함할 수 있으며, 반복의 단편은 tracr 핵산과혼성화하는 CRISPR 어레이에서 반복의 기능을 유지한다.
일 구체예에서, 본 발명은 Cas9, Cas3, Cas3', Cas3" 또는 Cpf1 뉴클레아제의 기능적 단편을 포함할 수 있다. Cas9 기능성 단편은 HNH 뉴클레아제 활성, RuvC 뉴클레아제 활성, DNA, RNA 및/또는 PAM 인식 및 결합 활성을 포함하지만 이에 한정되지 않는, 천연 Cas9 핵산 분해 효소 활성의 하나 이상의 활성을 유지한다. Cas9 뉴클레아제의 기능적 단편은 Cas9 폴리뉴클레오티드의 단편에 의해 코딩될 수 있다. Cas3, Cas3' 또는 Cas3" 기능적 단편은 니카아제 활성, 엑소뉴클레아제 활성, DNA-결합 및/또는 RNA 결합을 포함하지만 이에 한정되지 않는, 천연 Cas9 뉴클레아제의 하나 이상의 활성을 보유한다. Cas3, Cas3' 또는 Cas3" 뉴클레아제의 기능적 단편은 각각 Cas3, Cas3' 또는 Cas3" 폴리뉴클레오티드의 단편에 의해 코딩될 수 있다.
본 명세서에 사용된 용어 "유전자(gene)"는 mRNA, 안티센스 RNA, RNAi (miRNA, siRNA, shRNA), 항-마이크로RNA 안티센스 올리고데옥시리보뉴클레오티드(anti-microRNA antisense oligodeoxyribonucleotide: AMO) 등을 생산하는 데 사용될 수 있는 핵산 분자를 의미한다. 유전자는 기능성 단백질이나 유전자 산물을 생산하는 데 사용될 수 있거나 그렇지 않을 수 있다. 유전자는 코딩 및 비-코딩 영역(예를 들어, 인트론, 조절 요소, 프로모터, 인핸서, 종결 서열 및/또는 5' 및 3' 비번역 영역)을 모두 포함할 수 있다. 유전자는 자연 상태의 핵산과 관련하여 통상적으로 발견되는 성분이 실질적으로 또는 필수적으로 없는 핵산을 의미하는 것에 의해 "단리될(isolated)" 수 있다. 이러한 성분은 다른 세포 물질, 재조합 생산물로부터의 배양 배지 및/또는 핵산을 화학적으로 합성하는데 사용되는 다양한 화학 물질을 포함한다.
본 명세서에서 사용된 용어 "게놈"은 미토콘드리아 및/또는 플라스미드 게놈뿐만 아니라 생물체의 염색체/핵 게놈을 포함한다.
본 명세서에서 사용된 "헤어핀 서열"은 헤어핀(예를 들어, 하나 이상의 헤어핀 구조를 형성하는)을 포함하는 뉴클레오티드 서열이다. 헤어핀(예를 들어, 줄기-루프, 폴드-백)은 단일 가닥-영역에 의해 각 부분에 더 인접한 이중 가닥을 형성하는 상보적인 뉴클레오티드의 영역을 포함하는 2차 구조를 갖는 핵산 분자를 지칭한다. 이러한 구조는 당업계에 널리 알려져 있다. 당업계에 공지된 바와 같이, 이중 가닥 영역은 염기 쌍에서 약간의 미스 매치를 포함할 수 있거나 완전히 상보적일 수 있다. 본 발명의 일 구체예에서, 핵산 구조물의 헤어핀 서열은 tracr 핵산의 3 '말단에 위치할 수 있다.
"이종성(heterologous)" 또는 "재조합(recombinant)" 뉴클레오티드 서열은 자연적으로 발생한 뉴클레오티드 서열의 자연적으로 발생하지 않은 다중 카피를 포함하여 그것이 도입되는 숙주 세포와 자연적으로 결합하지 않은 뉴클레오티드 서열이다.
상동성을 갖는 상이한 핵산 또는 단백질은 본 명세서에서 "동종체(homologues)"로 지칭된다. 용어 동종체는 동일 및 다른 종으로부터의 동종성 서열 및 동일 종 및 다른 종으로부터의 이종상동성(orthologous) 서열을 포함한다. "상동성(homology)"은 위치상의 동일성(positional identity)(즉, 서열 유사성 또는 동일성(identity))의 백분율의 측면에서 2개 이상의 핵산 및/또는 아미노산 서열 간의 유사성 수준을 지칭한다. 상동성은 또한 상이한 핵산 또는 단백질 사이의 유사한 기능적 특성의 컨셉을 지칭한다. 따라서, 본 발명의 조성물 및 방법은 추가적으로 본 발명의 뉴클레오티드 서열 및 폴리펩티드 서열에 대한 동종체를 포함한다. 본 명세서에서, “이종상동성(Orthologous)”은 종 분화 동안 공통의 조상 유전자로부터 발생한 상이한 종에서 상동 뉴클레오티드 서열 및/또는 아미노산 서열을 지칭한다. 본 발명의 뉴클레오티드 서열의 동종체는 본 발명의 상기 뉴클레오티드 서열에 대해 실질적 서열 동일성(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및/또는 100% 이상)을 갖는다. 따라서, 예를 들어, 타입 Ⅰ, 타입 Ⅱ, 타입 Ⅲ, 타입 Ⅳ, 또는 타입 Ⅴ 폴리뉴클레오티드 또는 폴리펩티드의 동종체는 공지된 임의의 것 또는 이후에 확인된 타입 Ⅰ, 타입 Ⅱ, 타입 Ⅲ, 타입 Ⅳ, 또는 타입 Ⅴ 폴리뉴클레오티드 또는 폴리펩티드 중 임의의 하나에 대해 약 70% 상동 또는 그 이상일 수 있다.
본 명세서에서, 혼성화, 혼성화하다, 혼성화하는 것, 및 이들의 문법적 변형은 두 개의 완전히 상보적인 뉴클레오티드 서열 또는 일부 미스매치된 염기 쌍이 존재할 수 있는 실질적으로 상보적인 서열의 결합을 지칭할 수 있다. 혼성화를 위한 조건은 당업계에 공지되어 있고 뉴클레오티드 서열의 길이와 뉴클레오티드 서열 사이의 상보성의 정도에 기초하여 변한다. 일부 구체예에서, 혼성화의 조건은 매우 엄격할 수 있고, 또는 그들은 상보성의 양 및 혼성화될 서열의 길이에 의존하여 중간 엄격성 또는 낮은 엄격성일 수 있다. 뉴클레오티드 서열 사이의 혼성화의 목적에 대한 낮은, 중간 및 높은 엄격성을 구성하는 조건은 당업계에 공지되어 있다(예를 들어, Gasiunas et al. (2012) Proc . Natl . Acad . Sci . 109:E2579-E2586; M.R. Green and J. Sambrook (2012) Molecular Cloning: A Laboratory Manual. 4th Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY 참조).
본 명세서에서, 용어 “증가하다,” '증가하는,” “증가된,” “향상하다,” “향상된,” “향상시키는,” 및 “향상” (및 이들의 문법적 변형)은 대조군과 비교하여 약 25%, 50%, 75%, 100%, 150%, 200%, 300%, 400%, 500% 또는 그 이상의 향상을 설명한다.
“천연” 또는 “야생형” 핵산, 뉴클레오티드 서열, 폴리펩티드 또는 아미노산 서열은 자연적으로 발생한 또는 내인성 핵산, 뉴클레오티드 서열, 폴리펩티드 또는 아미노산 서열을 지칭한다. 따라서, 예를 들어, “야생형 mRNA”는 유기체에서 자연적으로 발생하거나 유기체에 대해 내인성인 RNA이다. “상동” 핵산 서열은 도입되는 숙주 세포와 자연적으로 연관된 핵산 서열이다. 또한 본 명세서에서, 용어 “핵산,” “핵산 분자,” “핵산 구조물,” “뉴클레오티드 서열” 및 “폴리뉴클레오티드”는 선형 또는 분지형, 단일 또는 이중 가닥, 또는 그들의 혼합인 RNA 또는 DNA를 지칭한다. 상기 용어는 또한 RNA/DNA 혼성체(hybrid)를 포함한다. dsRNA가 합성적으로 생산되는 경우, 덜 흔한 염기, 예컨대 이노신,(inosine), 5-메틸시토신, 6-메틸아데닌, 하이폭산틴(hypoxanthine) 및 다른 것들이 또한 안티센스, dsRNA, 및 리보자임 쌍에 사용될 수 있다. 예를 들어, 유리딘 및 시티딘의 C-5 프로핀 유사체를 함유하는 폴리뉴클레오티드는 RNA에 높은 결합력으로 결합하는 것이 나타났고 유전자 발현의 강한 안티센스 억제인 것이 나타났다. 다른 변형, 예컨대 포스포디에스터 백본, 또는 RNA의 리보오스 당 작용기에서 2'-히드록시에 대한 변형 또한 제조될 수 있다. 본 발명의 핵산 구조물은 DNA 또는 RNA일 수 있지만, 바람직하게는 DNA일 수 있다. 따라서, 비록 본 발명의 핵산 구조물이 DNA의 형태로 기술되고 사용될 수 있지만, 의도된 사용에 의존하여, 그들은 또한 RNA의 형태로 기술되고 사용될 수 있다.
본 명세서에서, 용어 “뉴클레오티드 서열”은 뉴클레오티드의 헤테로폴리머 또는 핵산 분자의 5'에서 3' 발단의 이러한 뉴클레오티드의 서열을 지칭하고 cDNA를 포함하는 DNA 또는 RNA, DNA 단편 또는 부분, 게놈 DNA, 합성(예를 들어 화학적으로 합성된) DNA, 플라스미드 DNA, mRNA, 및 안티-센스 RNA를 포함하고, 이들 중 임의의 것은 단일 가닥 또는 이중 가닥일 수 있다. 용어 “뉴클레오티드 서열” “핵산,” “핵산 분자,” “올리고뉴클레오티드” 및 “폴리뉴클레오티드”는 또한 본 명세서에 뉴클레오티드의 헤테로폴리머를 지칭하기 위해 상호교환적으로 사용된다. 달리 지시되지 않는 한, 본 명세서에 제공된 핵산 분자 및/또는 뉴클레오티드 서열은 본원에 5'에서 3' 방향, 왼쪽에서 오른쪽으로 나타내어지고 U.S. 서열 규칙, 37 CFR §§1.821 - 1.825에 기재된 것과 같은 뉴클레오티드 성격을 나타내는 표준 코드 및 WIPO(World Intellectual Property Organization) 표준 ST.25.을 사용하여 나타낸다.
본 명세서에서, 용어 “퍼센트(percent) 서열 동일성” 또는 “퍼센트 동일성”은 두 서열이 최적으로 정렬될 경우 시험(“개체(subject)” 폴리뉴클레오티드 분자(또는 이의 상보적 가닥)과 비교하여 기준(“쿼리(query)”) 폴리뉴클레오티드 분자(또는 이의 상보적 가닥)의 선형 폴리뉴클레오티드 서열에서 동일한 뉴클레오티드의 백분율을 지칭한다. 일부 구체예에서, “퍼센트 동일성”은 아미노산 서열에서 동일한 아미노산의 백분율을 지칭할 수 있다.
“프로토스페이서(protospacer) 서열”은 표적 이중 가닥 DNA 및 특이적으로 크리스퍼 반복-스페이서 서열, 크리스퍼 반복-스페이서-반복 서열, 및/또는 크리스퍼 어레이에 대해 완전히 또는 실질적으로 상보적인(및 혼성화하는) 표적 DNA의 부분(예를 들어, 또는 게놈 내 표적 영역)을 지칭한다.
본 명세서에서, 용어 “감소하다,” “감소된,” “감소하는,” “감소,” “약화하다,” “억제하다,” 및 “줄이다”(및 이들의 문법적 변이형)은, 대조군과 비교하여 예를 들어, 약 5%, 10%, 15%, 20%, 25%, 35%, 50%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 이상의 감소를 기술한다. 특정 구체예에서, 감소는 검출가능한 활성 또는 측정되는 성분의 양(예를 들어, 세포의 집단 또는 게놈의 크기)이 없거나 본질적으로 없는 것(즉, 유의적이지 않은 양, 예를 들어, 약 10% 이하 또는 심지어 5% 이하)을 야기할 수 있다. 따라서, 예를 들어, 감소된 게놈 크기는 대조군과 비교하여 약 5%, 10%, 15%, 20%, 25%, 35%, 50%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 이상의 게놈 크기 감소를 의미할 수 있다.
본 명세서에서 대조군은, 예를 들어, 본 발명의 이종성 핵산 구조물로 형질전환되지 않은 박테리아, 고세균, 조류 또는 효모 세포의 집단일 수 있다. 일부 구체예에서, 대조군은 박테리아, 고세균, 조류 또는 효모 세포의 야생형 집단일 수 있고, 또는 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼 어레이를 포함하는 이종성 구조물로 형질전환된 박테리아, 고세균 또는 효모 세포의 집단일 수 있다, 여기서 상기 스페이서는 상기 집단의 박테리아, 고세균 또는 효모 세포의 게놈 내 표적 영역에 대해 상보적이지 않은 뉴클레오티드 서열을 포함한다(즉, 비-자기 표적/"스크램블 스페이서"). 추가적인 양상에서, 대조군은, 예를 들어, 박테리아, 고세균, 조류 또는 효모 세포의 야생형 집단, 또는 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼 어레이를 포함하는 이종성 구조물로 형질전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단이다, 여기서 상기 스페이서는 프로토스페이서 인접 모티프(PAM)에 인접하여 위치하지 않은 상기 집단의 박테리아, 고세균, 조류 또는 효모 세포의 게놈 내 표적 영역에 대해 실질적으로 상보적인 뉴클레오티드 서열을 포함한다.
본 명세서에서 "반복 서열"은, 예를 들어, "스페이서 서열"에 의해 분리된 야생형 크리스퍼 유전자좌의 임의의 반복 서열 또는 합성 크리스퍼 어레이의 반복 서열을 지칭한다(예를 들어, 본 발명의 반복-스페이서 서열 또는 반복-스페이서-반복 서열). 본 발명에서 유용한 반복 서열은 임의의 공지된 또는 이후에 확인되는 크리스퍼 유전자좌의 반복 서열일 수 있다. 따라서, 일부 구체예에서, 반복-스페이서 서열 또는 반복-스페이서-반복은 야생형 타입 Ⅱ 크리스퍼 어레이 유래의 반복에 대해 실질적으로 동일한(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상) 반복을 포함한다. 일부 구체예에서, 반복 서열은 야생형 타입 Ⅰ 크리스퍼 어레이, 야생형 타입 Ⅱ 크리스퍼 어레이, 야생형 타입 Ⅲ 크리스퍼 어레이, 야생형 타입 Ⅳ 크리스퍼 어레이, 또는 야생형 타입 Ⅴ 크리스퍼 어레이 유래의 반복에 대해 100% 동일하다. 추가적인 구체예에서, 본 발명에서 유용한 반복 서열은 크리스퍼 유전자좌 또는 타입 Ⅰ crRNA, 타입 Ⅱ crRNA, 타입 Ⅲ crRNA, 타입 Ⅳ crRNA, 또는 타입 Ⅴ crRNA 중 임의의 크리스퍼 어레이의 반복 서열의 연속적 뉴클레오티드의 단편 또는 부분인 뉴클레오티드 서열을 포함할 수 있다.
본 명세서에서, 타입 Ⅰ, 타입 Ⅱ, 타입 Ⅲ, 타입 Ⅳ, 또는 타입 Ⅴ 크리스퍼-카스 시스템의 "크리스퍼 어레이"는 5'에서 3' 반복-스페이서-반복 서열을 포함 또는 5'에서 3' 적어도 하나의(예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 반복-스페이서 서열, 및 그중 임의의 범위 또는 값) 반복-스페이서 서열을 포함하는 핵산 구조물을 지칭한다. 하나 이상의 반복-스페이서가 크리스퍼 어레이에 포함된 경우, 선행 (5'에서 3') 반복-스페이서 서열의 스페이서는 후속 반복-스페이서의 반복에 연결될 수 있다(예를 들어, 첫번째 반복-스페이서 서열의 스페이서가 두번째 반복-스페이서 서열의 반복에 연결됨). 일부 구체예에서, 크리스퍼 어레이는 스페이서에 의해 분리된 두 개의 반복 (또는 두 개의 부분적 반복)을 포함할 수 있다(예를 들어, 반복-스페이서-반복 서열).
본 명세서에서 "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오티드 또는 펩티드 서열이 성분, 예를 들어 뉴클레오티드 또는 아미노산의 정렬 윈도우를 통해 변하지 않는 정도를 지칭한다. "동일성"은 다음에 기술된 방법을 포함하지만, 이에 제한되지 않는 알려진 방법에 의해 미리 계산될 수 있다: Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988); Biocomputing : Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, New York (1993); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, New Jersey (1994); Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987); 및 Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991).
본 명세서에서 "스페이서 서열"은 표적 DNA에 상보적인 뉴클레오티드 서열이다(즉, 게놈 내 표적 영역 또는 "프로토스페이서 서열", 이는 PAM 서열에 인접함). 스페이서 서열은 표적 DNA에 대해 완전히 상보적이거나 실질적으로 상보적(예를 들어, 약 70% 상보적(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상)) 일 수 있다. 대표적인 구체예에서, 스페이서 서열은 표적 DNA에 대해 100% 상보성을 갖는다. 추가적인 구체예에서, 표적 DNA에 대한 스페이서 서열의 3' 영역의 상보성은 100%이지만 스페이서의 5' 영역에서는 100% 이하이고 따라서 표적 DNA에 대한 스페이서 서열의 전체 상보성은 100% 이하이다. 따라서, 예를 들어, 20 뉴클레오티드 스페이서 서열(시드 서열)의 3' 영역 내 첫번째 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 등의 뉴클레오티드는 표적 DNA에 대해 100% 상보적일 수 있는 반면, 스페이서 서열의 나머지 5' 영역 내 뉴클레오티드는 표적 DNA에 대해 실질적으로 상보적이다(예를 들어, 약 70% 이상 상보적). 일부 구체예에서, 스페이서 서열의 첫번째 7 내지 12 뉴클레오티드는 표적 DNA에 대해 100% 상보적일 수 있는 반면, 스페이서 서열의 5' 영역 내 나머지 뉴클레오티드는 표적 DNA에 대해 실질적으로 상보적이다(예를 들어, 약 70% 이상 상보적). 다른 구체예에서, 스페이서 서열의 첫번째 7 내지 10 뉴클레오티드는 표적 DNA에 대해 100% 상보적일 수 있는 반면, 스페이서 서열의 5' 영역 내 나머지 뉴클레오티드는 표적 DNA에 대해 실질적으로 상보적이다(예를 들어, 약 70% 이상 상보적). 대표적인 구체예에서, 스페이서 서열의 첫번째 7 뉴클레오티드(시드 내)는 표적 DNA에 대해 100% 상보적일 수 있는 반면, 스페이서 서열의 5' 영역 내 나머지 뉴클레오티드는 표적 DNA에 대해 실질적으로 상보적이다(예를 들어, 약 70% 이상 상보적).
본 명세서에서 "표적 DNA," "표적 영역" 또는 "게놈 내 표적 영역"은 반복-스페이서 서열 또는 반복-스페이서-반복 서열 내 스페이서 서열에 대해 완전히 상보적이거나 실질적으로 상보적인(예를 들어, 약 70% 상보적(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상)) 유기체의 게놈의 영역을 지칭한다. 일부 구체예에서, 표적 영역은 유기체의 게놈 내(예를 들어, 타입 Ⅰ 크리스퍼-카스 시스템 또는 타입 Ⅱ 크리스퍼-카스 시스템) PAM 서열에 완전히 인접하여 위치하는(PAM 서열은 표적 영역의 3'에 완전히 인접하여 위치함) 길이가 약 10 내지 약 40 연속적 뉴클레오티드 일 수 있다. 일부 현예에서, 예를 들어, 타입 Ⅰ 시스템, PAM은 프로토스페이서(5' 말단)의 대체 면(alternate side)에 있다. 공지된 PAM이나 타입 Ⅲ 시스템이 없다. Makarova et al.은 크리스퍼 시스템의 모든 유형, 타입 및 아형(subtype)에 대한 명명법을 기술한다(Nature Reviews Microbiology 13:722-736 (2015)). 가이드 구조 및 PAM은 R. Barrangou (Genome Biol. 16:247 (2015))에 의해 기술된다.
일부 구체예에서, 본 발명에서 유용한 표적 영역은 필수 유전자 또는 비-필수 유전자내에 존재한다.
대표적인 구체예에서, 표적 영역은 무작위적으로 선택되거나 또는 특이적으로 선택될 수 있다. 일부 구체예에서, 무작위적으로 선택된 표적 영역은 박테리아, 고세균, 조류 또는 효모 게놈 내 PAM 서열에 바로 인접하여 위치하는 적어도 10 연속 뉴클레오티드(예를 들어, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 등, 및 거기서 임의의 범위 또는 값)에서 임의의 것으로부터 선택될 수 있다. 일부 구체예에서, 표적 영역은 박테리아, 고세균, 조류 또는 효모 게놈 내 프로토스페이서 인접 모티프(PAM) 서열에 바로 인접하여 위치하는 약 10 내지 약 20 연속 뉴클레오티드, 약 10 내지 약 30 연속 뉴클레오티드, 및/또는 약 10 내지 약 40 연속 뉴클레오티드 등, 또는 거기서 임의의 범위 또는 값인 뉴클레오티드일 수 있다. 일부 구체예에서, 표적 영역을 특이적으로 선택하는 것은 선택하는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포의 게놈 내의 또다른 하나로부터 약 100 뉴클레오티드 내지 약 1000 뉴클레오티드, 약 100 뉴클레오티드 내지 약 2000. 약 100 뉴클레오티드 내지 약 3000, 약 100 뉴클레오티드 내지 약 4000, 및/또는 약 100 뉴클레오티드 내지 약 5000 뉴클레오티드 등 마다 위치하는 두개 이상의 표적 영역을 선택하는 단계를 포함할 수 있다. 특정 구체예에서, 표적 영역을 특이적으로 선택하는 것은 유전자, 개방형 해독 틀, 추정 개방형 해독 틀 또는 유전자 간 영역으로부터 선택된 박테리아, 고세균, 조류 또는 효모 게놈 내 PAM 서열에 바로 인접한 약 10 내지 약 40 연속 뉴클레오티드를 포함하는 표적 영역을 특이적으로 선택하는 단계를 포함한다.
본 명세서에서 "트랜스-활성화 크리스퍼(trans-activating CRISPR: tracr) 핵산" 또는 "tracr 핵산"은 임의의 tracr RNA(또는 그것의 코딩 RNA)를 지칭한다. tracr 핵산은 5'에서 3' 낮은 스템(lower stem), 상부 스템(upper stem), 벌지(bulge), 넥서스 헤어핀(nexus hairpin) 및 말단 헤어핀(terminal haripin)을 포함한다(Briner et al. (2014) Molecular Cell. 56(2):333-339 참조). 트랜스-활성화 크리스퍼(tracr) 핵산은 성숙 또는 미성숙 crRNA의 반복 부분에 대한 혼성화에서 기능하고, Cas9 단백질을 표적 부위에 모집하고, 구조적 재배열을 유도함으로써 Cas9의 촉매 활성을 촉진할 수 있다. tracrRNA 분자의 기능적 조성물은 상기 나열하였다. tracrRNA에 대한 서열은 크리스퍼-카스 시스템에 대하여 특이적이고 다양할 수 있다. 공지된 또는 이후에 확인될 임의의 tracr 핵산이 본 발명에서 사용될 수 있다.
본 명세서에서 "실질적으로 동일한, 또는 "실질적 동일성"은 두 개의 핵산 분자, 뉴클레오티드 서열 또는 단백질 서열의 문맥에서, 하기의 서열 비교 알고리즘 중 하나의 사용 또는 시각 검사에 의해서 측정되는 최대 일치에 대한 비교 또는 정렬의 경우에 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및/또는 100% 이상의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 두 개 이상의 서열 또는 후속 서열을 지칭한다. 본 발명의 다른 구체예에서 실질적 동일성은 길이가 약 50 잔기 내지 약 150 잔기 이상인 서열의 영역에 걸쳐 존재한다. 따라서, 본 발명의 일부 구체예에서, 실질적 동일성은 길이가 약 3 내지 약 15 이상(예를 들어, 길이가 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 잔기 및 거기서 임의의 값 또는 임의의 범위) 약 5 내지 약 30 이상, 약 10 내지 약 30 이상, 약 16 내지 약 30 이상, 약 18 내지 약 25 이상, 약 18 내지 약 22 이상, 약 25 이상, 약 30 이상, 약 40 이상, 약 50 이상, 약 60, 약 70, 약 80, 약 90 약 100, 약 110, 약 120, 약 130, 약 140, 약 150 또는 그 이상의 잔기, 및 거기서 임의의 범위인 서열의 영역에 걸쳐 존재한다. 대표적인 구체예에서, 서열은 약 22 뉴클레오티드 이상에 걸쳐 실질적으로 동일할 수 있다. 일부 특정 구체예에서, 서열은 약 150 잔기 이상에 걸쳐 실질적으로 동일할 수 있다. 일부 구체예에서, 본 발명의 서열은 약 16 뉴클레오티드 내지 약 25 뉴클레오티드 이상에 걸쳐 약 70% 내지 약 100% 동일할 수 있다. 일부 구체예에서, 본 발명의 서열은 약 16 뉴클레오티드 내지 약 25 뉴클레오티드 이상에 걸쳐 약 75% 내지 약 100% 동일할 수 있다. 추가적인 구체예에서, 본 발명의 서열은 약 16 뉴클레오티드 내지 약 25 뉴클레오티드 이상에 걸쳐 약 80% 내지 약 100% 동일할 수 있다. 추가적인 구체예에서, 본 발명의 서열은 약 7 뉴클레오티드 내지 약 25 뉴클레오티드 이상에 걸쳐 약 80% 내지 약 100% 동일할 수 있다. 일부 구체예에서, 본 발명의 서열은 약 18 뉴클레오티드 이상에 걸쳐 약 70% 동일할 수 있다. 다른 구체예에서, 서열은 약 22 뉴클레오티드 에 걸쳐 약 85% 동일할 수 있다. 또다른 구체예에서, 서열은 약 16 뉴클레오티드에 걸쳐 100% 동일할 수 있다. 추가적 구체예에서, 서열은 코딩 영역의 전체 길이에 걸쳐 실질적으로 동일하다. 또한, 예시적인 구체예에서, 실질적으로 동일한 뉴클레오티드 또는 폴리펩티드 서열은 실질적으로 동일한 기능(예를 들어, crRNA, tracr 핵산, 반복 서열, Cas9 뉴클레아제(닉카제(nickase), DNA, RNA 및/또는 PAM 인식 및 결합), Cas3, Cas3', Cas3" 또는 임의의 다른 크리스퍼-카스 폴리뉴클레오티드 또는 폴리펩티드의 기능 또는 활성)을 수행한다.
서열 비교에서, 전형적으로 하나의 서열은 비교되는 시험 서열에 대한 기준(reference) 서열로서 작용한다. 서열 비교 알고리즘을 사용하는 경우, 시험 및 기준 서열은 컴퓨터로 입력되고, 서열 좌표는 필요한 경우에 지정되고, 서열 알고리즘 프로그램 변수가 지정된다. 이후 서열 비교 알고리즘은 지정된 프로그램 변수에 기초하여 기준 서열과 비교하여 시험 서열(들)에 대하여 퍼센트 서열 동일성을 계산한다.
비교 윈도우를 정렬하기 위한 서열의 최적의 정렬은 당업자에게 공지되어 있고 Smith 및 Watermanthe의 로컬 상동성 알고리즘(local homology algorithm), Needleman 및 Wunschthe의 상동성 정렬 알고리즘(homology alignment algorithm), Pearson 및 Lipmanthe의 유사성 방법의 검색, 및 선택적으로 이러한 알고리즘의 컴퓨터화된 실행 예컨대 GAP, BESTFIT, FASTA, 및 GCG® Wisconsin Package® (Accelrys Inc., San Diego, CA)의 부분으로서 사용가능한 TFASTA 도구에 의해서 수행될 수 있다. 시험 서열 및 기준 서열의 정렬된 단편에 대한 "동일성 부분(fraction)"은 두 개의 정렬된 서열에 의해 공유되는 동일한 성분의 수를 기준 서열 단편의 성분의 총 수, 즉 전체 기준 서열 또는 기준 서열의 더 작은 정의된 부분로 나눈 값이다. 퍼센트 서열 동일성은 동일성 부분에 100을 곱한 값으로 나타내어진다. 하나 이상의 폴리뉴클레오티드 서열의 비교는 전체 길이 폴리뉴클레오티드 서열 또는 그들의 부분, 또는 더 긴 폴리뉴클레오티드 서열에 대한 것일 수 있다. 본 발명의 목적을 위해서 "퍼센트 동일성"은 또한 번역된 뉴클레오티드 서열에 대해 BLASTX 버전 2.0을 그리고 폴리뉴클레오티드 서열에 대해 BLASTN 버전 2.0을 사용하여 결정될 수 있다.
BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information을 통해 공개적으로 입수할 수 있다. 이 알고리즘은 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 양수 값 임계 점수 T와 매치되거나 만족하는 쿼리 서열에서 길이 W의 짧은 단어를 식별하여 높은 점수 서열 쌍 (HSP)을 먼저 식별하는 것과 관련된다. T는 인접 단어 점수 임계(Altschul et al., 1990)라고 지칭된다. 이러한 초기 인접 단어는 검색을 시작하는 시드로 사용되어 더 긴 HSP를 포함하는 단어를 찾는다. 단어 히트는 누적 정렬 점수를 증가시킬 수있는 한 각 서열을 따라 양방향으로 확장된다. 누적 점수는 뉴클레오티드 서열에 대해 매개 변수 M (매칭되는 잔기의 쌍에 대한 보상 점수, 항상> 0) 및 N (미스매칭되는 잔기에 대한 패널티 점수; 항상 <0)을 사용하여 계산된다. 아미노산 서열의 경우 누적 점수를 계산하기 위해 점수 매트릭스가 사용된다. 누적 정렬 점수가 최대 달성 값에서 양 X만큼 떨어지면 각 방향으로 단어 히트의 연장이 중단되고, 누적 점수는 하나 이상의 음수 점수 잔기 정렬의 누적 때문에 0 또는 그 이사가 되거나, 또는 서열의 말단에 도달한다. BLAST 알고리즘 매개 변수인 W, T 및 X는 정렬의 민감도와 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열에 대함)은 11의 단어 길이 (W), 10의 기대값 (E), 100의 컷오프, M=5, N=-4 및 두 가닥의 비교를 기본값으로 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 3의 단어 길이 (W), 10의 기대값 (E) 및 BLOSUM62 점수 매트릭스 (Henikoff & Henikoff, Proc . Natl. Acad. Sci. USA 89: 10915 (1989) 참조)를 기본값으로 사용한다.
퍼센트 서열 동일성을 계산하는 것 이외에, BLAST 알고리즘은 또한 두 서열 사이의 유사성의 통계적 분석을 수행한다(예를 들어, Karlin & Altschul, Proc . Nat'l. Acad . Sci . USA 90: 5873-5787 (1993) 참조). BLAST 알고리즘에 의해 제공되는 유사성의 하나의 측정은 최소 합계 확률(P(N)), 두 뉴클레오티드 또는 아미노산 서열 사이의 매치가 우연히 일어날 수 있는 가능성의 지침을 제공한다. 예를 들어, 시험 핵산 서열은 시험 뉴클레오티드 서열 대 기준 뉴클레오티드 서열의 비교에서 최소 합계 확률이 약 0.1 이하 내지 약 0.001 이하인 경우 유사한 것으로 고려된다. 따라서, 본 발명의 일부 구체예에서, 시험 뉴클레오티드 서열 대 기준 뉴클레오티드 서열의 비교에서 최소 합계 가능성은 약 0.001 미만이다.
두 뉴클레오티드 서열은 또한 엄격한 조건 하에서 두 서열이 서로 혼성화될 때 실질적으로 상보적인 것으로 고려될 수 있다. 일부 대표적인 구체예에서, 실질적으로 상보적인 것으로 고려되는 두 뉴클레오티드 서열은 매우 엄격한 조건 하에서 서로 혼성화된다.
핵산 혼성화 실험 예컨대 서던 및 노던 혼성화의 문맥에서 "엄격한 혼성화 조건" 및 "엄격한 혼성화 세척 조건"은 서열 의존적이고, 다른 환경적 변수 하에서 상이하다. 핵산의 혼성화에 대한 광범위한 지침은 Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York (1993)에서 찾을 수 있다. 일반적으로, 매우 엄격한 혼성화 및 세척 조건은 정해진 이온 세기 및 pH에서 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮도록 선택된다.
Tm은 (정해진 이온 세기 및 pH 하) 표적 서열의 50 %가 완벽하게 매치된 프로브에 혼성화되는 온도이다. 매우 엄격한 조건은 특정 프로브에 대한 Tm과 같도록 선택된다. 서던 또는 노던 블롯 필터 상에 100 개 이상의 상보성 잔기를 갖는 상보적인 뉴클레오티드 서열의 혼성화를 위한 엄격한 혼성화 조건의 예는 42℃에서 1mg의 헤파린을 갖는 50 % 포름아마이드와 혼성화를 하룻밤 동안 수행하는 것이다. 매우 엄격한 세척 조건의 예는 72℃에서 약 15분 동안의 0.1 5M NaCl이다. 엄격한 세척 조건의 예는 65℃에서 15 분 동안 0.2x SSC 세척이다 (SSC 버퍼에 대한 설명은 Sambrook, infra, 참조). 종종, 매우 엄격한 세척은 배경 프로브 신호를 제거하기 위해 낮은 엄격도의 세척이 선행된다. 예를 들어, 100 개 이상의 뉴클레오티드의 이합체(duplex)에 대한 중간 엄격도 세척의 예는 45℃에서 15 분 동안 1x SSC이다. 예를 들어, 100 개 이상의 뉴클레오티드의 이합체에 대한 낮은 엄격도 세척의 예는 40℃에서 15 분 동안 4-6x SSC이다. 짧은 프로브 (예를 들어, 약 10 내지 50 뉴클레오티드)의 경우, 엄격한 조건은 전형적으로 약 1.0 M Na 이온 미만의 염 농도를 포함하고, 전형적으로 약 pH 7.0 내지 8.3에서 약 0.01 내지 1.0M Na 이온 농도(또는 다른 염)을 포함하고, 온도는 전형적으로 약 30℃ 이상이다. 엄격한 조건은 또한 포름 아마이드와 같은 불안정화 제제의 첨가로 달성될 수 있다. 일반적으로 특정 혼성화 분석에서 비 관련 프로브에 대해 관찰된 것보다 2 배 (또는 그 이상)의 신호 대 노이즈 비율은 특정 혼성화의 검출을 나타낸다. 엄격한 조건 하에서 서로 혼성화하지 않는 뉴클레오티드 서열은 그들이 암호화하는 단백질이 실질적으로 동일하다면 여전히 실질적으로 동일하다. 이것은 예를 들어, 뉴클레오티드 서열의 카피가 유전 암호에 의해 허용된 최대 코돈 축퇴를 사용하여 생성될 때 발생할 수 있다.
다음은 본 발명의 기준 뉴클레오티드 서열과 실질적으로 동일한 상동 뉴클레오티드 서열을 클로닝하는데 사용될 수 있는 혼성화/세척 조건 세트의 예이다. 일 구현 예에서, 기준 뉴클레오티드 서열은 50℃에서 2X SSC, 0.1 % SDS로 세척하면서 50℃에서 7% 소듐 도데실 설페이트 (SDS), 0.5M NaPO4, 1mM EDTA 중의 "시험" 뉴클레오티드 서열에 대해 혼성화한다. 다른 구체예에서, 기준 뉴클레오티드 서열은 50℃에서 1X SSC, 0.1 % SDS로 세척하면서 50℃에서 7% 소듐 도데실 설페이트 (SDS), 0.5M NaPO4, 1mM EDTA 중에서 또는 50℃에서 0.5X SSC, 0.1 % SDS로 세척하면서 50℃에서 7% 소듐 도데실 설페이드 (SDS), 0.5M NaPO4, 1mM EDTA 중에서 "시험" 뉴클레오티드 서열에 대해 혼성화한다. 또다른 구체예에서, 기준 뉴클레오티드 서열은 50℃에서 0.1X SSC, 0.1% SDS로 세척하면서 50℃에서 7% 소듐 도데실 설페이트 (SDS), 0.5M NaPO4, 1mM EDTA 중에서 또는 65℃에서 0.1X SSC, 0.1 % SDS로 세척하면서 50℃에서 7% 소듐 도데실 설페이드 (SDS), 0.5M NaPO4, 1mM EDTA 중에서 "시험" 뉴클레오티드 서열에 대해 혼성화한다. 본 발명의 임의의 뉴클레오티드 서열 및/또는 이종성 핵산 구조물은 임의의 관심 종에서 발현을 위해 코돈 최적화된 것일 수 있다. 코돈 최적화는 당업계에 공지되어 있고 관심의 종에 대해 매우 높게 발현되는 유전자의 서열 분석에 기초하여 생성된 종 특이적 코돈 사용 표를 사용하여 코돈 사용 편향에 대한 뉴클레오티드 서열의 변형을 포함한다. 뉴클레오티드 서열이 핵에서 발현될 때, 코돈 사용 표는 관심 종의 고도로 발현된 핵 유전자의 서열 분석에 기초하여 생성된다. 상기 뉴클레오티드 서열의 변형은 종 특이적 코돈 사용 표를 천연 폴리뉴클레오티드 서열에 존재하는 코돈과 비교함으로써 결정된다. 당해 기술 분야에서 이해되는 바와 같이, 뉴클레오티드 서열의 코돈 최적화는 원래의 천연 뉴클레오티드 서열에 의해 코딩된 것과 동일한 기능을 갖는 폴리펩티드를 여전히 코딩하는 천연 뉴클레오티드 서열과 100% 미만의 동일성(예를 들어, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)을 가지는 뉴클레오티드 서열을 초래한다. 따라서, 본 발명의 대표적인 구체예에서, 본 발명의 뉴클레오티드 서열 및/또는 이종성 핵산 구조물은 특정한 관심 종에서의 발현을 위해 코돈 최적화될 수 있다.
일 구체예에서, 본 발명의 이종성 또는 재조합 핵산 분자, 뉴클레오티드 서열 및/또는 폴리펩티드는 "단리된다(isolated)". "단리된(isolated)" 핵산 분자, "단리된(isolated)" 뉴클레오티드 서열 또는 "단리된(isolated)" 폴리펩티드는, 인간의 손으로, 그의 천연의 환경과 떨어져서 존재하는 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드이므로 자연의 산물이 아니다. 단리된 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드는 자연적으로 발생한 유기체 또는 바이러스의 다른 성분의, 예를 들어, 세포 또는 바이러스성 구조 성분 또는 다른 폴리펩티드 또는 폴리뉴클레오티드와 관련된 공통적으로 발견되는 핵산의 적어도 일부로부터 적어도 부분적으로 분리된 정제된 형태로 존재할 수 있다. 대표적인 구체예에서, 단리된 핵산 분자, 단리된 뉴클레오티드 서열 및/또는 단리된 폴리펩티드는 적어도 약 1%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 그 이상의 순도일 수 있다.
다른 구체예에서, 단리된 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드는 예를 들어, 재조합 숙주 세포와 같은 비-천연 환경에 존재할 수 있다. 따라서, 예를 들어, 뉴클레오티드 서열과 관련하여, 용어 "단리된(isolated)"은 자연적으로 존재하는 염색체 및/또는 세포로부터 분리된 것을 의미한다. 폴리뉴클레오티드는 만약 그것이 자연적으로 발생하는 염색체 및/또는 세포로부터 단리되어 유전적 배경(context), 염색체 및/또는 그것이 자연적으로 발생하지 않는 세포(예를 들어, 상이한 숙주 세포, 상이한 조절 서열 및/또는 자연에서 발견되는 것과는 상이한 게놈 내의 위치)에 삽입되면, 또한 분리된다. 따라서, 상기 이종성 핵산 구조물, 뉴클레오티드 서열 및 이들의 암호화 된 폴리펩티드는, 사람의 손에 의해, 그들의 본래 환경과 별개로 존재하므로 자연의 산물이 아니고, "분리(isolated)"된다. 그러나 일부 구체예에서는, 재조합 숙주 세포에 도입되어 존재할 수 있다.
일 구체예에서, 본 발명의 이종성 또는 재조합 핵산 구조물은 "합성(synthetic)"이다. "합성(synthetic)" 핵산 분자, "합성(synthetic)" 뉴클레오티드 서열 또는 "합성(synthetic)" 폴리펩티드는 자연에서는 발견되지 않지만, 인간의 손으로 생성되므로, 자연의 산물이 아닌 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드이다.
본 명세서에 기재된 임의의 구체예에서, 본 발명의 뉴클레오티드 서열 및/또는 이종성 핵산 구조물은 다양한 유기체 세포에서의 발현을 위한 다양한 프로모터 및 다른 조절 요소와 작동 가능하게 결합될 수 있다. 따라서, 대표적인 구체예에서, 본 발명의 핵산 구조물은 하나 이상의 뉴클레오티드 서열에 작동 가능하게 연결된 하나 이상의 프로모터를 추가로 포함할 수 있다.
본 명세서에서 사용된 바와 같이 "작동 가능하게 연결된(operably linked)"또는 "작동 가능하게 결합된(operably associated)"은, 지시된 요소가 서로 기능적으로 관련되며 일반적으로 물리적으로 관련되어 있음을 의미한다. 따라서, 본 명세서에서 사용된 "작동 가능하게 연결된(operably linked)" 또는 "작동 가능하게 결합된(operably associated)"이란 용어는 기능적으로 연관된 단일 핵산 분자 상의 뉴클레오티드 서열을 지칭한다. 따라서, 제2 뉴클레오티드 서열에 작동 가능하게 연결된 제1 뉴클레오티드 서열이란, 제1 뉴클레오티드 서열이 제2 뉴클레오티드 서열과 기능적 관계에 놓여있는 때의 상황을 의미한다. 예를 들어, 프로모터가 상기 뉴클레오티드 서열의 전사 또는 발현에 영향을 주는 경우, 프로모터는 뉴클레오티드 서열과 작동 가능하게 결합한다. 당업자는, 조절(control) 서열(예를 들어, 프로모터)이 그의 발현을 지시하는 기능을 하는 한, 작동 가능하게 결합된 뉴클레오티드 서열과 조절 서열이 연속적일 필요는 없다는 것을 인식할 것이다. 따라서, 예를 들어, 번역되지 않았지만, 전사된 간섭하는 서열이 프로모터와 뉴클레오티드 서열 사이에 존재할 수 있으며, 상기 프로모터는 여전히 상기 뉴클레오티드 서열에 "작동 가능하게 연결된" 것으로 간주될 수 있다.
"프로모터(promoter)"는 프로모터와 작동 가능하게 연결된 뉴클레오티드 서열(즉, 코딩 서열)의 전사를 제어 또는 조절하는 뉴클레오티드 서열이다. 코딩 서열은 폴리펩티드 및/또는 기능성 RNA를 코딩할 수 있다. 전형적으로, "프로모터"는 RNA 폴리머라제 II에 대한 결합 부위를 함유하고 전사 개시를 지시하는 뉴클레오티드 서열을 지칭한다. 일반적으로, 프로모터는 상응하는 코딩 서열의 코딩 영역의 시작에 비하여 5 ', 또는 상류(upstream)에 존재한다. 프로모터 영역은 유전자 발현의 조절 인자로서 작용하는 다른 요소를 포함할 수 있다. 여기에는 TATA 박스 컨센서스 서열(TATA box consensus sequence)이 포함되며, 종종 CAAT 박스 컨센서스 서열(CAAT box consensus sequence)(Breathnach and Chambon, (1981) Annu . Rev. Biochem. 50:349)도 포함된다. 식물에서, 상기 CAAT 박스는 ACCA 박스로 치환될 수 있다(Messing et al., (1983) in Genetic Engineering of Plants, T. Kosuge, C. Meredith and A. Hollaender (eds.), Plenum Press, pp. 211-227).
프로모터는 이종성 핵산 구조물, 즉 "키메라 유전자(chimeric genes)" 또는 "키메라 폴리뉴클레오티드(chimeric polynucleotides)"의 제조에 사용하기 위한, 예를 들어, 구성성, 유도성, 일시적으로 조절된, 발달 조절된, 화학적으로 조절된, 조직-선호된 및/또는 조직-특이적 프로모터를 포함할 수 있다. 이러한 다양한 유형의 프로모터는 당업계에 널리 공지되어 있다.
프로모터의 선택은 발현을 위한 시간적 및 공간적 요건에 따라, 또한 형질 전환될 숙주 세포에 따라 다양할 것이다. 많은 다른 유기체에 대한 프로모터가 당업계에 널리 공지되어 있다. 당업계에 존재하는 광범위한 지식에 기초하여, 적절한 프로모터가 특정한 관심 숙주 유기체에 대해 선택될 수 있다. 따라서, 예를 들어, 모델 생물체에서 고도로 구성적으로 발현된 유전자의 상류에 있는 프로모터에 관해서는 널리 공지되어 있고 그러한 지식은 적절하게 다른 시스템에 쉽게 접근 및 구현될 수 있다.
일 구체예에서, 본 발명의 핵산 구조물은 "발현 카세트(expression cassette)"일 수 있거나 발현 카세트 내에 포함될 수 있다. 본 명세서에서 사용된 바와 같이, "발현 카세트(expression cassette)"는 관심 뉴클레오티드 서열(예를 들어, 본 발명의 핵산 구조물(예를 들어, 합성 tracr 핵산 구조물, 합성 크리스퍼 핵산 구조물, 합성 크리스퍼 어레이, 키메라 핵산 구조물; 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열, 타입 I 폴리펩티드, 타입 II 폴리펩티드, 타입 III 폴리펩티드, 타입 IV 폴리펩티드 및/또는 타입 V 폴리펩티드))을 포함하는 핵산 구조물을 의미하며, 상기 뉴클레오티드 서열은 적어도 제어 서열(예를 들어, 프로모터)과 작동 가능하게 연결된 것이다. 따라서, 본 발명의 일 양상은 본 발명의 뉴클레오티드 서열을 발현하도록 설계된 발현 카세트를 제공한다.
관심 뉴클레오티드 서열을 포함하는 발현 카세트는 키메라일 수 있으며, 이는 그의 구성 요소 중 적어도 하나가 그 다른 구성 요소 중 적어도 하나에 대해 이종성임을 의미한다. 발현 카세트는 또한 자연적으로 발생하는 것이지만 이종성 발현에 유용한 재조합 형태로 수득된 것일 수 있다.
발현 카세트는 또한 선택된 숙주 세포에서 기능적인 전사 및/또는 번역 종결 영역(즉, 종결 영역)을 선택적으로 포함할 수 있다. 발현 카세트에서 다양한 전사 종결자를 사용할 수 있으며, 이종성 염기 서열 및 올바른 mRNA 폴리아데닐레이션을 넘어서는 전사의 종료를 담당한다. 종결 영역은 전사 개시 영역에 고유할 수 있고(native), 작동 가능하게 연결된 관심 뉴클레오티드 서열에 고유할 수 있거나, 숙주 세포에 고유할 수 있거나, 또는 다른 공급원(즉, 프로모터에 대해, 관심 뉴클레오티드 서열에 대해, 숙주에 대해 외래 또는 이종성 또는 이들의 임의의 조합)로부터 유래한 것일 수 있다.
발현 카세트는 또한 형질 전환된 숙주 세포를 선택하는데 사용될 수 있는 선택 가능한 마커를 위한 뉴클레오티드 서열을 포함할 수 있다. 본 명세서에 사용된 바와 같이, "선별 마커(selectable marker)"는 발현될 때 마커를 발현하는 숙주 세포에 별개의 표현형을 부여하고 따라서 형질 전환된 세포가 마커를 갖지 않은 세포와 구별되도록 하는 뉴클레오티드 서열을 의미한다. 그러한 뉴클레오티드 서열은 마커가 예를 들어 선별제(selective agent)(예를 들어, 항생제 등)를 사용함으로써, 화학적 수단에 의해 선별될 수 있는 형질을 부여하는지 여부에 따라, 또는 마커가 단순히 스크리닝(예를 들어, 형광)과 같은 관찰이나 테스트를 통해 식별할 수 있는 특성인지 여부에 따라 선별 또는 스크리닝 마커를 코딩할 수 있다. 물론, 적합한 선택 가능한 마커의 많은 예가 당업계에 공지되어 있으며, 본 명세서에 기재된 발현 카세트에서 사용될 수 있다.
발현 카세트 외에도, 본 명세서에 기술된 핵산 분자 및 뉴클레오티드 서열은 벡터와 관련하여 사용될 수 있다. 용어 "벡터(vector)"는 세포 내로 핵산(또는 핵산들)을 전송(transferring), 전달(delivering) 또는 도입하기 위한 조성물을 의미한다. 벡터는 전송, 전달 또는 도입될 뉴클레오티드 서열(들)을 포함하는 핵산 분자를 포함한다. 숙주 유기체의 형질 전환에 사용하기 위한 벡터는 당업계에 잘 알려져 있다. 일반적인 벡터 부류의 비-제한적인 예시는 벡터가 자기 전달 또는 동원 가능할 수도 있고 그렇지 않을 수도 있는 2중 또는 1중 직선 선형 또는 원형의 벡터로 바이러스 벡터, 플라스미드 벡터, 파지 벡터, 파지미드 벡터, 코스미드 벡터(cosmid vector), 포스미드 벡터(fosmid vector), 박테리오파지, 인공 염색체 또는 아그로박테리움 바이너리 벡터(Agrobacterium binary vector)를 포함하나, 이에 한정되지는 않는다. 본 명세서에서 정의된 바와 같은 벡터는 세포 게놈으로의 통합에 의해 원핵 생물 또는 진핵 생물을 형질 전환시킬 수 있거나 또는 염색체 외에서 존재할 수 있다(예를 들어, 복제 기점을 갖는 자율 복제 플라스미드). 더하여 방선균(actinomycetes) 및 관련 종, 박테리아 및 진핵 생물(예를 들어, 고등 식물, 포유 동물, 효모 또는 진균 세포)에서 선택될 수 있는 두 개의 다른 숙주 생물에서 복제가 가능하도록 디자인되거나 자연적으로 가능한 DNA 운반 수단을 의미하는 셔틀 벡터가 포함된다. 일부 대표적인 구체예에서, 상기 벡터 내의 핵산은 숙주 세포에서 전사를 위한 적절한 프로모터 또는 다른 조절 요소의 제어하에 있고, 작동 가능하게 연결되어 있다. 상기 벡터는 복수의 숙주에서 기능하는 이중-기능성 발현 벡터일 수 있다. 게놈 DNA의 경우, 이것은 그 자체의 프로모터 또는 다른 조절 요소를 포함할 수 있으며, cDNA의 경우, 이는 숙주 세포에서의 발현을 위한 적절한 프로모터 또는 다른 조절 요소의 제어하에 있을 수 있다. 따라서, 본 발명의 핵산 분자 및/또는 발현 카세트는 본 명세서에 기술되고 당업계에 공지된 바와 같은 벡터에 포함될 수 있다.
관심 폴리뉴클레오티드의 배경에서 "도입(Introducing)", "도입(introduce)", "도입된(introduced)"(및 그 문법적 변형)은 관심 폴리뉴클레오티드를 상기 유기체(예를 들어, 숙주 세포)의 숙주 유기체 또는 세포에 폴리뉴클레오티드가 세포의 내부에 접근권을 얻도록 그러한 방식으로 제시하는 것을 의미한다. 하나 이상의 폴리뉴클레오티드가 도입되는 경우, 이들 폴리뉴클레오티드는 단일 폴리뉴클레오티드 또는 핵산 구조물의 일부로서, 또는 별도의 폴리뉴클레오티드 또는 핵산 구조물로서 조립될 수 있고, 동일하거나 상이한 발현 구조물 또는 형질 전환 벡터상에 위치할 수 있다. 따라서, 이들 폴리뉴클레오티드는 단일 형질 전환 이벤트, 별도의 형질 전환/형질 감염 이벤트로 세포 내로 도입될 수 있거나, 또는, 예를 들어, 통상적인 육종 프로토콜에 의해 유기체에 혼입될 수 있다. 따라서, 일 양상에서, 본 발명의 하나 이상의 핵산 구조물은 단독으로 또는 조합하여 숙주 유기체 또는 상기 숙주 유기체의 세포로 도입될 수 있다. 세포 집단의 배경에서, "도입(introducing)"은 본 발명의 이종성 핵산 구조물이 집단의 하나 이상의 세포의 내부에 접근권을 얻은 조건하에서, 집단을 본 발명의 이종성 핵산 구조물과 접촉시키는 것을 의미하며, 이에 따라 상기 집단의 하나 이상의 세포를 변형시킨다.
본 명세서에서 사용된 용어 "형질 전환(transformation)" 또는 "형질 감염(transfection)"은 이종성 핵산을 세포 내로 도입하는 것을 지칭한다. 세포의 형질 전환은 안정적이거나 일시적일 수 있다. 따라서, 일부 구체예에서, 숙주 세포 또는 숙주 유기체는 본 발명의 핵산 구조물로 안정하게 형질 전환된다. 다른 구체 예에서, 숙주 세포 또는 숙주 유기체는 본 발명의 핵산 구조물로 일시적으로 형질 전환된다. 따라서, 대표적인 구체예에서, 본 발명의 이종성 핵산 구조물은 안정하게 및/또는 일시적으로 세포 내로 도입될 수 있다.
폴리뉴클레오티드의 배경에서의 "일시적인 형질 전환(transient transformation)"은 폴리뉴클레오티드가 세포 내로 도입되고 세포의 게놈에 통합되지 않는다는 것을 의미한다.
폴리뉴클레오티드의 배경에서 "안정적으로 도입(stably introducing)" 또는 "안정적으로 도입된(stably introduced)"은 도입된 폴리뉴클레오티드가 세포의 게놈에 안정하게 혼입됨으로써, 세포가 폴리뉴클레오티드로 안정적으로 형질 전환된다는 것을 의미한다.
본 명세서에서 사용되는 "안정한 형질 전환(Stable transformation)" 또는 "안정적으로 형질 전환된(stably transformed)"은 핵산 구조물이 세포 내로 도입되어 세포 게놈에 통합되는 것을 의미한다. 이와 같이, 통합된 핵산 구조물은 그의 자손에 의해, 보다 구체적으로는 다수의 연속적인 세대의 자손에 의해, 유전될 수있다. 본 명세서에서 사용된 "게놈(genome)"은 핵, 미토콘드리아 및 플라스미드 게놈을 포함하며, 따라서, 예를 들어, 플라스미드 또는 미토콘드리아 게놈 내로의 핵산 구조물의 통합을 포함할 수 있다. 본 명세서에서 사용되는 안정한 형질 전환은 또한 염색체 외에서, 예를 들어, 미니염색체(minichromosome) 또는 플라스미드로서 유지되는 형질 전환 유전자를 지칭할 수도 있다.
일시적인 형질 전환은 예를 들어, 유기체에 도입된 하나 이상의 형질 전환 유전자에 의해 코딩되는 펩티드 또는 폴리펩티드의 존재를 검출할 수 있는 효소-결합 면역흡착 분석(ELISA) 또는 웨스턴 블롯(Western blot)에 의해 검출될 수 있다. 세포의 안정한 형질 전환은, 예를 들어, 유기체(예를 들어, 박테리아, 고세균, 효모, 조류 등)에 도입된 형질 도입 유전자의 뉴클레오티드 서열과 특이적으로 혼성화하는 핵산 서열을 갖는 세포의 게놈 DNA의 서던 블롯 혼성화 분석(Southern blot hybridization assay of genomic DNA)에 의해 검출될 수 있다. 세포의 안정한 형질 전환은, 예를 들어, 식물 또는 다른 유기체에 도입된 형질 전환 유전자의 뉴클레오티드 서열과 특이적으로 혼성화되는 핵산 서열을 갖는 세포의 RNA의 노던 블롯 혼성화 분석(Northern blot hybridization assay of RNA)에 의해 검출될 수 있다. 세포의 안정한 형질 전환은 또한, 예를 들어, 중합 효소 연쇄 반응(PCR) 또는 형질 전환 유전자(transgene)의 표적 서열(들)과 혼성화하는 특정 프라이머 서열을 사용하여 당업계에 공지된 다른 증폭 반응에 의해 검출될 수 있으며, 이는 도입 유전자 서열의 증폭을 야기하고, 표준 방법에 따라 검출할 수 있다. 형질 전환은 또한 당업계에 공지된 직접 시퀀싱(direct sequencing) 및/또는 혼성화 프로토콜에 의해 검출될 수 있다.
따라서, 일 구체예에서, 뉴클레오티드 서열, 구조물, 발현 카세트는 일시적으로 발현될 수 있고 및/또는 숙주 생물의 게놈에 안정하게 혼입될 수 있다.
본 발명의 이종성 핵산 구조물은 당업자에게 공지된 임의의 방법에 의해 세포 내로 도입될 수 있다. 본 발명의 일부 구체예에서, 세포의 형질 전환은 핵 형질 전환을 포함한다. 또 다른 구체예에서, 본 발명의 이종 핵산 구조물(들)은 통상적 인 육종 기술을 통해 세포 내로 도입될 수 있다.
진핵 생물 및 원핵 생물 모두를 형질 전환하기 위한 절차는 당해 기술 분야에서 잘 알려져있고 일반적이며, 문헌(예를 들어, Jiang et al. 2013. Nat. Biotechnol. 31:233-239; Ran et al. Nature Protocols 8:2281-2308 (2013) 참조)에 기술되어 있다.
따라서, 뉴클레오티드 서열은 당업계에 공지된 임의의 수의 방식으로 숙주 유기체 또는 그의 세포에 도입될 수 있다. 본 발명의 방법은 하나 이상의 뉴클레오티드 서열을 유기체에 도입하는 특정 방법에 의존하지 않으며, 단지 유기체의 적어도 하나의 세포의 내부에 접근권을 얻는다. 하나 이상의 뉴클레오티드 서열이 도입되어야 하는 경우, 이들은 단일 핵산 구조물의 일부로서, 또는 별개의 핵산 구조물로서, 조립될 수 있고, 동일하거나 상이한 핵산 구조물에 위치할 수 있다. 따라서, 뉴클레오티드 서열은 단일 형질 전환 이벤트 또는 별개의 형질 전환 이벤트로 관심 세포에 도입될 수 있거나, 또는, 대안적으로, 관련이 있는 경우, 뉴클레오티드 서열은 육종 프로토콜의 일부로서 유기체 내로 혼입될 수 있다.
MGE(Mobile genetic element)는 게놈 안정성에 지속적으로 도전하는 박테리아를 제시하며, 수평 유전자 전달(horizontal gene transfer)을 통해 진화를 촉진한다. MGE라는 용어는 플라스미드, 박테리오파지, 전이 요소(transposable elements), 게놈 섬 및 많은 다른 특수 유전 요소(1)를 포함한다. MGE는 높은 보급 률, 숙주 적응 능력, 게놈 안정성을 제공하는 유전자를 포함하고 있어, 박테리아 게놈에 보편적으로 존재한다. 약탈적(predatory) 박테리오파지와 이기적인 유전 요소의 영구적인 위협에 대처하기 위해 박테리아는 외인성 유전 요소를 표적으로 하는 타고난 면역 시스템과 적응 면역 시스템 모두로 진화했다. 타고난 면역은 세포-벽 변형, 제한/변형 시스템 및 무산된 파지 감염(abortive phage infection)(2)을 포함한다. 크리스퍼(CRISPR)와 CRISPR-관련 유전자(Cas)는 박테리아의 침입 유전 요소를 표적으로 하는 적응 면역 시스템이다. 크리스퍼-카스 매개 면역은 획득(acquisition), 발현(expression) 간섭(interference)으로 분류되는, 별개의 분자 과정에 의존한다(3). 획득(acquisition)은 외래 유전 요소의 분자 '샘플링(sampling)'을 통해 이루어지는데, 짧은 서열은, 스페이서라고 하는, 상기 CRISPR 어레이에 양극화된 방식으로 통합된다(4). CRISPR 어레이의 발현(expression)은 선행 리더 서열 내의 프로모터 요소에 의해 구성적이고 유도성이다(5-6). 간섭(interference)은 각각의 반복 서열에서 선택적으로 처리되어, 서열-특이적 인식 및 스페이서(7)에 상보적인 표적 DNA의 절단을 위한 Cas 단백질을 유도하는 CRISPR RNA(crRNA)를 형성하는, 상응하는 전사물로부터 유래한다. 크리스퍼-카스 기술은 균주 타이핑(strain typing) 및 탐지(8-10), 이동 유전 요소(mobile genetic elements)에 대한 자연적/공학적 면역의 이용(exploitation)(11), 다양한 배경에서 프로그래밍 가능한 게놈 편집(12), 전사 제어(13-14) 및 정의된 컨소시엄에서 미생물 집단 조작(15)의 활용을 가진다.
다양한 CRISPR 시스템이 당업계에 공지되어있다. 예를 들어, CRISPR 시스템의 모든 클래스, 타입 및 서브타입에 대한 명명법을 설명하는 Makarova et al.을 참조한다(Nature Reviews Microbiology 13:722-736 (2015)); 또한, R. Barrangou (Genome Biol. 16:247 (2015) 참조).
CRISPR 배열에 상응하는 서열 특징은 이전에 여러 유기체에서 기술되었지만(16-17), 스트렙토코커스 서모필루스(Streptococcus thermophilus)는 특정 cas 유전자와 CRISPR-어레이 구성 요소의 역할이 밝혀진 첫 번째 미생물(microbe)이었다(4). S. 서모필루스(S. thermophilus)는 비병원성의 고온성 그람 양성 세균으로서 요구르트와 여러 치즈의 합성 생산에서 유산을 젖산으로 이화시키는 시동기 배양액으로 사용된다(18). S. 서모필루스(S. thermophilus)는 최대 4개의 크리스퍼-카스 시스템을 암호화하며, 그 중 2개(SthCRISPR1 및 SthCRISPR3)는 획득 및 간섭 모두에서 본질적으로 활성인 유형 II-A 시스템으로 분류된다(4, 19). 따라서, S. 서모필루스(S. thermophilus ) 및 그 박테리오파지의 게놈 분석은 파지/DNA 보호를 위한 크리스퍼-카스 시스템의 가능성 있는 기전을 확립하였다. S. 서모필루스(S. thermophilus)의 크리스퍼-카스 시스템에 대한 연구는 스페이서 기원의 생물 정보학적 분석(4,20), 프로토-스페이서 인접 모티프(PAM) 서열의 발견(19; 21), 파지-숙주 역학의 이해(22-23), Cas9 엔도뉴클레아제(endonuclease) 활성 입증(7, 24-25), 그리고 최근에, 타입 II 시스템의 기능과 직교성을 지배하는 tracrRNA 구조 모티프의 결정(26)을 이끌었다. S. 서모필루스(S. thermophilus)의 유전체 분석은 병원성 연쇄상구균(streptococci)에서 발견되는 탄수화물 이화작용(catabolism)과 병독성(virulence) 유전자의 손실을 통해 우유에 대한 진화적 적응을 밝혔다(18). S. 서모필루스(S. thermophilus )는 콜드-쇼크 단백질, 구리 내성 단백질, 프로 테이나아제, 박테리오신(bacteriocin) 및 유당 분해 단백질을 포함하는 틈새-관련 유전자(niche-related genes)의 중요한 획득을 또한 수행했다(18). 삽입 서열(IS)은 S. 서모필루스(S. thermophilus) 게놈에서 널리 유행하며 낙농(dairy) 적응 유전자와 관련된 섬의 보급을 촉진하여 균주 간의 유전적 이종성에 기여한다(18). S. 서모필루스(S. thermophilus)에서의 MGE와 기능적 크리스퍼-카스 시스템의 동시(concomitant) 존재는 게놈 항상성이 적어도 부분적으로 이러한 역동적인 힘의 상호 작용에 의해 지배된다는 것을 시사한다. 따라서, S. 서모필루스(S. thermophilus)는 게놈 섬에 대한 크리스퍼-카스 표적화의 유전적 결과를 조사하기 위한 이상적인 숙주를 구성한다.
크리스퍼-카스 시스템은 최근 게놈 편집 응용 분야에서 많은 연구가 이루어졌지만(12), 대부분의 내인성 미생물 시스템의 진화적 역할은 모르는 채로 남아있다. 외부 DNA 흡수(7), 스페이서 획득 이벤트(4), 및 염색체 자기-표적화(28-32)에 의해 야기된 돌연변이를 넘어서 하우징(housing) 활성 크리스퍼-카스 시스템의 진화 결과에 대해서는 훨씬 적게 알려져 있다. 따라서, 본 발명자들은 내인성 타입 II 크리스퍼-카스 시스템으로 통합된 MGE를 표적화하는 결과를 결정하고자 하였다. 4개의 섬이 S. 서모필루스(S. thermophilus) LMD-9에서 동정되었으며, 길이는 8 내지 102 kbp이며 총 132 kbp 또는 게놈의 7 %이다. 게놈 섬을 표적으로 하기 위해, 자기-표적 스페이서를 갖는 조작된 CRISPR 어레이의 플라스미드-기초된 발현을 S. 서모필루스(S. thermophilus) LMD-9로 형질 전환시켰다. 총체적으로, 우리의 결과는 자기-표적 이벤트의 근본적인 유전적 결과를 밝혀내고 크리스퍼-카스 시스템이 박테리아 집단 수준에서 게놈 진화를 지시할 수 있음을 보여준다.
이러한 발견을 이용하여, 본 발명자는 필수 유전자, 비-필수 유전자 및/또는 소모 가능한 게놈 섬을 위한 박테리아, 고세균, 조류 또는 효모 세포의 집단을 스크리닝하기 위한; 박테리아, 고세균, 조류 또는 효모 세포의 집단 내에서 하나 이상의 세포를 사멸시키기 위한; 박테리아, 고세균, 조류 또는 효모 유전자의 표현형을 동정하기 위한; 박테리아, 고세균 또는 효모 세포의 집단으로부터 게놈 크기가 감소하는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 선별하기 위한; 및/또는 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 그의 게놈에서 돌연변이(예를 들어, 결실)를 갖는 적어도 하나의 분리주(isolate)를 동정하기 위한 신규한 방법을 개발하였다.
따라서 일 양상에서, 본 발명자는, 표적으로부터 벗어날 수 있는 능력을 제공하는 유전자 내용이 변경된 집단에서 유전적 변이체를 동정하는 방법을 개발하였다. 여기서, 표적 서열은 변형되었으며, 하나의 표적 서열은 상기 변형을 갖는 생존자를 찾는다. 일 양상에서, 상기 변형(즉, 돌연변이)은 결실이다. 또한, 표적 서열이 변형된 경우, 야생형 유전자형은 필수적이지 않다.
그러므로, 본 발명의 일 양상은 필수 유전자, 비-필수 유전자 및/또는 소모 가능한 게놈 섬(expendable genomic islands)을 위한 박테리아 세포의 집단(population)을 스크리닝하는 방법으로서: (5’에서 3’) 반복-스페이서-반복(repeat-spacer-repeat) 서열 또는 적어도 하나의 반복-스페이서(repeat-spacer) 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물(heterologous nucleic acid construct)을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 이에 따라 형질 전환된 박테리아 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 결실의 존재 또는 부재를 결정하는 단계로서, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 존재는 상기 표적 영역이 비-필수 유전자 및/또는 소모 가능한 게놈 섬 내에 포함되는 것을 나타내며, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 부재는 상기 표적 영역이 필수 유전자 내에 포함되는 것을 의미하는 것인 단계를 포함하는 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
추가적 양상에서, 본 발명은 필수 유전자, 비-필수 유전자 및/또는 소모 가능한 게놈 섬을 위한 박테리아(bacterial), 고세균(archaeal), 조류(algal) 또는 효모(yeast) 세포의 집단을 스크리닝하는 방법으로서, 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) (5'에서 3') 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 도입하여, 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 결실의 존재 또는 부재를 결정하는 단계로서, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 존재는 상기 표적 영역이 비-필수 유전자 및/또는 소모 가능한 게놈 섬 내에 포함되는 것을 나타내며, 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 상기 결실의 부재는 상기 표적 영역이 필수 유전자 내에 포함되는 것을 의미하는 것인 단계를 포함하는 방법을 제공한다.
다른 양상에서, 본 발명은 박테리아 세포의 집단 내 하나 이상의 박테리아 세포를 사멸시키는 방법으로서, (5'에서 3') 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아 세포의 상기 게놈에서 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 이에 따라 상기 박테리아 세포의 집단 내의 상기 표적 영역을 포함하는 하나 이상의 박테리아 세포를 사멸시키는 것인 단계를 포함하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
추가적인 양상에서, 본 발명은 박테리아, 고세균, 조류 또는 효모 집단 내의 하나 이상의 세포를 사멸시키는 방법으로서, (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 도입하여, 상기 게놈 내의 상기 표적 영역을 포함하는 박테리아, 고세균, 조류 또는 효모 세포의 집단 내 하나 이상의 세포를 사멸시키는 것인 단계를 포함하는 것인 방법을 제공한다.
박테리아 게놈-표적하는 직교 CRISPR RNA의 형질 전환은 유전적으로 별개의 하위 집단을 제거하기 위해 박테리아 세포를 서열-선택적 기초하여 사멸시킬 수 있어, 이에 따라 표적 서열이 결핍된 박테리아 집단을 풍부하게 한다. 이러한 구별은 유전적으로 유사한 집단 내에서 직교 크리스퍼-카스 시스템의 이종성 분포에 기초하여 발생할 수 있다. 따라서, 일부 구체예에서, 세포 집단에 도입된 CRISPR 어레이는 적어도 하나 이상의 박테리아 세포의 크리스퍼-카스(크리스퍼-카스) 시스템과 적합성이지 않아서(즉, 기능적이지 않은) 사멸될 하나 이상의 박테리아 세포에서 크리스퍼-카스 시스템과 적합성인(즉, 기능적인) 것이다. 예를 들어, 대장균(Echerichia coli) 및 폐렴간균(Klebsiella pneumoniae)는 타입 I-E 또는 타입 I-F 크리스퍼-카스 시스템을 모두(either) 나타낸다. 클로스트리듐 디피실리(Clostridium difficile)은 타입 I-B 시스템을 암호화하고, 스트렙토코커스 서모필루스(S. thermophilus)의 다른 균주는 타입 II-A 및 타입 I-E 시스템 또는 타입 II-A 시스템만을 나타낸다. 박테리아의 혼합물로 변형된 특정 CRISPR RNA에 따라, 그의 동종 시스템과의 기능적 적합성에 기초하여 그 집단의 서브세트(subset)를 특이적으로 표적 할 수 있다. 이는 내인성 크리스퍼-카스 시스템을 포함하는 다양한 종에 적용될 수 있으며, 이에 한정되지는 않지만, 예를 들면: Pseudomonas spp. (예를 들면: P. aeruginosa), Escherichia spp. (예를 들면: E. coli), Enterobacter spp. (예를 들면: E. cloacae), Staphylococcus spp. (예를 들면: S. aureus), Enterococcus spp. (예를 들면: E. faecalis , E. faecium), Streptomyces spp. (예를 들면: S. somaliensis), Streptococcus spp. (예를 들면: S. pyogenes), Vibrio spp. (예를 들면: V. cholerae), Yersinia spp. (예를 들면: Y. pestis), Francisella spp. (예를 들면: F. tularensis , F. novicida), Bacillus spp. (예를 들면: B. anthracis , B. cereus), Lactobacillus spp. (예를 들면: L. casei, L. reuteri , L. acidophilus, L. rhamnosis ), Burkholderia spp. (예를 들면: B. mallei , B. pseudomallei), Klebsiella spp. (예를 들면: K. pneumoniae), Shigella spp. (예를 들면: S. dysenteriae , S. sonnei), Salmonella spp. (예를 들면: S. enterica), Borrelia spp. (예를 들면: B. burgdorfieri), Neisseria spp. (예를 들면: N. meningitidis), Fusobacterium spp. (예를 들면: F. nucleatum), Helicobacter spp. (예를 들면: H. pylori), Chlamydia  spp. (예를 들면: C. trachomatis), Bacteroides spp. (예를 들면: B. fragilis), Bartonella spp. (예를 들면: B. quintana), Bordetella spp. (예를 들면: B. pertussis), Brucella spp. (예를 들면: B. abortus), Campylobacter spp. (예를 들면: C. jejuni), Clostridium spp. (예를 들면: C. difficile), Bifidobacterium spp. (예를 들면: B. infantis), Haemophilus spp. (예를 들면: H. influenzae), Listeria spp. (예를 들면: L. monocytogenes), Legionella spp. (예를 들면: L. pneumophila), Mycobacterium spp. (예를 들면: M. tuberculosis), Mycoplasma spp. (예를 들면: M. pneumoniae), Rickettsia spp. (예를 들면: R. rickettsii), Acinetobacter spp. (예를 들면: A. calcoaceticus, A. baumanii), Rumincoccus spp. (예를 들면: R. albus), Propionibacterium spp. (예를 들면: P. freudenreichii), Corynebacterium spp. (예를 들면: C. diphtheriae), Propionibacterium spp. (예를 들면: P. acnes), Brevibacterium spp. (예를 들면: B. iodinum), Micrococcus spp. (예를 들면: M. luteus), 및/또는 Prevotella spp. (예를 들면: P. histicola)일 수 있다.
CRISPR 표적은 혼합된 집단의 고유한 유전적 내용에 기초하여 특정 박테리아의 부분 집합(subset)을 제거할 수 있다. 이러한 청구(claim)에 대한 지지는 Lac+가 집단에서 제거되는 동안 Lac- 박테리아가 선택되는 것인 실시예 4, 5에 제시된다. Lac+와 Lac- 균주 사이의 유전적 차이(genetic distinction)는 생존한 클론의 서열 결정(sequencing)이 기준 야생형 S. 서모필루스(S. thermophilus) 균주와 비교하여 유전적 함량(content)에서 최대 5.5 %의 차이를 나타내는 것인 실시예 8 및 10에 제시되어 있다. 따라서 CRISPR-표적 스페이서는 보존되거나 달라지는(divergent) 유전자 서열을 표적으로 하여 다양한 수준의 박테리아 관련성을 조정할 수 있다. 따라서, 일부 구체예에서, 집단 내의 박테리아 세포는 동일한 CRISPR Cas 시스템을 포함할 수 있고 도입된 CRISPR 어레이는 그럼으로써 전체적으로 박테리아 집단에서 기능적일 수 있지만 박테리아를 구성하는 상이한 균주 또는 종의 유전적 함량 집단은 도입된 CRISPR 어레이에 대한 표적 영역이 사멸될 집단의 하나 이상의 세균 종에서만 발견되도록 충분히 구별된다. 이것은 내인성 크리스퍼-카스 시스템을 포함하는 다양한 종에 적용될 수 있고, 이에 한정되는 것은 아니지만, 예를 들어: Pseudomonas spp. (예를 들면: P. aeruginosa), Escherichia spp. (예를 들면: E. coli), Enterobacter spp. (예를 들면: E. cloacae), Staphylococcus spp. (예를 들면: S. aureus), Enterococcus spp. (예를 들면: E. faecalis , E. faecium), Streptomyces spp. (예를 들면: S. somaliensis), Streptococcus spp. (예를 들면: S. pyogenes), Vibrio spp. (예를 들면: V. cholerae), Yersinia spp. (예를 들면: Y. pestis), Francisella spp. (예를 들면: F. tularensis , F. novicida), Bacillus spp. (예를 들면: B. anthracis , B. cereus), Lactobacillus spp. (예를 들면: L. casei, L. reuteri , L. acidophilus, L. rhamnosis ), Burkholderia spp. (예를 들면: B. mallei , B. pseudomallei), Klebsiella spp. (예를 들면: K. pneumoniae), Shigella spp. (예를 들면: S. dysenteriae , S. sonnei), Salmonella spp. (예를 들면: S. enterica), Borrelia spp. (예를 들면: B. burgdorfieri), Neisseria spp. (예를 들면: N. meningitidis), Fusobacterium spp. (예를 들면: F. nucleatum), Helicobacter spp. (예를 들면: H. pylori), Chlamydia  spp. (예를 들면: C. trachomatis), Bacteroides spp. (예를 들면: B. fragilis), Bartonella spp. (예를 들면: B. quintana), Bordetella spp. (예를 들면: B. pertussis), Brucella spp. (예를 들면: B. abortus), Campylobacter spp. (예를 들면: C. jejuni), Clostridium spp. (예를 들면: C. difficile), Bifidobacterium spp. (예를 들면: B. infantis), Haemophilus spp. (예를 들면: H. influenzae), Listeria spp. (예를 들면: L. monocytogenes), Legionella spp. (예를 들면: L. pneumophila), Mycobacterium spp. (예를 들면: M. tuberculosis), Mycoplasma spp. (예를 들면: M. pneumoniae), Rickettsia spp. (예를 들면: R. rickettsii), Acinetobacter spp. (예를 들면: A. calcoaceticus, A. baumanii), Rumincoccus spp. (예를 들면: R. albus), Propionibacterium spp. (예를 들면: P. freudenreichii), Corynebacterium spp. (예를 들면: C. diphtheriae), Propionibacterium spp. (예를 들면: P. acnes), Brevibacterium spp. (예를 들면: B. iodinum), Micrococcus spp. (예를 들면: M. luteus), 및/또는 Prevotella spp. (예를 들면: P. histicola)일 수 있다.
본 발명의 방법을 사용한 집단 내에서의 사멸의 정도(extent)는 표적 부위가 비-필수 유전자, 필수 유전자 또는 소모 가능한 섬에 포함되는지 아닌지에 더하여 형질 전환에 대한 특정 집단의 복종 가능성(amenability)에 영향을 받을 수 있다. 박테리아, 고세균 또는 효모 세포의 개체군에서의 사멸의 정도는 예를 들어 유기체, 속 및 종에 따라 다를 수 있다. 따라서, 본 명세서에 사용된 바와 같이, "사멸(killing)"은 집단에서 2 로그 또는 그 이상의 세포를 제거하는 것을 의미한다 (생존율 1% 이하). 1 로그 미만의 사멸은 집단의 적은 감소일 수 있다; 반면에 2 ~ 3 로그의 사멸 결과는 집단의 상당한 감소를 초래한다. 3 로그 이상의 사멸 결과는 집단이 실질적으로 박멸되었음을 나타낸다.
또 다른 양상에서, 박테리아 유전자와 연관된 표현형(phenotype)을 동정하는 방법으로서, 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 폴리펩티드 또는 기능성 핵산을 코딩하는 개방형 해독 틀(open reading frame)의 적어도 일 부분을 포함하고, 이에 따라 상기 표적 영역을 포함하는 세포를 사멸시키는 것 및 상기 표적 영역이 없는(즉, 생존 세포가 상기 표적 영역을 포함하고 있지 않은) 형질 전환된 박테리아 세포의 집단을 생산하는 것인 단계; 및 (i) 상기 집단의 상기 표현형을 분석하는 단계 또는 (ii) 상기 형질 전환된 박테리아 세포의 집단으로부터 개별 박테리아 콜로니를 성장시켜서 상기 개별 콜로니의 표현형을 분석하는 단계를 포함하는 것인 방법이 제공된다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
또 다른 양상에서, 박테리아, 고세균, 조류 또는 효모 유전자의 표현형을 동정하는 방법으로서, (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 도입하여, 상기 게놈 내의 상기 표적 영역을 포함하는 박테리아, 고세균 또는 효모 세포를 사멸시키는 것 및 상기 표적 영역이 없는 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 (i) 상기 세포의 집단의 상기 표현형을 분석하는 단계, 및/또는 (ii) 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 개별 박테리아, 고세균, 조류 또는 효모 콜로니를 성장시키는 단계; 및 상기 개별 콜로니의 상기 표현형을 분석하는 단계를 포함하는 것인 방법이 제공된다.
일 구체예에서, 상기 분석은 돌연변이를 동정하고 특징화하기 위한 PCR, 광학 게놈지도 작성(optical genome mapping), 게놈 서열 분석(genome sequencing), 제한지도 작성(restriction mapping) 및 제한 분석(complementation analysis) 및/또는 표현형을 분석(phenotypic assays)하기 위한 상보성 분석을 포함한다.
일 구체예에서, 사멸의 정도 또는 집단의 감소를 결정하는 것은 집단 수를 결정하는 임의의 방법을 포함할 수 있으며, 이에 한정되는 것은 아니지만, (1) 세포를 플레이팅하고 콜로니를 계수하는 것, (2) 광학 밀도를 계산하는 것, (3) 현미경 카운팅, (4) 가장 가능성 있는 숫자 및/또는 (5) 메틸렌 블루 감소를 포함할 수 있다. 일 구체예에서, 16S rDNA 시퀀싱은 혼합 집단의 조성을 규명(profile)하는데 사용될 수 있다. 예를 들어, 전체 샘플에서 DNA를 정제하고 고-처리량(high-throughput) 기술을 사용하여 전체-게놈 샷건 시퀀싱(whole-genome shotgun sequencing)을 수행하거나, 예를 들어, 16S 유전자를 PCR로 증폭하고 동일한 방식으로 제품을 시퀀싱함으로써 수행할 수 있다. 그런 다음 상기 서열을 특정 박테리아 분류(taxa)에 컴퓨터적으로 할당할 수 있다. 다른 구체예에서, 정량적 PCR 방법을 사용하여 세균 수준을 정량화할 수도 있다. 이러한 기술은 당업계에 잘 알려져 있다. 예를 들어, qPCR을 위한 프라이머는 서열을 공유하는 종, 속 또는 유기체 군 유래의 균주로부터 특이적으로 증폭되도록 설계될 수 있다. 따라서, 임계 수(threshold number)(ct)는 상기 유기체 또는 유기체 군을 정량화하는데 사용될 수 있다. 추가의 구체예에서, 표적 집단에 특이적인 임의의 박테리아 활성(표현형)은 또한 집단의 고갈(depletion)을 결정하기 위한 지표(metric)로서 사용될 수 있다.
추가의 구체예에서, 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 박테리아 세포의 집단으로부터 선별하는 방법으로서, (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물을 박테리아 세포의 집단으로 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역을 포함하는 상기 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 상기 박테리아 세포의 집단으로부터 선별하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
일 구체예에서, 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 박테리아 세포의 집단으로부터 선별하는 방법으로서, 박테리아 세포의 집단에 하기를 도입하는 단계를 포함하는 것인 방법: (a)(i) 상기 박테리아 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합(homologous recombination)을 위한 비-천연 부위를 포함하는 형질 전환 박테리아 세포의 집단을 생산하는 것; 및 (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아 세포를 상기 박테리아 세포의 집단으로부터 선별하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
당업계에 공지된 바와 같이, 트랜스포손은 예를 들어 PCR 증폭 또는 설계된 DNA 합성을 통해 생성될 수 있고, 임의의 형질 전환 방법을 통해 도입될 수 있다.
일 구체예에서, 본 발명은 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 박테리아, 고세균, 조류 또는 효모 세포의 집단(population)으로부터 선별하는 방법으로서, 박테리아, 고세균, 조류 또는 효모 세포의 집단에 (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 및/또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물을 도입하는 단계로서, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 선별하는 것인 방법을 제공한다.
다른 구체예에서, 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 박테리아, 고세균 또는 효모 세포의 집단(population)으로부터 선별하는 방법으로서, 박테리아, 고세균, 조류 또는 효모 세포의 집단에 하기를 도입하는 단계를 포함하는 것인 방법: (a)(i) 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합(homologous recombination)을 위한 비-천연 부위를 포함하는 형질 전환 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것; 및 (b)(i) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (ii) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (iii) Cas9 폴리펩티드 및/또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물로서, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없고 감소된 게놈 크기를 가지는 하나 이상의 박테리아, 고세균, 조류 또는 효모 세포를 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 선별하는 것인 방법이 제공된다.
일 양상에서, 상기 감소된 게놈 크기는 대조군과 비교하여 감소된 것일 수 있다. 일 양상에서, 대조군은 야생형 박테리아, 고세균, 조류 또는 효모세포의 집단일 수 있거나, 크리스퍼 어레이(예를 들어, 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이)를 포함하는 이종성 구조물으로 형질 전환된 박테리아, 고세균, 조류 또는 효모세포의 집단으로, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단(즉, 비-자기 표적/"스크램블 스페이서"(non-self targeting/"scrambled spacer"))의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈의 표적 영역에 상보적이지 않은 것일 수 있다. 추가적인 양상에서, 대조군은 크리스퍼 어레이를 포함하는 이종성 구조물으로 형질 전환된 박테리아, 고세균, 조류 또는 효모세포의 집단으로, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈의 표적 영역에 상보적이지만, 프로토스페이서 인접 모티프(protospacer adjacent motif)(PAM) 결실된 것일 수 있다.
일 구체예에서, 박테리아의 집단에서 그의 게놈에 결실(예를 들어, 염색체 및/또는 플리스미드 결실)을 가지는 적어도 하나의 분리주(isolate)를 동정하는 방법으로서, (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물을 상기 박테리아 세포의 집단에 도입하는 단계로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역을 포함하는 상기 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질 전환된 박테리아 세포의 집단을 생산하는 단계; 및 상기 형질 전환된 박테리아 세포의 집단으로부터 개별 박테리아 콜로니를 성장시키는 단계로서, 이에 따라 상기 박테리아의 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 단계를 포함하는 것인 방법이 제공된다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
추가적인 구체예에서, 본 발명은 박테리아의 집단에서 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 방법으로서, 상기 박테리아 세포의 집단에 하기를 도입하는 단계; (a)(i) 상기 박테리아 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합(homologous recombination)을 위한 비-천연 부위를 포함하는 형질 전환 박테리아 세포의 집단을 생산하는 것; 및 b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 하나 이상의 박테리아 세포의 상기 게놈 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질전환된 박테리아 세포의 집단을 생산하는 것; 및 상기 형질 전환된 박테리아 세포의 집단으로부터 개별 박테리아 콜로니를 성장시키는 단계로서, 이에 따라 상기 박테리아의 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 것인 단계를 포함하는 것인 방법을 제공한다. 본 발명에서 유용한 크리스퍼 어레이는 타입 I, 타입 II, 타입 III, 타입 IV 또는 타입 V 크리스퍼 어레이일 수 있다.
추가적인 양상에서, 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 방법으로서, 박테리아, 고세균, 조류 또는 효모 세포의 집단에 하기를 도입하는 단계; (a) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (b) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (c) Cas9 폴리펩티드 또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 개별 박테리아, 고세균, 조류 또는 효모 콜로니를 성장시키는 단계로서, 이에 따라 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 것인 단계를 포함하는 것인 방법이 제공된다.
더 추가적인 양상에서, 본 발명은 박테리아, 고세균, 조류 또는 효모 세포의 집단에서 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 방법으로서, 상기 박테리아, 고세균, 조류 또는 효모 세포의 집단에 하기를 도입하는 단계;(a)(i) 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈에 존재하는 적어도 300개의 연속적인 뉴클레오티드와 적어도 80퍼센트의 동일성을 가지는 뉴클레오티드 서열을 포함하는 하나 이상의 이종성 핵산 구조물 또는 (ii) 적어도 하나의 트랜스포손을 포함하는 둘 이상의 이종성 핵산 구조물, 이에 따라 상기 게놈 내에 통합된 상기 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이, 또는 상기 게놈 내에 통합된 제1 및 제2 트랜스포손 사이의 상동 재조합을 위한 비-천연 부위를 포함하는 형질 전환 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것; 및 (b)(i) 트랜스-코딩된 크리스퍼(CRISPR)(tracr) 핵산을 포함하는 이종성 핵산 구조물, (ii) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 크리스퍼(CRISPR) 어레이(crRNA, crDNA)를 포함하는 이종성 핵산 구조물로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 상기 스페이서는 상기 집단의 상기 박테리아, 고세균, 조류 또는 효모 세포의 상기 게놈(염색체 및/또는 플라스미드) 내의 표적 영역에 실질적으로 상보적인 뉴클레오티드 서열을 포함하는 것인 이종성 핵산 구조물, 및 (iii) Cas9 폴리펩티드 및/또는 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 이종성 핵산 구조물로서, 상기 표적 영역은 상기 게놈에 도입된 하나 이상의 이종성 핵산 구조물과 상기 게놈 내에 존재하는 상기 적어도 300개의 연속적인 뉴클레오티드 사이에 위치하는 것 및/또는 상기 제1 트랜스포손과 제2 트랜스포손 사이에 위치하는 것이고, 상기 표적 영역을 포함하는 세포는 사멸되고, 이에 따라 상기 표적 영역이 없는 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단을 생산하는 것인 단계; 및 상기 형질 전환된 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 개별 박테리아, 고세균 또는 효모 콜로니를 성장시키는 단계로서, 이에 따라 상기 집단으로부터 그의 게놈에 결실을 가지는 적어도 하나의 분리주를 동정하는 것인 단계를 포함하는 것인 방법을 제공한다.
일 구체예에서, 적응/성장(fitness/growth) 속도는 전사 및 번역을 위한 고 에너지 투입을 요구하는 선택 유전자(select genes)(폴리펩티드 또는 기능적 핵산(예를 들어, 전사 조절 인자)를 코딩하는)를 제거함으로써, 또는 게놈 크기를 감소시킴으로써 증가 될 수 있다. 따라서, 일 구체예에서, 박테리아, 고세균, 조류 또는 효모 세포의 집단의 적성 또는 성장 속도를 증가시키는 방법으로서, 하기를 포함하는 방법이 제공된다: 감소된 게놈 크기(예를 들어, 게놈의 부분의 부재를 선별하는 단계) 및/또는 본 명세서에 기재된 것과 같이 박테리아, 고생물, 조류 또는 효모 세포의 게놈에서의 결실을 선별하는 단계. 일 구체예에서, 결실은 하나의 유전자 또는 하나 이상의 유전자를 포함할 수 있다. 따라서, 게놈 크기를 감소시키거나 특정 유전자를 결실시킴으로써, 상기 집단은 결핍된 게놈 부분이나 결실된 유전자 또는 유전자의 전사/번역에 더이상 에너지를 소비하지 않아, 에너지 요구량이 감소하고 게놈 및/또는 상기 유전자 또는 유전자의 상기 부분을 여전히 포함하는 대조군 집단과 비교하여 증가된 적응(fitness)을 포함한다.
다른 구체예에서, 박테리아, 고세균, 조류 또는 효모 세포의 집단으로부터 생산된 생성물(product)의 양을 증가시키는 방법으로서, 본 명세서에 기재된 것과 같이 박테리아, 고세균, 조류 또는 효모 세포의 게놈에서 결실을 선별함으로써 세포의 적응(fitness) 또는 성장률을 증가시키는 단계를 포함하는 방법이 제공된다. 일 구체예에서, 상기 생성물은 항생제, 2차 대사 산물, 비타민, 단백질, 효소, 산 및 약제(pharmaceutical)를 포함할 수 있으나, 이에 한정되는 것은 아니다.
일 구체예에서, 본 발명에서 유용한 크리스퍼 어레이(crRNA, crDNA)는 타입 I 크리스퍼-카스 시스템 유래, 타입 II 크리스퍼-카스 시스템 유래, 타입 III 크리스퍼-카스 시스템 유래, 타입 IV 크리스퍼-카스 시스템 유래 또는 타입 V 크리스퍼 크리스퍼-카스 시스템 유래인 어레이일 수 있다.
상기 구체예와 관련하여, tracr 핵산 및 CRISPR 어레이를 포함하는 이종성 핵산 구조물을 포함하는 이종성 핵산 구조물은 동일한 구조물(예를 들어, 발현 카세트 또는 벡터)에 포함되거나 상이한 구조물에 포함될 수 있고, 도입될 수 있다. 특정 구체예에서, tracr 핵산 및 CRISPR 어레이를 포함하는 이종성 핵산 구조물을 포함하는 이종성 핵산 구조물은 Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드를 선택적으로 추가로 포함할 수 있는 단일 구조물(예를 들어, 발현 카세트 및/또는 벡터)에 포함될 수 있다. 일 구체예에서, tracr 핵산 및 CRISPR 어레이를 포함하는 이종성 핵산 구조물을 포함하는 이종성 핵산 구조물은 단일 프로모터 및/또는 분리된 프로모터에 작동 가능하게 연결될 수 있다.
일 구체예에서, 트랜스-활성화 CRISPR(tracr) 핵산 및 CRISPR 어레이 (crRNA, crDNA)를 포함하는 이종성 핵산 구조물을 포함하는 이종성 핵산 구조물은 CRISPR 가이드(gRNA, gDNA)에 포함될 수 있다. 일 구체예에서, CRISPR 가이드는 프로모터에 작동 가능하게 연결될 수 있다.
일 구체예에서, 본 발명에 유용한 Cas9 폴리펩티드는 Cas9 뉴클레아제의 아미노산 서열과 적어도 70%(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)의 동일성에서 포함될 수 있다. 본 발명에 유용한 예시적인 Cas9 뉴클레아제는 크리스퍼-카스 시스템에서 DNA 절단을 촉매하는 것으로 공지된 임의의 Cas9 뉴클레아제일 수 있다. 당업계에 공지된 바와 같이, 이러한 Cas9 뉴클레아제는 HNH 모티프 및 RuvC 모티프를 포함한다(예를 들어, WO2013/176772; WO/2013/188638 참조). 일 구체예에 있어서, Cas9 뉴클레아제의 기능적 단편이 본 발명에 사용될 수 있다.
크리스퍼-카스 시스템 및 Cas9 뉴클레아제 군은 당업계에 널리 공지되어 있으며, 예를 들어, 스트렙토코커스 서모필루스(Streptococcus thermophilus ) CRISPR1 (Sth CR1) 그룹의 Cas9 뉴클레아제, 스트렙토코커스 서모필루스(Streptococcus thermophilus) CRISPR3 (Sth CR3) 그룹의 Cas9 뉴클레아제, 락토바실러스 부치네리(Lactobacillus buchneri) CD934 (Lb) 그룹의 Cas9 뉴클레아제 및 락토바실러스 람노서스(Lactobacillus rhamnosus) GG (Lrh) 그룹의 Cas9 뉴클레아제를 포함한다. 추가적인 Cas9 뉴클레아제에는 락토바실러스 커바터스(Lactobacillus curvatus) CRL 705가 포함되지만, 이에 한정되지 않는다. 본 발명에 유용한 또 다른 Cas9 뉴클레아제에는 락토바실러스 아니말리스(Lactobacillus animalis) KCTC 3501 유래 Cas9 및 락토바실러스 파르시미니스(Lactobacillus farciminis) WP 010018949.1이 포함되나, 이에 한정되는 것은 아니다.
또한, 특정 구체예에서, Cas9 뉴클레아제는 표적 DNA를 포함하는 유기체에 대해 코돈 최적화된 뉴클레오티드 서열에 의해 코딩될 수 있다. 또 다른 구체예에서, Cas9 뉴클레아제는 적어도 하나의 핵 편재(nuclear localization) 서열을 포함 할 수 있다.
일 구체예에서, 본 발명에 유용한 타입 I 폴리펩티드는 Cas3, Cas3' 뉴클레아제, Cas3" 뉴클레아제, 그의 융합 변이체와 적어도 70%(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)의 동일성에서 포함될 수 있다. 일 구체예에서, 본 발명에 유용한 타입 I 캐스케이드 폴리펩티드는 Cas7 (Csa2), Cas8a1 (Csx13), Cas8a2 (Csx9), Cas5, Csa5, Cas6a, Cas6b, Cas8b (Csh1), Cas7 (Csh2), Cas5, Cas5d, Cas8c (Csd1), Cas7 (Csd2), Cas10d (Csc3), Csc2, Csc1, Cas6d, Cse1 (CasA), Cse2 (CasB), Cas7 (CasC), Cas5 (CasD), Cas6e (CasE), Cys1, Cys2, Cas7 (Cys3), Cas6f (Csy4), Cas6 및/또는 Cas4의 아미노산 서열과 적어도 70%(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)의 동일성에서 포함될 수 있다.
타입 I 크리스퍼-카스 시스템은 당업계에 잘 공지되어 있고, 예를 들어, 예시적인 타입 I-A 크리스퍼-카스 시스템을 포함하는 아키오글로버스 풀기더스(Archaeoglobus fulgidus), 예시적인 타입 I-B 크리스퍼-카스 시스템을 포함하는 클로스트리듐 크루이버리(Clostridium kluyveri) DSM 555, 예시적인 타입 I-C 크리스퍼-카스 시스템을 포함하는 바실러스 할로듀란스(Bacillus halodurans) C-125, 예시적인 타입 I-D 크리스퍼-카스 시스템을 포함하는 시아노테세 sp.(Cyanothece sp .) PCC 802, 예시적인 타입 I-E 크리스퍼-카스 시스템을 포함하는 대장균(Escherichia coli) K-12, 예시적인 타입 I-U 크리스퍼-카스 시스템을 포함하는 게오박터 설퍼레두센스(Geobacter sulfurreducens) 및 예시적인 타입 I-F 크리스퍼-카스 시스템을 포함하는 예르시니아 수도투버쿨로시스(Yersinia pseudotuberculosis) YPIII를 포함한다.
일 구체예에서, 본 발명에 유용한 타입 II 폴리펩티드는 Cas9의 아미노산 서열과 적어도 70%(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)의 동일성에서 포함될 수 있다. 타입 II 크리스퍼-카스 시스템은 당업계에 잘 공지되어 있으며, 예를 들어, 레지오넬라 뉴모필라 파리 균주(Legionella pneumophila str. Paris), 스트렙토코커스 서모필루스 (Streptococcus thermophilus) CNRZ1066 및 네이세리아 락타미카 (Neisseria lactamica) 020-06를 포함할 수 있다.
일 구체예에서, 본 발명에 유용한 타입 III 폴리펩티드는 Cas6, Cas10 (or Csm1), Csm2, Csm3, Csm4, Csm5, and Csm6, Cmr1, Cas10 (or Cmr2), Cmr3, Cmr4, Cmr5, and Cmr6, Cas7, Cas10, Cas7 (Csm3), Cas5 (Csm4), Cas7 (Csm5), Csm6, Cas7 (Cmr1), Cas5 (Cmr3), Cas7 (Cmr4), Cas7 (Cmr6), Cas7 (Cmr6), Cmr5, Cas5 (Cmr3), Cas5 (Csx10), Csm2, Cas7 (Csm3), 및 all1473의 아미노산 서열과 적어도 70%(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)의 동일성에서 포함될 수 있다. 타입 III 크리스퍼-카스 시스템은 당업계에서 널리 알려져 있으며, 예를 들어, 예시적인 타입 III-A 크리스퍼-카스 시스템을 포함하는 스타필로코커스 에피더미디스(Staphylococcus epidermidis) RP62A, 예시적인 타입 III-B 크리스퍼-카스 시스템을 포함하는 피로코커스 퓨리오서스(Pyrococcus furiosus) DSM 3638, 예시적인 타입 III-C 크리스퍼-카스 시스템을 포함하는 메타노서모박터 서마우토로피커스(Methanothermobacter thermautotrophicus) str. Delta H, 및 예시적인 타입 III-D 크리스퍼-카스 시스템을 포함하는 로세이플렉시스(Roseiflexis ) sp. Rs-1을 포함한다.
일 구체예에서, 본 발명에 유용한 타입 IV 폴리펩티드는 Csf4 (dinG), Csf1, Cas7 (Csf2) 및/또는 Cas5 (csf3)의 아미노산 서열과 적어도 70%(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)의 동일성에서 포함될 수 있다. 타입 IV 크리스퍼-카스 시스템은 당업계에 널리 알려져 있으며, 예를들어, 예시적인 타입 IV 크리스퍼-카스 시스템을 포함하는 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans) ATCC 23270 일 수 있다.
일 구체예에서, 본 발명에 유용한 타입 V 폴리펩티드는 Cpf1, Cas1, Cas2, 또는 Cas4의 아미노산 서열과 적어도 70%(예를 들어, 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 등)의 동일성에서 포함될 수 있다. 타입 V 크리스퍼-카스 시스템은 당업계에 널리 공지되어 있으며, 예를 들어, 예시적인 타입 V 크리스퍼-카스 시스템을 포함하는 프란시셀라 cf. 노비시다(Francisella cf . novicida) Fx1 을 포함한다.
추가적인 양상에서, 본 발명의 핵산 구조물, 핵산 어레이, 핵산 분자 및/또는 뉴클레오티드 서열은 숙주 유기체의 세포 내로 도입될 수 있다. 본 발명이 유용 할 수 있는 임의의 세포/숙주 유기체가 사용될 수 있다. 예시적인 숙주 유기체는 박테리아, 고세균, 조류 및 진균(예를 들어, 효모)을 포함한다.
본 발명은 이하 하기 실시예를 참조로 하여 기술될 것이다. 이들 실시예는 청구의 범위를 본 발명에 한정하려는 것이 아니라, 오히려 특정 실시예를 예시하도록 의도된 것이다. 당업자에게 일어나는 예시된 방법의 임의의 변형은 본 발명의 범위 내에 속하는 것으로 의도된다.
실시예
실시예 1. 박테리아 균주
모든 박테리아 균주를 표 1에 열거하였다. 박테리아 배양은 25% 글리세롤 (vol/vol)을 갖는 적절한 배양 배지에서 저온보존하였고 -80℃에 보관하였다. S. thermophilus 1% 쇠고기추출물(wt/vol) 및 1.9% (wt/vol) β-글리세롤포스페이트(Sigma) 브로쓰로 보충된 엘리커(Eliiker) 배지(Difco)에서 정치 호기 조건 하 37℃, 또는 1.5% (wt/vol) 아가 (Difco)를 갖는 고체 배지에서, 혐기성으로 37℃에서 48시간 동안 번식시켰다. 적절한 E.coli EC1000을 37℃에서 Luria-Bertani (Difco) 브로쓰 내, 또는 1.5% 아가로 보충된 BHI(brain-heart infusion) 고체 배지 상에서 호기성으로 번식되었을 때, 플라스미드 선별을 위해 2μg/mL의 에리스로마이신(EM) 및 5μg/mL의 클로람페니콜(Cm)(Sigma) 농도를 S. thermophilus 내에서 사용하였다. 적절한 때에, 재조합 E. coli에 대하여 E. coli의 항생제 선별을 40μg/mL 카나마이신(Kn) 및 150μg/mL의 Em으로 유지하였다. 1% 락토스, 1.5% 아가, 및 pH 지시약으로서 0.04% 브로모-크레졸 퍼플을 갖는 합성 엘리커 배지로 보충함으로써 β-갈락토시다제 활성에 대한 S. thermophilus 유도체의 스크리닝을 질적으로 평가하였다.
실시예 2. DNA 분리 및 클로닝
모든 키트, 효소 및 시약은 제조업체의 지침에 따라 사용하였다. DNA 정제 및 클로닝을 전술한 바와 같이 수행하였다 (41). 간단히, S. thermophilus의 게놈 DNA 정제에 ZR Fungal/Bacterial MiniPrep kit (Zymo)를 사용하였다. Qiagen Spin miniprep kit (Qiagen)를 사용하여 플라스미드 DNA를 E. coli로부터 분리하였다. PFU HS II DNA 중합효소 (Stratagene)로 DNA의 고정확도 PCR 증폭을 수행하였다. 일반 PCR은 Choice-Taq Blue 중합효소 (Denville)를 사용하여 수행하였다. PCR 증폭용 프라이머는 Integrated DNA Technologies (Coralville, IA)로부터 구입하였다. Zymoclean DNA gel recovery kit (Zymo)를 사용하여 아가로즈 겔로부터 DNA 추출을 수행하였다. 제한 효소는 Roche Molecular Biochemicals로부터 구입하였다. 라이게이션(ligation)은 New England Biolabs quick T4 ligase로 수행하였다. 시퀀싱은 Davis Sequencing Inc. (Davis, CA)에 의해 수행하였다. 동결 보존된 루비듐 클로라이드 적격(competent) E. coli 세포를 전술한 바와 같이 제조하였다 (41). lacZ 표적 어레이(array)를 갖는 플라스미드는 (1) SthCRISPR1 또는 SthCRISPR3에 특이적인 천연 리더 서열 (2) CRISPR 1 또는 CRISPR 3에 특이적인 천연 반복 (3_ lacZ의 5' 말단에 특이적인 스페이서 서열 (4) 또다른 천연 반복을 각각 순차적으로 갖도록 구성하였다 (도 1). 각각의 플라스미드를 설계하기 위해서, 상기에 열거한 서열 특징을 확장된 올리고머로 주문하고 (표 2), 오버랩 연장 PCR(overlap extension PCR) (42)에 의한 스플라이싱을 사용해서 조합하였고 pORI28로 클로닝하였다 (도 2).
실시예 3. CRISPR 스페이서의 선별 및 설계
원하는 스페이서 서열의 선별에서 염색체 절단 힌지의 프로그램 가능한 특이성은 표적 대립 유전자에 대해 고유하다. 특이성은 표적 서열 내 프로토-스페이서에 근접해야 하는 짧은 보존 서열인 필수적 PAM에 의해 추가적으로 구성된다(21, 43). 따라서, 스페이서의 선별 및 설계에 대한 엄격한 기준은 컨센서스 PAM 서열의 위치 및 외부 게놈 유전자좌에 동일한 부수적 서열이다. 추정 프로토스페이서(Putative protospacers)는 lacZ의 센스 및 안티센스 가닥 내 모든 추정 PAM 서열의 위치를 먼저 정의함으로써 제한된다. 3,081 nt 유전자 내에, 그들의 생물정보학적으로 유도된 일치 서열 (21)과 동일한 22 CRISPR1 (AGAAW) 및 39 CRISPR3 (GGNG) PAM 부위가 있다. 잠재적 스페이서를 동정한 후, 완전한 프로토-스페이서, 시드, 및 PAM 서열을 S. thermophilus LMD-9에 대해 BLAST 분석하여 비-특이적 유전자좌의 추가적인 표적을 예방하였다. CRISPR1 및 CRISPR3에 대한 스페이서는 서열 및 대응하는 PAM 부위에서 상이하지만, lacZ의 5' 말단을 표적하도록 설계하여 6 nt 간격으로 존재하는 예상되는 절단 부위를 초래하였다. 따라서, 각각의 플라스미드 상의 리더 서열, 반복, 및 스페이서는 각각 CRISPR1 또는 CRISPR3에 대하여 고유한 직교적 특징을 나타내었다. 표적 유전자좌-의존적 돌연변이를 분석하기 위해서, β-갈락토시다제 활성에 필수적인 금속 양이온-결합 잔기에 대한 스페이서를 갖는 추가적인 CRISPR3 플라스미드를 제조하였다. 비-자기-스페이서를 함유하는 CRISPR1 어레이 플라스미드를 자기-표적의 치사율을 정량화하기 위한 대조군으로 사용하였다.
실시예 4. 형질전환
플라스미드를 온도-감응성 헬퍼 플라스미드, pTRK669를 이전에 기술된 방법 (44)에 따라서 적격 S. thermophilus에 전기천공하였다. 간단히, S. thermophilus를 밤새 배양한 배양물을 1% 쇠고기추출물, 1.9% β-글리세로포스페이트 및 Cm 선별로 보충된 엘리코 배지 50mL에 1%(vol/vol)로 접종하였다. 배양이 0.3 OD600 nm에 도달할 때, 페니실린 G를 최종 농도가 10 μg/mL에 도달하도록 첨가하여 전기천공 효율을 촉진하도록 하였다 (45). 원심분리에 의해 세포를 수확하고 10 mL 차가운 전기천공 버퍼 (1 M 수크로오스 및 3.5 mM MgCl2)에서 3회 세척하였다. 세포를 전기천공 버퍼에서 100배 농축하고 40 μl의 현탁액을 0.1 mm 전기천공 큐벳에 분주하였다. 각각의 현탁액을 700 ng의 플라스미드와 혼합하였다. 전기천공 조건은 2,500 V, 25 μFd 커패시턴스(capacitance). 및 200 옴 저항(Ohms resistance)으로 설정하였다. 시간상수는 4.4 내지 4.6 ms 범위에서 기록하였다. 현탁액을 즉시 950 μL의 회복 배지와 혼합하고 8시간 동안 37℃에서 배양하였다. 세포 현탁액을 선별 배지에 플레이팅하고 전기천공 큐벳을 배지로 세척하여 세포의 회복을 확실히 하였다.
실시예 5. β-갈락토시다제 표현형 확인
초기에 CRISPR1 및 CRISPR3 모두에서 생성된 형질전환체를 탄수화물 공급원으로서 1% 락토오스로 보충된 반-합성 엘리커 배지 상에서 콜로니를 재스트리킹함으로써 β-갈락토시다제 결핍 표현형에 대하여 스크리닝하였다. β-갈락토시다제 활성의 결핍을 Miller 분석(o-니트로페닐-β-D-갈락토시드: ONPG)을 수행함으로써 확인하였다 (46). 간단히, 배양액을 5 mL의 배지에서 후기-log 단계(1.2의 OD600 nm)로 확장하고 원심분리(10분 동안 4,000 x g)에 의해서 수확하였다. 세포를 세척하고 0.5 mL (Gibco-Invitrogen)에 재현탁하였다. 각각의 현탁액을 100 μL의 0.1 mm 유리 비드 (Biospec)와 혼합한 후 Mini-Beadbeater (Biospec)에서 5번의 균질화 60초 사이클을 수행하였다. 이후 시료를 원심분리하여 (5분 동안 15,000 x g) 잔여물 및 온전한 세포를 제거하였다. 세포 용해물 (10 μL 분주)을 600 μL의 기질 용액(60 mM Na2HPO4; 40 mM NaH2PO4; 1 mg/mL ONPG; 2.7 μL/mL β-메르캅토에탄올)과 혼합하고 상온에서 5분 동안 배양하고, 700 μL의 정지 용액을 첨가하였다(1 M NaCO3). 420 nm에서 흡광도를 기록하고 β-갈락토시다제의 활성을 Miller 단위로 기록하였고, 이전에 기술된 바와 같이 계산하였다 (46).
실시예 6. 성장 및 활성 분석
배양액은 락토오스가 결핍된 반-합성 엘리커 배지에서 12 세대 동안 계대 배양함으로써 성장 분석을 하기 위해 미리 준비되었다. 신선한 배지를 밤새 배양한 1% (vol/vol) 배양액으로 접종하고 37℃에서 정치 배양 하였다. OD600을 배양액이 정지 단계에 도달할 때까지 매시간 모니터링하였다. 우유의 산성화는 밤새 배양한 배양액을 108 cfu/mL의 수준으로 탈지 우유를 접종하고 42℃에서 배양함으로써 분석하였다. 이어서 Mettler Toledo Seven Easy pH meter와 Accumet probe를 사용하여 pH를 모니터링하였다. 탈지 우유는 NCSU 낙농 공장에서 구입하여 80℃에서 30분 동안 저온살균 하였다.
실시예 7. 소모 가능한 게놈 영역(expendable genomic regions)의 동정
크리스퍼-카스 표적을 위한 이동성 및 유전자좌의 in silico 예측을 i) IS 요소의 위치, 방향 및 뉴클레오티드 동일성, 및 ⅱ) 필수 ORF의 위치에 기초하여 수행하였다. Bacillus subtilis에서는 271 개의 필수 ORF를 게놈 전체 유전자 녹아웃의 치사율을 결정함으로써 확인하였다 (33). S. thermophilus 게놈은 B. subtilis로부터 각 필수 유전자에 대한 상동체(homologues)를 쿼리(qurery)하기 위해 BLASTp 검색 도구를 아미노산 서열의 기본 스코어링 매트릭스 하에서 사용하였다. S. thermophilus에서 약 239 개의 필수 ORF에 대한 상동체가 확인되었으며, 모두 염색체로 인코딩된다 (표 4). DNA 복제/항상성, 번역 장치 및 핵심 대사 경로를 포함한 보존된 세포 과정에 관여하는 단백질은 이미 확인되었다. 발효 박테리아의 대사 프로파일에 따라 시토크롬 생합성/호흡에 상응하는 상동체가 관찰되지 않았다. 각각의 추정 필수 ORF는 SnapGene 소프트웨어를 사용하여 표준(reference) 게놈에 매핑되어 S. thermophilus LMD-9에서 그들의 위치와 분포를 시각화 하도록 하였다 (도 3a).
S. thermophilus 게놈 내의 IS 요소는 Geneious® 소프트웨어를 사용하여 트랜스포존 코딩 서열을 정렬함으로써 그룹화 하였다 (도 4). 계통 지정은 IS 요소 데이터베이스 (www-is.biotoul.fr//) 내의 BLAST 분석에 따라 결정하였다. 염색체 단편의 재조합-매개된 절제 가능성을 예측하기 위해, 관련 IS 요소의 상대적 위치를 S. thermophilus 게놈에 대해 매핑하였다 (도 3a). IS 요소의 IS1193과 Sth6 계통은 게놈에서 가장 자주 나타났으며 Streptococcus pneumoniaeStreptococcus mutans에서 흔하게 발견되었다 (34). IS1193 요소의 우세에도 불구하고, 이 유전자좌의 대부분은 일부 다형성과 퇴행성을 나타내는 작은 단편으로 보였으나 높은 수준의 서열 동일성이 존재하는 몇몇의 카피가 있었다 (도 5a). 대조적으로, Sth6 계통은 상당한 다형성과 높은 퇴화를 나타내었고 일부 카피는 상당한 내부 결실을 가지고 있었다 (도 5b). IS1167 및 IS1191 요소는 덜 빈번하였으나 게놈에서 확인된 카피 사이에서 거의 완벽한 정확도(fidelity)를 나타내었다 (도 5c 및 5d). S. thermophilus의 IS1167과 IS1191 요소의 길이 및 서열의 보존, 및 우유 적응 유전자와의 상대적 근접성을 토대로, 우리는 이러한 보존/고 정확성 트랜스포손이 최근에 게놈에 획득되었다고 가정하였다.
예측된 필수 ORF와 IS 요소의 위치를 결합함으로써, 높은 정확성의 IS 요소에 인접한 소모 가능한 섬(expendable island)을 확인하였다 (도 3a)(표 3). 첫 번째 섬은 알려지지 않은 특이성을 갖는 추정 ATP-의존성 올리고뉴클레오티드 수송 시스템을 코딩하는 S. thermophilus LMD-9에 고유한 오페론을 포함한다 (도 3b) (35). 두 번째는 S. thermophilus의 빠른 산성화 표현형에 기여하는 세포-외피 프로테나아제 PrtS를 갖는다 (도 3c) (36). 특히, prtSS. thermophilus 게놈에 흔히 있는 것은 아니지만, prtS를 코딩하는 게놈 섬은 자연적 능력을 사용하는 균주간에 전이가 가능하다는 것을 증명하였다 (36). 세 번째 섬은 추정 ATP-의존성 구리 유출 단백질을 함유하고 모든 서열화된 S. thermophilus 균주에 존재한다 (도 3d). 네 번째 섬은 102 kbp의 길이와 lac 오페론을 포함하는 102 개의 예측된 ORF를 갖는, 유전자의 함량 측면에서 가장 크다 (도 3e). 이 섬은 S. thermophilus의 모든 균주에서 발견되지만, 특정 유전자의 함량과 길이가 균주에 따라 다르다. 두 가지 내인성 타입 Ⅱ 시스템을 갖는 큰 게놈 섬을 표적으로 한 결과를 결정하기 위해, lacZ 코딩 서열에 대하여 반복-스페이서 어레이를 생성하고 (도 3e) pORI28로 클로닝하였다 (도 2). 네 번째 섬은 S. thermophilus 균주의 크기, 편재 및 β-갈락토시다제 음성 표현형에 기초한 lacZ 돌연변이에 대한 스크리닝 능력으로 인해 크리스퍼-카스 표적으로 선택하였다.
실시예 8. lacZ 의 크리스퍼-카스 표적은 큰 결실 이벤트를 선택한다
타입 Ⅱ 시스템에서, Cas9는 DNA를 조사하고 tracrRNA::crRNA 이중 복합체(duplex)의 형성을 통해 발생하는 표적에서 Cas9의 활성화와 함께 PAM 서열에 가역적으로 결합하고 (37), 궁극적으로 dsDNA 절단을 야기한다 (도 6a 및 6b). 도 14a 및 14b는 표적된 사멸에 대한 내인성 크리스퍼 시스템을 선택하기 위한 일반적 접근을 나타내는 도식이다. 구체적으로, 이러한 도 14a 및 14b는 Streptococcus thermophilus에서 표적된 사멸에 대한 내인성 타입 Ⅱ 시스템을 선택하기 위한 시도를 나타낸다. 따라서, S. thermophilus, 프로그램화된 세포 사멸은 발현이 천연 또는 합성 프로모터에 의해 유도되는 천연 반복에 인접한 게놈 표적 스페이서 서열을 설계함으로써 크리스퍼-Sth1 (A) 또는 크리스퍼-Sth3 (B) 타입 Ⅱ 시스템을 사용하여 달성된다. 전사된 반복-스페이서 어레이는 숙주를 통해서 프로세싱되어 성숙 crRNA를 수득하고, 이는 Cas9를 게놈에 모집하여 세포 사멸을 야기하는 이중-가닥 DNA 절단을 유도한다.
크리스퍼-카스 시스템에 의한 염색체 자기-표적을 유도하는 플라스미드로의 형질전환은 비-자기-표적 플라스미드와 비교해서 형질전환체 생존 상의 상대적인 감소에 의해 측정된 바와 같은 세포독성을 나타낸다 (15, 29). S. thermophilus에서 lacZ 유전자를 표적하는 것은 회수된 형질전환체에서 약 2.5-log 감소를 가져 왔으며 (도 6c), 형질전환 효율의 한계에 도달하였다. 이중 가닥 DNA 절단 (DSB)은 유기체의 생존에 중대한 위협이 된다. 대응하는 복구 경로는 종종 블런트-말단 DNA를 복구하기 위해 최종 절제를 필요로 한다. 야생형에 대한 표적 유전자좌(locus)의 회복이 후속 크리스퍼 표적을 피하지 않기 때문에 Cas9에 의한 엔도뉴클레오리시스(endonucleolysis)는 추가로 DSB에 의한 돌연변이가 발생하기 위한 압력을 더욱 심화시킨다. 젖산 박테리아 내에서 스페이서 기원의 확인은 22%의 스페이서가 자기에 대한 상보성을 나타내고 해당 게놈 유전자좌가 변경되고 자연발생된 자기-표적 이벤트의 생존을 촉진할 것임을 나타내었다 (28).
표적 유전자좌(locus)가 Cas9-유도된 절단에 반응하여 돌연변이되었는지를 결정하기 위해서, 형질전환체는 먼저 β-갈락토시다제 활성의 결핍에 대하여 스크리닝되었다. 활성이 결핍된 클론을 lacZ 유전자좌(locus)에서 유전자형 분석하였다. 전형적 또는 대안적 말단 접합(joining)에 대한 돌연변이 및 어떠한 자발적 단일 뉴클레오티드 다형성 또한 서열분석된 클론 중 어떤 것에서도 발견되지 않았다. 단일 뉴클레오티드 다형성의 부재는 낮은 점 돌연변이의 발생 정도에 의해 타협된 낮은 형질전환 효율, 및 비-상동 및 접합의 부재에 연관된 Ku 및 LigaseIV 상동체의 부재에 기여할 수 있다 (38). PCR 스크리닝은 lacZ가 존재하지 않음을 나타내었지만, PCR 앰플리콘은 천연 lacZ 유전자좌에 대응하지 않았고, 오히려 또다른 게놈 유전자좌에서 IS 요소-인접된 서열이 증폭되었다. β-갈락토시다제 활성의 결핍에 대하여 책임이 있는 유전자형을 조사하기 위해, 단일 분자 실시간 시퀀싱을 다음의 두 개의 클론 상에서 수행하였다; lacZ의 5' 말단을 표적하는 CRISPR3으로부터 생성된 하나, 및 β-갈락토시다제 촉매에 필요한 이온-결합 포켓을 코딩하는 서열을 표적 하는 CRISPR3으로부터 생성된 하나 (도 7a 및 7b). 이러한 시퀀싱 전략은 게놈 내 IS 요소의 높은 수로 인한 그것의 긴 판독 길이에 사용되어 적절한 유전자좌에 대해 신뢰할 수 있는 매핑 판독에서의 어려움을 피한다 (35). 판독은 Geneious 소프트웨어를 사용하여 기준 게놈 서열에 대해 매핑되고, lacZ 개방형 해독 틀을 코딩하는 큰 단편(약 102 kbp)의 부재를 밝혔다(도 7a 및 7b). 모든 서열분석된 균주는 큰 결실 경계의 재현성을 확인하였고, 결실이 표적에 사용된 lacZ 스페이서 서열 또는 크리스퍼-카스 시스템과 독립적으로 발생하는 것은 나타내었다. 그런, 시퀀싱 데이터는 결실의 정확한 접합을 신뢰할 만한 하도록 나타내지 않는다.
결실된 102 kbp 단편은 S. thermophilus의 약 5.5%의 1.86 Mbp 게놈을 구성한다. 영역은 ABC 수송(transporter), 2-성분 조절 시스템, 박테리오신 합성 유전자, 파지 관련 단백질, 락토오스 이화 유전자, 및 지정된 기능이 없는 일부 미지의 유전자를 코딩하는 102 추정 ORF(STER_1278-1379)를 포함한다 (35). 성장 표현형에 있어서 결실의 효과를 브로쓰 배양에서 시간 경과에 따른 OD 600 nm 측정에 의해서 평가하였다(도 7c). 결실 클론은 더 긴 유도기(lag phase), 더 낮은 최종 OD(]<0.01) 을 나타내었고 유의적으로 로그기에서 평균 103분인, 야생형의 경우 62분인 것과 비교하여(p<0.001) 더 긴 생성 시간을 보였다. 결실 유도체는 세대 당 복제할 게놈이 5.5% 이하이고 제거된 OFR의 전사 또는 번역에서 자원을 소비하지 않지만, 야생형에 비하여 적응에 있어서의 명백한 증가가 관찰되지 않았다. β-갈락토시다제 활성은 젖산 박테리아의 산업적 적응을 위한 특징이고 산성화를 통한 식품 시스템의 보존에 필수적이다. 따라서 lacZ 결핍 S. thermophilus 균주의 우유를 산성화할 수 있는 능력을 pH를 모니터링함으로써 평가하였다(도 7d). 예상되는 것처럼, 결실 균주는 실험 과정에서 우유를 산성화하는데 실패하였고, 야생형에서 관찰된 빠른 산성화 표현형과 현저한 대조를 이룬다.
실시예 9. 게놈 결실은 상동 IS 요소 사이의 재조합을 통해 발생한다
결실의 메커니즘을 조사하기 위해서, 단편에 인접한 뉴클레오티드 서열을 결정하였다. 접합(junction)에서 발견된 유일한 상동 서열은 전체적으로 727 bp 이상의 91% 뉴클레오티드 서열 동일성을 나타내는 두개의 절단된 IS1193 삽입 서열이다. 따라서, 두 개의 IS 요소에 인접한 프라이머 쌍은 결실을 나타내는 생존 클론의 게놈 DNA를 증폭하기 위해서 설계되었다. 각각의 결실 균주는 예상된 크기의 강한 밴드를 나타내었다 (약 1.2 kb), 그리고 큰 게놈 결실 이벤트가 확인되었다 (도 8a). 흥미롭게도, 염색체 결실에 대응하는 앰플리콘이 야생형에서 거의 관찰되지 않았고, 야생형 집단에서 낮은 속도로 이러한 영역을 자연적으로 게놈으로부터 삭제할 수 있음을 나타내었다. CRISPR3에 의해 염색체 자기-표적에 의해 생성된 20 클론에 대하여 접합 앰플리콘의 시퀀싱을 수행하였다. 유전자좌의 유전형분석은 각각의 클론 내 하나의 키메라 IS 요소의 존재를 밝혔고, 나아가, 각각의 클론에 대해 키메라 내에서 상류 요소로부터 하류 서열까지의 전이를 밝혔다 (도 8b). 관찰된 결실의 크기는 101,865-102,145 bp의 범위이다. 전이의 정확한 유전자좌는 가변적이지만, 클론 내에서는 비-무작위적이고, 결실 메커니즘의 잠재적 편향을 암시하였다. S. thermophilus는 이중 ATP-의존성 DNA 엑소뉴클레아제(STER_ 1681 및 STER_ 1682), 및 RecD 계통의 헬리카제(STER_1742)로 기능하는 RecA (STER_0077), AddAB 상동체(homolog)로서 코딩되는 전형적인 재조합 장치를 포함한다. 인접한 IS 요소 사이의 높은 뉴클레오티드 동일성 및 부위-특이적 재조합 (4)을 수행할 수 있는 S. thermophilus에 대한 능력은 게놈 단편의 절제를 매개하는 RecA-매개된 재조합에 대한 잠재력을 확인하였다 (도 8c).
다음, 동일한 유전적 구조를 갖는 각각의 유전자좌에 대한 결실의 분리를 가능하게 할 수 있는 능력에 대해 크리스퍼-카스 표적을 측정하였다. 이러한 목적을 위해서, 세개의 CRISPR3 반복-스페이서 어레이, 첫번째 유전자좌에서 표적 올리고뉴클레오티드 수송(transporter)을 표적하는 하나의 것, 두번째 유전자좌로부터 prtS, 및 세번째 유전자좌로부터 ATPase 구리 유출 유전자를 생성하고 pORI28로 클로닝하였다 (도 5). 결실에 대해 스크리닝하기 위해서, 각각의 유전자좌에서 IS 요소에 인접한 프라이머를 각각의 결실 접합을 증폭하기 위해 설계하였다 (도 8d). 야생형 유전자좌의 부재 또한 각각의 게놈 섬에 대한 내부 프라이머를 설계함으로써 각각의 경우에서 확인하였다 (도 8e). 다음 표적 플라스미드로의 형질전환, 각각의 유전자좌에서 결실을 분리하고 야생형의 부존재를 확인하였다. 결실 접합 앰플리콘의 시퀀싱은 단일 키메라 IS 요소 풋프린트가 남아있음을 확인하였고, 각각의 유전자좌에서 결실에 대한 일반적인 메커니즘을 나타내었다. 흥미롭게, IS 요소에 인접한 프라이머 또한 야생형 gDNA로부터 증폭되었고, 추가적으로 각각의 유전자좌에서 자연적으로 발생된 집단 이질성(heterogeneity)이 자발적인 게놈 결실 때문임을 제안한다. 이러한 결과는 서열-특이적 Cas9 절단이 프로토스페이서가 결핍된 변이체 및 표적을 위해 필요한 PAM 조합을 선택하는 것을 암시한다. 따라서, 그들의 게놈 섬을 이미 잃은 미생물 변이체에 대한 강한 선택으로서 크리스퍼-카스 표적을 사용하여 자발적인 게놈 결실이 분리될 수 있다.
실시예 10. 집단 스크리닝
본 연구에서, S. thermophilus에 포함된 천연 타입 ⅡA 시스템을 큰 게놈 섬의 자발적 결실을 정의하기 위해 다시 사용하였다. S. thermophilus에서 네 개의 섬을 독립적으로 표적함으로써, 게놈의 총 7%가 결핍된 안정적 돌연변이를 생성하였다. 결실 접합의 특징화는 IS-의존성 재조합 메커니즘이 집단 이질성에 기여함을 제시하였고 결실 이벤트가 8 내지 102 kbp의 범위로 밝혀졌다. 키메라 IS 요소의 정확한 매핑은 천연 재조합 이벤트가 S. thermophilus 내의 큰 염색체 결실에 책임이 있고 잠재적으로 표적 게놈 편집에 이용될 수 있음을 나타내었다. 우리의 결과는 야생형 클론이 집단으로부터 제거되는 반면 크리스퍼-카스 표적 특징을 갖지 않는 돌연변이가 생존함을 증명한다. 따라서, 적응 섬을 확인하고 입증하였고, 내인성 Cas9에 의한 정확한 표적이 혼합된 집단 내에서 큰 결실 변이체를 분리하는데 사용될 수 있음을 나타내었다.
박테리아의 게놈 진화는 수평 유전자 전달, 내재적 돌연변이, 및 게놈 재구조화를 통해 발생한다. S. thermophilus 균주의 게놈 시퀀싱 및 상대적 분석은 유의적인 게놈 쇠퇴(decay)를 밝혔지만, 또한 니체-특이적 유전자 획득을 통해 발생된 영양-풍부 식품 환경에 대한 적응을 나타내었다 (18; 35). S. thermophilus 게놈 내 통합 및 접합 요소, 프로파지, 및 IS 요소를 포함하는 MGE의 존재가 낙농 환경에 대한 빠른 진화를 나타낸다 (38-39). 이동 유전 형질은 유전자 획득을 가능하게 하고, 반대로 비-필수 서열의 불활성화 또는 결실을 가능하게 한다. 따라서, MGE는 적합성 또는 생태적 라이프스타일의 변화 증가의 수단으로서 게놈 유연성을 부여한다. 우리의 결과는 이러한 요소의 크리스퍼-카스 표적이 염색체 재배열 및 항상성에 영향을 줄 수 있음을 강력하게 나타낸다. 이것은 불활성화된 크리스퍼-카스 장치를 갖는 변이체의 선택을 야기한, 필수적 특징을 표적으로 한 실험과 대조적이다 (Jiang 2013). 필수 ORF의 돌연변이가 크리스퍼-카스 표적의 회피를 위한 실행 가능한 수단이 아니고, 따라서 불활성화된 크리스퍼-카스 시스템을 갖는 이러한 클론이 유일하게 남는다. 설계에 의해서, 초가변적 및 소모 가능한 것으로 예측된 유전적 요소를 표적하는 것은 변경된 유전자좌를 갖는 변이체가 생존 가능하고, 자기-표적 이벤트 도중에 활성 크리스퍼-카스 시스템을 유지함을 입증한다.
박테리아 게놈 내에서 IS 요소가 거의 어디에나 있는 분포되어 있음에도 불구하고, 그들은 기능에서의 그들의 다양성 및 유연성 때문에 의문의 유전체로 남아있다 (34). 우리의 결과는 그들의 위치, 방향, 및 서열 보존을 분석함으로써 연관 IS 요소 사이의 재조합을 예측하는 것이 가능하다는 것을 제시한다 (도 4 및 도 5). 크리스퍼-카스 표적은 각각의 예측된 유전자좌에서 집단 이질성을 경험적으로 검증하고 동시에 빈도가 낮은 돌연변이의 회복을 증가시키는 데 사용될 수 있다. 젖산 박테리아, 특히 S. thermophilus에서 MEG의 높은 보급은 게놈 진화를 통한 초-적응된 박테리아의 그들의 종 분화에서의 그들의 역할에 부합한다 (39-40). 더욱이, 크리스퍼-카스 표적을 사용한 게놈 결실 돌연변이체의 회복은 알려지지 않은 기능을 갖는 유전자의 표현형 특징화를 가능하게 한다. lac 오페론을 코딩하는 102 kb 섬의 결실을 나타내는 돌연변이체는 야생형에 비하여 상당히 증가된 생성 시간을 갖고 더 낮은 최종 OD를 달성한다. 102 예측된 ORF가 있으면, 추가적인 표현형이 영향을 받고 많은 유전자가 지정된 기능을 갖지 않을 가능성이 있다. prtS와 같은 니체-특이적 유전자의 산업 관련성을 고려하면, 이러한 방법은 섬-코딩된 유전자가 어떻게 우유에서 성장하기 위해 적응하는지 직접적으로 분석하는 것을 가능하게 한다. 또한, 그들이 별개의 섬으로서 획득될 수 있기 때문에, 이러한 수평적으로 획득된 형질의 천연 게놈 및 생태학적 문맥에 있다. 이러한 결과는 전위(transposition), DNA 복구 메커니즘, 및 게놈 유연성의 조사를 위해 박테리아에서 자기-표적 크리스퍼-Cas9 시스템의 적용에 대한 새로운 길을 제시한다.
크리스퍼-카스 시스템은 일반적으로 유전적 요소와의 간섭을 통해서 유전적 다양성을 제한하지만, 획득된 MGE는 또한 숙주 박테리아에 적응 이익을 제공할 수 있다. 따라서, 크리스퍼-카스 표적에도 불구하고 게놈적으로 통합된 MGE를 유지하는 것의 이익은 게놈 항상성의 중요한 동인이다. 전체적으로, 우리의 결과는 GEI의 in silico 예측이 큰 게놈 결실을 나타내는 클론을 분리하기 위해 크리스퍼-카스 표적과 결합될 수 있음을 제시한다. 각각의 결실 접합에서 키메라 삽입 서열 풋프린트는 네 개의 섬에 대한 결실의 공통적인 메커니즘을 나타내었다. 게놈 유전자좌에 동일성을 나타내는 자기-표적 스페이서의 높은 보급은, 게놈 변경의 실험적인 증명과 결합하여 크리스퍼-카스 자기-표적이 박테리아의 게놈 진화에 상당히 기여할 수 있음을 제시한다 (28;30). 종합적으로, 크리스퍼-카스에 의해 유도된 큰 결실에 대한 연구는 이러한 접근을 알려지지 않은 유전자 클러스터의 필수성 및 기능성을 평가하기 위한 빠르고 효과적인 방법으로서 입증하고, 전이 가능한(transposable) 요소를 통해 발생하는 염색체 결실에 기초하여 최소 박테리아 게놈을 정의한다.
도 9는 Streptococcus thermophilus LMD-9의 게놈의 표적으로 하는 것을 통한 타입 Ⅱ 크리스퍼-카스 시스템-기반의 치사율을 평가하기 위해 정의된 유전적 유전자좌를 나타낸다. 이 분석을 수행하기 위한 방법은 당업계에 공지되어 있다. Selle and Barrangou PNAS. 112(26):8076-8081 (2015) 참조.
직교적 타입 Ⅱ 시스템 (CRISPR1 및 CRISPR3) 모두를 시험하였다; CRISPR1은 어두운 회색을 표적, CRISPR3은 밝은 회색을 표적. (i) 유전자 간 영역 (intergenic regions: INT), (ⅱ) 이동 유전 요소 (IS, GEI1-GEI3, PRO, lacZ, EPS), (ⅲ) 필수 유전자 (dltA, LTA),(ⅳ) 레플리코어(replichore)의 극점, 및 DNA의 정방향 sv 역방향 가닥 (외부 표적 vs. 내부 표적).
도 10은 도 9에 정의된 영역을 표적함으로써 달성된 크리스퍼-기반 치사율을 나타낸다. CFU에서의 로그 감소는 비-표적 플라스미드 대조군의 형질전환과 관련하여 계산하였다; pORI28. 치사율은 염색체 위치, 코딩 순서, 또는 필수성에 상관 없이 실험된 모든 표적에 대해 2-3 로그 감소 범위였다.
도 11은 크리스퍼-매개된 게놈 섬 결실 균주의 전사 프로파일을 나타낸다. 게놈 섬 1-4의 크리스퍼 표적에서 생존한 세포의 회복 및 유전자형 분석은 각각의 실험에서 표적된 게놈 섬이 결핍된 안정한 독립된 돌연변이체의 확인을 야기하였다. 이후, 세포를 확장하고 그들의 전체 RNA를 분리하고 시퀀싱하였다. 이러한 시도를 사용해서, 기준(reference) 게놈에 대한 시퀀싱 판독을 매핑함으로써 전사 프로파일을 생성하였다. 각각의 경우에, 게놈의 나머지 부분에 걸쳐 핵심 유전자의 발현에 미치는 영향을 최소화하면서, 예상된 게놈 섬 유전자좌에 대한 시퀀싱 판독의 부재는 표적 유전적 실체(target genetic entity)의 결핍을 추가로 제시했다.
또한, RNA 시퀀싱 데이터는 판독 범위 캐핑 및 전사 값 비교를 사용함으로써 결실의 경계를 지원하고 추가적으로 동일한 데이터 세트를 사용하여 생성된 비교적 전사체학을 사용하여 표현형의 식별을 지원한다. 구체적으로, 고-처리량 RNA-시퀀싱을 사용하여 예측된 결실 영역에 존재하는 번역 활성의 결핍은 도 12에 나타낸 바와 같이 확인되었다. 도 12는 게놈 섬 결실 균주 및 각각의 게놈 섬 균주 (GEI1-GEI4)의 log2 형질전환된 RNA-시퀀싱 판독 범위를 나타내고, 예상된 게놈 섬 유전자좌에 대한 시퀀싱 판독의 부재는 게놈의 나머지 부분에 걸쳐 핵심 유전자의 발현에 미치는 영향을 최소화하면서, 표적 유전적 실체(target genetic entity)의 결핍을 추가적으로 제안한다.
도 13은 결실된 유전자에 대한 전사 활성의 결핍을 추가적으로 확인한다. 각각의 게놈 섬 결실 균주(GEI1-GEI4)에 대해, 각각의 표적 섬(흑색)에 코딩된 유전자의 발현은 최소였다. GEI1에서 코딩된 유전자는 왼쪽 상단 패널에, GEI2에서 코딩된 유전자는 오른쪽 상단 패널에, GEI3에서 코딩된 유전자는 왼쪽 하단 패널에, GEI4에서 코딩된 유전자는 오른쪽 하단 패널에 나타냈다. 일반적으로, 게놈 섬 결실 1 및 2는 다른 유전자(회색)의 전사에 대해 최소 영향을 갖는 반면, 게놈 섬 3 및 4는 섬 상에 코딩되지 않은 다른 유전자의 전사에 영향을 주는 것으로 보인다.
또한, RNA-시퀀싱 데이터를 결실된 섬 (GEI4) 상에 코딩되지 않은 유전자의 전사 수준의 비교에 사용하였다, 즉, 다른 유전자는 여전히 염색체에 존재하고, 게놈 결실과 연관된 표현형을 확인하였다. 결실 균주에서 구별되어 전사된 유전자는 세포 과정이 결핍된 유전자에 의해 영향을 받거나 이들 유전자의 활성의 결핍에 대한 보상이 있음을 제시한다. 따라서, 이러한 유전자 또는 게놈 영역이 관련된 경로에 대하여 추론할 수 있다. 표 5는 결실 균주 GEI4에서 확인된 구별되어 발현된 유전자의 목록을 제공한다. 구별되어 발현된 것으로 관찰된 많은 유전자는 방향족 아미노산 및 퓨린 생합성을 포함하는 Streptococcus thermophilus의 생합성 능력과 관계가 있다.
실시예 11. 타입 Ⅱ 크리스퍼 - 카스 시스템을 사용한 표적된 Lactobacillus casei 의 사멸
L. Casei의 표적된 사멸에 대한 예시적인 크리스퍼-카스 타입 Ⅱ 가이드를 도 16에 나타내었다. 상단 패널은 예측된 가이드를 제공하고, 왼쪽 하단 패널은 예시적인 이중 가이드 구조를 나타내고 오른쪽 하단 패널은 예시적 단일 가이드 구조를 나타낸다.
실시예 12. 타입 Ⅱ 크리스퍼 - 카스 시스템을 사용한 표적된 Lactobacillus gasseri 의 사멸
L. gasseri의 표적된 사멸에 대한 예시적인 타입 Ⅱ 가이드를 도 16에 나타내었다. 상단 패널은 예측된 가이드를 제공하고, 왼쪽 하단 패널은 올바른 이중 가이드 crRNA:tracrRNA (RNA 시퀀싱으로 확인됨)를 제공하고 오른쪽 하단 패널은 예시적 예측된 단일 가이드를 제공한다.
플라스미드를 각각 다른 구조물을 다음과 같이 운반하는 L. gasseri 로 형질전환하였다: 빈 pTRK563 벡터, 올바른 프로토스페이서를 갖지만 부정확한 PAM을 갖는 구조물. 결과를 도 19에 나타내었다. 올바른 프로토스페이서 및 올바른 PAM을 갖는 플라스미드는 유의적으로 더 많은 간섭 표적 및 세포 사멸을 나타내었다.
실시예 13. 타입 Ⅱ 크리스퍼 - 카스 시스템을 사용한 표적된 Lactobacillus pentosus 의 사멸
L. pentosus의 표적된 사멸에 대한 예시적인 타입 Ⅱ 가이드를 도 17에 나타내었다. 상단 패널은 예측된 가이드를 나타낸다. 왼쪽 하단 상의 패널은 올바른 이중 가이드 crRNA:tracrRNA (RNA 시퀀싱으로 확인됨)를 제공하고 오른쪽 하단 패널은 예시적 예측된 인공 단일 가이드를 제공한다.
플라스미드를 각각 다른 구조물을 다음과 같이 운반하는 L. pentosus로 형질전환하였다: 올바른 프로포트페이서를 갖지만 부정확한 PAM을 갖는 구조물, 올바른 PAM을 갖지만 어레이에 존재하지 않은 프로토스페이서를 갖는 구조물, 빈 pTRK563 벡터, 및 올바른 프로토스페이서 및 올바른 PAM. 결과를 도 20에 나타내었다. 올바른 프로토스페이서 및 올바른 PAM(Lpe1 gttaat)을 갖는 플라스미드는 유의적으로 더 많은 간섭 표적 및 세포 사멸을 나타내었다.
실시예 14. 타입 Ⅱ 크리스퍼 - 카스 시스템을 사용한 표적된 Lactobacillus jensenii 의 사멸
도 18은 예시적 크리스퍼-카스 타입 Ⅱ 가이드를 제공한다. 왼쪽의 패널은 RNA 시퀀싱에 의해 확인된 바와 같이 올바른 이중 crRNA:tracrRNA이고 오른쪽의 패널은 예시적 예측된 인공 단일 가이드이다.
플라스미드를 각각 다른 구조물을 다음과 같이 운반하는 L. jensenii로 형질전환 하였다: 빈 pTRK563 벡터를 포함하는 구조물, 올바른 프로토스페이서를 갖지만 부정확한 PAM을 갖는 구조물, 올바른 PAM을 갖지만 어레이에 존재하지 않는 프로토스페이서를 갖는 구조물, 올바른 PAM을 갖는 올바른 프로토스페이서를 갖는 구조물. 결과를 도 22에 나타내었다. 올바른 프로토스페이서 및 올바른 PAM을 갖는 플라스미드는 유의적으로 더 많은 간섭 표적 및 세포 사멸을 나타내었다.
실시예 15. 타입 Ⅰ 크리스퍼 - 카스 시스템을 사용한 표적된 Lactobacillus casei NCK 125의 사멸
도 21은 L. casei에 대한 예시적 타입 Ⅰ 크리스퍼-카스 가이드를 제공하고, 이는 천연 타입 Ⅰ 리더 및 L. casei NCK 125에서 발견된 반복 서열을 포함한다. 유기체에서 천연 스페이서 서열을 사용하여 M 5'-YAA-3'가 예측되었다. 인공 어레이는 숙주 게놈에 16s rDNA 유전자를 표적하는 스페이서를 함유한다. 결과를 도 22에 나타내었고, 이는 빈 벡터와 두 개의 상이한 인공 어레이(이중 하나는 16s 유전자(1-2 alt)에서 +가닥을 표적으로 하는 단일 스페이서를 함유하고 다른 하나는 +가닥을 표적으로 하는 원래 스페이서를 함유하지만 16s 유전자에서 -가닥을 표적으로 하는 추가적인 스페이서를 함유한다 ((1, 2-3)) 사이의 유의적인 감소를 나타낸다.
본원에 기술된 바와 같은 크리스퍼-카스 시스템은 예를 들어, (i) 의학적 개입(예를 들어, 곰팡이, 선충, 원생동물(예를 들어, 말라리아), 촌충류, 콕시듐류(작은포자충), 디스토마류, 오구동물, 구두충, 절지동물 등을 포함하지만 이에 제한되지 않음)의 경우에 병원체의 표적된 감소; (ⅱ) 소모품(식품 시스템, 동물, 작물)의 보호; (ⅲ) 산업 발효 공정으로부터 필요하지 않은 유기체(원료, 공정 장비, 시동기 배양)의 조절 및/또는 제거 및 (iv) 생태계 및/또는 화학적 사이클에 대한 영향을 주는 환경의 미생물 컨소시엄의 조절뿐만 아니라 예방을 위하여 사용될 수 있다.
표 1. 박테리아 균주 및 플라스미드
Figure 112017130757083-pct00001
표 2. 프라이머
Figure 112017130757083-pct00002
표 3. 추정 전이 가능한 게놈 섬(islands) 및 작은섬(islets)
Figure 112017130757083-pct00003
표 4. S. thermophilus에서 동정된 약 239개의 필수 ORF에 대한 동종체
Figure 112017130757083-pct00004
Figure 112017130757083-pct00005
Figure 112017130757083-pct00006
Figure 112017130757083-pct00007
Figure 112017130757083-pct00008
Figure 112017130757083-pct00009
Figure 112017130757083-pct00010
Figure 112017130757083-pct00011
Figure 112017130757083-pct00012
Figure 112017130757083-pct00013
Figure 112017130757083-pct00014
Figure 112017130757083-pct00015
Figure 112017130757083-pct00016
Figure 112017130757083-pct00017
Figure 112017130757083-pct00018
Figure 112017130757083-pct00019
표 5. 결실 균주 GEI4에서 동정된 구별되어 발현된 유전자들의 목록
Figure 112017130757083-pct00020
참고 문헌
1. Darmon E, Leach DF. (2014) Bacterial Genome Instability. Microbiol . Mol. Biol. Rev. 78, 1-39.
2. Labrie SJ, Samson JE, and Moineau S. (2010) Bacteriophage resistance mechanisms. Nat. Rev. Microbiol. 8, 317-327.
3. Barrangou R, Marraffini LA (2014) CRISPR-Cas systems: prokaryotes upgrade to adaptive immunity. Mol Cell 54(2):234-244.
4. Barrangou R, et al. (2007) CRISPR provides acquired resistance against viruses in prokaryotes. Science 315(5819):1709-1712.
5. Brouns SJJ, et al. (2008) Small CRISPR RNAs guide antiviral defense in prokaryotes. Science 321(5891):960-964.
6. Young JC et al. (2012) Phage-induced expression of CRISPR-associated proteins is revealed by shotgun proteomics in Streptococcus thermophilus. PLoS ONE 7(5):e38077.
7. Garneau JE, et al. (2010) The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA. Nature 468(7320):67-71.
8. Groenen PM, Bunschoten AE, Van Soolingen D, Van Embden JD (1993) Nature of DNA polymorphism in the direct repeat cluster of Mycobacterium tuberculosis; application for strain differentiation by a novel typing method. Mol Microbiol 10(5):1057-1065.
9. Yin S, et al. (2013) The evolutionary divergence of Shiga toxin-producing Escherichia coli is reflected in clustered regularly interspaced short palindromic repeat (CRISPR) spacer composition. Appl Environ Microbiol 79(18):5710-5720.
10. Liu F, et al. (2011) Novel virulence gene and clustered regularly interspaced short palindromic repeat (CRISPR) multilocus sequence typing scheme for subtyping of the major serovars of Salmonella enterica subsp. enterica. Appl Environ Microbiol 77(6):1946-1956.
11. Barrangou R, Horvath P (2012) CRISPR: new horizons in phage resistance and strain identification. Annu Rev Food Sci Technol 3, 143-162.
12. Sander JD, and Joung JK. (2014) CRISPR-Cas systems for editing, regulating and targeting genomes. Nat. Biotechnol. 32, 347-355.
13. Bikard D, et al. (2013) Programmable repression and activation of bacterial gene expression using an engineered CRISPR-Cas system. Nucleic Acids Res 41(15):7429-7437
14. Qi LS, et al. (2013) Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression. Cell 152(5):1173-1183.
15. Gomaa AA, et al. (2014) Programmable Removal of Bacterial Strains by Use of Genome-Targeting CRISPR-Cas Systems. mBio 5(1):e00928-13.
16. Ishino Y, Shinagawa H, Makino K, Amemura M, Nakata A (1987) Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product. J Bacteriol 169(12):5429-5433.
17. Jansen R, Embden JDA van, Gaastra W, Schouls LM (2002) Identification of genes that are associated with DNA repeats in prokaryotes. Mol Microbiol 43(6):1565-1575.
18. Bolotin A, et al. (2004) Complete sequence and comparative genome analysis of the dairy bacterium Streptococcus thermophilus. Nat Biotechnol 22(12):1554-1558.
19. Horvath P, et al. (2008) Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus. J Bacteriol 190(4):1401-1412.
20. Bolotin A, Quinguis B, Sorokin A, Ehrlich SD (2005) Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin. Microbiology 151(Pt 8):2551-2561.
21. Deveau H, et al. (2008) Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. J Bacteriol 190(4):1390-1400.
22. Paez-Espino D, et al. (2013) Strong bias in the bacterial CRISPR elements that confer immunity to phage. Nat Commun 4, 1430.
23. Sun CL, et al. (2013) Phage mutations in response to CRISPR diversification in a bacterial population. Environ Microbiol 15(2):463-470.
24. Sapranauskas R, et al. (2011) The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic Acids Res 39(21):9275-9282.
25. Gasiunas G, Barrangou R, Horvath P, Siksnys V (2012) Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc Natl Acad Sci USA 109(39):E2579-2586.
26. Briner AE, et al. (2014) Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality. Molecular Cell. 56(2):333-339
27. Bondy-Denomy J, Davidson AR. (2014) To acquire or resist: the complex biological effects of CRISPR-Cas systems. Trends Microbiol . 22, 218-225.
28. Horvath P, et al. (2009) Comparative analysis of CRISPR loci in lactic acid bacteria genomes. Int J Food Microbiol 131(1):62-70.
29. Jiang W, Bikard D, Cox D, Zhang F, Marraffini LA. (2013a) RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31(3):233-239.
30. Vercoe RB, et al. (2013) Cytotoxic chromosomal targeting by CRISPR/Cas systems can reshape bacterial genomes and expel or remodel pathogenicity islands. PLoS Genet 9(4):e1003454.
31. Oh JH, van Pijkeren JP. (2014) CRISPR-Cas9-assisted recombineering in Lactobacillus reuteri. Nucleic Acids Res 10.1093/nar/gku623
32. Selle K, Barrangou R. (2015) Harnessing CRISPR-Cas systems for bacterial genome editing. Trends Microbiol . In press
33. Kobayashi K, et al. (2003) Essential Bacillus subtilis genes. Proc . Natl. Acad . Sci . U.S.A. 100, 4678-4683.
34. Mahillon J, Chandler M. (1998) Insertion sequences. Microbiol Mol Biol Rev 62(3):725-774.
35. Goh YJ, Goin C, O'Flaherty S, Altermann E, Hutkins R (2011) Specialized adaptation of a lactic acid bacterium to the milk environment; the comparative genomics of Streptococcus thermophilus LMD-9. Microbial Cell Factories 10 (Suppl 1):S22
36. Dandoy D, et al. (2011) The fast milk acidifying phenotype of Streptococcus thermophilus can be acquired by natural transformation of the genomic island encoding the cell-envelope proteinase PrtS. Microb . Cell Fact. 10 Suppl 1, S21.
37. Deltcheva E, et al. (2011) CRISPR RNA maturation by trans-activating small RNA and host factor RNase III. Nature 471, 602-607.
38. Aravind L, Koonin EV (2001) Prokaryotic homologs of the eukaryotic DNA-end-binding protein Ku, novel domains in the Ku protein and prediction of a prokaryotic double-strand break repair system. Genome Res 11(8):1365-1374.
39. Koonin EV, Makarova KS (2007) Evolutionary genomics of lactic acid bacteria. J Bacteriol 189(4):1199-1208
40. Makarova KS, et al. (2006) Comparative genomics of the lactic acid bacteria. Proc Natl Acad Sci USA 103(42):15611-15616.
41. Goh YJ, et al. (2009) Development and application of a upp-based counterselective gene replacement system for the study of the S-layer protein SlpX of Lactobacillus acidophilus NCFM. Appl Environ Microbiol 75(10):3093-3105.
42. Horton RM, Hunt HD, Ho SN, Pullen JK, Pease LR (1989) Engineering hybrid genes without the use of restriction enzymes: gene splicing by overlap extension. Gene 77(1):61-68.
43. Mojica FJM, Diez-Villasenor C, Garcia-Martinez J, Almendros C (2009) Short motif sequences determine the targets of the prokaryotic CRISPR defence system. Microbiology 155(Pt 3):733-740.
44. Russell WM, Klaenhammer TR (2001) Efficient System for Directed Integration into the Lactobacillus acidophilus and Lactobacillus gasseri Chromosomes via Homologous Recombination. Appl Environ Microbiol 67(9):4361-4364.
45. Wei M-Q, et al. (1995) An improved method for the transformation of Lactobacillus strains using electroporation. Journal of Microbiological Methods 21(1):97-109.
46. Zhang X, Bremer H (1995) Control of the Escherichia coli rrnB p1 promoter strength by ppGpp. Journal of Biological Chemistry 270(19):11181-11189.
47. Law J, et al. (1995) A system to generate chromosomal mutations in Lactococcus lactis which allows fast analysis of targeted genes. J Bacteriol 177(24):7011-7018.
전술한 내용은 본 발명의 예시이며, 본 발명을 제한하는 것으로 해석되어서는 아니 된다. 본 발명은 다음의 청구 범위와 그에 포함되는 상기 청구 범위의 등가물에 의해 정의된다.

Claims (31)

  1. 박테리아 서브세트에서의 특이적 유전자 내용에 기초하여 박테리아 세포의 혼합 집단 내 특정 박테리아 서브세트를 선택적으로 사멸시키는 방법으로서,
    이종성 핵산 구조물을 박테리아 세포의 혼합 집단에 도입하는 단계로서:
    상기 이종성 핵산 구조물은 크리스퍼-카스 시스템을 포함하고, 상기 크리스퍼-카스 시스템은 타입 I 크리스퍼-카스 시스템 또는 타입 V 크리스퍼-카스 시스템이고,
    상기 타입 I 크리스퍼-카스 시스템은 (i) 적어도 하나의 타입 I 캐스케이드 폴리펩티드을 코딩하는 이종성 핵산 구조물, (ⅱ) Cas3, 또는 Cas3' 및 Cas3" 폴리펩티드, 또는 Cas3, 또는 Cas3' 및 Cas3" 폴리펩티드를 코딩하는 이종성 핵산 구조물; 및 (iii) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 타입 I 크리스퍼(CRISPR) 어레이로서, 상기 반복-스페이서-반복 서열 또는 상기 반복-스페이서 서열의 스페이서는 상기 혼합 집단의 다른 박테리아 세포와 구별되는 상기 특정 박테리아 서브세트의 보존적 유전자 서열 중의 표적 영역에 70% 이상 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 상기 크리스퍼-카스 시스템에 의해 인식되는 프로토스페이서-인접 모티프(PAM)서열에 인접하여 위치하는 적어도 10개의 연속적인 뉴클레오티드를 갖고,
    상기 타입 I 크리스퍼-카스 시스템의 (i)의 이종성 핵산 구조물 및 (ii)의 이종성 구조물은 상기 혼합 집단의 박테리아 세포의 게놈 내에 통합되지 않고,
    상기 타입 V 크리스퍼-카스 시스템은 (i) 적어도 하나의 Cpf1 폴리펩티드을 코딩하는 이종성 핵산 구조물, (ⅱ) Cas1, 또는 Cas2, 또는 Cas4 폴리펩티드, 및 (iii) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 타입 V 크리스퍼 어레이로서, 상기 반복-스페이서-반복 서열 또는 상기 반복-스페이서 서열의 스페이서는 상기 혼합 집단의 다른 박테리아 세포와 구별되는 상기 특정 박테리아 서브세트의 보존적 유전자 서열 중의 표적 영역에 70% 이상 상보적인 뉴클레오티드 서열을 포함하고, 상기 표적 영역은 상기 크리스퍼-카스 시스템에 의해 인식되는 프로토스페이서-인접 모티프(PAM)서열에 인접하여 위치하는 적어도 10개의 연속적인 뉴클레오티드를 갖고,
    상기 타입 V 크리스퍼-카스 시스템의 (i)의 이종성 핵산 구조물 및 (ii)의 이종성 구조물은 상기 혼합 집단의 박테리아 세포의 게놈 내에 통합되지 않고,
    그리하여, 상기 표적 영역을 포함하는 특정 박테리아 서브세트를 선택적으로 사멸시키는 것인 단계를 포함하는 것인, 방법.
  2. 청구항 1에 있어서, 상기 혼합 집단 중의 적어도 하나의 박테리아 세포는 표적 영역을 포함하지 안고, 그리하여 적어도 하나의 박테리아 세포는 크리스퍼-카스 시스템의 도입 시 사멸되지 않는 것인 방법.
  3. 청구항 1에 있어서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 스페이서는 상기 표적 영역에 대해 100% 상보적인 뉴클레이오티드 서열을 포함하는 것인 방법.
  4. 청구항 1에 있어서, 상기 타입 I 크리스퍼 어레이의 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열은 야생형 타입 I 크리스퍼 어레이 유래의 반복과 동일한 반복을 포함하고,
    상기 타입 V 크리스퍼 어레이의 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열은 야생형 타입 V 크리스퍼 어레이 유래의 반복과 동일한 반복을 포함하는 것인, 방법.
  5. 청구항 1에 있어서, 상기 표적 영역은 필수 유전자 내에 존재하는 것인 방법.
  6. 청구항 1에 있어서, 상기 표적 영역은 비필수 유전자 내에 존재하는 것인 방법.
  7. 청구항 1에 있어서, 상기 표적 영역은 유전자, 개방형 해독 틀, 추정 개방형 해독 틀, 또는 유전자 간 영역으로부터 선택되는 것인 방법.
  8. 박테리아 세포 집단 중에 하나 이상의 박테리아 세포의 게놈에 존재하는 보존된 표적 영역을 게놈 중에 포함하지 않는 하나 이상의 분리주(isoalte)를 박테리아 세포 집단 중에서 선택하는 방법으로서,
    이종성 핵산 구조물을 박테리아 세포의 혼합 집단에 도입하는 단계로서:
    상기 이종성 핵산 구조물은 크리스퍼-카스 시스템을 포함하고, 상기 크리스퍼-카스 시스템은 타입 I 크리스퍼-카스 시스템 또는 타입 V 크리스퍼-카스 시스템이고,
    상기 타입 I 크리스퍼-카스 시스템은 (i) 적어도 하나의 타입 I 캐스케이드 폴리펩티드을 코딩하는 이종성 핵산 구조물, (ⅱ) Cas3, 또는 Cas3' 및 Cas3" 폴리펩티드, 또는 Cas3, 또는 Cas3' 및 Cas3" 폴리펩티드를 코딩하는 이종성 핵산 구조물; 및 (iii) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 타입 I 크리스퍼(CRISPR) 어레이로서, 상기 반복-스페이서-반복 서열 또는 상기 반복-스페이서 서열의 스페이서는 상기 집단의 하나 이상의 박테리아 세포의 게놈에 존재하는 보존적 표적 영역에 70% 이상 상보적인 뉴클레오티드 서열을 포함하고,
    상기 타입 I 크리스퍼-카스 시스템의 (i)의 이종성 핵산 구조물 및 (ii)의 이종성 구조물은 상기 집단의 박테리아 세포의 게놈 내에 통합되지 않고,
    상기 타입 V 크리스퍼-카스 시스템은 (i) 적어도 하나의 Cpf1 폴리펩티드을 코딩하는 이종성 핵산 구조물, (ⅱ) Cas1, 또는 Cas2, 또는 Cas4 폴리펩티드, 및 (iii) (5’에서 3’) 반복-스페이서-반복 서열 또는 적어도 하나의 반복-스페이서 서열을 포함하는 타입 V 크리스퍼 어레이로서, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열의 스페이서는 상기 집단의 하나 이상의 박테리아 세포의 게놈에 존재하는 보존적 표적 영역에 70% 이상 상보적인 뉴클레오티드 서열을 포함하고, 상기 보존적 표적 영역을 포함하는 세포는 사멸되고,
    상기 타입 V 크리스퍼-카스 시스템의 (i)의 이종성 핵산 구조물 및 (ii)의 이종성 구조물은 상기 집단의 박테리아 세포의 게놈 내에 통합되지 않는 것인, 단계; 및
    상기 박테리아 세포의 집단으로부터 게놈에 상기 보존적 표적 영역이 없는 적어도 하나의 분리주를 선택하는 단계를 포함하는 것인 방법.
  9. 청구항 8에 있어서, 상기 게놈 중에 상기 보존적 표적 영역이 없는 적어도 하나의 분리주의 개별적인 박테리아 콜로니를 증식시키는 단계를 추가로 포함하는 것인 방법.
  10. 청구항 8에 있어서, 상기 타입 I 크리스퍼 어레이의 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열은 야생형 타입 I 크리스퍼 어레이 유래의 반복과 동일한 반복을 포함하고, 상기 타입 V 크리스퍼 어레이의 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열은 야생형 타입 V 크리스퍼 어레이 유래의 반복과 동일한 반복을 포함하는 것인 방법.
  11. 청구항 8에 있어서, 상기 크리스퍼 어레이는 타입 I 크리스퍼 어레이이고, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열은 야생형 타입 I 크리스퍼 어레이 유래의 반복과 동일한 반복을 포함하고,
    상기 크리스퍼-카스 시스템은 (i) 적어도 하나의 타입 I 캐스케이드 폴리펩티드를 코딩하는 이종성 핵산 구조물, 및 (ⅱ) Cas3, 또는 Cas3' 및 Cas3" 폴리펩티드, 또는 Cas3, 또는 Cas3' 및 Cas3" 폴리펩티드를 코딩하는 이종성 핵산 구조물을 포함하는 것인 방법.
  12. 청구항 8에 있어서, 상기 크리스퍼 어레이는 타입 V 크리스퍼 어레이이고, 상기 반복-스페이서-반복 서열 또는 상기 적어도 하나의 반복-스페이서 서열은 야생형 타입 V 크리스퍼 어레이 유래의 반복과 동일한 반복을 포함하고,
    상기 크리스퍼-Cas 시스템은 (i) 적어도 하나의 Cpf1 폴리펩티드를 코딩하는 이종성 핵산 구조물, 및 (ⅱ) Cas1, 또는 Cas2, 또는 Cas4 폴리펩티드를 포함하는 것인 방법.
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
KR1020177037797A 2015-05-29 2016-05-27 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법 KR102451796B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020227034331A KR20220139447A (ko) 2015-05-29 2016-05-27 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562168355P 2015-05-29 2015-05-29
US62/168,355 2015-05-29
US201662296853P 2016-02-18 2016-02-18
US62/296,853 2016-02-18
PCT/US2016/034812 WO2016196361A1 (en) 2015-05-29 2016-05-27 Methods for screening bacteria, archaea, algae, and yeast using crispr nucleic acids

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020227034331A Division KR20220139447A (ko) 2015-05-29 2016-05-27 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법

Publications (2)

Publication Number Publication Date
KR20180010272A KR20180010272A (ko) 2018-01-30
KR102451796B1 true KR102451796B1 (ko) 2022-10-06

Family

ID=57396918

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020177037797A KR102451796B1 (ko) 2015-05-29 2016-05-27 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법
KR1020227034331A KR20220139447A (ko) 2015-05-29 2016-05-27 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020227034331A KR20220139447A (ko) 2015-05-29 2016-05-27 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법

Country Status (10)

Country Link
US (3) US10136649B2 (ko)
EP (2) EP3303607A4 (ko)
JP (3) JP2018516563A (ko)
KR (2) KR102451796B1 (ko)
CN (1) CN108026536A (ko)
AU (2) AU2016270649B2 (ko)
CA (1) CA2983023A1 (ko)
EA (1) EA201792663A1 (ko)
HK (1) HK1253712A1 (ko)
WO (1) WO2016196361A1 (ko)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US10584358B2 (en) 2013-10-30 2020-03-10 North Carolina State University Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
US10787654B2 (en) 2014-01-24 2020-09-29 North Carolina State University Methods and compositions for sequence guiding Cas9 targeting
WO2015155686A2 (en) 2014-04-08 2015-10-15 North Carolina State University Methods and compositions for rna-directed repression of transcription using crispr-associated genes
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
EP3186375A4 (en) 2014-08-28 2019-03-13 North Carolina State University NEW CAS9 PROTEINS AND GUIDING ELEMENTS FOR DNA TARGETING AND THE GENOME EDITION
PL3291679T3 (pl) 2015-05-06 2022-04-25 Snipr Technologies Limited Zmiana populacji drobnoustrojowych i modyfikowanie mikrobioty
KR102451796B1 (ko) 2015-05-29 2022-10-06 노쓰 캐롤라이나 스테이트 유니버시티 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법
KR20220158846A (ko) * 2015-06-15 2022-12-01 노쓰 캐롤라이나 스테이트 유니버시티 핵산 및 rna-기반 항미생물제를 효율적으로 전달하기 위한 방법 및 조성물
US11286480B2 (en) * 2015-09-28 2022-03-29 North Carolina State University Methods and compositions for sequence specific antimicrobials
EP3365357B1 (en) 2015-10-23 2024-02-14 President and Fellows of Harvard College Evolved cas9 proteins for gene editing
WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
GB201609811D0 (en) 2016-06-05 2016-07-20 Snipr Technologies Ltd Methods, cells, systems, arrays, RNA and kits
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
IL306092A (en) 2017-03-23 2023-11-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
EP3630975A4 (en) * 2017-05-26 2021-03-10 North Carolina State University CHANGED GUIDE RNAS FOR MODULATING CAS9 ACTIVITY AND USAGE PROCEDURES
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CN107904208B (zh) * 2017-12-25 2019-11-01 云舟生物科技(广州)有限公司 细胞表型研究用的细胞克隆及其筛选方法和应用
BR112020019418A2 (pt) 2018-03-25 2021-02-17 Snipr Biome Aps. tratamento e prevenção de infecções microbianas
US10760075B2 (en) 2018-04-30 2020-09-01 Snipr Biome Aps Treating and preventing microbial infections
US10227576B1 (en) 2018-06-13 2019-03-12 Caribou Biosciences, Inc. Engineered cascade components and cascade complexes
KR102142474B1 (ko) * 2019-04-08 2020-08-07 한국식품연구원 Lactobacillus acidophilus YT1 균주 판별용 조성물 및 이를 이용한 판별방법
KR102142473B1 (ko) * 2019-04-08 2020-08-07 한국식품연구원 락토바실러스 속 중에서 특정 종을 특이적으로 판별하기 위한 프라이머 조성물 및 이를 이용한 판별방법
US10711267B2 (en) 2018-10-01 2020-07-14 North Carolina State University Recombinant type I CRISPR-Cas system
US11851663B2 (en) 2018-10-14 2023-12-26 Snipr Biome Aps Single-vector type I vectors
JP2022524037A (ja) * 2019-03-07 2022-04-27 ザ トラスティーズ オブ コロンビア ユニバーシティー イン ザ シティー オブ ニューヨーク Tn7様トランスポゾンを用いたRNA誘導DNA組込み
JP2022526908A (ja) 2019-03-19 2022-05-27 ザ ブロード インスティテュート,インコーポレーテッド 編集ヌクレオチド配列を編集するための方法および組成物
WO2020245785A2 (en) * 2019-06-06 2020-12-10 Tata Consultancy Services Limited Method and system for identification of candidate target sites for combating pathogens
US20220310204A1 (en) * 2019-06-06 2022-09-29 Tata Consultancy Services Limited Method and system for identification of candidate target sites for combating pathogens
CN110791578B (zh) * 2019-11-28 2022-12-16 广州微远医疗器械有限公司 用于百日咳博德特氏杆菌的crispr检测引物组及其用途
WO2021173734A1 (en) * 2020-02-24 2021-09-02 The Broad Institute, Inc. Novel type iv and type i crispr-cas systems and methods of use thereof
WO2021195594A1 (en) * 2020-03-26 2021-09-30 San Diego State University (SDSU) Foundation, dba San Diego State University Research Foundation Compositions and methods for treating or ameliorating infections
US20230218684A1 (en) * 2020-03-30 2023-07-13 North Carolina State University Engineered bacteria for use in vaccine compositions
AU2021267940A1 (en) 2020-05-08 2022-12-08 President And Fellows Of Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
GB202007943D0 (en) 2020-05-27 2020-07-08 Snipr Biome Aps Products & methods
CN112080571B (zh) * 2020-09-22 2022-11-11 扬州大学 基于CRISPR-Cas12b系统的空肠弯曲菌检测试剂盒和方法
CN112646902A (zh) * 2020-12-24 2021-04-13 山西大学 一种古菌快速检测的试剂盒及方法
CA3209014A1 (en) * 2021-02-19 2022-08-25 Nuclear Rna Networks, Inc. Compositions and methods for modulating gene transcription networks based on shared high identity transposable element remnant sequences and nonprocessive promoter and promoter-proximal transcript

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
EP2860267A1 (en) 2007-03-02 2015-04-15 Dupont Nutrition Biosciences ApS Cultures with improved phage resistance

Family Cites Families (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4723202A (en) 1987-04-02 1988-02-02 The Garrett Corporation Converter-fed AC machine without damper winding
US7919277B2 (en) 2004-04-28 2011-04-05 Danisco A/S Detection and typing of bacterial strains
AU2006236392B2 (en) 2005-04-15 2011-07-21 Del Monte Fresh Produce Company Plant promoters, terminators, genes, vectors and related transformed plants
MX337838B (es) 2008-11-07 2016-03-22 Dupont Nutrition Biosci Aps Secuencias de repetidos palindromicos cortos regularmente intercalados agrupados de bifidobacterias.
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
EP2630156B1 (en) 2010-10-20 2018-08-22 DuPont Nutrition Biosciences ApS Lactococcus crispr-cas sequences
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
LT3401400T (lt) 2012-05-25 2019-06-10 The Regents Of The University Of California Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui
CN104540382A (zh) 2012-06-12 2015-04-22 弗·哈夫曼-拉罗切有限公司 用于产生条件性敲除等位基因的方法和组合物
US9688971B2 (en) 2012-06-15 2017-06-27 The Regents Of The University Of California Endoribonuclease and methods of use thereof
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
DE202013012597U1 (de) 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
US20150315576A1 (en) * 2012-11-01 2015-11-05 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
EP3138911B1 (en) 2012-12-06 2018-12-05 Sigma Aldrich Co. LLC Crispr-based genome modification and regulation
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
EP4234696A3 (en) * 2012-12-12 2023-09-06 The Broad Institute Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
ES2576128T3 (es) 2012-12-12 2016-07-05 The Broad Institute, Inc. Modificación por tecnología genética y optimización de sistemas, métodos y composiciones para la manipulación de secuencias con dominios funcionales
CA3081054A1 (en) 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
LT2943579T (lt) 2013-01-10 2018-11-12 Dharmacon, Inc. Molekulių bibliotekos ir molekulių generavimo būdai
AU2014207618A1 (en) 2013-01-16 2015-08-06 Emory University Cas9-nucleic acid complexes and uses related thereto
US10660943B2 (en) 2013-02-07 2020-05-26 The Rockefeller University Sequence specific antimicrobials
KR101780885B1 (ko) 2013-03-14 2017-10-11 카리부 바이오사이언시스 인코포레이티드 핵산-표적화 핵산의 조성물 및 방법
CA2906553C (en) 2013-03-15 2022-08-02 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
MX2015011985A (es) 2013-03-15 2016-04-07 Univ Minnesota Ingenieria genomica de plantas utilizando sistemas crispr/cas.
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
US9890393B2 (en) 2013-05-29 2018-02-13 Cellectis Methods for engineering T cells for immunotherapy by using RNA-guided CAS nuclease system
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
EP3004349B1 (en) 2013-05-29 2018-03-28 Cellectis S.A. A method for producing precise dna cleavage using cas9 nickase activity
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
EP3008181B1 (en) 2013-06-11 2019-11-06 The Regents of The University of California Methods and compositions for target dna modification
ES2777217T3 (es) 2013-06-17 2020-08-04 Broad Inst Inc Suministro, modificación y optimización de sistemas de guía en tándem, métodos y composiciones para la manipulación de secuencias
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
CA3109801C (en) 2013-08-22 2024-01-09 Andrew Cigan Plant genome modification using guide rna/cas endonuclease systems and methods of use
WO2015034872A2 (en) 2013-09-05 2015-03-12 Massachusetts Institute Of Technology Tuning microbial populations with programmable nucleases
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
ES2844174T3 (es) 2013-09-18 2021-07-21 Kymab Ltd Métodos, células y organismos
US20150098954A1 (en) 2013-10-08 2015-04-09 Elwha Llc Compositions and Methods Related to CRISPR Targeting
US10584358B2 (en) 2013-10-30 2020-03-10 North Carolina State University Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri
WO2015070193A1 (en) 2013-11-11 2015-05-14 Liu Oliver Compositions and methods for targeted gene disruption in prokaryotes
EP3071695A2 (en) 2013-11-18 2016-09-28 Crispr Therapeutics AG Crispr-cas system materials and methods
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
WO2015089486A2 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
US9994831B2 (en) 2013-12-12 2018-06-12 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
US10787654B2 (en) 2014-01-24 2020-09-29 North Carolina State University Methods and compositions for sequence guiding Cas9 targeting
CA2936646C (en) 2014-01-24 2024-04-30 North Carolina State University Methods and compositions for sequences guiding cas9 targeting
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
CA2938669A1 (en) 2014-02-04 2015-08-13 Igenomx International Genomics Corporation Genome fractioning
EP3126498A4 (en) 2014-03-20 2017-08-23 Université Laval Crispr-based methods and products for increasing frataxin levels and uses thereof
DK3122870T3 (da) 2014-03-25 2022-09-12 Ginkgo Bioworks Inc Fremgangsmåder og genetiske systemer til celleteknik
WO2015153791A1 (en) 2014-04-01 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2)
WO2015153889A2 (en) 2014-04-02 2015-10-08 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
EP3126503A1 (en) 2014-04-03 2017-02-08 Massachusetts Institute Of Technology Methods and compositions for the production of guide rna
WO2015155686A2 (en) 2014-04-08 2015-10-15 North Carolina State University Methods and compositions for rna-directed repression of transcription using crispr-associated genes
SG11201608503UA (en) 2014-04-14 2016-11-29 Maxcyte Inc Methods and compositions for modifying genomic dna
CN106536739B (zh) 2014-04-14 2021-08-03 内梅西斯生物有限公司 治疗剂
GB201406970D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Targeted mutations
GB201406968D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Deletion mutants
US11584936B2 (en) 2014-06-12 2023-02-21 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using CRISPR /Cas9
WO2015200555A2 (en) 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
GB2542087B (en) * 2014-07-30 2019-03-27 Tyco Fire & Security Gmbh Method and system for passive tracking of moving objects
EP3186375A4 (en) 2014-08-28 2019-03-13 North Carolina State University NEW CAS9 PROTEINS AND GUIDING ELEMENTS FOR DNA TARGETING AND THE GENOME EDITION
CN107208070B (zh) * 2014-11-26 2021-09-07 技术创新动力基金(以色列)有限合伙公司 细菌基因的靶向消除
US20180200387A1 (en) 2015-02-23 2018-07-19 Crispr Therapeutics Ag Materials and methods for treatment of human genetic diseases including hemoglobinopathies
PL3291679T3 (pl) 2015-05-06 2022-04-25 Snipr Technologies Limited Zmiana populacji drobnoustrojowych i modyfikowanie mikrobioty
KR102451796B1 (ko) 2015-05-29 2022-10-06 노쓰 캐롤라이나 스테이트 유니버시티 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법
KR20220158846A (ko) 2015-06-15 2022-12-01 노쓰 캐롤라이나 스테이트 유니버시티 핵산 및 rna-기반 항미생물제를 효율적으로 전달하기 위한 방법 및 조성물
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
WO2017053713A1 (en) 2015-09-25 2017-03-30 Tarveda Therapeutics, Inc. Compositions and methods for genome editing
US11286480B2 (en) 2015-09-28 2022-03-29 North Carolina State University Methods and compositions for sequence specific antimicrobials
US11970710B2 (en) 2015-10-13 2024-04-30 Duke University Genome engineering with Type I CRISPR systems in eukaryotic cells
WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
US11504404B2 (en) 2016-02-24 2022-11-22 Crown Laboratories, Inc. Skin probiotic formulation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2860267A1 (en) 2007-03-02 2015-04-15 Dupont Nutrition Biosciences ApS Cultures with improved phage resistance
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Genome Biology, 2014
mBio, 2014, Vol.5, No.1, pp.1-9 1부.*

Also Published As

Publication number Publication date
JP2018516563A (ja) 2018-06-28
CA2983023A1 (en) 2016-12-08
US20160345578A1 (en) 2016-12-01
US11261451B2 (en) 2022-03-01
EP3303607A1 (en) 2018-04-11
AU2016270649A1 (en) 2018-01-04
US20190021343A1 (en) 2019-01-24
JP2023126899A (ja) 2023-09-12
KR20220139447A (ko) 2022-10-14
EP4039816A1 (en) 2022-08-10
AU2022204596A1 (en) 2022-07-21
WO2016196361A1 (en) 2016-12-08
US10136649B2 (en) 2018-11-27
KR20180010272A (ko) 2018-01-30
EA201792663A1 (ru) 2018-04-30
CN108026536A (zh) 2018-05-11
US20220228154A1 (en) 2022-07-21
HK1253712A1 (zh) 2019-06-28
AU2016270649B2 (en) 2022-04-21
JP2022031673A (ja) 2022-02-22
EP3303607A4 (en) 2018-10-10

Similar Documents

Publication Publication Date Title
KR102451796B1 (ko) 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법
Estibariz et al. The core genome m5C methyltransferase JHP1050 (M. Hpy99III) plays an important role in orchestrating gene expression in Helicobacter pylori
AU2016280002B2 (en) Methods and compositions for efficient delivery of nucleic acids and RNA-based antimicrobials
Darmon et al. Bacterial genome instability
Humbert et al. Characterization of Helicobacter pylori factors that control transformation frequency and integration length during inter‐strain DNA recombination
WO2016205623A1 (en) Methods and compositions for genome editing in bacteria using crispr-cas9 systems
Dulermo et al. Identification of new genes contributing to the extreme radioresistance of Deinococcus radiodurans using a Tn5-based transposon mutant library
Zhang et al. A broadly applicable gene knockout system for the thermoacidophilic archaeon Sulfolobus islandicus based on simvastatin selection
Szuplewska et al. Mobility and generation of mosaic non-autonomous transposons by Tn 3-derived inverted-repeat miniature elements (TIMEs)
Steyert et al. Development of a novel genetic system to create markerless deletion mutants of Bdellovibrio bacteriovorus
Rajagopalan et al. devI is an evolutionarily young negative regulator of Myxococcus xanthus development
Sangal et al. Corynephages: infections of the infectors
Geddes et al. A locus necessary for the transport and catabolism of erythritol in Sinorhizobium meliloti
Wang et al. Premethylation of foreign DNA improves integrative transformation efficiency in Synechocystis sp. strain PCC 6803
Dai et al. DNA phosphorothioate modification plays a role in peroxides resistance in Streptomyces lividans
Fallico et al. Plasmids of raw milk cheese isolate Lactococcus lactis subsp. lactis biovar diacetylactis DPC3901 suggest a plant-based origin for the strain
Suzuki et al. Plasmid artificial modification: a novel method for efficient DNA transfer into bacteria
Dorrazehi et al. Building scarless gene libraries in the chromosome of bacteria
Kwong et al. Characterization of the endogenous plasmid from Pseudomonas alcaligenes NCIB 9867: DNA sequence and mechanism of transfer
Petrovski et al. Embedded elements in the IncPβ plasmids R772 and R906 can be mobilized and can serve as a source of diverse and novel elements
Gifford et al. Stable genetic transformation and heterologous expression in the nitrogen-fixing plant endosymbiont Frankia alni ACN14a
EA042506B1 (ru) Способы скрининга бактерий, архей, водорослей и дрожжей с использованием нуклеиновых кислот crispr
van der Meulen RNA regulation in Lactococcus lactis
Petassi Dual Pathway Transposition with Tn7-Like Elements: Safe Sites, Mobile Plasmids, and CRISPR-Cas
Verdú et al. Deletion of the primase-polymerases encoding gene, located in a mobile element in Thermus thermophilus HB27, leads to loss of function mutation of addAB genes

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right