KR20160128306A - 돌연변이유발 방법 - Google Patents

돌연변이유발 방법 Download PDF

Info

Publication number
KR20160128306A
KR20160128306A KR1020167021908A KR20167021908A KR20160128306A KR 20160128306 A KR20160128306 A KR 20160128306A KR 1020167021908 A KR1020167021908 A KR 1020167021908A KR 20167021908 A KR20167021908 A KR 20167021908A KR 20160128306 A KR20160128306 A KR 20160128306A
Authority
KR
South Korea
Prior art keywords
rna
nuclease
nucleic acid
sequence
dna
Prior art date
Application number
KR1020167021908A
Other languages
English (en)
Inventor
티안 쑤
조나단 엠. 로스버그
Original Assignee
램 테라퓨틱스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 램 테라퓨틱스, 인코포레이티드 filed Critical 램 테라퓨틱스, 인코포레이티드
Publication of KR20160128306A publication Critical patent/KR20160128306A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity

Abstract

일부 실시양태에서, 본 개시내용의 양태는 세포 내의 게놈 좌위의 하나 이상의 대립유전자를 변형하는 (예를 들어, 돌연변이시키는) 데에 유용한 방법 및 조성물을 제공한다. 일부 실시양태에서, 본원에 기술된 방법 및 조성물은 뉴클레아제 상호작용성 RNA 절편으로 스플라이싱된 전사된 엑손을 포함하는 키메라 스플라이싱된 RNA 분자를 제조하는 것에 관여한다. 일부 실시양태에서, 키메라 스플라이싱된 RNA는 DNA 변형 효소 (예를 들어, 뉴클레아제)를 세포 내 게놈 좌위로 가이드하여 좌위의 변형을 일으킨다.

Description

돌연변이유발 방법 {MUTAGENESIS METHODS}
<관련 출원>
본 출원은 2014년 1월 14일에 출원된 미국 가특허 출원 61/927,458에 대해 35 U.S.C. §119 하에 우선권을 주장하며, 그의 전문은 본원에 참조로서 포함된다.
RNA-가이드된 뉴클레아제 (예를 들어, Cas9)는 부위-특이적 가이드 RNA를 사용하여 특정 관심 게놈 표적 부위를 표적화할 수 있다. 부위-특이적 가이드 RNA는 i) 관심 게놈 표적 부위의 한 가닥에 상보적인 표적 절편 및 ii) RNA-가이드된 뉴클레아제와 상호작용하는 뉴클레아제 상호작용성 절편을 모두 포함하도록 설계될 수 있다. 사용 시, 가이드 RNA의 표적 절편은 표적 게놈 부위에서 상보적 서열에 결합하며, 가이드 RNA의 뉴클레아제 상호작용성 절편은 RNA-가이드된 뉴클레아제를 게놈 표적 부위에 동원해 그 부위에 표적화된 핵산 절단 (예를 들어, 이중-가닥 절단)을 가져온다. 많은 세포에서, 게놈 부위의 절단은 절단 부위에 돌연변이를 도입할 수 있는 세포내 복구 기작을 통해 복구된다. 따라서, RNA-가이드된 뉴클레아제는 알려진 관심 부위에 게놈 돌연변이를 도입하는 데에 사용될 수 있다.
게놈 돌연변이를 생성하기 위해 RNA-가이드된 뉴클레아제를 사용하는 현재 시스템은 표적 부위가 설계에 의해 식별되어 가이드 RNA로 혼입되어야 한다는 요건으로 제한된다. 반대로, 본원에 기술된 시스템은 각 게놈 부위에 대한 특이적 합성 가이드 RNA 또는 특이적 합성 가이드 RNA를 코딩하는 DNA 구축물의 설계 없이 임의의 발현된 게놈 부위로 돌연변이를 도입하는 데에 유용하다. 오히려, 본원에 기술된 시스템은 뉴클레아제를 게놈 좌위로 표적화할 수 있는 키메라 스플라이싱된 RNA를 생산하도록 게놈 좌위로부터 전사되는 엑손 (엑손으로부터의 하류)에 스플라이싱될 수 있는 구성의 뉴클레아제 상호작용성 절편을 제공한다. 일부 실시양태에서, 스플라이스 수용자 부위로부터 하류의 뉴클레아제 상호작용성 RNA 절편을 코딩하는 삽입성 핵산 구축물은 유전자 (예를 들어, 유전자의 인트론)에 통합된다. 그 결과, 전사된 RNA의 스플라이싱이 뒤따르는 유전자의 전사는, 뉴클레아제 상호작용성 RNA 절편으로 스플라이싱된 유전자의 하나 이상의 엑손을 포함하는 키메라 스플라이싱된 RNA를 생산한다. 이 키메라 스플라이싱된 RNA는 i) (키메라 스플라이싱된 RNA의 하나 이상의 엑손 및 게놈 좌위의 대응하는 상보적 가닥 간의 염기 쌍형성(base pairing)을 통해) 대응하는 게놈 좌위의 하나 이상의 대립유전자를 표적화할 수 있고 ii) (키메라 스플라이싱된 RNA의 뉴클레아제 상호작용성 절편과의 상호작용을 통해) RNA-가이드된 뉴클레아제를 하나 이상의 대립유전자에 동원할 수 있으며, 이로써 게놈 좌위의 하나 이상의 대립유전자에서의 뉴클레아제-기반 절단을 촉진한다. 일부 실시양태에서, RNA-가이드된 뉴클레아제는 키메라 스플라이싱된 RNA 분자에 의해 표적화된 엑손의 3' 말단 또는 이와 근접한 게놈 좌위를 절단한다 (RNA-가이드된 뉴클레아제는 키메라 스플라이싱된 RNA 분자의 표적 부분과 함께 상보적 염기 쌍형성을 통해 엑손에 결합하는 키메라 스플라이싱된 RNA 분자에 의해 그 위치로 가이드 된다). 키메라 스플라이싱된 RNA 분자가 세포의 게놈 좌위의 각 대립유전자 (예를 들어, 2배체 세포의 두 대립유전자) 상의 대응하는 엑손에 결합할 수 있음이 이해되어야 한다. 따라서, 발현된 게놈 좌위의 각 대립유전자를 RNA-가이드된 뉴클레아제에 의해 동일한 위치에서 표적화 할 수 있으며, 그 결과, 돌연변이를 발현된 게놈 좌위의 각 대립유전자의 동일한 위치에 도입할 수 있다. 따라서, 둘 이상의 대립유전자 (예를 들어, 다배체 세포의 3, 4, 5, 6, 이상의 대립유전자)가 본원에 기술된 바와 같이 돌연변이 될 수 있음이 이해되어야 한다.
일부 실시양태에서, 본원에 기술된 조성물 및 방법은 복수의 발현된 유전자 좌위의 두 대립유전자에 돌연변이를 생성하는 데에 사용할 수 있으며, 각 좌위는 스플라이스 공여자 부위를 갖는 전사체를 생산하고, 발현은 RNA 스플라이싱이 가능한 숙주 세포 내에서 발생한다. 예를 들어, 본원에 기술된 조성물 및 방법은 진핵인 숙주 세포에서 유용하다. 일부 실시양태에서, 숙주 세포는 시험관 (in vitro)이다. 일부 실시양태에서, 숙주 세포는 생체 (in vivo)이다. 일부 실시양태에서, 숙주 세포는 유기체, 예를 들어, 생쥐, 비-인간 영장류 또는 인간과 같은 포유류의 세포이다. 진핵 숙주 세포의 비-제한적인 예는 포유동물, 조류, 곤충, 효모, 식물 및 다른 진핵 숙주 세포를 포함한다. 일부 실시양태에서, 숙주 세포는 인간 숙주 세포이다. 숙주세포의 비-제한적인 예는, 제한 없이, 줄기 세포, 상피 세포, 내피 세포, 을 포함한다. 일부 실시양태에서, 숙주 세포는 인간 줄기 세포이다.
본원에 기술된 조성물 및 방법을 각 복수의 상이한 발현된 게놈 좌위에 돌연변이를 갖는 숙주 세포의 라이브러리를 생성하는 데에 사용할 수 있다. 라이브러리를, 본 개시내용의 삽입성 핵산 구축물을 숙주 세포에 전달 (예를 들어, 형질감염(transfection))하고, 이후 하나 이상의 핵산 구축물이 삽입된 DNA를 함유하는 세포를 단리함으로써 생산할 수 있다. 형질감염 과정 동안 세포와 혼합되는 삽입성 핵산 구축물의 비를 조정함으로써 상이한 수의 돌연변이를 갖는 숙주 세포를 생산할 수 있다. 일부 실시양태에서, 라이브러리의 각 돌연변이체 세포는 평균적으로, 2배체 세포의 하나 또는 두 대립유전자 (또는 더 높은 배수성, 예를 들어, 3n, 4n, 5n, 6n, 7n, 8n, 등의 배수성을 갖는 세포의 다수의 대립유전자)에서의 오직 한 게놈 좌위에 돌연변이를 갖는다. 2배체 세포의 두 대립유전자가 DNA 단절(break) 복구를 겪을 경우, 각 대립유전자에 도입된 돌연변이는 상이할 수 있음이 이해되어야 한다. 그러나, 일부 실시양태에서, 2 배체 세포의 라이브러리의 각 돌연변이체 세포는 평균적으로, 하나 또는 두 대립유전자에서의 둘 이상의 상이한 게놈 좌위에 돌연변이를 갖는다. 일부 실시양태에서, 2배체 세포의 라이브러리의 각 돌연변이체 세포는 평균적으로, 단일 게놈 좌위의 두 대립유전자에 돌연변이를 갖는다. 상이한 돌연변이가 주어진 게놈 좌위에서 생산될 수 있으며 라이브러리의 상이한 숙주 세포에 존재할 수 있음이 또한 이해되어야 한다. 예를 들어, 본원에 기술된 삽입성 구축물은 발현된 게놈 좌위의 상이한 위치 (예를 들어, 인트론)로 통합될 수 있고 결과적으로 게놈 좌위의 상이한 엑손 (예를 들어, 각 상이한 엑손의 3' 말단)에 돌연변이를 생성할 수 있다. 일부 실시양태에서, 각각 상이한 통합 부위를 갖는 많은 상이한 세포를 갖는 라이브러리를 생산한다. 일부 실시양태에서, 103 이하, 102 내지 104, 102 내지 105, 102 내지 106, 102 내지 107, 102 내지 109, 103 내지 106, 103 내지 107, 104 내지 106, 104 내지 107, 또는 104 내지 108 범위의 많은 세포를 가지며, 각 세포는 상이한 통합 부위를 갖는 라이브러리를 생산한다. 일부 실시양태에서, 특정 분류의 유전자 내에 (랜덤 또는 표적) 삽입을 갖는 세포를 골라냄으로써 상이한 분류의 유전자를 함유하도록 라이브러리를 제작하고 배열할 수 있다. 예를 들어, 라이브러리의 세포는 조절 인자, 대사 인자, 발달 인자, 수용체 (예를 들어, 면역 체크포인트 수용체, G-단백질 결합성 수용체), 효소 (예를 들어, 키나제, 포스파타제), 전사 인자, 구조 단백질, 운동 단백질 및 조절 RNA, 예컨대 miRNA, 비-암호화(non-coding) RNA (예를 들어, lncRNA), 을 코딩하는 유전자를 포함하는 다른 분류의 유전자를 코딩하는 유전자 내에 삽입을 가질 수 있다.
일부 실시양태에서, 게놈 돌연변이의 라이브러리를 하나 이상의 후보 화합물의 처치에 민감한 하나 이상의 좌위를 식별하기 위해 스크리닝할 수 있다. 그러나, 돌연변이의 라이브러리를 표현형 또는 관심 특성과 연관된 하나 이상의 좌위를 식별하기 위해 임의의 분석을 사용하여 스크리닝할 수 있음이 이해되어야 한다.
본 발명의 양태는, 스플라이싱할 수 있는 세포, 예컨대 진핵 세포에서, DNA 뉴클레아제를 게놈 표적으로 가이드할 수 있는 표적-특이적 RNA 분자의 제조 방법과 관련된다. 일부 실시양태에서, 본 방법은 재조합 핵산을 진핵 세포로 도입하는 단계를 포함하며, 여기서 재조합 핵산은 RNA-가이드된 DNA 뉴클레아제와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함한다. 일부 실시양태에서, 본 방법은 진핵 세포의 게놈 좌위로 재조합 핵산을 통합하는 단계를 포함하며, 여기서 재조합 핵산은 RNA-가이드된 DNA 뉴클레아제와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함한다.
본 발명의 일부 양태는 세포 내 게놈 DNA의 RNA-가이드된 절단의 촉진 방법을 제공한다. 일부 실시양태에서, 본 방법은, 세포에서, 제2 RNA 절편으로 스플라이싱된 제1 RNA 절편을 포함하는 RNA 분자를 제조하는 단계를 포함하며, 여기서 제1 RNA 절편은 게놈 좌위로부터 전사된 엑손 서열을 포함하고 제2 RNA 절편은 RNA-가이드된 DNA 뉴클레아제와 상호작용할 수 있는 RNA 절편을 포함한다. 일부 실시양태에서, 본 방법은, 세포에서, RNA-가이드된 DNA 뉴클레아제를 발현시키는 단계를 더 포함한다.
본 발명의 양태는, 진핵 세포에서, DNA 변형 효소를 가이드하는 표적 특이적 핵산의 제조 방법과 관련된다. 일부 실시양태에서, 본 방법은, 재조합 핵산을 진핵 세포로 도입하는 단계를 포함하고, 여기서 재조합 핵산은 DNA 변형효소와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함한다. 일부 실시양태에서, DNA 변형 효소는 RNA-가이드된 DNA 뉴클레아제다. 일부 실시양태에서, 진핵 세포는 줄기 세포이다.
본 발명의 양태는 DNA 변형 효소와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함하는 핵산과 관련된다. 일부 실시양태에서, DNA 변형 효소는 RNA-가이드된 DNA 뉴클레아제이다.
일부 실시양태에서, 재조합 핵산은 DNA 분자이다. 일부 실시양태에서, 재조합 핵산은 (예를 들어, 선형 재조합 핵산의 5' 말단 및 3' 말단의) 트랜스포존 말단 서열을 포함한다. 일부 실시양태에서, 트랜스포존 말단 서열은 역위 말단 반복 서열(ITR)을 포함한다. 일부 실시양태에서, 트랜스포존 말단 서열은 직접 말단 반복 서열(direct terminal repeat sequence)을 포함한다. 일부 실시양태에서, 직접 말단 반복 서열은 ITR을 플랭킹한다. 일부 실시양태에서, 트랜스포존 말단 서열은 5' 말단 CCY 및 3' 말단 GGG를 포함한다. 일부 실시양태에서, 트랜스포존 말단 서열은 5' 말단 CCC 및 3' 말단 GGG를 포함한다. 일부 실시양태에서, 트랜스포존 말단 서열은 TTAA 삽입 부위를 표적화한다. 일부 실시양태에서, 트랜스포존 말단 서열은 피기백(PiggyBac) 트랜스포존-특이적 역위 말단 반복 서열(ITR)을 포함한다. 일부 실시양태에서, 트랜스포존 말단 서열은 태그얼롱(Tagalong) 트랜스포존-특이적 역위 말단 반복 서열(ITR)을 포함한다. 일부 실시양태에서, 재조합 핵산은 선택 또는 스크리닝 마커를 코딩하는 제3 핵산 영역을 더 포함한다. 일부 실시양태에서, 선택 또는 스크리닝 마커는 항생제 내성 단백질 또는 형광 또는 생물발광 단백질이다.
일부 실시양태에서, 스플라이스 수용자 부위는 5'-X1X2X3-3'로 기재되는 서열을 포함하며, 여기서: X1은 A; X2는 G 또는 C; 및 X3은 A, G, C, 또는 U이고, 여기서 3' 스플라이스 접합부는 X2 및 X3 사이에 있다. 일부 실시양태에서, X2는 G이다. 일부 실시양태에서, X3은 A, G 또는 C이다. 일부 실시양태에서, 스플라이스 수용자 부위는 5'-X1X2X3X4X5-3'로 기재되는 서열을 포함하며, 여기서: X1은 A, C 또는 U; X2는 A; X3은 G; X4는 A, G 또는 C; 및 X5는 A, U 또는 C이고, 여기서 3' 스플라이스 접합부는 X3 및 X4 사이에 있다. 일부 실시양태에서, 스플라이스 수용자 부위는 5'-X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16X17X18X19X20X21X22-3' (서열 18)로 기재되는 서열을 포함하며, 여기서: X1, X3, X5, X7, X9, X12, X15, X16, 및 X17은 각각 독립적으로 A, G, C, 및 U로부터 선택되며; X2는 C 또는 G; X4는 U; X6, X8, X10, X11, X13, X14는 각각 독립적으로 G, C, 및 U로부터 선택되며; X18은 A, C 또는 U; X19는 A; X20은 G; X21은 A, C, 또는 G; 및 X22는 A, U 또는 C이며, 여기서 3' 스플라이스 부위는 X20 및 X21 사이에 있다.
일부 실시양태에서, 뉴클레아제 상호작용성 절편은 RNA-가이드된 DNA 뉴클레아제와 상호작용하는 하나 이상의 스템 부분을 포함한다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 비-상보적 RNA 뉴클레오티드에 의해 분리된 제1 및 제2 스템 부분을 포함한다. 일부 실시양태에서, 제1 스템 부분은 5'-GUUGUAGC-3'로 기재되는 뉴클레오티드 서열을 갖는 가닥을 포함한다. 일부 실시양태에서, 제2 스템 부분은 5'-UUCUC-3'로 기재되는 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 제2 스템 부분의 두 가닥의 상보적 염기쌍이 루프 구조를 통해 공유적으로 결합된다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAU-3'(서열 1)로 기재되는 서열을 포함한다.
일부 실시양태에서, 진핵 세포는 포유동물 세포이다. 일부 실시양태에서, 진핵 세포는 식물 세포이다. 일부 실시양태에서, 포유동물 세포는 인간 세포이다.
일부 실시양태에서, 재조합 핵산은 RNA-가이드된 DNA 뉴클레아제를 코딩한다. 일부 실시양태에서, RNA-가이드된 DNA 뉴클레아제는 CRISPR-연관 (Cas) 뉴클레아제이다. 일부 실시양태에서, Cas 뉴클레아제는 II 형 Cas 뉴클레아제이다. 일부 실시양태에서, Cas 뉴클레아제는 Cas9 뉴클레아제이다. 일부 실시양태에서, Cas9 뉴클레아제는 네이세리아 메닌기티디스 ( Neisseria meningitidis ) Cas9 뉴클레아제이다. 일부 실시양태에서, Cas9 뉴클레아제는 스트렙토코쿠스 써모필레스(Streptococcus thermophiles) Cas9 뉴클레아제이다. 일부 실시양태에서, RNA-가이드된 DNA 뉴클레아제는 단일-가닥 단절을 DNA에 도입한다. 일부 실시양태에서, RNA-가이드된 DNA 뉴클레아제는 이중-가닥 단절을 DNA에 도입한다. 일부 실시양태에서, RNA-가이드된 DNA 뉴클레아제는 i) RNA-가이드된 DNA 뉴클레아제 및 RNA 분자의 제2 RNA 절편 간의 상호작용, 및 ii) 엑손 서열을 코딩하는 하나 이상의 게놈 좌위에서의 DNA 절단을 촉진하는 조건하에서 발현된다. 일부 실시양태에서, DNA 절단은 엑손 서열의 스플라이스 공여자 부위 상류의 5 염기쌍 내에서 발생한다.
일부 실시양태에서, 하나 이상의 게놈 좌위는 엑손 서열을 코딩하는 둘 이상의 대립유전자이다. 일부 실시양태에서, 둘 이상의 대립유전자는 포유동물 세포의 두 대립유전자이다.
이들 및 다른 양태가 본원에서 보다 자세히 기술된다.
도 1a 및 1b는 (엑손 a'를 함유하는) 키메라 스플라이싱된 RNA 분자의 생성의 비제한적인 실시양태를 도시한다;
도 2a 및 2b는 다수의 대립유전자를 표적화하는 (엑손 a'를 함유하는) 키메라 스플라이싱된 RNA 분자에 의해 가이드된 핵산 절단 시스템 및 목표한 핵산 절단에 이어지는 DNA 복구 유도성 돌연변이유발의 비-제한적인 실시양태를 도시한다;
도 3은 DNA 복구 유도성 돌연변이유발에 이어지는 트랜스포존 절제(transposon excision)의 비-제한적인 실시양태를 도시한다;
도 4a 내지 4c는 네이세리아 메닌기티디스의 표적화 CRISPR 연관 RNA (crRNA) 및 전사활성화(transactivating) crRNA (tracrRNA)의 서열을 포함하는 뉴클레아제 상호작용성 절편의 비-제한적인 실시양태를 도시한다. 서열 2는 도 4a에 나열되어 있다; 서열 3은 도 4b에 나열 되어 있다; 서열 4는 도 4c에 나열되어 있다;
도 4d는 네이세리아 메닌기티데스(Neisseria meningitides)의 표적화 crRNA 및 tracrRNA의 서열을 포함하는 뉴클레아제 상호작용성 절편을 포함하는 삽입성 재조합 핵산을 사용하고 피기백 트랜스포존 서열에 의해 플랭킹된 II 형 CRISPR 시스템을 도시한다;
도 4e는 인간 디스트로핀(Dystrophin) 유전자의 두 엑손/인트론 경계를 도시한다. 엑손 13은 서열 5이고 엑손 24는 서열 6이다;
도 5a는 컨센서스(consensus) 스플라이스 공여자 및 수용자 부위의 비-제한적인 실시양태를 도시한다;
도 5b는 키메라 RNA의 비-제한적인 실시양태를 도시한다. 서열 7은 도 5b에 나열되어 있다;
도 6a는 스플라이스 수용자 및 뉴클레아제 상호작용성 절편을 포함하는 RNA를 코딩하는 부분 및 프로토스페이서(protospacer) 인접 모티프(PAM)를 구비한 엑손을 함유하는 핵산 구축물의 비-제한적인 실시양태를 도시한다;
도 6b는 RNA-가이드된 뉴클레아제를 코딩하는 핵산 구축물의 비-제한적인 실시양태를 도시한다;
도 7은 CRISPR 활성을 평가하기 위한 작업 흐름의 비-제한적인 실시양태를 도시한다;
도 8은 엑손 a'가 스플라이싱된 RNA 분자를 나타내는, 변형된 뉴클레아제를 게놈 부위에 표적화하는 시스템의 비-제한적인 실시양태를 도시한다;
도 9는 삽입성 재조합 핵산의 서열 (서열 19)의 비-제한적인 예를 제공한다. 재조합 핵산은 RNA-가이드된 뉴클레아제와 상호작용할 수 있는 RNA 절편을 코딩하는 핵산 영역 상류의 스플라이스 수용자 부위를 포함한다;
도 10은 Cas9 뉴클레아제를 발현하도록 조작된 핵산의 서열의 비-제한적인 예를 제공한다. DNA 서열은 서열 20에 대응하며, 단백질 서열은, 왼쪽에서 오른쪽으로, 서열 21, 22, 및 23에 대응한다.
일부 실시양태에서, 본 개시내용의 양태는 세포 내의 게놈 좌위의 하나 이상의 대립유전자를 변형하는 (예를 들어, 돌연변이시키는) 데에 유용한 방법 및 조성물을 제공한다. 일부 실시양태에서, 본원에 기술된 방법 및 조성물은 뉴클레아제 상호작용성 RNA 절편으로 스플라이싱된 전사된 엑손을 포함하는 키메라 스플라이싱된 RNA 분자를 제조하는 것에 관여한다.
본 개시내용의 양태는 세포내의 표적 핵산을 변형하는 방법 및 조성물과 관련된다. 일부 실시양태에서, 표적 핵산은, 표적 핵산에 (예를 들어, 표적 부위에서의 이중 가닥 DNA 분자 중 한 가닥에) 상보적이고 뉴클레아제와 상호작용할 수 있는 제2 절편으로 스플라이싱되는 제1 표적 절편을 포함하는 키메라 스플라이싱된 RNA 분자에 의해 표적 핵산으로 가이드되는 뉴클레아제에 의해 세포내에서 변형된다. 일부 실시양태에서, 제1 절편은 하나 이상의 엑손을 포함하며, 제2 절편은 CRISPR-연관 뉴클레아제 (예를 들어, Cas9 뉴클레아제)와 상호작용할 수 있는 RNA를 포함한다.
일부 실시양태에서, 키메라 스플라이싱된 RNA 분자는 세포내에서 생산되며 재조합 RNA 절편으로 스플라이싱되는 전사된 게놈 영역 (예를 들어, 하나 이상의 엑손을 포함한다)에 대응하는 RNA 절편을 포함하고, 여기서 재조합 RNA 절편은 전사된 게놈 영역의 인트론으로 통합되는 재조합 핵산에 코딩된다. 따라서, 일부 실시양태에서, 본 개시내용의 양태는, 세포 내에, 뉴클레아제와 상호작용할 수 있는 RNA에 연결된 스플라이스 수용자 부위를 함유하는 RNA를 제공하는 것과 관련된다. 일부 실시양태에서, RNA는 게놈 부위로 구축물을 통합함으로써 제공된다.
일부 실시양태에서, 키메라 스플라이싱된 RNA 분자는 (예를 들어, 표적 절편 및 발현된 좌위에서의 게놈 DNA의 상보적 가닥 간의 상보적 염기-쌍형성을 통해) 발현된 게놈 좌위 및 키메라 스플라이싱된 RNA 분자의 뉴클레아제 상호작용성 절편에 결합하는 뉴클레아제에 결합한다. 그 결과, 뉴클레아제는 게놈 좌위로 가이드된다. 일부 실시양태에서, 뉴클레아제는 키메라 스플라이싱된 RNA의 표적 절편에 상보적인 서열을 갖는 게놈 부위에서 또는 부근에서 게놈 DNA (예를 들어, 하나 또는 두 가닥 모두)를 절단한다. 일부 실시양태에서, 숙주 세포 복구 기작은 절단된 DNA를 복구하며 복구 과정 동안 절단 부위에 돌연변이를 도입한다. 뉴클레아제 상호작용성 절편을 코딩하는 재조합 핵산이 게놈 좌위의 오직 하나의 대립유전자로 통합됨에도 불구하고, 이 과정이 발현된 게놈 좌위의 다수의 대립유전자 (예를 들어, 2배체 유기체의 두 대립유전자)에 표적화될 수 있다는 것이 이해되어야 한다. 따라서, 본원에 기술된 방법 및 조성물을 세포 내 좌위의 다수의 대립유전자에 대한 뉴클레아제 활성 (예를 들어, 2배체 세포의 두 대립유전자)을 표적화하는 데에 사용할 수 있다. 일부 실시양태에서, 뉴클레아제는 하나 이상의 대립유전자에 이중 가닥 단절을 도입한다.
일부 실시양태에서, 본 개시내용의 양태는 발현된 게놈 좌위에 (예를 들어, 표적화된 각 발현된 게놈 좌위의 둘 이상의 대립유전자에) 하나 이상의 변형 (예를 들어, 돌연변이)을 갖는 숙주 세포를 생산하는 데에 유용하다. 일부 실시양태에서, 숙주 세포의 라이브러리를 상이한 유전자 좌위의 돌연변이와 함께 생산할 수 있으며 이들 라이브러리를 하나 이상의 (예를 들어, 질병 또는 치료에 대한 반응 또는 다른 관심 특성과 연관된) 관심 좌위를 식별하도록 스크리닝할 수 있다.
일부 실시양태에서, 숙주 세포는, 복구 도중 오류의 빈도를 증가시키고, 이로써 본원에 기술된 방법에서 생성된 돌연변이의 빈도를 증가시키는 하나 이상의 돌연변이를 갖는 세포일 수 있다.
본원에 개시된 재조합 핵산을 임의의 적절한 벡터로 전달할 수 있다. 예를 들어, 재조합 핵산은 말단 중 어느 하나에, 재조합을 촉진하거나 관심 삽입 부위를 표적화하는 서열을 가질 수 있다. 일부 실시양태에서, 재조합 핵산을 바이러스성 벡터, 예컨대, 예를 들어, 레트로바이러스 (예를 들어, 렌티바이러스), 헤르페스바이러스 (예를 들어, 단순 헤르페스 바이러스 1 형), 으로 전달할 수 있다.
일부 실시양태에서, 재조합 핵산을 트랜스포존으로 전달한다. 일부 실시양태에서, 재조합 핵산을 트랜스포존 시스템의 TTAA-특이적, 짧은 반복 요소를 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 TTAA 표적 부위에 대한 선호도를 나타내는 요소, 및 FP-좌위 내 또는 게놈의 다른 영역에서의 삽입체를 포함하는 벡터로 전달한다.
일부 실시양태에서, 재조합 핵산을 "컷 앤 페이스트(cut and paste)" 기작을 통해 효율적으로 전위하는 이동성 유전적 요소(mobile genetic element)인 피기백 (PB) 트랜스포존 요소를 포함하는 벡터로 전달한다. 일부 실시양태에서, 전위 동안, PB 트랜스포사제(transposase)는 트랜스포존 벡터의 양 말단에 위치한 트랜스포존-특이적 역위 말단 반복 서열(ITR)을 인식하고 내용물을 효율적으로 원래 부위로부터 이동시키며 이들을 TTAA 염색체 부위로 효율적으로 통합한다.
일부 실시양태에서, 적절한 트랜스포사제 (예를 들어, 피기백(PB) 트랜스포사제, 슬리핑 뷰티(Sleeping Beauty, SB) 트랜스포사제, 트랜스포사제 Tn5, )를 발현하도록 조작된 재조합 핵산을, 세포에 원하는 유형의 전위를 초래하도록 숙주 세포에 전달한다.
일부 실시양태에서, 재조합 핵산을 배큘로바이러스 AcMNPV 또는 GmMNPV의 소수-폴리헤드라(few-polyhedra, FP) 좌위 내의 이동성 숙주 DNA 삽입 요소의 서열을 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 태그얼롱 (대안적으로 TFP3으로서 지칭됨) 트랜스포존의 트랜스포존 서열을 포함하는 벡터로 전달한다.
일부 실시양태에서, 재조합 핵산을 피기백과 상동성인 서열을 갖는 루퍼(LOOPER) 요소를 포함하는 벡터로 전달한다. 일부 실시양태에서, 루퍼 요소는 5' CCY....GGG 3'로 종결되고, TTAA 삽입 부위를 표적화하는 DNA 요소이다.
일부 실시양태에서, 재조합 핵산을 TTAA-특이적 화석 반복 요소(fossil repeat element), 예컨대, 예를 들어, MER75 및 MER85를 포함하는 벡터로 전달한다. 일부 실시양태에서, TTAA-특이적 화석 반복 요소는 5' CCC....GGG 3'로 종결되고, TTAA 삽입 부위를 표적화한다.
일부 실시양태에서, 재조합 핵산을 메이즈(Maize) Ac/Ds 시스템의 플랭킹 트랜스포존 서열을 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 P 요소를 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 Tn 패밀리에 속하는 박테리아성 트랜스포존의 서열을 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 Alu 서열을 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 마리너-유사(Mariner-like) 요소를 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 Mu 파지(phage) 전위를 촉진하는 서열을 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 레트로트랜스포존 패밀리 Ty1, Ty2, Ty3, Ty4 또는 Ty5로부터의 트랜스포존 서열을 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 헬리트론(helitron)의 트랜스포존 서열을 포함하는 벡터로 전달한다. 일부 실시양태에서, 재조합 핵산을 슬리핑 뷰티 트랜스포존으로 전달한다.
일부 실시양태에서, 재조합 핵산을 (예를 들어, 식물 세포로의 전달을 위한) T-DNA 벡터로 전달한다.
임의의 적절한 방법을 사용하여 게놈 좌위에 재조합 핵산을 삽입할 수 있음이 이해되어야 한다. 일부 실시양태에서, 표적 게놈 좌위로의 예를 들어, 상동 재조합을 통해, 표적화된 삽입을 촉진하기 위해 관심 게놈 좌위 (예를 들어, 종양유전자 또는 통합된 바이러스성 유전자)와 상동인 플랭킹 서열을 포함하도록 삽입성 재조합 핵산을 조작할 수 있다. 일부 실시양태에서, 삽입성 재조합 핵산은 관심 게놈 좌위와 상동인 플랭킹 서열을 함유하며, 플랭킹 서열은 100 bp 이하, 500 bp 이하, 1 kb 이하, 2 kb 이하, 3 kb 이하, 또는 5 kb 이하이다. 일부 실시양태에서, 플랭킹 서열은 10 bp 내지 100 bp, 100 bp 내지 500 bp, 100 bp 내지 1 kb, 100 bp 내지 2 kb, 500 bp 내지 3 kb, 또는 1 kb 내지 5 kb 범위이다.
일부 실시양태에서, 스플라이스 수용자 부위로부터 하류의 RNA 분자의 뉴클레아제 상호작용성 절편을 코딩하는 재조합 핵산을 제공한다. 재조합 핵산이 숙주 세포로 도입될 때 (예를 들어, 형질감염, 바이러스성 형질도입(transduction), 전기천공, 또는 다른 기술을 통해), 이것은 발현된 주형 핵산 (예를 들어, 게놈 핵산의 발현된 영역의 인트론 내)의 엑손의 스플라이스 공여자 부위로부터 하류의 발현된 주형 핵산 내에 통합될 수 있다. 일부 실시양태에서, 재조합 핵산을 전사를 촉진하는 담체 (예를 들어, 지질-기반 담체)와 함께, 또는 이것이 없는 형질감염을 통해 세포로 전달한다. 일부 실시양태에서, 재조합 핵산을 바이러스성 형질도입을 통해 세포로 전달한다.
이 부위로부터 얻은 전사체를 뉴클레아제 상호작용성 RNA 절편에 스플라이싱된 발현된 핵산으로부터 상류 엑손을 함유하는 키메라 스플라이싱된 RNA 분자를 생산하도록 스플라이싱할 수 있다. 이 키메라 스플라이싱된 분자는 발현된 주형 핵산에 뉴클레아제를 표적화하기 위한 표적 분자로서 작용할 수 있다. 키메라 스플라이싱된 RNA 분자의 엑손 부분은 표적 서열로서 작용할 수 있다 - 이것은 발현된 주형 핵산 중 한 가닥에 상보적이고 상보적 염기 쌍형성에 의해 결합할 수 있다. 이것은 결합된 키메라 스플라이싱된 RNA 부위에 뉴클레아제를 동원하는 상호작용성 RNA 절편을 통해 뉴클레아제를 그 주형 핵산 (예를 들어, 게놈 핵산)에 표적화한다.
따라서, 일부 실시양태에서, 본 개시내용의 양태는 핵산의 특정 표적 부위 또는 영역에 뉴클레아제를 표적화하는 RNA 분자의 생산 방법 및 조성물과 관련된다. 일부 실시양태에서, 표적화 RNA 분자는 표적 영역 및 뉴클레아제 상호작용성 영역을 둘 다 함유한다. 일부 실시양태에서, 세포 내에서 표적화 RNA를 생산하기 위해 두 영역을 함께 세포 내에서 스플라이싱한다. 표적 핵산 및 뉴클레아제 모두의 존재하에서, 표적화 RNA는 표적 핵산 및 뉴클레아제를 함께 가져오며, 이로써 뉴클레아제에 의한 표적 핵산의 절단을 촉진하는 약제로서 작용한다. 표적화 RNA의 표적화 절편은 표적 핵산으로부터 전사된 부분에 대응하며, 따라서 표적 핵산 (예를 들어, 게놈 DNA) 중 한 가닥에 상보적이고 표적 핵산에 (예를 들어, 표적 DNA와 상보적 염기 쌍형성을 통해) 결합할 수 있다. 일부 실시양태에서, 표적화 RNA의 뉴클레아제 상호작용성 절편은 뉴클레아제와 상호작용하며, 이로써 표적 핵산의 절단을 촉진한다. 그러나, 일부 실시양태에서, 변형된 뉴클레아제를 사용할 수 있음이 이해되어야 한다. 변형된 뉴클레아제는 표적화 RNA의 뉴클레아제 상호작용성 절편에 결합하는 그의 능력을 보유할 수 있지만, 이의 핵산 절단 활성을 제거하고(거나) 하나 이상의 추가적인 (예를 들어, 본원에 더 구체적으로 기술된 바와 같은 조절적 및/또는 효소적) 이펙터 기능(effector function)을 도입하도록 변형된다.
따라서, 일부 실시양태에서, 표적화 RNA는 두 영역: i) 핵산 표적에 상보적인 영역, 및 ii) 뉴클레아제와 상호작용하는 영역을 포함한다. 뉴클레아제와 함께 세포에 제공된 경우, 표적화 RNA는 (이것의 상보적 제1 영역을 통해) 표적 핵산에 결합하며 (뉴클레아제와 상호작용하는 영역을 통해) 뉴클레아제와 상호작용함으로써 표적 핵산의 절단을 촉진한다.
일부 실시양태에서, 본 개시내용의 일부 양태는 도 1a 및 1b를 참조하여 설명된다. 특히, 표적화된 게놈 DNA 절단 시스템 생성의 비-제한적인 실시양태는 도 1a 및 1b에 도시된다. 도 1a에서, 스플라이스 수용자(SA) 부위 하류의 뉴클레아제 상호작용성 절편을 포함하는 RNA를 코딩하는 재조합 핵산이 제공된다. 일부 실시양태에서, 전사 종결 서열 (중지)은 뉴클레아제 상호작용성 절편 하류에 코딩된다. 일부 실시양태에서, 폴리아데닐화 신호는 뉴클레아제 상호작용성 절편 하류에 코딩된다.
단계 100A는 제1 엑손 (엑손 a)의 스플라이스 공여자(SD) 부위 하류의 두 엑손 (엑손 a 및 엑손 b) 사이의 게놈 좌위의 인트론으로의 재조합 핵산의 삽입을 설명한다. 재조합 핵산의 삽입이 게놈의 부위로의 (예를 들어, 인트론 내의 부위) 랜덤 통합 또는 표적화된 통합의 결과일 수 있음이 이해되어야 한다. 랜덤 또는 표적화된 통합의 경우, 상이한 통합 부위를 갖는 상이한 세포를 단리할 수 있으며 (예를 들어, 랜덤하게 또는 선택 또는 스크리닝을 사용하여) 나아가 평가할 수 있다. 재조합 핵산을 유전자의 임의의 인트론으로 통합할 수 있음이 또한 이해되어야 한다. 특정 인트론에 따라, 얻어진 차이점은 절단 (및 후속적 오류 수정 - 만일 있다면)이 상이한 대립 위치, 예를 들어, 상이한 엑손에 있을 수 있다는 점일 수 있다. 개시된 방법이, 삽입이 인트론 내에서 발생하는 경우로 제한되지 않음이 또한 이해되어야 한다. 일부 실시양태에서, 원하는 스플라이싱이 여전히 효과적이라면, 삽입은 인트론, 엑손, 비번역 영역 또는 또 다른 위치에 인접하거나 그 내에서 발생할 수 있다.
도 1a 및 1b에서, 엑손 a의 스플라이스 공여자 부위는 재조합 핵산의 게놈 삽입 부위에 이르기까지의 인트론 부분에 의해 뉴클레아제 상호작용성 절편의 스플라이스 수용자 부위와 분리된다. 단계 101A에서, 게놈 좌위의 프로모터부터의 전사는 뉴클레아제 상호작용성 절편의 스플라이스 수용자 부위로부터 상류의 그의 스플라이스 공여자 부위를 갖는 엑손 a'를 포함하는 RNA 전사체를 생산한다. RNA 전사체의 스플라이싱은, 단계 101A에서 보여지는 바와 같이, 엑손 a'의 바로 하류의 뉴클레아제 상호작용성 절편을 포함하는 스플라이싱된 키메라 RNA 분자를 생산한다. 도 1a는 또한, 단계 101A에서, 스플라이싱 반응으로부터 얻은 스플라이스 부산물을 도시한다. 스플라이스 부산물은 스플라이스 공여자 및 수용자 부위 및 인트론 부분을 포함한다.
도 1b에서, 스플라이스 수용자(SA) 부위 하류의 뉴클레아제 상호작용성 절편을 포함하는 RNA를 코딩하는 재조합 핵산은 트랜스포존 말단 반복(TR)에 의해 플랭킹된다. 트랜스포존 말단 반복은 게놈으로 재조합 핵산의 통합을 촉진한다. 도 1b에서, 트랜스포존 구축물은 단계 100B 내지 101B에서 보여지는 바와 같이, 게놈 좌위의 두 엑손 (엑손 a 및 엑손 b) 사이의 인트론으로 통합된다. 도 1a와 유사하게, RNA 전사체의 스플라이싱은, 단계 101B에서 보여지는 바와 같이, 엑손 a의 바로 하류의 뉴클레아제 상호작용성 절편을 포함하는 스플라이싱된 키메라 RNA 분자를 생산한다. 도 1b는 또한, 단계 101B에서, 스플라이싱 반응으로부터 얻은 스플라이스 부산물을 도시한다. 스플라이스 부산물은 스플라이스 공여자 및 수용자 부위, 인트론 부분, 및 제1 트랜스포존 말단 반복을 포함한다.
본원에 기술된 바와 같이, 게놈 좌위의 다수의 대립유전자는 단일 통합된 핵산으로부터 발현된 키메라 스플라이싱된 RNA 분자에 의해 표적화될 수 있다. 도 2a 및 2b는 재조합 핵산이 통합된 대립유전자 중 오직 하나로부터 발현된 키메라 스플라이싱된 RNA 분자에 의해 표적화된 게놈 좌위의 두 대립유전자의 비-제한적인 실시양태를 도시한다. 도 2a 및 2b에서 도시된 방법이 세포 내 유전자 좌위의 다수의 대립유전자 (예를 들어, 2배체 유기체의 두 대립유전자)에 게놈 돌연변이를 생성할 수 있음이 또한 이해되어야 한다.
도 2a에서 설명된 바와 같이, (예를 들어, 도 1a 또는 1b의 단계에 의해 생성된 바와 같은) 키메라 스플라이싱된 RNA 분자는, 단계 200A에서 도시된 바와 같이, (인트론에 통합된 핵산을 함유하지 않는) 게놈 좌위의 대립유전자에 대한 RNA-가이드된 DNA 뉴클레아제 표적-결합을 촉진할 수 있다. 단계 200A에서, 키메라 스플라이싱된 RNA 분자 (스플라이싱된 RNA 전사체)는 (스플라이싱된 RNA의 엑손 a 절편 및 게놈 좌위에서의 엑손 a의 상보적 가닥 간의 염기-쌍형성 상호작용을 통해) 엑손 a를 코딩하는 게놈 좌위에 결합한다. 게놈 엑손 a 좌위에 결합한 키메라 스플라이싱된 RNA 분자는 또한 (키메라 스플라이싱된 RNA 분자의 뉴클레아제 상호작용성 절편 및 뉴클레아제 간의 상호작용을 통해) 동일한 세포에서 발현된 RNA-가이드된 DNA 뉴클레아제를 동원한다.
키메라 스플라이싱된 RNA 분자에 의해 게놈 부위로 동원된 뉴클레아제는 단계 201A에 도시된 바와 같이 게놈 핵산을 절단할 수 있다.
얻어진 절단된 게놈 영역은 세포내 복구 효소에 의해 복구될 수 있다. 그러나, 일부 경우, 복구 과정은 단계 202A에 도시된 바와 같이 절단 부위에 돌연변이를 도입할 수 있다. 따라서, 도 2a에 도시된 과정은 절단 부위에 게놈 돌연변이의 생성을 가져올 수 있다.
도 2b에서 설명된 바와 같이, 키메라 스플라이싱된 RNA 분자는, 단계 200B에 도시된 바와 같이, (인트론에 통합된 핵산을 함유하는) 게놈 좌위의 또 다른 대립유전자에 대한 RNA-가이드된 DNA 뉴클레아제 표적-결합을 촉진할 수 있다. 키메라 스플라이싱된 RNA는, 단계 200B에서 보여지는 바와 같이, DNA 뉴클레아제를 엑손 a의 게놈 좌위로 가이드한다. 게놈 부위에 동원된 뉴클레아제는, 단계 201B에 도시된 바와 같이 게놈 핵산을 절단할 수 있다. 후속적으로, 세포내 DNA 복구 효소는 단계 202B에 도시된 바와 같이, 엑손 a에 복구-유도성 돌연변이를 갖는 게놈 좌위를 생산하도록, 복구 과정 동안 단절 부위에 돌연변이를 도입할 수 있다.
따라서, 도 2a 및 2b에 도시된 바와 같이, 본원에 기술된 바와 같은 세포성 DNA 복구 과정을 통해, 돌연변이를 게놈 좌위의 다수의 대립유전자로 도입할 수 있다.
일부 실시양태에서, (트랜스포존 반복에 의해 플랭킹된) 통합된 재조합 핵산을 (예를 들어, 트랜스포사제-유도성 절제를 통해) 절제하고, 이로써 엑손 a의 게놈 좌위에 복구-유도성 돌연변이를 남기지만, 도 3에 도시된 바와 같이, 게놈으로부터 (뉴클레아제 상호작용성 절편과 함께) 재조합 핵산을 제거한다.
일부 실시양태에서, 전사 종결 서열은 숙주 세포 게놈 (스플라이스 수용자 부위로부터 하류의 뉴클레아제 상호작용성 절편을 코딩하는 재조합 핵산)으로 통합된 재조합 핵산의 뉴클레아제 상호작용성 절편으로부터 하류에 위치한다. 이것은 재조합 핵산에 의해 코딩된 서열 내의 키메라 RNA의 전사를 종결하고 게놈 통합 부위로부터 하류의 임의의 추가적 인트론 또는 엑손으로의 전사 계속을 방지한다.
일부 실시양태에서, 숙주 게놈으로 삽입된 재조합 핵산은 스플라이스 수용자 부위로부터 상류의 프로모터 서열을 포함하지 않는다.
일부 실시양태에서, 하나 이상의 트랜스포존 말단 반복 서열 (예를 들어, 직접 또는 간접 반복, 또는 이들의 조합)은 스플라이스 수용자 부위로부터 하류의 뉴클레아제 상호작용성 절편을 코딩하는 재조합 핵산의 양 말단에 존재한다. 이들 트랜스포존 말단 반복 서열은 숙주 세포의 게놈으로 재조합 핵산의 삽입을 촉진할 수 있다.
일부 실시양태에서, 하나 이상의 선택가능 마커 (예를 들어, 약물 내성 마커)를 스플라이스 수용자 부위로부터 하류의 뉴클레아제 상호작용성 절편을 코딩하는 재조합 핵산에 코딩한다. 하나 이상의 선택가능 마커를 재조합 핵산이 게놈으로 통합되어 있는 숙주 세포를 선택하는 데에 사용할 수 있다.
일부 실시양태에서, 트랜스포존 통합 및/또는 절제를 촉진하는 하나 이상의 효소 (예를 들어, 하나 이상의 트랜스포사제)는 숙주 세포 게놈으로 통합된 재조합 핵산에 코딩되어 있다. 일부 실시양태에서, 하나 이상의 RNA-가이드된 뉴클레아제 (예를 들어, Cas9)는 숙주 세포 게놈으로 통합된 재조합 핵산에 코딩되어 있다. 그러나, 트랜스포존 통합 및/또는 절제 및/또는 하나 이상의 RNA-가이드된 뉴클레아제를 촉진하는 하나 이상의 효소를 별도의 핵산 (예를 들어, 다른 벡터, 예를 들어 자가-복제성 벡터, 또는 숙주 세포 내의 하나 이상의 다른 게놈 좌위)에 코딩할 수 있음이 이해되어야 한다.
뉴클레아제 상호작용성 절편:
일부 실시양태에서, 본 개시내용은 뉴클레아제 상호작용성 절편을 갖는 RNA를 코딩하는 재조합 핵산을 제공한다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 RNA-가이드된 뉴클레아제와 상호작용하는 2차 구조의 형성을 촉진할 수 있는 하나 이상의 서열을 포함한다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 RNA-가이드된 뉴클레아제와 상호작용하는 실질적으로 이중 가닥인 RNA 구조 (예를 들어, 스템(stem))의 형성을 촉진할 수 있는 하나 이상의 서열을 포함한다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 RNA 가이드된 뉴클레아제와 상호작용하는 crRNA:tracrRNA 복합체의 자연구조의 특징을 보유한다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 II 형 CRISPR 시스템의 표적화 crRNA 및 tracrRNA 분자 사이에 형성되는 염기-쌍형성 구조를 모방하는 스템을 형성한다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편의 스템은 표 1에 나타난 서열 또는 이들의 일부를 갖는 하나 이상의 염기-쌍형성 구조를 포함한다. 예를 들어, 일부 실시양태에서, 뉴클레아제 상호작용성 절편의 스템은 표 1에 나타난 염기-쌍형성 구조 또는 이들의 일부 (예를 들어, 표 1의 염기-쌍형성 구조 또는 이들의 일부의 한 스템 또는 양 스템)의 5 이상의 뉴클레오티드 (예를 들어, 5 내지 10, 10 내지 15, 15 내지 20, 이상의 뉴클레오티드)를 포함한다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편의 스템은 표 1에 나타난 염기-쌍형성 구조 또는 이들의 일부 (예를 들어, 표 1의 염기-쌍형성 구조 또는 이들의 일부의 한 스템 또는 양 스템)의 서열과 90 %, 90 내지 95 %, 약 95 %, 또는 95 내지 100 % 동일한 서열을 갖는 5 이상의 뉴클레오티드 (예를 들어, 5 내지 10, 10 내지 15, 15 내지 20, 이상의 뉴클레오티드)를 포함한다.
<표 1>: RNA- 가이드된 뉴클레아제 상호작용성 영역
Figure pct00001
뉴클레아제 상호작용성 절편에 의해 형성될 수 있고 RNA-가이드된 뉴클레아제와 상호작용하는 염기-쌍형성 구조의 추가적 예는, 2013년 11월 28일에 공개된, "전사의 RNA-지시된 모듈화 및 RNA-지시된 표적 DNA 변형을 위한 방법 및 조성물"이라는 제목의, 그 내용이 (예를 들어, 이 공보의 도 8에 설명된 것을 포함하는) 염기-쌍형성 구조와 관련되며 본원에 그 전체가 참조로서 포함되는, 국제 특허 출원 공개 번호 WO/2013/176772에 개시되어 있다.
일부 실시양태에서, 루프는 뉴클레아제 상호작용성 절편의 스템 부분의 가닥을 연결한다. 일부 실시양태에서, 4 염기 루프를 포함한다. 그러나, 다른 크기의 루프 (예를 들어, 2, 3, 5, 6, 7, 8, 9, 10, 이상)를 포함할 수 있음이 이해되어야 한다. 일부 실시양태에서, 루프는 다음의 서열 5'-GAAA-3'를 갖는다. 그러나, 본 개시내용의 양태가 본 측면으로 제한되지 않음에 따라, 루프에 다른 서열을 사용할 수 있음이 이해되어야 한다.
일부 실시양태에서, 뉴클레아제 상호작용성 절편은 표 1에 나타난 염기-쌍형성 스템의 5 내지 35의 5' 염기 (위 가닥) 및 5 내지 35의 3' 염기 (아래 가닥)를 포함할 수 있으며, 여기서 스템은 RNA 절편을 형성하도록 루프 (예를 들어, 5'-GAAA-3' 루프)에 의해 연결된다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 표 1에 나타난 염기-쌍형성 스템의 10 내지 25의 5' 염기 (위 가닥) 및 10 내지 25의 3' 염기 (아래 가닥)를 포함할 수 있으며, 여기서 스템은 RNA 절편을 형성하도록 루프 (예를 들어, 5'-GAAA-3' 루프)에 의해 연결된다. 일부 실시양태에서, 뉴클레아제 상호작용성 절편은 표 1에 나타난 염기-쌍형성 스템의 15 내지 20의 5' 염기 (위 가닥) 및 15 내지 20의 3' 염기 (아래 가닥)를 포함할 수 있으며, 여기서 스템은 RNA 절편을 형성하도록 루프 (예를 들어, 5'-GAAA-3' 루프)에 의해 연결된다.
뉴클레아제 상호작용성 절편을 형성하는 데에 사용할 수 있는 표 1의 염기-쌍형성 구조 부분의 비 제한적인 예는 표 1에 나타난 엔. 메닌기티디스의 염기-쌍형성 스템의 18의 5' 염기 (위 가닥) 및 18의 3' 염기 (아래 가닥)를 포함하며, 여기서 스템은 다음의 서열을 갖는 RNA 절편을 형성하도록 5'-GAAA-3' 루프에 의해 연결된다:
5'-GUUGUAGCUCCCUUUCUCGAAAGAGAACCGUUGCUACAAU-3' (서열 2, 밑줄은 루프이다).
유사하게, 표 1에 나타난 에스 . 피오게네스 스템의 부분은 뉴클레아제 상호작용성 절편을 형성하도록 루프 (예를 들어, 5'-GAAA-3' 루프)에 의해 연결될 수 있다. 비-제한적인 예는 다음의 서열을 갖는다:
5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAU-3' (서열 1, 밑줄은 루프이다).
그러나, 뉴클레아제와 상호작용할 수 있는 다른 서열을 갖는 다른 스템 루프 구조를 본원에 기술된 바와 같이 사용할 수 있음이 이해되어야 한다.
일부 실시양태에서, 미부(tail portion)는 뉴클레아제 상호작용성 영역 바로 3' 하류 스트레치(stretch)에 포함된다. 일부 실시양태에서, 미부는 스템-루프 구조의 형성을 촉진하지 않는 서열을 갖는다. 일부 실시양태에서, 미부는 5 이상의 뉴클레오티드 길이 (예를 들어, 5 내지 10, 10 내지 15, 15 내지 20 뉴클레오티드 길이)이다. 그러나, 더 짧거나 더 긴 미부를 포함할 수 있음이 이해되어야 한다. 게다가, 일부 실시양태에서, 스템-루프 구조의 형성을 촉진하는 서열을 갖는 미부가 제공된다.
일부 실시양태에서, 미부는 RNA 분자의 안정성 (예를 들어, 생체 내 안정성)을 촉진하는 뉴클레아제 상호작용성 영역 바로 3' 하류 스트레치에 포함된다.
도 4a는 엔. 메닌기티데스의 CRISPR-연관 뉴클레아제와 상호작용하는 염기-쌍형성 영역인 RNA-가이드된 뉴클레아제 상호작용성 영역을 포함하는 뉴클레아제 상호작용성 절편의 비-제한적인 실시양태를 도시한다. 염기-쌍형성 구조는 i) 엔. 메닌기티데스의 표적화 crRNA의 서열에 대응하는 5' GUUGUAGCUCCCUUUCUC 3' (서열 16)로 기재되는 서열을 갖는 제1 가닥 및 ii) 활성화 tracrRNA의 서열에 대응하는 5' GAGAACCGUUGCUACAAU 3' (서열 17)로 기재되는 서열을 갖는 제2 가닥을 포함하며, 제1 및 제2 가닥은 5' GAAA 3'로 기재되는 서열을 갖는 루프에 의해 접합된다. 도 4b 및 4c는 상이한 길이의 미부를 포함하는 뉴클레아제 상호작용성 절편의 비-제한적인 실시양태를 도시하며, 각 미부는 엔. 메닌기티데스의 활성화 tracrRNA 분자의 3' 서열에 대응한다. 도 4c에 설명된 미부는 스템 루프 구조를 형성할 수 있는 서열을 포함한다.
도 4d에 도시된 바와 같이, 네이세리아 메닌기티디스의 Cas9 뉴클레아제는 표적화 RNA 절편에 혼성화되지 않은 5' GTNNGNN 3' 모티프로부터 바로 상류의 여러 염기 (3 내지 4 염기)인, 키메라 스플라이싱된 RNA 분자의 상보적 표적화 절편에 혼성화된 게놈 좌위 부분 내에서 우선적으로 절단된다.
도 4e는 그 중 일부가 네이세리아 메닌기티디스의 Cas9 뉴클레아제에 대한 바람직한 뉴클레아제 절단 부위를 함유하는 복수의 인트론을 함유하는 유전자 (인간 디스트로핀 유전자)의 비-제한적인 실시양태를 도시한다. 도 4e는 본원에 기술된 재조합 핵산의 도시된 인트론으로의 통합 (전사 및 스플라이싱이 이어진다)으로부터 야기될 수 있는 키메라 스플라이싱된 RNA의 표적화 절편에 혼성화할 것인 게놈 엑손으로부터 바로 하류의 비-혼성화 5' GTNNGNN 3' 모티프를 생성할 것인 인간 디스트로핀 유전자의 두 엑손/인트론 경계를 도시한다. 예를 들어, 본원에 기술된 재조합 핵산의 인트론 13 - 14 (또는 인트론 24 - 25)로의 통합은 뉴클레아제 상호작용성 절편으로 이어지는 표적화 절편으로서 엑손 13 RNA (또는 엑손 24)를 포함하는 키메라 스플라이싱된 RNA 분자를 가져올 것이다. 키메라 스플라이싱된 RNA가 게놈 엑손 13 (또는 엑손 24)의 상보적 가닥에 결합한 경우, 엑손 13 (또는 엑손 24)로부터 바로 하류이며, 키메라 스플라이싱된 RNA의 표적화 절편에 상보적이지 않거나 혼성화되지 않은 게놈 서열은 5' GTNNGNN 3' 모티프 (인트론 13 - 14에 대해 5' GTCAGAT 3', 및 인트론 24 - 25에 대해 5' GTAAGAT 3')에 대응한다. 그러나, 본 개시내용의 양태가 본 측면으로 제한되지 않음에 따라, 절단이 항상 효율적이지 않더라도 (예를 들어, 이들이 절단 모티프에 정확히 대응하지 않을지라도) 다른 서열이 절단을 지지할 수 있음이 이해되어야 한다.
일부 실시양태에서, 전사 종결자를 미부의 하류에 코딩할 수 있다. 일부 실시양태에서, 전사 종결자는 스템-루프 구조의 형성을 촉진하는 서열을 포함한다. 일부 실시양태에서, 폴리아데닐화 신호를 뉴클레아제 상호작용성 절편 하류에 코딩한다. 일부 실시양태에서, 폴리아데닐화 신호는 재조합 핵산에 의해 코딩되는 RNA의 3' 부분을 절단하는 하나 이상의 인자 (예를 들어, 효소, 보조-인자(co-factor))에 의해 인식되고 이 절단에 의해 생성된 말단을 폴리아데닐화한다. 일부 실시양태에서, 폴리아데닐화 신호는 뉴클레오티드 서열: AAUAAA를 포함한다. 일부 실시양태에서, 폴리아데닐화 신호는 SV40 초기(early), SV40 후기(late), 또는 BGH 폴리아데닐화 신호이다.
RNA- 가이드된 뉴클레아제:
일부 실시양태에서, RNA-가이드된 뉴클레아제는 CRISPR-연관 뉴클레아제이다. 일부 실시양태에서, 다음의 유기체 중 하나 이상으로부터의 Cas9 뉴클레아제를 사용할 수 있다: 엔. 메닌기티데스, 에스 . 써모필레스, 또는 티. 덴티콜라. . 메닌기티데스, 에스 . 써모필레스, 또는 티. 덴티콜라의 오르토로그(orthologue)의 Cas9 뉴클레아제를 또한 사용할 수 있다. 사용할 수 있는 CRISPR-연관 뉴클레아제의 추가적 비-제한적인 예는, 2013년 11월 28일에 공개된, "전사의 RNA-지시된 표적 DNA 변형 및 RNA-지시된 모듈화를 위한 방법 및 조성물"이라는 제목의, 그 내용이 RNA-가이드된 뉴클레아제와 관련되며 본원에 그 전체가 참조로서 포함되는, 국제 특허 출원 공개 번호 WO/2013/176772에 개시된 것을 포함한다.
본원에 기술된 바와 같이, 상이한 뉴클레아제는 가이드 RNA의 상이한 상호작용성 절편 및 상이한 표적 서열에 대한 상이한 상대적 선호도를 보인다. 일부 실시양태에서, 가이드 RNA의 상호작용성 절편은 뉴클레아제에 결합하며, 이후 RNA의 가이드 부분에 상보적인 게놈 서열에 대해 특이적이고 활성화된다. RNA의 가이드 부분은 전형적으로 20 뉴클레오티드 길이이다. 그러나, 일부 실시양태에서, 가이드 부분은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 이상의 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, 가이드 부분은 5 내지 25, 10 내지 30, 15 내지 25, 또는 18 내지 22 뉴클레오티드 길이 범위이다.
일부 실시양태에서, 가이드 RNA에 상보적인 게놈 표적 서열은 그들의 3' 말단에 인접한 프로토스페이서 인접 모티프(PAM)를 갖는다. 일부 실시양태에서, PAM 서열은 분해를 위한 게놈 표적의 구별에 있어 뉴클레아제를 돕는다. 본 개시내용의 양태에서, 뉴클레아제를 스플라이스 공여자 부위의 5' 위치의 엑손에 상보적인 (본원에 기술된 키메라 스플라이싱된 RNA의) 가이드 서열에 의해, 게놈 부위에 표적화한다. 이러한 실시양태에서, 만일 공여자 부위를 포함하는 서열이 표적화된 뉴클레아제에 의해 인식된 PAM 서열이라면, 뉴클레아제는 엑손 내의 게놈 부위를 절단할 것이다. 따라서, 일부 실시양태에서, 뉴클레아제는 스플라이스 공여자 부위를 함유하는 PAM 서열 (예를 들어, 엔. 메닌기티데스의 Cas9 효소에 의해 인식되는 PAM 서열, NNNNGTNN)을 갖는 게놈 표적에 대해 활성인 것으로 선택된다.
아래 표 2는 상이한 유기체의 Cas9 뉴클레아제에 의해 인식되는 상이한 PAM 서열을 나열한다.
<표 2>: 상이한 Cas9 뉴클레아제에 의해 인식된 PAM 서열
Figure pct00002
일부 실시양태에서, 특정 뉴클레아제에 의해 인식된 PAM 서열 (예를 들어, 에스. 피오게네스의 천연(native) 뉴클레아제에 의해 인식된 PAM 서열)은 특정 컨센서스 서열 스플라이스 서열에 일치하지 않을 수 있다. 그러나, 이러한 서열을 인식하는 효소는 특정 맥락에서, 예를 들어, PAM 서열이 스플라이스 부위로서 작동하는 서열을 포함하는 특정 세포 유형에서 유용할 수 있다.
스플라이스 수용자 부위:
일부 실시양태에서, 뉴클레아제 상호작용성 영역의 5'인 스플라이스 수용자 부위를 갖는 RNA를 코딩하는 재조합 핵산이 제공된다. 일부 실시양태에서, 재조합 핵산은 세포에서 전사되는 게놈 부위의 인트론 내로 삽입한다. 얻어진 전사체는 뉴클레아제 상호작용성 영역에 융합된 상류 엑손 서열을 포함하고 엑손을 코딩하는 게놈 부위로 RNA-가이드된 뉴클레아제를 표적화하는 키메라 가이드 RNA를 가져오는 재조합 핵산의 내인성 스플라이스 공여자 부위 및 스플라이스 수용자 사이에서 스플라이싱된다.
따라서, 본 개시내용의 양태는 특정 게놈 부위로 뉴클레아제를 표적화하는 가이드 RNA를 생성하도록 키메라 RNA 전사체로부터 인트론을 제거하기 위해 RNA 스플라이싱을 사용한다. 각 인트론은 그의 5' 말단의 스플라이스 공여자 부위 및 그의 3' 말단의 스플라이스 수용자 부위를 포함한다. 도 5a는 인트론의 5' 말단의 (GT에 의해 코딩된) 서열 GU를 갖는 스플라이스 공여자 부위의 컨센서스 서열의 비-제한적인 실시양태를 설명한다. 그러나, 일부 실시양태에서, 스플라이스 공여자 부위는 인트론의 5' 말단의 (AT에 의해 코딩된) 서열 AU 또는 (GC에 의해 코딩된) 서열 GC를 가질 수 있다.
도 5a는 또한 인트론의 3' 말단의 서열 AG를 갖는 스플라이스 수용자 부위의 컨센서스 서열의 비-제한적인 실시양태를 설명한다. 그러나, 일부 실시양태에서, 수용자 부위는 인트론의 3' 말단의 서열 AC를 가질 수 있다.
일부 실시양태에서, 각각 GT 및 AG를 함유하는 스플라이스 공여자 및 수용자 부위 쌍이 제공된다. 일부 실시양태에서, 각각 AT 및 AC를 함유하는 스플라이스 공여자 및 수용자 부위 쌍이 제공된다. 일부 실시양태에서, 각각 GC 및 AG를 함유하는 스플라이스 공여자 및 수용자 부위 쌍이 제공된다. 이러한 실시양태에서, 스플라이스 수용자 부위는 일반적으로 재조합 핵산 구축물에 제공되며, 스플라이스 공여자 부위는 (재조합적으로 제공된 것과 반대로) 게놈의 자연 부위이다.
도 5b는 그의 3' 말단이 뉴클레아제와 상호작용하는 RNA 상호작용성 절편에 연결된 인트론의 3' 말단에 스플라이스 수용자 부위를 갖는 키메라 RNA 부분의 비-제한적인 실시양태를 설명한다.
변형된 RNA-가이드된 뉴클레아제:
일부 실시양태에서, 변형된 뉴클레아제를 본원에 기술된 키메라 스플라이싱된 RNA 분자에 의해 게놈 표적 부위로 가이드할 수 있다. 일부 실시양태에서, 변형된 뉴클레아제는 효소적으로 불활성일 수 있다 (예를 들어, 이것은 DNA를 절단하지 않는다). 일부 실시양태에서, 효소적으로 불활성인 뉴클레아제는 엑손 (예를 들어, 키메라 스플라이싱된 RNA 분자에 포함된 엑손)에 대한 게놈 좌위와 연관된 키메라 스플라이싱된 RNA 분자에 결합하며 변형된 뉴클레아제가 결합된 부위 이후의 전사 효율을 감소시키거나 막도록 전사 차단(transcriptional block)으로서 작용할 수 있다. 도 9는 재조합 핵산 통합, 전사, 및 스플라이싱이 도 1에 도시된 것과 동일한, 본원에 기술된 시스템의 비-제한적인 실시양태를 도시한다. 그러나, 세포에 존재하는 뉴클레아제는 키메라 스플라이싱된 RNA에 결합하나, 연관된 게놈 서열을 절단하지 않는 변형된 뉴클레아제이다.
결합할 수 있고 전사를 막거나 전사 효율을 감소시킬 수 있는 변형된 뉴클레아제가 세포의 유전자 좌위 (또는 유전자 좌위의 다수의 대립유전자)의 두 대립유전자에 작용할 수 있음이 이해되어야 한다. 따라서, 본원에 기술된 방법 및 조성물을 세포의 유전자 좌위의 하나 이상의 대립유전자를 침묵시키는 데에 사용할 수 있다.
일부 실시양태에서, 상이한 게놈 좌위 (예를 들어, 상이한 유전자의 인트론으로, 및/또는 하나 이상의 유전자의 상이한 인트론으로)로 통합된 삽입성 구축물을 갖는 숙주 세포의 라이브러리를 생성할 수 있다. 라이브러리의 상이한 숙주 세포는 각 숙주 세포 내의 독립적 통합 사건의 수 및 장소에 따라, 하나 이상의 침묵 유전자 좌위 (예를 들어, 2, 3, 4, 5, 이상)를 가질 수 있다. 일부 실시양태에서, 본원에 기술된 숙주 세포의 라이브러리를 관심 표현형 (예를 들어, 하나 이상의 치료적 화합물에 대한 반응 또는 민감성)과 연관된 하나 이상의 유전자 좌위를 식별하도록 스크리닝할 수 있다.
일부 실시양태에서, 변형된 뉴클레아제는 효소적으로 불활성화되는 것에 더하여, 또는 그 대신, 하나 이상의 신규한 기능을 가질 수 있다. 일부 실시양태에서, 뉴클레아제를 검출가능한 모이어티(moiety)를 포함하도록 변형할 수 있다. 일부 실시양태에서, 뉴클레아제를 추가적인 펩티드 절편을 포함하도록 변형할 수 있다. 추가적인 펩티드 절편을 N-말단, C-말단, 및/또는 뉴클레아제의 N-말단 및 C-말단 위치 사이에 부착할 수 있다. 일부 실시양태에서, 추가적인 펩티드 절편은 이펙터 기능을 갖는 도메인이다. 일부 실시양태에서, 추가적인 펩티드 절편은 링커(linker) 펩티드를 포함한다. 일부 실시양태에서, 이펙터 기능은 효소적 기능 및/또는 조절 기능이다. 이펙터 기능의 비-제한적인 예는: 전사 증진, 전사 억제, 메틸화 (예를 들어, DNA 및/또는 DNA-연관 단백질의 메틸화), 탈메틸화 (예를 들어, DNA 및/또는 DNA-연관 단백질의 탈메틸화), 다른 DNA 또는 RNA 변형 활성, 하나 이상의 조절 단백질과의 결합, 및/또는 본 개시내용의 양태가 본 측면으로 제한되지 않음에 따라 다른 기능을 포함한다.
따라서, 본원에 기술된 방법 및 조성물을 또한, 각각 상이한 유전자 좌위 (예를 들어, 상이한 유전자의 인트론 및/또는 하나 이상의 유전자의 상이한 인트론)에 표적화되는 이펙터 기능을 갖는 변형된 뉴클레아제를 갖는, 숙주 세포의 라이브러리를 생산하는 데에 사용할 수 있다. 관심 특성을 갖는 하나 이상의 세포를 식별하도록, 본원에 기술된 바와 같이 이들 숙주 세포를 스크리닝할 수 있음이 이해되어야 한다.
일부 실시양태에서, 본원에 기술된 조성물 및 방법을, 단일 세포 또는 복수의 세포 (예를 들어 세포 배양물)의 하나 이상의 좌위 (예를 들어, 본원에 기술된 바와 같이, 하나 이상의 좌위의 하나 이상의 대립유전자)에 변형 (예를 들어, 돌연변이)을 도입하는 데에 사용할 수 있다. 일부 실시양태에서, 변형된 세포 (예를 들어, 본원에 기술된 바와 같이 변형된, 배아 또는 다른 줄기 세포)를 원래 세포의 변형 (예를 들어 하나 이상의 돌연변이)을 갖는 다세포성 유기체를 생성하는 데에 사용할 수 있다.
일부 실시양태에서, 본원에 기술된 조성물 또는 방법을 다세포성 유기체의 하나 이상의 세포를 변형하는 데에 사용할 수 있다. 일부 실시양태에서, 본원에 기술된 조성물을 (예를 들어, 주사 또는 다른 기술에 의해) 배아 (또는 다른 다세포성 발달 단계의 다세포성 유기체, 예를 들어 포배)로 도입할 수 있다. 이것은 모든 세포 또는 세포의 일부가 변형되는 (예를 들어, 다세포성 유기체는 하나 이상의 유전적 좌위의 하나 이상의 변형에 대한 키메라이다) 성체 다세포성 유기체를 생산하도록 하나 이상의 세포 (예를 들어, 모든 세포)의 변형을 가져올 수 있다. 상이한 변형이 발달 단계 초기에 상이한 세포로 도입되기 쉬우므로, 이 실시양태에서, 다세포성 유기체의 상이한 세포는 상이한 변형을 가질 수 있음이 이해되어야 한다.
일부 실시양태에서, 본원에 기술된 조성물 및 방법을 유년 또는 성체 다세포성 유기체의 하나 이상의 세포를 변형하는 데에 사용할 수 있다. 예를 들어, 본원에 기술된 조성물을 (예를 들어, 주사 또는 다른 기술에 의해) 유년 또는 성체 다세포성 유기체의 하나 이상의 장소에 도입할 수 있다. 각 장소에서, 하나 이상의 세포를 본원에 기술된 바와 같이 변형할 수 있다.
다세포성 유기체의 비-제한적인 예는 포유류, 새, 파충류를 포함한다. 포유류의 비-제한적인 예는 인간, 생쥐, 토끼, 래트, 양, 염소, 소, 및 말을 포함한다.
본 발명의 예시적인 실시양태가 다음의 실시예에 의해 보다 구체적으로 기술될 것이다. 이들 실시양태는 본 발명의 예이며, 당업자는 예시적인 실시양태로 제한되지 않음을 인식할 것이다.
< 실시예 >
실시예 1:
도 6은 i) 뉴클레아제 상호작용성 절편으로 스플라이싱되는 ii) 엑손에 대응하는 RNA 표적화 절편을 포함하는, 키메라 스플라이싱된 RNA를 생성하는 실험적 시스템의 비-제한적인 실시양태를 도시한다. 도 6a에 도시된 핵산 구축물은 i) 폴리아데닐화 부위 (SV40 pA)로 이어지는 ii) 뉴클레아제 상호작용성 절편 상류의 iii) 스플라이스 수용자 부위(SA) 상류의 iv) (트랜스포존 반복 - PBR을 함유하는) 개입 절편으로 이어지는 v) 스플라이스 공여자 부위(SD) 바로 상류의 vi) 실험적 표적 절편 (엑손)을 함유하는 RNA 분자의 전사를 일으킬 수 있는 프로모터 (CMV 프로모터)를 포함한다. 일부 실시양태에서, 핵산 구축물은, 제한 없이, 태그 코딩 서열 (예를 들어, MYC 에피토프(epitope)) 또는 표지(label), 단백질 코딩 서열, (예를 들어, 형광 단백질), 핵산 등에 의해 코딩된 전사체로부터 하나 이상의 단백질을 발현하도록 구성된 내부 리보솜 진입 부위(IRES) 코딩 서열을 포함하는, 하나 이상의 추가적인 구성요소를 포함할 수 있다. 이 전사된 RNA 분자가 스플라이싱된 후, 얻어진 키메라 스플라이싱된 RNA는 뉴클레아제 상호작용성 절편으로 스플라이싱된 엑손을 함유한다 (스플라이스 공여자 및 스플라이스 수용자 부위는 개입 RNA 절편과 함께 스플라이싱된다). 이 키메라 스플라이싱된 RNA의 (예를 들어, 적절한 절단 부위의 맥락에서 스플라이스 공여자 부위로 이어지는) 엑손을 함유하는 DNA 분자를 표적화하는 능력을 적절한 분석을 사용하여 평가할 수 있다. 일부 실시양태에서, 분석은 키메라 스플라이싱된 RNA가 엑손을 함유하는 DNA 분자의 절단을 촉진하는지 결정하도록 Cas9 뉴클레아제를 사용하는 것을 포함할 수 있다. 일부 실시양태에서, 분석을 (예를 들어, 독립적으로 복제되는 벡터 상의, 또는 게놈 좌위로 통합된) 도 6a의 시험 구축물 및 Cas9 뉴클레아제를 발현하는 구축물을 둘 다 포함하는 세포에서 수행할 수 있다. 도 6b는 네이세리아 메닌기티디스 Cas9 뉴클레아제를 발현할 수 있는 구축물의 비-제한적인 실시양태를 도시한다. 도 6b의 구축물은 또한 게놈 좌위로 통합된 독립적으로 복제되는 벡터 상에 있을 수 있다.
하나 이상의 선택가능 마커를 관심 숙주 세포에서 도 6a 및 도 6b의 구축물의 존재를 선택하는 데에 사용할 수 있음이 이해되어야 한다. 도 6a 및 도 6b에 나타난 마커는 각각 네오마이신 (Neo) 및 푸로마이신 (Puro) 내성 마커이다. 그러나, 본 개시내용의 양태가 본 측면으로 제한되지 않음에 따라 다른 선택가능 마커를 사용할 수 있음이 이해되어야 한다.
예컨대 도 6a에 도시된 구축물을 상이한 표적 서열, 상이한 절단 서열, 상이한 뉴클레아제 상호작용성 서열, 및/또는 다양할 수 있는 다른 인자의 효과를 평가하는 데에 사용할 수 있음이 이해되어야 한다.
실시예 2:
일부 실시양태에서, 도 6a에 도시된 구축물을, 게놈 좌위로부터 전사된 자연 엑손의 3' 말단으로 스플라이싱되는 뉴클레아제 상호작용성 절편의 능력을 평가하기 위해, 트랜스포존 말단 (PBR 및 PBL) 사이의 절편을 게놈 좌위로 (예를 들어, 인트론으로) 통합시키는 데에 사용할 수 있다. 트랜스포존 말단 사이의 절편의 게놈 통합을 트랜스포사제 (예를 들어, PBase)에 의해 촉진할 수 있다. 이것이 도 6a의 구축물의, 실시예 1에 기술된 것과 상이한 용도를 가져온다는 것이 이해되어야 한다. 실시예 1에서, 스플라이싱이 구축물의 CMV 프로모터로부터 전사되는 실험적 엑손 (엑손)과 함께 발생한다. 반대로, 게놈 인트론으로의 통합 후, 스플라이싱은 게놈 좌위로부터 전사된 자연 엑손과 함께 발생한다. 따라서, CMB 엑손-SD 부분이 통합에 요구되지 않음이 이해되어야 한다.
도 7은 숙주 세포의 하나 이상의 게놈 좌위에 돌연변이를 생성하는, 본원에 기술된 시스템의 효과를 평가하기 위한 실험적 개요의 비-제한적인 실시양태를 도시한다. 1)에서, 도 6a에 도시된 것과 같은 구축물 (예를 들어, PBR 및 PBL를 포함하는 이들 사이의 절편)을 숙주 세포의 게놈 좌위로 통합을 촉진하도록 숙주 세포로 트랜스포사제 (PBase)와 함께 공동형질감염시킨다. 2)에서, 선택가능 마커 (Puro)를 또한 코딩하는 구축물로부터 네이세리아 메닌기티데스의 Cas9 (NMCas9)를 발현하는 숙주 세포를 사용할 수 있다. 3)에서, 각각 통합된 트랜스포존 절편 (도 6a의 트랜스포존 반복 사이의 절편)을 함유하는 복수의 상이한 개별 숙주 세포 클론을 트랜스포존 절편 (Neo)에 코딩된 선택가능 마커를 사용하는 데에 선택할 수 있다. 4)에서, 상이한 숙주 세포 클론의 게놈 DNA (gDNA)를 추출할 수 있다. 5)에서, gDNA를 a) 상이한 숙주 세포 클론의 상이한 삽입 부위 (PB 삽입 부위), 및 b) 삽입 부위로부터 바로 상류의 엑손의 잠재적 절단 부위를 식별하도록 서열화할 수 있다. 6)에서, (예를 들어, 절단 부위의 오류-연관 복구 및 절단으로 야기되는) 돌연변이율을 잠재적 절단 부위에서 오류가 발견되는 빈도를 결정함으로써 계산할 수 있다. 게놈 좌위의 둘 이상의 대립유전자에서의 돌연변이율을 결정할 수 있음이 이해되어야 한다.
일부 실시양태에서, 트랜스포존 절편을 (예를 들어, 엑손에 돌연변이가 도입되고 난 후) 트랜스포사제 (예를 들어, PBase)의 추가적 작용에 의해 절제할 수 있음이 이해되어야 한다. 일부 실시양태에서, 트랜스포존 절편이 절제된 세포를, 예컨대 도 6a에 도시된 Kat 마커와 같은 트랜스포존 절편에 코딩된 추가적 마커를 포함하므로써 식별할 수 있다. Kat은 카투쉬카(Katushka) 적색 형광 단백질을 지칭하며 액틴 프로모터에 의해 조절된다. 일부 실시양태에서, Kat 전사체는, 이것이 폴리아데닐화 꼬리를 결여하였으므로, 상대적으로 세포에서 불안정함이 이해되어야 한다. 따라서, 일부 실시양태에서, 전사체를 코딩하는 핵산이 폴리아데닐화 부위 상류의 인트론으로 삽입된 경우, 전사체의 안정성은 증가할 것이다. 이 구성은 안정한 폴리아데닐화된 전사체를 갖는 세포에서만 검출 임계점을 넘어 발현될 수 있는 형광 단백질의 발현을 검출함으로써 유용한 트랜스포존 삽입을 보유하는 세포의 식별을 촉진한다. 일부 실시양태에서, 마커의 검출을 전사 단위로의 트랜스포존 삽입을 가진 세포를 식별하고(거나) 분류하는 데에 사용할 수 있다. 트랜스포사제의 추가적 작용 후 Kat이 없는 세포를 트랜스포존 절편이 절제되었는지 확인하기 위해 (예를 들어, 서열화를 통해) 추가로 평가할 수 있다. 그러나, 본 개시내용의 양태가 본 측면으로 제한되지 않음에 따라, 다른 마커 또는 기술을 트랜스포존 절편이 제거된 세포를 식별하는 데에 사용할 수 있음이 이해되어야 한다.
실시예 3:
도 9는 삽입성 재조합 핵산의 서열의 비-제한적인 실시예를 제공한다. 재조합 핵산은 RNA-가이드된 뉴클레아제와 상호작용할 수 있는 RNA 절편을 코딩하는 핵산 영역 상류의 스플라이스 수용자 부위를 포함한다.
도 10은 Cas9 뉴클레아제를 발현하도록 조작된 핵산의 서열의 비-제한적인 실시예를 제공한다.
본 발명의 여러 실시양태가 본원에 설명 및 도시되었지만, 당업자는 본원에 기술된 하나 이상의 장점 및/또는 결과를 얻고(거나) 기능을 수행하는 다양한 다른 수단 및/또는 구조를 쉽게 구상할 것이며, 이러한 각 변이 및/또는 변형은 본 발명의 범위 내인 것으로 여겨진다. 보다 일반적으로, 당업자는 본원에 기술된 모든 파라미터, 치수, 재료, 및 구성이 예시적임을 의미하며 실제 파라미터, 치수, 재료, 및/또는 구성이 특정 적용 또는 본 발명의 교시가 사용되는 적용에 의존할 것임을 쉽게 이해할 것이다. 당업자는 통상의 실험 이상을 사용하지 않고 본원에 기술된 본 발명의 구체적 실시양태에 대한 많은 균등물을 인식 또는 확인할 수 있을 것이다. 따라서, 앞선 실시양태는 오직 실시예의 방식으로 나타나며, 첨부된 청구항 및 그 균등물의 범위 내에서, 본 발명을 구체적으로 기술되고 청구된 바와 다르게 실시할 수 있음이 이해된다. 본 발명은 본원에 기술된 각 개별 특성, 시스템, 물건, 재료, 및/또는 방법과 관련된다. 이에 더해, 이러한 특성, 시스템, 물건, 재료, 및/또는 방법 중 둘 이상의 임의의 조합은, 만일 이러한 특성, 시스템, 물건, 재료, 및/또는 방법이 상호 불일치하지 않으면, 본 발명의 범위 내에 포함된다.
명세서 및 청구항에서 본원에 사용된 "한" 및 "하나"는 (부정 관사 "a" 및 "an"), 명백히 달리 지시되지 않는 한, "하나 이상"을 의미하는 것으로 이해되어야 한다.
명세서 및 청구항에서 본원에 사용된 구 "및/또는"은, 결합된 구성요소, 즉, 일부 경우에서 결합하여 존재하고 다른 경우에서 분리되어 존재하는 구성요소의 "둘 중 하나 또는 둘 다"를 의미하는 것으로 이해되어야 한다. 다른 구성요소는, 명백히 달리 지시되지 않는 한 구체적으로 식별된 이들 구성요소와 관련되거나 관련되지 않는지에 따라, "및/또는" 절에 의해 구체적으로 식별된 구성요소 외에 임의로 존재할 수 있다. 따라서, 비-제한적인 실시예로서, 예컨대 "포함하는"과 같은 개방형 언어와 함께 사용될 때, "A 및/또는 B"에 대한 언급은, 한 실시양태에서, B가 없는 A (임의로 B 외의 구성요소를 포함); 또 다른 실시양태에서, A가 없는 B (임의로 A 외의 구성요소를 포함); 또 다른 실시양태에서, A 및 B를 모두 (임의로 다른 구성요소를 포함); 등을 지칭할 수 있다.
명세서 및 청구항에서 본원에 사용된 바와 같이, "또는"은 상기에 정의된 바와 같은 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록 내 항목을 분리할 때, "또는" 또는 "및/또는"은 포함하는 것, 즉, 구성요소 다수 또는 목록의 적어도 하나, 뿐만 아니라 하나 초과 및, 임의로, 나열되지 않은 추가적인 항목을 포함하는 것으로 해석되어야 한다. 명백히 달리 지시된 용어만이, 예컨대 "...중 오직 하나" 또는 "정확히 하나", 또는, 청구항에서 사용될 때, "구성되는"은, 구성요소 다수 또는 목록 중 정확히 한 구성요소의 포함을 지칭할 것이다. 일반적으로, 본원에 사용된 용어 "또는"은, 예컨대 "둘 중 하나," "...중 하나" "...중 오직 하나" 또는 "...중 정확히 하나"와 같은 배타성의 용어가 선행될 때, 오직 배타적인 대안 (즉, "하나 또는 다른 하나이고 둘은 아님")을 나타내는 것으로 해석되어야 한다. "...로 필수적으로 구성되는"이 청구항에 사용될 때, 특허법의 분야에서 사용되는 바와 같은 그것의 본래 의미를 가져야 한다.
명세서 및 청구항에서 본원에 사용된 바와 같이, 하나 이상의 구성요소의 목록의 언급 중 구 "하나 이상"은, 구성요소의 목록 중 임의의 하나 이상의 구성요소로부터 선택된 하나 이상의 구성요소를 의미하는 것으로 이해되어야 하지만, 구성요소의 목록 내 구체적으로 나열된 하나 이상의 각각 및 모든 구성요소를 포함할 필요는 없고, 구성요소의 목록 중 구성요소의 임의의 조합을 배제하는 것도 아니다. 이 정의는 또한 구성요소가 구 "하나 이상"이, 구체적으로 식별된 이들 구성요소와 관련되거나 관련되지 않든지, 지칭하는 구성요소의 목록 내에서 구체적으로 식별된 구성요소 외의 것으로 임의로 존재할 수 있음을 허용한다. 따라서, 비-제한적인 실시예로서, "A 및 B 중 하나 이상" (또는, 동등하게, "A 또는 B 중 하나 이상" 또는, 동등하게 "A 및/또는 B 중 하나 이상")은, 한 실시양태에서, B 없이 하나 이상 (임의로 하나 초과를 포함)의 A (및 임의로 B 외의 구성요소를 포함); 또 다른 실시양태에서, A 없이 하나 이상 (임의로 하나 초과를 포함)의 B (및 임의로 A 외의 구성요소를 포함); 또 다른 실시양태에서, 하나 이상 (임의로 하나 초과를 포함)의 A 및 하나 이상 (임의로 하나 초과를 포함)의 B (및 임의로 다른 구성요소를 포함); 등을 지칭할 수 있다.
상기 명세서뿐만 아니라 청구항에서, 모든 연결구 예컨대 "구성하는(comprising)", "포함하는(including)", "수반하는(carrying)", "갖는(having)", "함유하는(containing)", "관여하는(involving)", "유지하는(holding)", 등은 개방형, 즉, 포함하지만 이로 제한되지는 않는 것으로 이해되어야 한다. 미국 특허청 심사지침서, 2111.03 부문에서 제시한 바와 같이, 연결구 "...로 구성되는" 및 "...로 필수적으로 구성되는" 만이 각각 폐쇄형 또는 반-폐쇄형 연결구가 될 것이다.
청구항에서 청구항 구성요소를 변형하기 위한 서수 용어의 사용, 예컨대 "제1," "제2," "제3," 등은, 임의의 우선권, 선행, 또는 한 청구항 구성요소의 다른 것에 대한 순서 또는 방법의 동작이 수행되는 일시적인 순서를 그 자체로 내포하는 것은 아니며, 청구항 구성요소를 구별하기 위해, 단지 특정 명칭을 갖는 한 청구항 구성요소를 동일 명칭을 갖는 (그러나 서수 용어의 사용을 위한) 또 다른 구성요소와 구별하기 위한 표지로서 사용된다.
SEQUENCE LISTING <110> LAM Therapeutics, Inc. <120> MUTAGENESIS METHODS <130> L0769.70000WO00 <150> US 61/927,458 <151> 2014-01-14 <160> 23 <170> PatentIn version 3.5 <210> 1 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 1 guuuuagagc uagaaauagc aaguuaaaau 30 <210> 2 <211> 40 <212> RNA <213> N. meningitidis <400> 2 guuguagcuc ccuuucucga aagagaaccg uugcuacaau 40 <210> 3 <211> 44 <212> RNA <213> N. meningitidis <400> 3 guuguagcuc ccuuucucga aagagaaccg uugcuacaau aagg 44 <210> 4 <211> 101 <212> RNA <213> N. meningitidis <400> 4 guuguagcuc ccuuucucga aagagaaccg uugcuacaau aaggccgucu gaaaagaugu 60 gccgcaacgc ucugccccuu aaagcuucug cuuuaacggg c 101 <210> 5 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 5 ctttggaaga acaacttaag gtcagattat tttgcttagt aaact 45 <210> 6 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 6 agcagctgaa acagtgcaga gtaagatttt tatatgatgc cttta 45 <210> 7 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 7 cuaauuccuc ucuucuccuc ucuccagguu guag 34 <210> 8 <211> 36 <212> RNA <213> S. pyogenes <400> 8 guuuuagagc uaugcuguuu ugaauggucc caaaac 36 <210> 9 <211> 38 <212> RNA <213> S. pyogenes <400> 9 uuguuggaac cauucaaaac agcauagcaa guuaaaau 38 <210> 10 <211> 36 <212> RNA <213> N. meningitidis <400> 10 guuguagcuc ccuuucucau uucgcagugc uacaau 36 <210> 11 <211> 36 <212> RNA <213> N. meningitidis <400> 11 auugucgcac ugcgaaauga gaaccguugc uacaau 36 <210> 12 <211> 36 <212> RNA <213> S. thermophilus <400> 12 guuuuuguac ucucaagauu uaaguaacug uacaac 36 <210> 13 <211> 37 <212> RNA <213> S. thermophilus <400> 13 cuuacacagu uacuuaaauc uugcagaagc uacaaag 37 <210> 14 <211> 36 <212> RNA <213> T. denticola <400> 14 guuugagagu uguguaauuu aagauggauc ucaaac 36 <210> 15 <211> 38 <212> RNA <213> T. denticola <400> 15 auuuaagauc caucuuaaau uacacaacga guucaaau 38 <210> 16 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 16 guuguagcuc ccuuucuc 18 <210> 17 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 17 gagaaccguu gcuacaau 18 <210> 18 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or u <220> <221> misc_feature <222> (3)..(3) <223> n is a, c, g, or u <220> <221> misc_feature <222> (5)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (7)..(7) <223> n is a, c, g, or u <220> <221> misc_feature <222> (9)..(9) <223> n is a, c, g, or u <220> <221> misc_feature <222> (12)..(12) <223> n is a, c, g, or u <220> <221> misc_feature <222> (15)..(17) <223> n is a, c, g, or u <220> <221> misc_feature <222> (20)..(21) <223> 3' splice site <400> 18 nsnunbnbnb bnbbnnnhag vh 22 <210> 19 <211> 7113 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 19 ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 60 ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg 120 ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 180 ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 240 ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 300 gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 360 tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 420 ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc cattcgccat tcaggctgcg 480 caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 540 gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 600 taaaacgacg gccagtgagc gcgcgtaata cgactcacta tagggcgaat tggagctcca 660 ccgcggccgc ccggtttatc gttaatatgg atcaatttga acagttgatt aacgtgtctc 720 tgctcaagtc tttgatcaaa acgcaaatcg acgaaaatgt gtcggacaat atcaagtcga 780 tgagcgaaaa actaaaaagg ctagaatacg acaatctcac agacagcgtt gagatatacg 840 gtattcacga cagcaggctg aataataaaa aaattagaaa ctattattta accctagaaa 900 gataatcata ttgtgacgta cgttaaagat aatcatgcgt aaaattgacg catgtgtttt 960 atcggtctgt atatcgaggt ttatttatta atttgaatag atattaagtt ttattatatt 1020 tacacttaca tactaataat aaattcaaca aacaatttat ttatgtttat ttatttatta 1080 aaaaaaaaca aaaactcaaa atttcttcta taaagtaaca aaacttttaa acattctctc 1140 ttttacaaaa ataaacttat tttgtacttt aaaaacagtc atgttgtatt ataaaataag 1200 taattagctt aacttataca taatagaaac aaattatact tattagtcag tcagaaacaa 1260 ctttggcaca tatcaatatt atgctctcga caaataactt ttttgcattt tttgcacgat 1320 gcatttgcct ttcgccttat tttagagggg cagtaagtac agtaagtacg ttttttcatt 1380 actggctctt cagtactgtc atctgatgta ccaggcactt catttggcaa aatattagag 1440 atattatcgc gcaaatatct cttcaaagta ggagcttcta aacgcttacg cataaacgat 1500 gacgtcaggc tcatgtaaag gtttctcata aattttttgc gactttgaac cttttctccc 1560 ttgctactga cattatggct gtatataata aaagaattta tgcaggcaat gtttatcatt 1620 ccgtacaata atgccatagg ccacctattc gtcttcctac tgcaggtcat cacagaacac 1680 atttggtcta gcgtgtccac tccgccttta gtttgattat aatacataac catttgcggt 1740 ttaccggtac tttcgttgat agaagcatcc tcatcacaag atgataataa gtataccatc 1800 ttagctggct tcggtttata tgagacgaga gtaaggggtc cgtcaaaaca aaacatcgat 1860 gttcccactg gcctggagcg actgtttttc agtacttccg gtatctcgcg tttgtttgat 1920 cgcacggttc ccacaatggt taattcgagc tcgcccaaac cgggcgcgcc taattcctct 1980 cttctcctct ctccaggttg tagctccctt tctcgaaaga gaaccgttgc tacaataagg 2040 ccgtctgaaa agatgtgccg caacgctctg ccccttaaag cttctgcttt aacgggcaat 2100 aaaatatctt tattttcatt acatctgtgt gttggttttt tgtgtgggat ccggctgtgg 2160 aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa 2220 agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc cccagcaggc 2280 agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc cctaactccg 2340 cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg ctgactaatt 2400 ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca gaagtagtga 2460 ggaggctttt ttggaggcct aggcttttgc aaaaagcttg ggctgcaggt cgaggcggat 2520 ctgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga ttgcacgcag 2580 gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg 2640 gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca 2700 agaccgacct gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc 2760 tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg 2820 actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg 2880 ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta 2940 cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag 3000 ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac 3060 tgttcgccag gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg acccatggcg 3120 atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg 3180 gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg 3240 aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg 3300 attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgagcg ggactctggg 3360 gttcgataaa ataaaagatt ttatttagtc tccagaaaaa ggggggaatg aaagacccca 3420 cctgtaggtt tggcaagcta gcttaagtaa cgccattttg caaggcatgg aaaaatacat 3480 aactgagaat agagaagttc agatcaaggt caggaacaga tggaacagct gaatatgggc 3540 caaacaggat atctgtggta agcagttcct gccccggctc agggccaaga acagatggaa 3600 cagctgaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 3660 caagaacaga tggtccccag atgcggtcca gccctcagca gtttctagag aaccatcaga 3720 tgtttccagg gtgccccaag gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc 3780 agttcgcttc tcgcttctgt tcgcgcgctt ctgctccccg agctcaataa aagagcccac 3840 aacccctcac tcggggcgcc agtcctccga ttgactgagt cgcccagctt ggcgtaatca 3900 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 3960 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 4020 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagcg gatcgatctg 4080 acaatgttca gtgcagagac tcggctacgc ctcgtggact ttgaagttga ccaacaatgt 4140 ttattcttac ctctaatagt cctctgtggc aaggtcaaga ttctgttaga agccaatgaa 4200 gaacctggtt gttcaataac attttgttcg tctaatattt cactaccgct tgacgttggc 4260 tgcacttcat gtacctcatc tataaacgct tcttctgtat cgctctggac gtcatcttca 4320 cttacgtgat ctgatatttc actgtcagaa tcctcaccaa caagctcgtc atcgctttgc 4380 agaagagcag agaggatatg ctcatcgtct aaagaactac ccattttatt atatattagt 4440 cacgatatct ataacaagaa aatatatata taataagtta tcacgtaagt agaacatgaa 4500 ataacaatat aattatcgta tgagttaaat cttaaaagtc acgtaaaaga taatcatgcg 4560 tcattttgac tcacgcggtc gttatagttc aaaatcagtg acacttaccg cattgacaag 4620 cacgcctcac gggagctcca agcggcgact gagatgtcct aaatgcacag cgacggattc 4680 gcgctattta gaaagagaga gcaatatttc aagaatgcat gcgtcaattt tacgcagact 4740 atctttctag ggttaaaaaa gatttgcgct ttactcgacc taaactttaa acacgtcata 4800 gaatcttcgt ttgacaaaaa ccacattgtg gccaagctgt gtgacgcgac gcgcgctaaa 4860 gaatggcaaa ccaagtcgcg cgagcgtcga cctcgagggg gggcccggta cccagctttt 4920 gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 4980 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 5040 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 5100 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 5160 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 5220 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 5280 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 5340 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 5400 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 5460 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 5520 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 5580 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 5640 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 5700 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 5760 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 5820 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 5880 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 5940 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6000 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6060 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 6120 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 6180 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 6240 gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 6300 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 6360 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 6420 gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 6480 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 6540 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 6600 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 6660 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 6720 gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 6780 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 6840 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 6900 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 6960 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7020 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7080 gggttccgcg cacatttccc cgaaaagtgc cac 7113 <210> 20 <211> 8387 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 20 ggcctaactg gccggtacct gagctcgcta gcctcgagga tatcaagatc tcccgatccc 60 ctatggtcga ctctcagtac aatctgctct gatgccgcat agttaagcca gtatctgctc 120 cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca aaatttaagc tacaacaagg 180 caaggcttga ccgacaattg catgaagaat ctgcttaggg ttaggcgttt tgcgctgctt 240 cgggggtgag gctccggtgc ccgtcgtgag gctccggtgc ccgtcagtgg gcagagcgca 300 catcgcccac agtccccgag aagttggggg gaggggtcgg caattgaacc ggtgcctaga 360 gaaggtggcg cggggtaaac tgggaaagtg atgtcgtgta ctggctccgc ctttttcccg 420 agggtggggg agaaccgtat ataagtgcag tagtcgccgt gaacgttctt tttcgcaacg 480 ggtttgccgc cagaacacag gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta 540 cgggttatgg cccttgcgtg ccttgaatta cttccacctg gctccagtac gtgattcttg 600 atcccgagct ggagccaggg gcgggccttg cgctttagga gccccttcgc ctcgtgcttg 660 agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc accttcgcgc 720 ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac ctgctgcgac 780 gctttttttc tggcaagata gtcttgtaaa tgcgggccag gatctgcaca ctggtatttc 840 ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat gttcggcgag 900 gcggggcctg cgagcgcggc caccgagaat cggacggggg tcggacgggg gtagtctcaa 960 gctggccggc ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg 1020 gcaaggctgg cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct 1080 gctccagggg gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc 1140 acacaaagga aaggggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac 1200 cgggcgccgt ccaggcacct cgattagttc tggagctttt ggagtacgtc gtctttaggt 1260 tggggggagg ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt 1320 aggccagctt ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct 1380 tggttcattc tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg 1440 tgaacaccgc caccatggtg cctaagaaga agagaaaggt ggctgccttc aaacctaatt 1500 caatcaacta catcctcggc ctcgatatcg gcatcgcatc cgtcggctgg gcgatggtag 1560 aaattgacga agaagaaaac cccatccgcc tgattgattt gggcgtgcgc gtatttgagc 1620 gtgccgaagt accgaaaaca ggcgactccc ttgccatggc aaggcgtttg gcgcgcagtg 1680 ttcgccgcct gacccgccgt cgcgcccacc gcctgcttcg gacccgccgc ctattgaaac 1740 gcgaaggcgt attacaagcc gccaattttg acgaaaacgg cttgattaaa tccttaccga 1800 atacaccatg gcaacttcgc gcagccgcat tagaccgcaa actgacgcct ttagagtggt 1860 cggcagtctt gttgcattta atcaaacatc gcggctattt atcgcaacgg aaaaacgagg 1920 gcgaaactgc cgataaggag cttggcgctt tgcttaaagg cgtagccggc aatgcccatg 1980 ccttacagac aggcgatttc cgcacaccgg ccgaattggc tttaaataaa tttgagaaag 2040 aaagcggcca tatccgcaat cagcgcagcg attattcgca tacgttcagc cgcaaagatt 2100 tacaggcgga gctgattttg ctgtttgaaa aacaaaaaga atttggcaat ccgcatgttt 2160 caggcggcct taaagaaggt attgaaaccc tactgatgac gcaacgccct gccctgtccg 2220 gcgatgccgt tcaaaaaatg ttggggcatt gcaccttcga accggcagag ccgaaagccg 2280 ctaaaaacac ctacacagcc gaacgtttca tctggctgac caagctgaac aacctgcgta 2340 ttttagagca aggcagcgag cggccattga ccgataccga acgcgccacg cttatggacg 2400 agccatacag aaaatccaaa ctgacttacg cacaagcccg taagctgctg ggtttagaag 2460 ataccgcctt tttcaaaggc ttgcgctatg gtaaagacaa tgccgaagcc tcaacattga 2520 tggaaatgaa ggcctaccat gccatcagcc gtgcactgga aaaagaagga ttgaaagaca 2580 aaaaatcccc attaaacctt tctcccgaat tacaagacga aatcggcacg gcattctccc 2640 tgttcaaaac cgatgaagac attacaggcc gtctgaaaga ccgtatacag cccgaaatct 2700 tagaagcgct gttgaaacac atcagcttcg ataagttcgt ccaaatttcc ttgaaagcat 2760 tgcgccgaat tgtgcctcta atggaacaag gcaaacgtta cgatgaagcc tgcgccgaaa 2820 tctacggaga ccattacggc aagaagaata cggaagaaaa gatttatctg ccgccgattc 2880 ccgccgacga aatccgcaac cccgtcgtct tgcgcgcctt atctcaagca cgtaaggtca 2940 ttaacggcgt ggtacgccgt tacggctccc cagctcgtat ccatattgaa actgcaaggg 3000 aagtaggtaa atcgtttaaa gaccgcaaag aaattgagaa acgccaagaa gaaaaccgca 3060 aagaccggga aaaagccgcc gccaaattcc gagagtattt ccccaatttt gtcggagaac 3120 ccaaatccaa agatattctg aaactgcgcc tgtacgagca acaacacggc aaatgcctgt 3180 attcgggcaa agaaatcaac ttaggccgtc tgaacgaaaa aggctatgtc gaaatcgacc 3240 atgccctgcc gttctcgcgc acatgggacg acagtttcaa caataaagta ctggtattgg 3300 gcagcgaaaa ccaaaacaaa ggcaatcaaa ccccttacga atacttcaac ggcaaagaca 3360 acagccgcga atggcaggaa tttaaagcgc gtgtcgaaac cagccgtttc ccgcgcagta 3420 aaaaacaacg gattctgctg caaaaattcg atgaagacgg ctttaaagaa cgcaatctga 3480 acgacacgcg ctacgtcaac cgtttcctgt gtcaatttgt tgccgaccgt atgcggctga 3540 caggtaaagg caagaaacgt gtctttgcat ccaacggaca aattaccaat ctgttgcgcg 3600 gcttttgggg attgcgcaaa gtgcgtgcgg aaaacgaccg ccatcacgcc ttggacgccg 3660 tcgtcgttgc ctgctcgacc gttgccatgc agcagaaaat tacccgtttt gtacgctata 3720 aagagatgaa cgcgtttgac ggtaaaacca tagacaaaga aacaggagaa gtgctgcatc 3780 aaaaaacaca cttcccacaa ccttgggaat ttttcgcaca agaagtcatg attcgcgtct 3840 tcggcaaacc ggacggcaaa cccgaattcg aagaagccga taccctagaa aaactgcgca 3900 cgttgcttgc cgaaaaatta tcatctcgcc ccgaagccgt acacgaatac gttacgccac 3960 tgtttgtttc acgcgcgccc aatcggaaga tgagcgggca agggcatatg gagaccgtca 4020 aatccgccaa acgactggac gaaggcgtca gcgtgttgcg cgtaccgctg acacagttaa 4080 aactgaaaga cttggaaaaa atggtcaatc gggagcgcga acctaagcta tacgaagcac 4140 tgaaagcacg gctggaagca cataaagacg atcctgccaa agcctttgcc gagccgtttt 4200 acaaatacga taaagcaggc aaccgcaccc aacaggtaaa agccgtacgc gtagagcaag 4260 tacagaaaac cggcgtatgg gtgcgcaacc ataacggtat tgccgacaac gcaaccatgg 4320 tgcgcgtaga tgtgtttgag aaaggcgaca agtattatct ggtaccgatt tacagttggc 4380 aggtagcgaa agggattttg ccggataggg ctgttgtaca aggaaaagat gaagaagatt 4440 ggcaacttat tgatgatagt ttcaacttta aattctcatt acaccctaat gatttagtcg 4500 aggttataac aaaaaaagct agaatgtttg gttactttgc cagctgccat cgaggcacag 4560 gtaatatcaa tatacgcatt catgatcttg atcataaaat tggcaaaaat ggaatactgg 4620 aaggtatcgg cgtcaaaacc gccctttcat tccaaaaata ccaaattgac gaactgggca 4680 aagaaatcag accatgccgt ctgaaaaaac gcccgcctgt ccgttaccca tacgatgttc 4740 cagattacgc tgcagctcca gcagcgaaga aaaagaagct ggattaactc gctgatcagc 4800 ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 4860 gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 4920 ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 4980 ggattgggaa gacaatagca gggatccgtt tgcgtattgg gcgctcttcc gctgatctgc 5040 gcagcaccat ggcctgaaat aacctctgaa agaggaactt ggttagctac cttctgaggc 5100 ggaaagaacc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 5160 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 5220 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 5280 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 5340 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc tgcctctgag 5400 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagctcgat 5460 tcttctgaca ctagcgccac catgaccgag tacaagccta ccgtgcgcct ggccactcgc 5520 gatgatgtgc cccgcgccgt ccgcactctg gccgccgctt tcgccgacta ccccgctacc 5580 cggcacaccg tggaccccga ccggcacatc gagcgtgtga cagagttgca ggagctgttc 5640 ctgacccgcg tcgggctgga catcggcaag gtgtgggtag ccgacgacgg cgcggccgtg 5700 gccgtgtgga ctacccccga gagcgttgag gccggcgccg tgttcgccga gatcggcccc 5760 cgaatggccg agctgagcgg cagccgcctg gccgcccagc agcaaatgga gggcctgctt 5820 gccccccatc gtcccaagga gcctgcctgg tttctggcca ctgtaggagt gagccccgac 5880 caccagggca agggcttggg cagcgccgtc gtgttgcccg gcgtagaggc cgccgaacgc 5940 gccggtgtgc ccgcctttct cgaaacaagc gcaccaagaa accttccatt ctacgagcgc 6000 ctgggcttca ccgtgaccgc cgatgtcgag gtgcccgagg gacctaggac ctggtgtatg 6060 acacgaaaac ctggcgccta atgatctaga accggtcatg gccgcaataa aatatcttta 6120 ttttcattac atctgtgtgt tggttttttg tgtgttcgaa ctagatgctg tcgaccgatg 6180 cccttgagag ccttcaaccc agtcagctcc ttccggtggg cgcggggcat gactatcgtc 6240 gccgcactta tgactgtctt ctttatcatg caactcgtag gacaggtgcc ggcagcgctc 6300 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 6360 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 6420 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 6480 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 6540 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 6600 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 6660 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 6720 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 6780 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 6840 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 6900 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 6960 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 7020 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 7080 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 7140 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 7200 atcaatctaa agtatatatg agtaaacttg gtctgacagc ggccgcaaat gctaaaccac 7260 tgcagtggtt accagtgctt gatcagtgag gcaccgatct cagcgatctg cctatttcgt 7320 tcgtccatag tggcctgact ccccgtcgtg tagatcacta cgattcgtga gggcttacca 7380 tcaggcccca gcgcagcaat gatgccgcga gagccgcgtt caccggcccc cgatttgtca 7440 gcaatgaacc agccagcagg gagggccgag cgaagaagtg gtcctgctac tttgtccgcc 7500 tccatccagt ctatgagctg ctgtcgtgat gctagagtaa gaagttcgcc agtgagtagt 7560 ttccgaagag ttgtggccat tgctactggc atcgtggtat cacgctcgtc gttcggtatg 7620 gcttcgttca actctggttc ccagcggtca agccgggtca catgatcacc catattatga 7680 agaaatgcag tcagctcctt agggcctccg atcgttgtca gaagtaagtt ggccgcggtg 7740 ttgtcgctca tggtaatggc agcactacac aattctctta ccgtcatgcc atccgtaaga 7800 tgcttttccg tgaccggcga gtactcaacc aagtcgtttt gtgagtagtg tatacggcga 7860 ccaagctgct cttgcccggc gtctatacgg gacaacaccg cgccacatag cagtactttg 7920 aaagtgctca tcatcgggaa tcgttcttcg gggcggaaag actcaaggat cttgccgcta 7980 ttgagatcca gttcgatata gcccactctt gcacccagtt gatcttcagc atcttttact 8040 ttcaccagcg tttcggggtg tgcaaaaaca ggcaagcaaa atgccgcaaa gaagggaatg 8100 agtgcgacac gaaaatgttg gatgctcata ctcgtccttt ttcaatatta ttgaagcatt 8160 tatcagggtt actagtacgt ctctcaagga taagtaagta atattaaggt acgggaggta 8220 ttggacaggc cgcaataaaa tatctttatt ttcattacat ctgtgtgttg gttttttgtg 8280 tgaatcgata gtactaacat acgctctcca tcaaaacaaa acgaaacaaa acaaactagc 8340 aaaataggct gtccccagtg caagtgcagg tgccagaaca tttctct 8387 <210> 21 <211> 1081 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 21 Ala Ala Phe Lys Pro Asn Ser Ile Asn Tyr Ile Leu Gly Leu Asp Ile 1 5 10 15 Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu Glu 20 25 30 Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg Ala 35 40 45 Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu Ala 50 55 60 Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu Arg 65 70 75 80 Thr Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asn Phe 85 90 95 Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln Leu 100 105 110 Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser Ala 115 120 125 Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg Lys 130 135 140 Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys Gly 145 150 155 160 Val Ala Gly Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr Pro 165 170 175 Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile Arg 180 185 190 Asn Gln Arg Ser Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu Gln 195 200 205 Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn Pro 210 215 220 His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met Thr 225 230 235 240 Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly His 245 250 255 Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr Thr 260 265 270 Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile Leu 275 280 285 Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr Leu 290 295 300 Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala Arg 305 310 315 320 Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg Tyr 325 330 335 Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala Tyr 340 345 350 His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys Lys 355 360 365 Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr Ala 370 375 380 Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys Asp 385 390 395 400 Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser Phe 405 410 415 Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val Pro 420 425 430 Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile Tyr 435 440 445 Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu Pro 450 455 460 Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala Leu 465 470 475 480 Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly Ser 485 490 495 Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser Phe 500 505 510 Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys Asp 515 520 525 Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe Val 530 535 540 Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu Gln 545 550 555 560 Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly Arg 565 570 575 Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe Ser 580 585 590 Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly Ser 595 600 605 Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn Gly 610 615 620 Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu Thr 625 630 635 640 Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys Phe 645 650 655 Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr Val 660 665 670 Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr Gly 675 680 685 Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn Leu 690 695 700 Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp Arg 705 710 715 720 His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala Met 725 730 735 Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala Phe 740 745 750 Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln Lys 755 760 765 Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met Ile 770 775 780 Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala Asp 785 790 795 800 Thr Leu Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser Arg 805 810 815 Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg Ala 820 825 830 Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys Ser 835 840 845 Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu Thr 850 855 860 Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg Glu 865 870 875 880 Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys Asp 885 890 895 Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys Ala 900 905 910 Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val Gln 915 920 925 Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn Ala 930 935 940 Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr Leu 945 950 955 960 Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp Arg 965 970 975 Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp Asp 980 985 990 Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu Val 995 1000 1005 Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys His 1010 1015 1020 Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp His 1025 1030 1035 Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys Thr 1040 1045 1050 Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys Glu 1055 1060 1065 Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg 1070 1075 1080 <210> 22 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 22 Met Thr Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val 1 5 10 15 Pro Arg Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala 20 25 30 Thr Arg His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu 35 40 45 Leu Gln Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val 50 55 60 Trp Val Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu 65 70 75 80 Ser Val Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala 85 90 95 Glu Leu Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu 100 105 110 Leu Ala Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val 115 120 125 Gly Val Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val 130 135 140 Leu Pro Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu 145 150 155 160 Glu Thr Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe 165 170 175 Thr Val Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys 180 185 190 Met Thr Arg Lys Pro Gly Ala 195 <210> 23 <211> 286 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 23 Trp His Lys Ile Leu Ser Ala Gly Ile Glu Ala Ile Gln Arg Asn Arg 1 5 10 15 Glu Asp Met Thr Ala Gln Ser Gly Thr Thr Tyr Ile Val Val Ile Arg 20 25 30 Ser Pro Lys Gly Asp Pro Gly Leu Ala Ala Ile Ile Gly Arg Ser Gly 35 40 45 Arg Glu Gly Ala Gly Ser Lys Asp Ala Ile Phe Trp Gly Ala Pro Leu 50 55 60 Ala Ser Arg Leu Leu Pro Gly Ala Val Lys Asp Ala Glu Met Trp Asp 65 70 75 80 Ile Leu Gln Gln Arg Ser Ala Leu Thr Leu Leu Glu Gly Thr Leu Leu 85 90 95 Lys Arg Leu Thr Thr Ala Met Ala Val Pro Met Thr Thr Asp Arg Glu 100 105 110 Asp Asn Pro Ile Ala Glu Asn Leu Glu Pro Glu Trp Arg Asp Leu Arg 115 120 125 Thr Val His Asp Gly Met Asn His Leu Phe Ala Thr Leu Glu Lys Pro 130 135 140 Gly Gly Ile Thr Thr Leu Leu Leu Asn Ala Ala Thr Asn Asp Ser Met 145 150 155 160 Thr Ile Ala Ala Ser Cys Leu Glu Arg Val Thr Met Gly Asp Thr Leu 165 170 175 His Lys Glu Thr Val Pro Ser Tyr Glu Val Leu Asp Asn Gln Ser Tyr 180 185 190 His Ile Arg Arg Gly Leu Gln Glu Gln Gly Ala Asp Ile Arg Ser Leu 195 200 205 Val Ala Gly Cys Leu Leu Val Lys Phe Thr Ser Met Met Pro Phe Arg 210 215 220 Glu Glu Pro Arg Phe Ser Glu Leu Ile Lys Gly Ser Asn Leu Asp Leu 225 230 235 240 Glu Ile Tyr Gly Val Arg Ala Gly Leu Gln Asp Glu Ala Asp Lys Val 245 250 255 Lys Val Leu Thr Glu Pro His Ala Phe Val Pro Leu Cys Phe Ala Ala 260 265 270 Phe Phe Pro Ile Leu Ala Val Arg Phe His Gln Ile Ser Met 275 280 285

Claims (46)

  1. RNA-가이드된 DNA 뉴클레아제와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함하는 재조합 핵산을 진핵 세포로 도입하는 단계를 포함하는, 진핵 세포에서, DNA 뉴클레아제를 게놈 표적으로 가이드할 수 있는 표적-특이적 RNA 분자의 제조 방법.
  2. RNA-가이드된 DNA 뉴클레아제와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함하는 재조합 핵산을 진핵 세포의 게놈 좌위로 통합하는 단계를 포함하는, 진핵 세포에서, DNA 뉴클레아제를 게놈 표적으로 가이드할 수 있는 표적-특이적 RNA 분자의 제조 방법.
  3. 제1 RNA 절편이 게놈 좌위로부터 전사된 엑손 서열을 포함하고 제2 RNA 절편이 RNA-가이드된 DNA 뉴클레아제와 상호작용할 수 있는 RNA 절편을 포함하는, 진핵 세포에서, 제2 RNA 절편으로 스플라이싱된 제1 RNA 절편을 포함하는 RNA 분자를 제조하는 단계, 및
    진핵 세포에서, RNA-가이드된 DNA 뉴클레아제를 발현시키는 단계
    를 포함하는, 세포 내 게놈 DNA의 RNA-가이드된 절단의 촉진 방법.
  4. 제1항 또는 제2항에 있어서, 재조합 핵산이 DNA 분자인 방법.
  5. 제1항 또는 제2항에 있어서, 재조합 핵산이 트랜스포존 말단 서열을 포함하는 방법.
  6. 제5항에 있어서, 트랜스포존 말단 서열이 역위 말단 반복 서열(ITR)을 포함하는 방법.
  7. 제5항 또는 제6항에 있어서, 트랜스포존 말단 서열이 직접 말단 반복 서열을 포함하는 방법.
  8. 제6항에 종속된 제7항에 있어서, 직접 말단 반복 서열이 ITR을 플랭킹하는 방법.
  9. 제5항에 있어서, 트랜스포존 말단 서열이 5' 말단 CCY 및 3' 말단 GGG를 포함하는 방법.
  10. 제9항에 있어서, 트랜스포존 말단 서열이 5' 말단 CCC 및 3' 말단 GGG를 포함하는 방법.
  11. 제5항에 있어서, 트랜스포존 말단 서열이 TTAA 삽입 부위를 표적화하는 방법.
  12. 제5항에 있어서, 트랜스포존 말단 서열이 피기백 트랜스포존-특이적 역위 말단 반복 서열(ITR)을 포함하는 방법.
  13. 제5항에 있어서, 트랜스포존 말단 서열이 태그얼롱 트랜스포존-특이적 역위 말단 반복 서열(ITR)을 포함하는 방법.
  14. 제1항 또는 제2항에 있어서, 재조합 핵산이 선택 또는 스크리닝 마커를 코딩하는 제3 핵산 영역을 더 포함하는 방법.
  15. 제14항에 있어서, 선택 또는 스크리닝 마커가 항생제 내성 단백질 또는 형광 또는 생물발광 단백질인 방법.
  16. 제1항 또는 제2항에 있어서, 스플라이스 수용자 부위가 5'-X1X2X3-3'로 기재되는 서열을 포함하며,
    여기서:
    X1은 A,
    X2는 G 또는 C, 및
    X3은 A, G, C, 또는 U이며, 여기서 3' 스플라이스 접합부는 X2 및 X3 사이에 있는, 방법.
  17. 제16항에 있어서, X2가 G인 방법.
  18. 제16항 또는 제17항에 있어서, X3이 A, G 또는 C인 방법.
  19. 제1항 또는 제2항에 있어서, 스플라이스 수용자 부위가 5'-X1X2X3X4X5-3'로 기재되는 서열을 포함하며,
    여기서:
    X1는 A, C 또는 U,
    X2는 A,
    X3은 G,
    X4는 A, G 또는 C, 및
    X5는 A, U 또는 C이며, 여기서 3' 스플라이스 접합부는 X3 및 X4 사이에 있는, 방법.
  20. 제1항 또는 제2항에 있어서, 스플라이스 수용자 부위가 5'-X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16X17X18X19X20X21X22-3' (서열 18)로 기재되는 서열을 포함하며,
    여기서:
    X1, X3, X5, X7, X9, X12, X15, X16, 및 X17은 각각 독립적으로 A, G, C, 및 U로부터 선택되는 것이며,
    X2는 C 또는 G,
    X4는 U,
    X6, X8, X10, X11, X13, X14는 각각 독립적으로 G, C, 및 U로부터 선택되는 것이며,
    X18은 A, C 또는 U,
    X19는 A,
    X20은 G,
    X21은 A, C, 또는 G, 및
    X22는 A, U 또는 C이며, 여기서 3' 스플라이스 부위는 X20 및 X21 사이에 있는, 방법.
  21. 제1항 또는 제2항에 있어서, 뉴클레아제 상호작용성 절편이 RNA-가이드된 DNA 뉴클레아제와 상호작용하는 하나 이상의 스템 부분을 포함하는 방법.
  22. 제21항에 있어서, 뉴클레아제 상호작용성 절편이 비-상보적 RNA 뉴클레오티드에 의해 분리된 제1 및 제2 스템 부분을 포함하는 방법.
  23. 제21항 또는 제22항에 있어서, 제1 스템 부분이 5'-GUUGUAGC-3'로 기재되는 뉴클레오티드 서열을 갖는 가닥을 포함하는 방법.
  24. 제21항 내지 제23항 중 어느 한 항에 있어서, 제2 스템 부분이 5'-UUCUC-3'로 기재되는 뉴클레오티드 서열을 포함하는 방법.
  25. 제21항 내지 제24항 중 어느 한 항에 있어서, 제2 스템 부분의 두 가닥의 상보적 염기쌍이 루프 구조를 통해 공유적으로 결합된 방법.
  26. 제1항 또는 제2항에 있어서, 뉴클레아제 상호작용성 절편이 5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAU-3' (서열 1)로 기재되는 서열을 포함하는 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 진핵 세포가 포유동물 세포인 방법.
  28. 제1항 내지 제26항 중 어느 한 항에 있어서, 진핵 세포가 식물 세포인 방법.
  29. 제27항에 있어서, 포유동물 세포가 인간 세포인 방법.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 재조합 핵산이 RNA-가이드된 DNA 뉴클레아제를 코딩하는 것인 방법.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, RNA-가이드된 DNA 뉴클레아제가 CRISPR-연관 (Cas) 뉴클레아제인 방법.
  32. 제31항에 있어서, Cas 뉴클레아제가 II 형 Cas 뉴클레아제인 방법.
  33. 제32항에 있어서, Cas 뉴클레아제가 Cas9 뉴클레아제인 방법.
  34. 제33항에 있어서, Cas9 뉴클레아제가 네이세리아 메닌기티데스 Cas9 뉴클레아제(NmCas9)인 방법.
  35. 제34항에 있어서, Cas9 뉴클레아제가 스트렙토코쿠스 써모필레스 Cas9 뉴클레아제인 방법.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, RNA-가이드된 DNA 뉴클레아제가 DNA에 단일-가닥 단절을 도입하는 것인 방법.
  37. 제1항 내지 제36항 중 어느 한 항에 있어서, RNA-가이드된 DNA 뉴클레아제가 DNA에 이중-가닥 단절을 도입하는 것인 방법.
  38. 제3항에 있어서, RNA-가이드된 DNA 뉴클레아제가 i) RNA-가이드된 DNA 뉴클레아제 및 RNA 분자의 제2 RNA 절편 간의 상호작용, 및 ii) 엑손 서열을 코딩하는 하나 이상의 게놈 좌위에서의 DNA 절단을 촉진하는 조건하에서 발현되는 것인 방법.
  39. 제38항에 있어서, 하나 이상의 게놈 좌위가 엑손 서열을 코딩하는 둘 이상의 대립유전자인 방법.
  40. 제39항에 있어서, 둘 이상의 대립유전자가 포유동물 세포의 두 대립유전자인 방법.
  41. 제38항 내지 제40항 중 어느 한 항에 있어서, DNA 절단이 엑손 서열의 스플라이스 공여자 부위 상류의 5 염기쌍 내에서 발생하는 방법.
  42. DNA 변형효소와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함하는 재조합 핵산을 진핵 세포로 도입하는 단계를 포함하는, 진핵 세포에서, DNA 변형 효소를 가이드하는 표적 특이적 핵산의 제조 방법.
  43. 제42항에 있어서, DNA 변형 효소가 RNA-가이드된 DNA 뉴클레아제인 방법.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, 진핵 세포가 줄기 세포인 방법.
  45. DNA 변형 효소와 상호작용할 수 있는 RNA 절편을 코딩하는 제2 핵산 영역 상류의 스플라이스 수용자 부위를 코딩하는 제1 핵산 영역을 포함하는 핵산.
  46. 제45항에 있어서, DNA 변형 효소가 RNA-가이드된 DNA 뉴클레아제인 핵산.
KR1020167021908A 2014-01-14 2015-01-14 돌연변이유발 방법 KR20160128306A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461927458P 2014-01-14 2014-01-14
US61/927,458 2014-01-14
PCT/US2015/011425 WO2015108993A1 (en) 2014-01-14 2015-01-14 Mutagenesis methods

Publications (1)

Publication Number Publication Date
KR20160128306A true KR20160128306A (ko) 2016-11-07

Family

ID=52432989

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167021908A KR20160128306A (ko) 2014-01-14 2015-01-14 돌연변이유발 방법

Country Status (11)

Country Link
US (1) US20150197759A1 (ko)
EP (1) EP3094729A1 (ko)
JP (1) JP2017502683A (ko)
KR (1) KR20160128306A (ko)
CN (1) CN106459996A (ko)
AU (1) AU2015206510A1 (ko)
CA (1) CA2936936A1 (ko)
IL (1) IL246762A0 (ko)
MX (1) MX2016009243A (ko)
RU (1) RU2016133286A (ko)
WO (1) WO2015108993A1 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
LT3066201T (lt) 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
EP3397757A4 (en) * 2015-12-29 2019-08-28 Monsanto Technology LLC NEW TRANSPOSASES ASSOCIATED WITH CRISPR AND USES THEREOF
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
RU2722934C1 (ru) * 2019-06-11 2020-06-05 Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий Средство разрезания днк на основе cas9 белка из бактерии pasteurella pneumotropica
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6436707B1 (en) * 1998-03-27 2002-08-20 Lexicon Genetics Incorporated Vectors for gene mutagenesis and gene discovery
DK1815001T3 (da) * 2004-11-26 2011-05-16 Helmholtz Zentrum Muenchen Genfældekassetter til tilfældig og målrettet konditioneret geninaktivering
BRPI0520212A2 (pt) * 2005-05-14 2009-08-18 Univ Fudan métodos de geração de um vertebrado não humano transgênico, e de uma célula de vertebrado recombinante, célula de vertebrado em cultura, e, ácido nucleico
EP2166107A1 (en) * 2008-09-12 2010-03-24 TaconicArtemis GmbH Lentiviral vectors for the expression of shRNA
US9790489B2 (en) * 2009-10-26 2017-10-17 Chang Gung University Method for performing genetic modification under a drug-free environment and components thereof
US9637739B2 (en) * 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
US9234213B2 (en) * 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
LT3066201T (lt) * 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
US20150191744A1 (en) * 2013-12-17 2015-07-09 University Of Massachusetts Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling
US20170022499A1 (en) * 2014-04-03 2017-01-26 Massachusetts Institute Of Techology Methods and compositions for the production of guide rna

Also Published As

Publication number Publication date
US20150197759A1 (en) 2015-07-16
CN106459996A (zh) 2017-02-22
JP2017502683A (ja) 2017-01-26
AU2015206510A1 (en) 2016-08-04
MX2016009243A (es) 2017-03-08
WO2015108993A1 (en) 2015-07-23
WO2015108993A8 (en) 2016-06-02
CA2936936A1 (en) 2015-07-23
IL246762A0 (en) 2016-08-31
RU2016133286A (ru) 2018-02-20
EP3094729A1 (en) 2016-11-23

Similar Documents

Publication Publication Date Title
KR20160128306A (ko) 돌연변이유발 방법
US20040043468A1 (en) Synthetic internal ribosome entry sites and methods of identifying same
AU2013282323B2 (en) Massively parallel combinatorial genetics
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
US6699686B1 (en) Modified nuclear glucocorticoid receptor, fusion protein, and DNA fragments coding for said receptor and said fusion protein
US6642028B1 (en) Vectors and genes exhibiting increased expression
CN113584134B (zh) 一种基于CRISPR-Cas9的等温核酸检测系统及其方法和应用
CN112154211A (zh) 用于束缚供体dna的修饰的核酸编辑系统
CN113906134A (zh) Tau蛋白病模型
CN1995384A (zh) 一种快速方便转基因插入位点鉴定技术
CN111214496B (zh) 一种重组溶瘤病毒在制备治疗淋巴瘤药物组合物中的用途
CN101372683B (zh) 人丙肝病毒的人工假病毒及其制备和应用
US20040101520A1 (en) Recombination method
KR102280546B1 (ko) 세포 내재성 dna 변형 효소를 사용하여 표적화된 dna의 핵산 염기를 특이적으로 변환시키는, 세포의 핵산 서열의 변환 방법 및 이에 사용하는 분자 복합체
CN112522205B (zh) 一种过表达血管紧张素转换酶2的细胞系及其制备方法与应用
US6489099B1 (en) Detection of DNA damaging agents
CN101492685A (zh) 一种重组表达载体的基因序列及其构建方法
US6693226B1 (en) Transgenic mice expressing human p25
KR20130078265A (ko) 감염력이 있는 구제역바이러스 O형 cDNA 클론 및 클론의 전체염기서열
CN114085868A (zh) 一种打靶载体、重组Huh7细胞系及构建方法和应用
KR102422842B1 (ko) 크리스퍼 간섭을 이용한 rna 번역 조절용 조성물
KR20130048562A (ko) Mis18α 유전자 넉아웃 생쥐모델 및 그의 제조방법
CN107828876A (zh) 可共价结合底物的标签蛋白在clip中的应用
CN113528450B (zh) 一种水稻原生质体高效生物素标记体系的建立及应用
CN116987686A (zh) 一种工程优化的核酸酶、向导rna、编辑系统和应用

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid