KR102061251B1 - 내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법 - Google Patents

내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법 Download PDF

Info

Publication number
KR102061251B1
KR102061251B1 KR1020180121984A KR20180121984A KR102061251B1 KR 102061251 B1 KR102061251 B1 KR 102061251B1 KR 1020180121984 A KR1020180121984 A KR 1020180121984A KR 20180121984 A KR20180121984 A KR 20180121984A KR 102061251 B1 KR102061251 B1 KR 102061251B1
Authority
KR
South Korea
Prior art keywords
cell
nucleic acid
polypeptide
target
lys
Prior art date
Application number
KR1020180121984A
Other languages
English (en)
Other versions
KR20190049456A (ko
Inventor
배상수
우재성
유지현
Original Assignee
주식회사 에이치유비바이오텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에이치유비바이오텍 filed Critical 주식회사 에이치유비바이오텍
Publication of KR20190049456A publication Critical patent/KR20190049456A/ko
Application granted granted Critical
Publication of KR102061251B1 publication Critical patent/KR102061251B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Abstract

표적특이적 엔도뉴클레아제 시스템 또는 이의 암호화 유전자 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 발현 및/또는 생산용 조성물, 상기 조성물이 도입된 재조합 동물 세포 및 이의 제조 방법, 및 상기 조성물을 동물 세포에 도입하는 단계 및/또는 상기 동물 세포를 배양하는 단계를 포함하는 동물세포에서의 목적 폴리펩타이드의 발현 및/또는 생산 방법이 제공된다.

Description

내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법{RECOMBINANT CELL AND METHOD FOR PRODUCTION OF ENDOGENOUS POLYPEPTIDE}
표적특이적 엔도뉴클레아제 시스템 또는 이의 암호화 유전자 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 발현 및/또는 생산용 조성물, 상기 조성물 또는 상기 도너 DNA 구조체가 도입된 재조합 동물 세포 및 이의 제조 방법, 및 상기 조성물을 동물 세포에 도입하는 단계 및/또는 상기 동물 세포를 배양하는 단계를 포함하는 동물세포에서의 목적 폴리펩타이드의 발현 및/또는 생산 방법이 제공된다.
동물세포에서 생산되는 단백질을 대량으로 생산하기 위하여, 유전자 재조합을 통하여 원하는 목적 단백질을 암호화하는 유전자 서열(Coding Sequence: CDS)을 삽입한 플라스미드 DNA를 만들고, 이를 세포 내에 주입(transfection)하는 방식이 주로 사용된다. 이러한 방식은 목적 단백질을 암호화하는 mRNA로부터 역전사 효소(Reverse transcriptase)를 사용하여 cDNA(complementary DNA)를 합성하고, 이를 증폭하여, 인간 세포 등의 동물 세포에서 발현할 수 있는 플라스미드에 재조합적으로 삽입하는 단계를 수반한다. 또한, 세포에서 발현된 목적 단백질을 효율적으로 추출/정제하기 위하여, 상기 플라스미드에 항체와 같은 태그를 함께 재조합하여 동물 세포에 주입하여, 태그가 연결된 단백질이 만들어지도록 할 수 있다.
그러나, 이와 같이 재조합 플라스미드를 세포에 주입하여 단백질을 제조하는 경우, 다음과 같은 문제점이 있다:
1) 세포 배양 규모와 세포 밀도를 높이기 어렵다;
2) 단백질이 세포 안에서 한시적으로 발현되기 때문에 특정시기에 단백질을 추출해야 하는 제한이 있다;
3) 이종 세포에 주입시 단백질의 접힘(folding), 당화(glycosylation) 등의 전사 후 변형 (post-translational modification)이 원래의 세포에서와 달라져서 올바른 구조 및/또는 기능을 갖지 못하게 될 수 있다;
4) 크기가 크거나 반복되는 서열이 존재하는 단백질들은 이를 암호화하는 CDS의 길이가 길어서 플라스미드에 클로닝하는데 곤란한 점이 있다.
따라서, 이러한 문제점을 극복하기 위하여 세포에서 올바른 구조 및 기능을 갖는 단백질 대량으로 생산하는 기술이 개발이 요구된다.
Andrianantoandro E et al. Mol Syst Biol. 2: 2006.0028 (2006)
일 예는 표적 특이적 엔도뉴클레아제 시스템 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 발현용 조성물을 제공한다.
다른 예는 상기 목적 폴리펩타이드 발현용 조성물이 동물세포에 도입되어 제조된 재조합 세포를 제공한다. 상기 재조합 세포는 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 상기 조성물에 포함된 도너 DNA 구조체가 삽입된 것일 수 있다. 상기 재조합 세포는 상기 목적 폴리펩타이드의 생산에 사용될 수 있다.
다른 예는 상기 도너 DNA 구조체가 동물 세포 (숙주 세포)의 유전체 내의 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽(예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5'-UTR 사이)에 도입(삽입)된 재조합 세포를 제공한다. 상기 재조합 세포는 상기 목적 폴리펩타이드의 생산에 사용될 수 있다. 상기 상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하는 것일 수 있다.
다른 예는 도너 DNA 구조체를 숙주 세포의 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 삽입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산을 위한 재조합 세포의 제조 방법을 제공한다. 상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하는 것일 수 있고, 상기 숙주세포는 동물 세포일 수 있다.
다른 예는 상기 동물 세포에서의 목적 폴리펩타이드 발현용 조성물, 또는 상기 재조합 세포를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물을 제공한다.
다른 예는 상기 목적 폴리펩타이드 생산용 조성물을 동물 세포에 도입하는 단계를 포함하는, 목적 폴리펩타이드 생산용 동물 세포의 제조 방법을 제공한다.
다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 발현 방법을 제공한다. 상기 발현 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포의 상기 목적 폴리펩타이드의 발현량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.
다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다. 상기 생산 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포에서의 상기 목적 폴리펩타이드의 생산량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.
다른 예는 상기 목적 폴리펩타이드 생산용 재조합 동물 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다.
상기 동물 세포에서의 목적 폴리펩타이드의 발현 및/또는 생산 방법은 상기 동물세포에 상기 목적 폴리펩타이드의 암호화 유전자 (CDS)를 세포 외부에서 도입시키는 단계를 수행하지 않는 것을 특징으로 한다.
본 명세서에서, 표적특이적 엔도뉴클레아제 시스템 또는 이의 암호화 유전자 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 생산용 조성물, 상기 조성물이 도입된 재조합 동물 세포, 및 상기 조성물을 동물세포에 도입하는 단계를 포함하는 동물세포에서의 목적 폴리펩타이드의 생산 방법이 제공된다. 상기 목적 폴리펩타이드는 상기 세포 내 유전체에서 암호화되는 내인성 폴리펩타이드일 수 있으며, 본 명세서에서 제공되는 목적 폴리펩타이드 생산용 조성물, 재조합 동물 세포, 및 목적 폴리펩타이드 생산 방법은 상기 내인성 폴리펩타이드를 이의 암호화 유전자(Coding Sequence; CDS)의 재조합적 도입 과정 없이 본래의 구조 및/또는 기능을 유지한 상태로 동물 세포에서 대량으로 생산할 수 있도록 하는 것을 특징으로 할 수 있다.
본 명세서에서 다르게 언급되지 않는 한, 상기 '도너 DNA 구조체'는 발현시키고자 하는 목적 폴리펩타이드의 암호화 핵산 서열 (CDS)를 포함하지 않는 것일 수 있다.
일 예는 표적 특이적 엔도뉴클레아제 시스템 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 발현용 조성물을 제공한다.
다른 예는 상기 목적 폴리펩타이드 발현용 조성물이 동물세포에 도입되어 제조된 재조합 세포를 제공한다. 상기 재조합 세포는 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 상기 조성물에 포함된 도너 DNA 구조체가 삽입된 것일 수 있다. 상기 재조합 세포는 상기 목적 폴리펩타이드의 생산에 사용될 수 있다.
다른 예는 상기 도너 DNA 구조체가 동물 세포 (숙주 세포)의 유전체 내의 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽(예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5'-UTR 사이)에 도입(삽입)된 재조합 세포를 제공한다. 상기 재조합 세포는 상기 목적 폴리펩타이드의 생산에 사용될 수 있다. 상기 상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하는 것일 수 있다.
다른 예는 도너 DNA 구조체를 숙주 세포의 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 삽입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산을 위한 재조합 세포의 제조 방법을 제공한다. 상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하는 것일 수 있고, 상기 숙주세포는 동물 세포일 수 있다.
다른 예는 상기 동물 세포에서의 목적 폴리펩타이드 발현용 조성물, 또는 상기 재조합 세포를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물을 제공한다.
다른 예는 상기 목적 폴리펩타이드 생산용 조성물을 동물 세포에 도입하는 단계를 포함하는, 목적 폴리펩타이드 생산용 재조합 세포의 제조 방법을 제공한다.
다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 발현 방법을 제공한다. 상기 발현 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포의 상기 목적 폴리펩타이드의 발현량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.
다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다. 상기 생산 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포의 상기 목적 폴리펩타이드의 생산량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.
다른 예는 상기 목적 폴리펩타이드 생산용 재조합 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다.
다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하여, 목적 폴리펩타이드 발현용 조성물이 유전체 내의 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽(예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5'-UTR 사이)에 도입(삽입)된 재조합 세포를 준비하는 단계 및 상기 재조합 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다.
상기 동물 세포에서의 목적 폴리펩타이드의 발현 및/또는 생산 방법은 상기 동물세포에 목적 폴리펩타이드의 암호화 유전자 (CDS)를 세포 외부에서 도입시키는 단계를 수행하지 않는 것을 특징으로 한다. 따라서, 상기 방법은 별도의 목적 폴리펩타이드의 암호화 유전자의 제작을 필요로 하지 않는다.
상기 동물 세포에서의 목적 폴리펩타이드의 생산 방법은, 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계 및/또는 목적 폴리펩타이드 생산용 재조합 동물 세포를 배양하는 단계 이후에, 목적 폴리펩타이드를 통상의 방법으로 분리(추출) 및/또는 정제하는 단계를 추가로 포함할 수 있다.
이하 본 발명을 보다 상세히 설명한다.
본 명세서에 사용된 바로서, 용어 "목적 폴리펩타이드"는 생산하고자 하는 폴리펩타이드로서, 생체에서 목적하는 활성 (예컨대 특정 질병 또는 증상의 예방, 경감, 및/또는 치료 활성 또는 생체 필요 물질을 대체하는 활성)을 갖는 단백질 및/또는 펩타이드뿐 아니라, 활성이 알려지지 않은 폴리펩타이드를 포함하여, 숙주 세포 내의 유전체에서 암호화되고 발현되는 모든 단백질 및 펩타이드 중에서 선택된 1종 이상일 수 있다. 상기 목적 폴리펩타이드는 세포질 내에 위치하는 폴리펩타이드, 세포막 위치 폴리펩타이드, 및 세포외 분비 폴리펩타이드로 이루어진 군에서 선택된 1종 이상일 수 있다. 예컨대, 상기 목적 폴리펩타이드는 효소, 호르몬, 성장인자, 수용체, 수송 폴리펩타이드, 면역 폴리펩타이드 (면역 세포에서 만들어지는 폴리펩타이드들을 총칭함), 신호전달 폴리펩타이드, 생체 구성 폴리펩타이드 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
일 구체예에서, 상기 목적 폴리펩타이드는,
가수분해효소 (예컨대, 단백질 분해효소, 인산분해효소(phosphatase) 등), 산화환원효소, 메틸기, 인산기 등의 전달효소 (예컨대, 인산화효소 (kinase) 등) 등을 포함하는 효소,
인슐린, 성장호르몬, 성장호르몬 방출호르몬, 멜라토닌, 세로토닌, 갑상선호르몬, 갑상선자극호르몬, 갑상선자극호르몬 방출호르몬, 에피네프린, 노르에피네프린, 도파민, 아디포넥틴, 부신피질자극호르몬, 부신피질자극호르몬 방출호르몬, 바소프레신, 칼시토닌, 콜레시스토키닌, 여포자극호르몬, 가스티린, 그렐린, 글로카곤, 인간융모성성선자극호르몬, 황체형성호르몬, 파라토르몬, 프로락틴, 세크레틴, 리포트로핀, 히스타민 등을 포함하는 호르몬,
인슐린-유사 성장인자(insulin-Like growth factors, IGFs), 표피성장인자(epidermal growth factor, EGF), 혈관성장인자 (VEGF(Vascular endothelial growth factor), 안지오포이에틴(Angiopoietin) 등), 신경성장인자 (nerve growth factor, NGF), 에리트로포이에틴(Erythropoietin, EPO), 섬유아세포성장인자(Fibroblast growth factor; FGF), 혈소판유래성장인자(Platelet-derived growth factor, PDGF), 형질전환성장인자(Transforming growth factor; TGF), 성장/분화 인자 (Growth/differentiation factor; GDF, 예컨대, GDF15) 등을 포함하는 성장인자,
G 단백질 결합 수용체 (G protein-coupled receptor, GPCR), 타이로신 인산화효소 수용체 (receptor tyrosine kinase, RTK), 이온성 수용체(ionotropic receptor) 등을 포함하는 수용체,
헤모글로빈, 트랜스페린 등의 수송 폴리펩타이드,
면역글로불린 (예컨대, IgG (IgG1, IgG2, IgG3, IgG4), IgA, IgD, IgM IgE 등), 사이토카인 (예컨대, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18과 같은 인터루킨), 인터페론(IFN)-알파, -베타, -감마, -오메가 또는 -타우, TNF-알파, 베타 또는 감마와 같은 종양 괴사 인자(TNF), TRAIL(TNF-related apoptosis-inducing ligand), 콜로니 자극인자 (colony stimulating factor (CSF); 예컨대, G-CSF(Granulocyte-colony stimulating factor), GM-CSF(Granulocyte-macrophage colony-stimulating factor), M-CSF(macrophage colony-stimulating factor) 등) 등을 포함하는 면역 폴리펩타이드,
세포외기질 당단백질 (예컨대, Reelin 등), 골형성 단백질 (Bone morphogenetic protein, BMP) 등의 각종 신호전달 폴리펩타이드,
그 외, 콜라겐, 엘라스틴, 케라틴, 튜불린, 액틴, 피브린, 미오신, 알부민, 히스톤, 카제인, 오브알부민 등의 생체 구성 폴리펩타이드
등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
상기 목적 폴리펩타이드를 암호화하는 유전자 (이하, 목적 유전자)는 상기와 같은 목적 폴리펩타이드 정의에 의하여 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자가 그 구체적 사항 (예컨대, 핵산서열 등)을 명확하게 알 수 있다.
상기 목적 폴리펩타이드는 2개 이상의 아미노산이 펩타이드 결합으로 연결된 것일 수 있으며, 예컨대, 2 내지 10,000개, 2 내지 9,000개, 2 내지 8,000개, 2 내지 7,000개, 2 내지 6,000개, 2 내지 5,000개, 2 내지 4,000개, 2 내지 3,000개, 2 내지 2,000개, 2 내지 1,000개, 50 내지 10,000개, 50 내지 9,000개, 50 내지 8,000개, 50 내지 7,000개, 50 내지 6,000개, 50 내지 5,000개, 50 내지 4,000개, 50 내지 3,000개, 50 내지 2,000개, 50 내지 1,000개, 100 내지 10,000개, 100 내지 9,000개, 100 내지 8,000개, 100 내지 7,000개, 100 내지 6,000개, 100 내지 5,000개, 100 내지 4,000개, 100 내지 3,000개, 100 내지 2,000개, 100 내지 1,000개, 500 내지 10,000개, 500 내지 9,000개, 500 내지 8,000개, 500 내지 7,000개, 500 내지 6,000개, 500 내지 5,000개, 500 내지 4,000개, 500 내지 3,000개, 500 내지 2,000개, 500 내지 1,000개, 1000 내지 10,000개, 1000 내지 9,000개, 1000 내지 8,000개, 1000 내지 7,000개, 1000 내지 6,000개, 1000 내지 5,000개, 1000 내지 4,000개, 1000 내지 3,000개, 1000 내지 2,000개, 2000 내지 10,000개, 2000 내지 9,000개, 2000 내지 8,000개, 2000 내지 7,000개, 2000 내지 6,000개, 2000 내지 5,000개, 2000 내지 4,000개, 2000 내지 3,000개, 3000 내지 10,000개, 3000 내지 9,000개, 3000 내지 8,000개, 3000 내지 7,000개, 3000 내지 6,000개, 3000 내지 5,000개, 또는 3000 내지 4,000개의 아미노산을 포함하는 폴리펩타이드일 수 있다.
상기 목적 폴리펩타이드는 숙주 세포에 의하여 생산되는 내인성 폴리펩타이드 (endogenous polypeptide)일 수 있다. 상기 내인성 폴리펩타이드는, 숙주 세포에 외래 유전자 도입 없이, 숙주 세포 내의 유전체(genome) 중의 유전자에 의하여 암호화되고 상기 숙주 세포 내에서 발현되는 폴리펩타이드를 의미할 수 있다.
이와 같은 내인성 폴리펩타이드는 다음과 같은 이점을 갖는다: (1) 접힘(folding), 당화(glycosylation) 등의 전사 후 변형 (post-translational modification) 과정이 본래의 세포에서 진행되므로, 본래의 세포의 genetic context를 그대로 이용할 수 있고, 외래의 암호화 유전자가 숙주 세포에 삽입되어 발현된 폴리펩타이드와 비교하여, 폴리펩타이드 본래의 2차 및/또는 3차 구조, 및/또는 기능을 유지하는데 유리하다. (2) 외래 유전자의 삽입을 필요로 하지 않으므로, 암호화 유전자(CDS) 크기 한계 등의 이유로 플라스미드에 삽입하기 곤란한 폴리펩타이드의 경우에도 적용 가능하다.
상기 내인성 폴리펩타이드는 진핵 동물, 예컨대, 인간, 원숭이, 마모셋 등의 영장류, 개, 고양이 등의 식육목 동물, 돼지, 소, 양 등의 우제목 동물 등을 포함하는 포유 동물 또는 닭, 오리 등의 조류에서 유래하는 폴리펩타이드일 수 있다. 또한, 상기 숙주 세포는 생산하고자 하는 폴리펩타이드가 유래하는 진핵 동물 세포일 수 있으며, 예컨대, 인간, 원숭이, 마모셋 등의 영장류, 개, 고양이 등의 식육목 동물, 돼지, 소, 양 등의 우제목 동물 등을 포함하는 포유 동물 세포 또는 닭, 오리 등의 조류 세포일 수 있다. 상기 세포는 생체로부터 분리된 것일 수 있다.
본 명세서에 사용된 바로서, 용어 "표적 특이적 엔도뉴클레아제 시스템"은 특정 표적 핵산 서열을 인식하여 절단하는 기능적 단위체를 의미하는 것으로, 유전자 가위라고도 불리우며, 엔도뉴클레아제 또는 이를 암호화하는 핵산 분자 또는 상기 핵산 분자 (제1 핵산 분자)를 포함하는 재조합 벡터 (제1 재조합 벡터) 및 특정 표적 핵산 서열을 인식하는 핵산 분자 (DNA 또는 RNA; 제2 핵산 분자) 또는 상기 핵산 분자를 포함하는 재조합 벡터 (제2 재조합 벡터)를 포함할 수 있다.
상기 엔도뉴클레아제는 단일가닥 및/또는 이중가닥의 특정 유전자 부위를 절단하는 활성을 가지며, 특정 표적 핵산 서열을 인식하는 핵산 분자와 함께 작용하여 특정 표적 유전자 서열을 절단할 수 있는 모든 표적 특이적 엔도뉴클레아제들 중에서 선택될 수 있다.
예컨대, 상기 표적 특이적 엔도뉴클레아제는
유전체 상의 특정 표적 서열을 인식하는 도메인인 식물 병원성 유전자에서 유래한 TAL 작동자 (transcription activator-like effector) 도메인과 절단 도메인이 융합된 TALEN (transcription activator-like effector nuclease);
징크-핑거 뉴클레아제 (zinc-finger nuclease, ZFN);
미생물 면역체계인 CRISPR에서 유래한 RNA-가이드 엔도뉴클레아제 (RNA-guided endonuclease, RGEN; 예컨대, Cas 단백질 (예컨대, Cas9 등), Cpf1, 등);
DNA-가이드 엔도뉴클레아제 (DNA-guided endonuclease; 예컨대, 아고 호몰로그 (Ago homolog) 등)
등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
상기 표적 특이적 엔도뉴클레아제는 원핵 세포, 및/또는 인간 세포를 비롯한 동식물 세포 (예컨대, 진핵 세포)의 유전체에서 특정 염기서열을 인식해 이중나선절단 (double strand break, DSB) 또는 단일나선절단 (single strand break, SSB)을 일으킬 수 있다. 이 중 상기 이중나선절단의 경우에는 DNA의 이중 나선을 잘라, 둔단 (blunt end) 또는 점착종단 (cohesive end)을 생성시킬 수 있다. DSB는 세포 내에서 상동재조합 (homologous recombination) 또는 비상동재접합 (non-homologous end-joining, NHEJ) 기작에 의해 효율적으로 수선될 수 있는데, 이 과정에 소망하는 변이(유전자 전부 또는 일부의 치환, 결실, 삽입 등)를 표적 위치에 도입할 수 있다.
일 예에서, 상기 표적특이적 엔도뉴클레아제는 CRISPR에서 유래한 RNA-가이드 엔도뉴클레아제(RGEN)일 수 있다. 이 경우, 상기 표적 특이적 엔도뉴클레아제 시스템은,
(1) RNA-가이드 엔도뉴클레아제 또는 이를 암호화하는 핵산 분자 또는 상기 핵산 분자를 포함하는 재조합 벡터, 및
(2) 표적 핵산 서열과 혼성화 가능한 (또는 상보적 핵산 서열을 갖는) 가이드 RNA 또는 이의 암호화 DNA 또는 상기 DNA를 포함하는 재조합 벡터
를 포함하는 것일 수 있다.
일 구체예에서, 상기 RNA-가이드 엔도뉴클레아제는 Cas 단백질 (예컨대, Cas9 단백질(CRISPR (Clustered regularly interspaced short palindromic repeats) associated protein 9)), Cpf1 단백질 (CRISPR from Prevotella and Francisella 1) 등과 같은 타입 Ⅱ 및/또는 타입 V의 CRISPR 시스템에 수반되는 엔도뉴클레아제들로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 가이드 RNA는 상기 표적 특이적 엔도뉴클레아제를 유전체 DNA의 특정 표적 부위로 안내하는 역할을 한다. 상기 RNA-가이드 엔도뉴클레아제와 가이드 RNA는 생체(세포) 외에서 결합되어 리보핵산-단백질 복합체를 형성(RNA-Guided Engineered Nuclease)하여 리보핵산 단백질 (RNP) 형태로 세포 내에 도입되거나, 이들의 암호화 핵산분자 또는 DNA가 각각 별개의 플라스미드 또는 함께 하나의 플라스미드를 통하여 세포 내로 도입된 후 발현되어 세포 내에서 리보핵산 단백질을 형성하여 작용할 수 있다.
상기 Cas 단백질은 CRISPR/Cas 시스템의 주요 단백질 구성 요소로, 활성화된 엔도뉴클레아제 또는 nickase를 형성할 수 있는 단백질이다. Cas 단백질 또는 유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.
예컨대, 상기 Cas 단백질은,
스트렙토코커스 sp. (Streptococcus sp.), 예컨대, 스트렙토코커스 피요게네스 (Streptococcus pyogenes) 유래의 Cas9 단백질 (예컨대, SwissProt Accession number Q99ZW2(NP_269215.1); 서열번호 4);
캄필로박터 속, 예컨대, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질;
스트렙토코커스 속, 예컨대, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 또는 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질;
네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 Cas9 단백질;
파스테우렐라 (Pasteurella) 속, 예컨대, 파스테우렐라 물토시다 (Pasteurella multocida) 유래의 Cas9 단백질;
프란시셀라 (Francisella) 속, 예컨대, 프란시셀라 노비시다 (Francisella novicida) 유래의 Cas9 단백질
등으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
일 예에서, 상기 Cas9 단백질이 스트렙토코커스 피요게네스 (Streptococcus pyogenes) 유래의 것인 경우, 상기 PAM 서열은 5'-NGG-3' (N은 A, T, G, 또는 C임)이고, 상기 PAM 서열의 5' 말단쪽으로 3번째 뉴클레오타이드와 4번째 뉴클레오타이드 사이가 절단되며, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대응하는 상보적 가닥의 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산 부위 (보다 구체적으로, PAM 서열이 위치하는 가닥과 상보적 가닥의 상기 표적 핵산 서열)와 혼성화하는 것일 수 있다.
다른 예에서, 상기 Cas9 단백질이 캄필로박터 제주니 (Campylobacter jejuni) 유래의 것인 경우, 상기 PAM 서열은 5'-NNNNRYAC-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임)이고, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대응하는 상보적 가닥의 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산 부위와 혼성화하는 것일 수 있다.
다른 예에서, 상기 Cas9 단백질이 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래의 것인 경우, 상기 PAM 서열은 5'-NNAGAAW-3' (N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임)이고, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대응하는 상보적 가닥의 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산 부위와 혼성화하는 것일 수 있다.
다른 예에서, 상기 Cas9 단백질이 네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 것인 경우, 상기 PAM 서열은 5'-NNNNGATT-3'(N은 각각 독립적으로 A, T, C 또는 G임)이고, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대응하는 상보적 가닥의 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산 서열 부위와 혼성화하는 것일 수 있다.
다른 예에서, 상기 Cas9 단백질이 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 것인 경우, 상기 PAM 서열은 5'-NNGRR(T)-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함)이고, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대응하는 상보적 가닥의 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산 부위와 혼성화하는 것일 수 있다.
Cpf1 단백질은 상기 CRISPR/Cas 시스템과는 구별되는 새로운 CRISPR 시스템의 엔도뉴클레아제로서, Cas9에 비해 상대적으로 크기가 작고 tracrRNA가 필요 없으며, 단일 가이드 RNA에 의해 작용할 수 있다. 또한, 티민 (thymine)이 풍부한 PAM (protospacer-adjacent motif) 서열을 인식하고 DNA의 이중 사슬을 잘라 점착종단 (cohesive end; cohesive double-strand break)을 생성한다.
예컨대, 상기 Cpf1 단백질은 캔디다투스 (Candidatus) 속, 라치노스피라 (Lachnospira) 속, 뷰티리비브리오 (Butyrivibrio) 속, 페레그리니박테리아 (Peregrinibacteria), 액시도미노코쿠스 (Acidominococcus) 속, 포르파이로모나스 (Porphyromonas) 속, 프레보텔라 (Prevotella) 속, 프란시셀라 (Francisella) 속, 캔디다투스 메타노플라스마 (Candidatus Methanoplasma), 또는 유박테리움 (Eubacterium) 속 유래의 것일 수 있고, 예컨대, Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasiicus, Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Smiihella sp. (SC_KO8D17), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, Candidatus Paceibacter , Eubacterium eligens 등으로부터 선택된 1종 이상의 미생물 유래의 것일 수 있으나, 이에 제한되는 것은 아니다 .
엔도뉴클레아제로 Cpf1 단백질이 사용되는 경우, 상기 PAM 서열은 5'-TTN-3'(N은 A, T, C 또는 G임)이고, 절단되는 위치는 목적 유전자 내의 PAM 서열의 5' 말단 또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 21bp 내지 23bp의 염기서열 부위 내에 위치할 수 있고, 가이드 RNA는 상기 PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 21bp 내지 23bp의 표적 핵산 부위와 혼성화하는 것일 수 있다.
상기 표적 특이적 엔도뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것(non-naturally occurring)일 수 있다. 상기 표적 특이적 엔도뉴클레아제는 in vitro에서 미리 전사된 mRNA 또는 미리 생산된 단백질 형태, 또는 표적 세포 또는 생체 내에서 발현하기 위하여 재조합 벡터에 포함된 형태로 사용될 수 있다. 일 예에서, 상기 표적 특이적 엔도뉴클레아제 (예컨대, Cas9, Cpf1, 등)는 재조합 DNA(Recombinant DNA; rDNA)에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 표적 특이적 엔도뉴클레아제를 생산 (in vivo 또는 in vitro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 코딩 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 뉴클레오타이드 서열을 갖는 것일 수 있다.
본 명세서에서 사용된 상기 표적 특이적 엔도뉴클레아제는 변이된 형태의 변이 표적 특이적 엔도뉴클레아제일 수 있다. 상기 변이 표적 특이적 엔도뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니카아제 활성을 갖도록 변이된 변이 표적 특이적 엔도뉴클레아제 및 엔도뉴클레아제 활성과 니카아제 활성을 모두 상실하도록 변이된 변이 표적 특이적 엔도뉴클레아제 중에서 선택된 1종 이상일 수 있다. 이와 같은 표적 특이적 엔도뉴클레아제의 변이 (예컨대, 아미노산 치환 등)는 적어도 뉴클레아제의 촉매 활성 도메인 (예컨대, Cas9의 경우 RuvC 촉매 도메인)에서 일어나는 것일 수 있다. 일 예에서, 상기 표적 특이적 엔도뉴클레아제가 스트렙토코커스 피요젠스 유래 Cas9 단백질 (SwissProt Accession number Q99ZW2(NP_269215.1); 서열번호 4)인 경우, 상기 변이는 촉매 활성을 갖는 아스파르트산 잔기 (catalytic aspartate residue; 예컨대, 서열번호 4의 경우 10번째 위치의 아스파르트산 (D10) 등), 서열번호 4의 762번째 위치의 글루탐산 (E762), 840번째 위치의 히스티딘 (H840), 854번째 위치의 아스파라긴 (N854), 863번째 위치의 아스파라긴 (N863), 986번째 위치의 아스파르트산 (D986) 등으로 이루어진 군에서 선택된 하나 이상 임의의 다른 아미노산으로 치환된 돌연변이를 포함할 수 있다. 이 때, 치환되는 임의의 다른 아미노산은 알라닌 (alanine)일 수 있지만, 이에 제한되지 않는다.
다른 예에서, 상기 변이 표적 특이적 엔도뉴클레아제는 야생형 Cas9 단백질과 상이한 PAM 서열을 인식하도록 변이된 것일 수 있다. 예컨대, 상기 변이 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 1135번째 위치의 아스파르트산 (D1135), 1335번째 위치의 아르기닌 (R1335), 및 1337번째 위치의 트레오닌 (T1337) 중 하나 이상, 예컨대 3개 모두가 다른 아미노산으로 치환되어, 야생형 Cas9의 PAM 서열 (NGG)와 상이한 NGA (N은 A, T, G, 및 C 중에서 선택된 임의의 염기임)을 인식하도록 변이된 것일 수 있다.
일 예에서, 상기 변이 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산 서열 (서열번호 4) 중,
(1) D10, 또는 H840;
(2) D1135, R1335, T1337, 또는 D1135 + R1335 + T1337; 또는
(3) (1)과 (2) 잔기 모두
에서 아미노산 치환이 일어난 것일 수 있다.
본 명세서에 사용된 바로서, 상기 '다른 아미노산'은, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴산, 시스테인, 글루타민, 글리신, 세린, 트레오닌, 티로신, 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 상기 아미노산들의 공지된 모든 변형체 중에서, 야생형 단백질이 원래 변이 위치에 갖는 아미노산을 제외한 아미노산들 중에서 선택된 아미노산을 의미한다. 일 예에서, 상기 '다른 아미노산'은 알라닌, 발린, 글루타민, 또는 아르기닌일 수 있다.
또 다른 예에서, 상기 변이 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산 서열 (Q99ZW2(NP_269215.1))에 대하여 다음의 변이(치환)를 갖는 것일 수 있다:
off-target effect를 줄인 Cas9 mutant
Cas9 종류 Mutations
Sniper Cas9 F539S/M763I/K890N
evoCas9 M495V/Y515N/K526E/R661Q
HypaCas9 N692A/M694A/Q695A/H698A
HeFSpCas9 N497A/R661A/Q695A/K848A/Q926A/K1003A/R1060A
SpCas9-HF N497A/R661A/Q695A/Q926A
eSpCas9 (1.1) K848A/K1003A/R1060A
다른 PAM 서열을 인식하는 Cas9 mutant
Cas9 종류 Mutations
xCas9-3.7 A262T/R324L/S409I/E480K/E543D/M694I/E1219V
상기 "가이드 RNA (guide RNA)"는 세포 내 유전체의 특정 핵산 서열 (이하, 표적 핵산 서열)에 혼성화 가능한 표적화 서열을 포함하는 RNA를 의미하며, 생체 외 (in vitro) 또는 생체 (또는 세포) 내에서 Cas 단백질, Cpf1 등과 같은 RNA-가이드 엔도뉴클레아제와 결합하여 이를 목적 유전자 (또는 목적 유전자 내의 표적 부위)로 인도하는 역할을 한다. 상기 가이드 RNA는 RNA 형태 또는 이를 암호화하는 DNA 형태로 RNA-가이드 엔도뉴클레아제와 결합되거나 결합되지 않은 상태로 숙주 세포에 도입될 수 있다.
상기 가이드 RNA는 복합체를 형성할 엔도뉴클레아제의 종류 및/또는 그 유래 미생물에 따라서 적절히 선택될 수 있다.
예컨대, 상기 가이드 RNA는,
표적 핵산 서열과 혼성화 가능한 부위 (표적화 서열)을 포함하는 CRISPR RNA (crRNA);
Cas 단백질, Cpf1 등과 같은 뉴클레아제와 상호작용하는 부위를 포함하는 trans-activating crRNA (tracrRNA); 및
상기 crRNA 및 tracrRNA의 주요 부위 (예컨대, 표적화 서열을 포함하는 crRNA 부위 및 뉴클레아제와 상호작용하는 tracrRNA의 부위)가 융합된 형태의 단일 가이드 RNA (single guide RNA; sgRNA)
로 이루어진 군에서 선택된 1종 이상일 수 있으며,
구체적으로 CRISPR RNA (crRNA) 및 trans-activating crRNA (tracrRNA)를 포함하는 이중 RNA (dual RNA), 또는 crRNA 및 tracrRNA의 주요 부위를 포함하는 단일 가이드 RNA (sgRNA)일 수 있다.
상기 sgRNA는 표적 핵산 서열과 상보적인 서열 (표적화 서열)을 가지는 부분 (이를 Spacer region, Target DNA recognition sequence, base pairing region 등으로도 명명함) 및 Cas 단백질과의 결합을 위한 hairpin 구조를 포함할 수 있다. 보다 구체적으로, 표적화 서열을 포함하는 부분, Cas 단백질 결합을 위한 hairpin 구조, 및 Terminator 서열을 포함할 수 있다. 상기 기술된 구조는 5'에서 3' 방향으로 순차적으로 존재하는 것일 수 있으나, 이에 제한되는 것은 아니다. 상기 가이드 RNA가 crRNA 및 tracrRNA의 주요 부분 및 표적 DNA의 상보적인 부분을 포함하는 경우라면 어떠한 형태의 가이드 RNA도 본 발명에서 사용될 수 있다.
예컨대, Cas9 단백질은 표적 유전자 교정을 위하여 두 개의 가이드 RNA, 즉, 표적 유전자의 표적 부위와 혼성화 가능한 뉴클레오타이드 서열을 갖는 CRISPR RNA (crRNA)와 Cas9 단백질와 상호작용하는 trans-activating crRNA (tracrRNA; Cas9 단백질과 상호작용함)를 필요로 하며, 이들 crRNA와 tracrRNA는 서로 결합된 이중 가닥 crRNA:tracrRNA 복합체 형태, 또는 링커를 통하여 연결되어 단일 가이드 RNA (single guide RNA; sgRNA) 형태로 사용될 수 있다. 일 예에서, Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, sgRNA는 적어도 상기 crRNA의 혼성화 가능한 뉴클레오타이드 서열을 포함하는 crRNA 일부 또는 전부와 상기 Cas9의 tracrRNA의 Cas9 단백질과 상호작용하는 부위를 적어도 포함하는 tracrRNA 일부 또는 전부가 뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때 뉴클레오타이드 링커가 루프 구조에 해당할 수 있음).
상기 가이드 RNA, 구체적으로 crRNA 또는 sgRNA는 표적 핵산 서열과 상보적인 서열(표적화 서열)을 포함하며, crRNA 또는 sgRNA의 업스트림 부위, 구체적으로 sgRNA 또는 dualRNA의 crRNA의 5' 말단에 하나 이상, 예컨대, 1-10개, 1-5개, 또는 1-3개의 추가의 뉴클레오티드를 포함할 수 있다. 상기 추가의 뉴클레오티드는 구아닌 (guanine, G)일 수 있으나, 이에 제한되는 것은 아니다.
다른 예에서, 상기 뉴클레아제가 Cpf1인 경우, 상기 가이드 RNA는 crRNA을 포함하는 것일 수 있으며, 복합체를 형성할 Cpf1 단백질 종류 및/또는 그 유래 미생물에 따라서 적절히 선택될 수 있다.
상기 가이드 RNA의 구체적 서열은 뉴클레아제 (Cas9 또는 Cpf1)의 종류 (즉, 유래 미생물)에 따라서 적절히 선택할 수 있으며, 이는 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자가 용이하게 알 수 있는 사항이다.
일 예에서, 표적 특이적 엔도뉴클레아제로서 Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, crRNA는 다음의 일반식 1로 표현될 수 있다:
5'-(Ncas9)l-(GUUUUAGAGCUA)-(Xcas9)m-3' (일반식 1: 서열번호 5)
상기 일반식 1에서,
Ncas9는 표적화 서열, 즉 표적 핵산 서열에 따라서 결정되는 부위 (표적 핵산 서열과 혼성화 가능)이며, l은 상기 표적화 서열에 포함된 뉴클레오타이드 수를 나타내는 것으로 15 내지 30, 17 내지 23, 또는 18 내지 22의 정수, 예컨대 20일 수 있고,
상기 표적화 서열의 3' 방향으로 인접하여 위치하는 연속하는 12개의 뉴클레오타이드(GUUUUAGAGCUA) (서열번호 1)를 포함하는 부위는 crRNA의 필수적 부분이고,
Xcas9는 crRNA의 3' 말단쪽에 위치하는 (즉, 상기 crRNA의 필수적 부분의 3' 방향으로 인접하여 위치하는) m개의 뉴클레오타이드를 포함하는 부위로, m은 8 내지 12의 정수, 예컨대 11일 수 있으며, 상기 m개의 뉴클레오타이드들은 서로 같거나 다를 수 있으며, 각각 독립적으로 A, U, C 및 G로 이루어진 군에서 선택될 수 있다.
일 예에서, 상기 Xcas9는 UGCUGUUUUG (서열번호 2)를 포함할 수 있으나 이에 제한되지 않는다.
또한, 상기 tracrRNA는 다음의 일반식 2로 표현될 수 있다:
5'-(Ycas9)p-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3' (일반식 2: 서열번호 6)
상기 일반식 2에서,
60개의 뉴클레오타이드 (UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC) (서열번호 3)로 표시된 부위는 tracrRNA의 필수적 부분이고,
Ycas9는 상기 tracrRNA의 필수적 부분의 5' 말단에 인접하여 위치하는 p개의 뉴클레오타이드를 포함하는 부위로, p는 6 내지 20의 정수, 예컨대 8 내지 19의 정수일 수 있으며, 상기 p개의 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.
또한, sgRNA는 상기 crRNA의 표적화 서열과 필수적 부위를 포함하는 crRNA 부분과 상기 tracrRNA의 필수적 부분 (60개 뉴클레오타이드)를 포함하는 tracrRNA 부분이 올리고뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때, 올리고뉴클레오타이드 링커가 루프 구조에 해당함). 보다 구체적으로, 상기 sgRNA는 crRNA의 표적화 서열과 필수적 부분을 포함하는 crRNA 부분과 tracrRNA의 필수적 부분을 포함하는 tracrRNA 부분이 서로 결합된 이중 가닥 RNA 분자에서, crRNA 부위의 3' 말단과 tracrRNA 부위의 5' 말단이 올리고뉴클레오타이드 링커를 통하여 연결된 헤어핀 구조를 갖는 것일 수 있다.
일 예에서, sgRNA는 다음의 일반식 3으로 표현될 수 있다:
5'-(Ncas9)l-(GUUUUAGAGCUA)-(올리고뉴클레오타이드 링커)-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3' (일반식 3: 서열번호 7)
상기 일반식 3에서, (Ncas9)l는 표적화 서열로서 앞서 일반식 1에서 설명한 바와 같다.
상기 sgRNA에 포함되는 올리고뉴클레오타이드 링커는 3 내지 5개, 예컨대 4개의 뉴클레오타이드를 포함하는 것일 수 있으며, 상기 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.
상기 crRNA 또는 sgRNA는 5' 말단 (즉, crRNA의 타겟팅 서열 부위의 5' 말단)에 1 내지 3개의 구아닌(G)을 추가로 포함할 수 있다.
상기 tracrRNA 또는 sgRNA는 tracrRNA의 필수적 부분(60nt)의 3' 말단에 5개 내지 7개의 우라실 (U)을 포함하는 종결부위를 추가로 포함할 수 있다.
다른 예에서, 표적 특이적 엔도뉴클레아제가 Cpf1 시스템인 경우, 가이드 RNA (crRNA)는 다음의 일반식 4로 표현될 수 있다:
5'-n1-n2-A-U-n3-U-C-U-A-C-U-n4-n5-n6-n7-G-U-A-G-A-U-(Ncpf1)q-3' (일반식 4: 서열번호 8).
상기 일반식 4에서,
n1은 존재하지 않거나, U, A, 또는 G이고, n2는 A 또는 G이고, n3은 U, A, 또는 C이고, n4는 존재하지 않거나 G, C, 또는 A이고, n5는 A, U, C, G, 또는 존재하지 않고, n6은 U, G 또는 C이고, n7은 U 또는 G이며,
Ncpf1는 표적 핵산 부위와 혼성화 가능한 뉴클레오타이드 서열을 포함하는 표적화 서열로서 표적 핵산 서열에 따라서 결정되며, q는 포함된 뉴클레오타이드 수를 나타내는 것으로, 15 내지 30의 정수일 수 있다. 상기 표적 유전자의 표적 서열 (crRNA와 혼성화 하는 서열)은 PAM 서열 (5'-TTN-3' 또는 5'-TTTN-3'; N은 임의의 뉴클레오타이드로서, A, T, G, 또는 C의 염기를 갖는 뉴클레오타이드임)의 3' 방향으로 인접하여 위치하는 (예컨대, 연속하는) 15 내지 30개의 표적 유전자의 표적 부위의 뉴클레오타이드 서열이다.
상기 일반식 4에서 5' 말단에서 카운팅하여 6번째부터 10번째까지의 5개의 뉴클레오타이드 (5' 말단 스템 부위)와 15번째 (n4가 존재하는 경우 16번째)부터 19번째 (n4가 존재하는 경우 20번째)까지의 5개 뉴클레오타이드(3' 말단 스템 부위)은 서로 역평행 (antiparallel)하게 상보적 뉴클레오타이드로 이루어져 이중 가닥 구조 (스템 구조)를 형성하고, 상기 5' 말단 스템 부위와 3' 말단 스템 부위 사이의 3 내지 5개 뉴클레오타이드가 루프 구조를 형성할 수 있다.
상기 Cpf1 단백질의 crRNA (예컨대, 일반식 4로 표현됨)는 5' 말단에 1 내지 3개의 구아닌(G)을 추가로 포함할 수 있다.
Cpf1 유래 미생물에 따라 사용 가능한 Cpf1 단백질의 crRNA 서열의 5' 말단 부위 서열 (표적화 서열 부위 제외한 부분)을 표 2에 예시적으로 기재하였다:
Cpf1 유래 미생물 가이드 RNA (crRNA)의 5' 말단 부위 서열 (5'-3')
Parcubacteria bacterium GWC2011_GWC2_44_17 (PbCpf1) AAAUUUCUACU-UUUGUAGAU
Peregrinibacteria bacterium GW2011_GWA_33_10 (PeCpf1) GGAUUUCUACU-UUUGUAGAU
Acidaminococcus sp. BVBLG (AsCpf1) UAAUUUCUACU-CUUGUAGAU
Porphyromonas macacae (PmCpf1) UAAUUUCUACU-AUUGUAGAU
Lachnospiraceae bacterium ND2006 (LbCpi1) GAAUUUCUACU-AUUGUAGAU
Porphyromonas crevioricanis(PcCpf1) UAAUUUCUACU-AUUGUAGAU
Prevotella disiens (PdCpf1) UAAUUUCUACU-UCGGUAGAU
Moraxella bovoculi 237 (MbCpf1) AAAUUUCUACUGUUUGUAGAU
Leptospira inadai (LiCpf1) GAAUUUCUACU-UUUGUAGAU
Lachnospiraceae bacterium MA2020 (Lb2Cpf1) GAAUUUCUACU-AUUGUAGAU
Francisella novicida U112 (FnCpf1) UAAUUUCUACU-GUUGUAGAU
Candidatus Methanoplasma termitum (CMtCpf1) GAAUCUCUACUCUUUGUAGAU
Eubacterium eligens (EeCpf1) UAAUUUCUACU--UUGUAGAU
(-: 뉴클레오타이드가 존재하지 않음을 의미)상기 가이드 RNA의 표적화 서열이 결합 (혼성화)하는 목적 유전자의 표적 핵산 서열은 목적 유전자 상의 PAM (Protospacer Adjacent Motif) 서열의 5' 및/또는 3' 말단에 인접하여 위치하는 약 17개 내지 약 23개 또는 약 18개 내지 약 22개, 예컨대 20개의 연속하는 핵산 서열 (1) 또는 이의 상보적 서열 (2)로 표현될 수 있다. 이 때, 가이드 RNA의 표적화 서열이 실제로 결합하는 서열은 상보적 서열(2)일 수 있다.
상기 목적 유전자의 표적 핵산 서열은, 목적 유전자의 시작 코돈 부위 (예컨대, 시작 코돈의 5' 말단 부위) 중에서, 어느 하나의 핵산 서열에 혼성화 가능한 가이드 RNA (또는 표적화 서열)가 상기 핵산 서열과 비교하여 3개 이하, 2개 이하, 또는 1개의 불일치 서열 (mismatch)을 포함하는 다른 핵산 서열에 대하여 혼성화 정도가 현저히 낮거나 (예컨대, 상기 가이드 RNA를 사용한 유전자 교정시 DNA 변이 비율이 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 또는 0.001% 미만), 혼성화하지 않는 핵산 서열들 중에서 선택된 것일 수 있다.
상기 가이드 RNA의 표적화 서열은 상기 표적 핵산 서열 (즉, PAM 서열이 위치하는 DNA 가닥의 표적 핵산 부위 또는 이의 상보적 가닥의 표적 핵산 부위의 핵산 서열)과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오타이드 서열을 의미하는 것으로, 상기 상보적 가닥의 뉴클레오타이드 서열과 상보적 결합이 가능하다. 이하, 특별한 언급이 없는 한 동일한 의미로 사용되며, 상기 서열 상동성은 통상적인 서열 비교 수단 (예컨대, BLAST, GCG (Genetics Computer Group, Madison Wis.) 프로그램 패키지 등)를 사용하여 확인될 수 있다.
상기 방법에서, 상기 가이드 RNA와 RNA-가이드 엔도뉴클레아제 (예컨대, Cas9 단백질)의 세포 내로의 형질도입은 상기 가이드 RNA와 RNA-가이드 엔도뉴클레아제를 통상적인 방법 (예컨대, 전기천공 등)으로 직접 세포에 도입하거나, 상기 가이드 RNA를 암호화하는 DNA 분자와 RNA-가이드 엔도뉴클레아제를 암호화하는 유전자를 하나의 벡터 또는 각각 별개의 벡터 (예컨대, 플라스미드, 바이러스 벡터 등)에 포함된 상태로 세포에 도입하거나, mRNA delivery를 통하여 수행할 수 있다.
상기 RNA-가이드 엔도뉴클레아제 (예컨대, Cas9 단백질) 또는 이의 암호화 핵산 분자, 가이드 RNA 또는 이의 암호화 DNA 분자, 또는 상기 핵산 분자 및 DNA 분자 중 하나 이상을 포함하는 벡터는 각각 미세주입법(microinjection), 전기천공법(electroporation), DEAE-덱스트란 처리(DEAE-dextran treatment), 리포펙션(lipofection), 나노파티클-매개 형질주입, 단백질 전달 도메인(Protein translocation domain, PTD) 매개 도입, 바이러스-매개 유전자 전달, PEG-매개 트랜스펙션 등과 같은 당업계의 다양한 방법에 의해 세포로 도입(전달)될 수 있으나, 이에 제한되는 것은 아니다.
또한, 숙주 세포의 핵내 전달을 위하여, 상기 RNA-가이드 엔도뉴클레아제 (예컨대, Cas9 단백질)는 적절한 핵 위치화 신호 (nuclear localization signal)를 추가로 포함할 수 있다.
상기 "절단(cleavage)"은 핵산 서열의 covalent backbone의 파손(breakage)을 의미한다. 상기 절단은 포스포다이에스터(phosphodiester) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일-가닥의 절단 및 이중-가닥의 절단 모두 가능하며, 이중-가닥의 절단은 두 개의 구별되는(distinct) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end를 생성할 수 있다.
본 명세서에 사용된 바로서, 용어 "도너 (donor) DNA 구조체"는 숙주 세포의 유전체 내에 삽입하고자 하는 도너 DNA 분자 또는 상기 도너 DNA 분자를 포함하는 재조합 벡터 (제3 재조합 벡터)일 수 있다.
상기 도너 DNA 분자는 프로모터를 포함한다. 상기 프로모터는 숙주 세포 이외의 세포 (숙주 세포와 이종 세포)에서 유래하는 외래 프로모터로서, 숙주 세포의 발현 시스템의 조절 하에서 이와 작동가능하게 연결된 유전자의 과발현을 유도할 수 있는 모든 프로모터들 중에서 선택된 1종 이상일 수 있다. 예컨대, 상기 프로모터는 CMV 프로모터 (예컨대, 인간 CMV immediate-early 프로모터, 마우스 CMV immediate-early 프로모터 등), T7 프로모터, SP6 프로모터, rpr-1 프로모터, rrk 프로모터, U6 프로모터, UBC 프로모터, ACTB 프로모터, EF1A 프로모터, CAG 프로모터, SV40 프로모터, PGK 프로모터, TRE 프로모터 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
상기 프로모터는 숙주 세포의 유전체 내의 목적 폴리펩타이드를 암호화하는 목적 유전자의 시작 코돈의 5' 말단쪽 (예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5'-UTR 사이; 상기 "시작 코돈"은 시그널 펩타이드를 포함한 폴리펩타이드 또는 시그널 펩타이드를 제외한 목적 폴리펩타이드의 첫 번째 아미노산을 암호화하는 코돈을 의미할 수 있음, 이하 동일함)에 상기 목적 유전자와 작동 가능하게 연결되도록 삽입될 수 있다. 상기 용어 "작동 가능하게 연결된다(operatively linked)"고 함은 상기 프로모터와 목적 유전자 사이의 기능적인 결합(cis)을 의미한다. 상기 프로모터는 목적 유전자에 "작동 가능하게 연결(operatively linked)"됨으로써 목적 유전자의 전사 및/또는 해독을 조절할 수 있다. 상기 프로모터가 목적 유전자에 작동 가능하게 연결되기 위해서, 목적 유전자의 5' 말단 쪽에 연결된 것일 수 있다.
상기 프로모터는 앞서 설명한 표적 특이적 엔도뉴클레아제 시스템에 의하여 절단된 위치에 삽입될 수 있다. 따라서, 상기 표적 특이적 엔도뉴클레아제 시스템에 포함된 특정 표적 핵산 서열을 인식하는 핵산 분자 (예컨대, 가이드 RNA)는 상기 엔도뉴클레아제가 숙주 세포의 유전체 내의 목적 폴리펩타이드를 암호화하는 목적 유전자의 시작 코돈의 5' 말단쪽 (예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5'-UTR 사이)를 절단할 수 있도록 목적 유전자의 시작 코돈의 근처의 핵산 서열을 표적 핵산 서열로 인식하도록(즉, 표적화 서열이 상기 표적 핵산 서열과 혼성화 가능한 (상보적인) 서열을 갖도록) 설계된 것일 수 있다.
상기 프로모터는 숙주 세포의 유전체 내의 목적 유전자의 시작 코돈의 5' 말단쪽의 소정의 위치에 삽입되어, 원래의 내재 프로모터를 대체(치환)하여, 이와 작동가능하게 연결된 목적 유전자의 발현을 조절하는 것일 수 있다. 숙주 세포의 유전체 내의 목적 유전자의 시작 코돈의 5' 말단쪽의 소정의 위치에 삽입된 프로모터 (외래 프로모터)가 실제 숙주 세포 유전체 내의 내재 프로모터를 치환하는지 여부와 무관하게, 상기 내재 프로모터는 프로모터로서의 기능을 나타내지 않고, 목적 유전자는 삽입된 프로모터에만 의존적으로 발현하게 된다.
다른 예에서, 상기 도너 DNA 분자는, 앞서 설명한 바와 같은 외래 프로모터 이외에, 적절한 태그 암호화 핵산 분자 (태그 유전자), 선별 마커, 리포터 유전자, 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열(핵산 분자), 외래 인트론 (예컨대, SV40 인트론, CMV 인트론 A, 베타-글로빈 인트론, 유비퀴틴 인트론 (UbC 인트론), hGH 인트론 등으로 이루어진 군에서 선택된 1종 이상) 등으로 이루어진 군에서 선택된 1종 이상을 추가로 포함할 수 있다.
일 예에서, 상기 도너 DNA 분자는 앞서 설명한 바와 같은 외래 프로모터를 필수적으로 포함하는 것일 수 있다. 다른 예에서, 상기 도너 DNA 분자는 외래 프로모터에 더하여, 태그 암호화 핵산 서열을 추가로 포함하는 것일 수 있다. 이 경우, 상기 외래 프로모터와 태그 암호화 핵산 서열은 하나의 DNA 구조체에 함께 포함되거나 각각 다른 DNA 구조체에 각각 포함될 수 있다. 상기 외래 프로모터와 태그 암호화 핵산 서열이 하나의 DNA 구조체에 함께 포함되는 경우, 상기 외래 DNA 분자는, 5'에서 3' 방향으로, 외래 프로모터와 태그 암호화 핵산 서열(유전자)을 순차적으로 포함할 수 있다. 또한, 상기 외래 프로모터와 태그 암호화 핵산 서열이 하나의 DNA 구조체에 함께 포함되는 경우, 상기 도너 DNA 분자는 외래 프로모터 및 태그 암호화 핵산 서열에 더하여, 상기 태그 암호화 핵산 서열의 5' 말단에 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열을 추가로 포함하는 것일 수 있다 (이 경우, 상기 도너 DNA 분자는 5'에서 3' 방향으로, 외래 프로모터, 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열, 및 태그 암호화 핵산 서열을 순차적으로 포함하는 것일 수 있다). 다른 예에서, 상기 도너 DNA 분자는, 외래 프로모터 및 태그 암호화 핵산 서열, 및 상기 태그 암호화 핵산 서열의 5' 말단에 연결된 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열에 더하여, 선별마커 및 외래 인트론 (예컨대, SV40 인트론)으로 이루어진 군에서 선택된 1종 이상을 추가로 포함할 수 있다. 일 구체예에서, 상기 도너 DNA 분자는, 5'에서 3' 방향으로, (1) 선별 마커, (2) 외래 프로모터, (3) SV40 인트론, (4) 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열, 및 (5) 태그 암호화 핵산 서열을 순차적으로 포함하는 것일 수 있다.
상기 태그는 숙주 세포에서 생산된 내인성 목적 폴리펩타이드의 분리 및/또는 정제를 용이하게 위한 것으로, 상기 DNA 분자의 N-말단 암호화 부위 (5' 말단쪽), C-말단 암호화 부위 (3' 말단쪽), 또는 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열의 하류 (3' 말단쪽)에 연결된 것일 수 있다. 상기 태그가 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열의 하류에 연결되는 경우, 숙주 세포 내에서 목적 폴리펩타이드 발현시 시그널 펩타이드가 잘려나가면 태그의 N-말단이 노출되어 상기 태그에 특이적으로 결합 가능한 물질 (예컨대, 항체 등)에 의하여 용이하게 검출 및/또는 정제할 수 있다. 상기 태그는 예컨대 항체와 결합할 수 있고 형광, 발광, 발색 등의 신호를 발생시킬 수 있는, 통상적으로 사용되는 모든 태그들 중에서 선택될 수 있으며, 예컨대, c-myc, 6x His, FLAG, HA, V5, TAP 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
상기 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열은 세포 외에서 인위적으로 얻어진 (합성된) 핵산 서열일 수 있다. 상기 도너 DNA 구조체가 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열을 포함하는 경우, 표적 특이적 엔도뉴클레아제 시스템은 내인성 목적 폴리펩타이드의 아미노산 서열 중 시그널 펩타이드 암호화 핵산 서열의 3' 말단 또는 내부를 절단하도록 설계된 것일 수 있고, 예컨대, 내인성 목적 폴리펩타이드의 아미노산 서열 중 시그널 펩타이드를 제외한 첫 번째 아미노산을 암호화하는 코돈의 5' 말단쪽 인접 부위를 절단하도록 설계된 것일 수 있다.
상기 선별 마커는 상기 도너 DNA 구조체가 삽입된 숙주 세포를 선별하기 위한 가이드 기능을 하는 유전자로서, 약물 내성 마커, 형광 마커, 발광 마커, 대사 관련 마커, 유전자 증폭 마커 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다. 상기 형광 마커는 형광 단백질(예를 들면 녹색 형광 단백질(GFP), 시안 형광 단백질(CFP), 황색 형광 단백질(YFP), 적색 형광 단백질(dsRFP) 등)을 암호화하는 유전자들로 이루어진 군에서 선택된 1종 이상일 수 있지만, 이에 한정되지는 것은 아니다. 상기 발광 마커는 루시페라제 등의 발광 단백질을 암호화하는 유전자들로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 한정되는 것은 아니다. 상기 약물 내성 마커는 항생 물질(예를 들면 암피실린, 스트렙토마이신, 겐타마이신, 카나마이신, 하이그로마이신, 테트라사이클린, 클로람페니콜, 네오마이신, 블라스티시딘, 제오신, 퓨로마이신 등)에 대한 내성 유전자들로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 한정되지는 것은 아니다. 상기 대사관련 마커는 티미딘 키나아제 (TK) 유전자, 디하이드로폴레이트 환원효소 (Dihydrofolate reductase, DHFR) 유전자, 글루타민 합성효소 (Glutamine synthetase, GS) 유전자 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
상기 리포터 유전자는 특정 DNA가 삽입된 세포의 선별에 통상적으로 사용되는 모든 유전자들 중에서 선택될 수 있으며, 예컨대, 트랜스펙션된 콜로니의 블루/화이트 선택을 용이하게 하기 위한 lacZ 리포터 유전자일 수 있으나, 이에 한정되는 것은 아니다.
일 예에서, 상기 도너 DNA 구조체는 5'에서 3' 방향으로 선별마커, 외래 프로모터, SV40 인트론, 시그널 펩타이드, 및 태그를 포함하는 것일 수 있다 (도 1 참조). 도 1은 상기 도너 DNA 구조체가 표적 특이적 엔도뉴클레아제 시스템에 의하여 목적 유전자의 시작 코돈의 5' 말단쪽의 특정 위치에 삽입되는 과정을 모식적으로 보여준다.
다른 예에서, 상기 도너 DNA 분자는 외래 프로모터와 태그 유전자를 포함하는 것일 수 있고, 이 경우, 상기 외래 프로모터와 태그 유전자는 각각 별개의 재조합 벡터에 포함하는 것일 수 있다 (즉, 상기 도너 DNA 구조체는 외래 프로모터 포함 재조합 벡터와 태그 유전자 포함 재조합 벡터를 포함하는 것일 수 있다). 이 때, 상기 외래 프로모터와 태그 유전자는 숙주 세포의 유전체 내의 서로 다른 위치에 삽입될 수 있다. 예컨대, 외래 프로모터는 앞서 설명한 위치, 즉 숙주 세포의 유전체 내의 목적 유전자의 시작 코돈의 5' 말단쪽의 소정의 위치에 삽입되고, 태그 유전자는 목적 유전자의 시작 코돈, 종결 코돈 또는 내인성 펩타이드 절단 부위(내인성 목적 폴리펩타이드의 시그널 펩타이드가 절단되어 목적 폴리펩타이드로부터 분리되는 부위 또는 자체적 프로세싱되어 절단되는 부위)에 도입(삽입)될 수 있다. 이와 같은 외래 프로모터 및 태그 유전자의 삽입 위치는 목적 유전자의 종류와 목적에 따라 다양하게 선택할 수 있다. 예컨대, 상기 태그 유전자를 시작코돈 (5' UTR) 및/또는 종결 코돈(3' UTR) 에 도입하여 N-말단 및/또는 C-말단에 태그를 삽입할 수 있으며, 또는 내인성 펩타이드 절단 부위에 도입하여 상기 목적 유전자에 의하여 발현된 목적 폴리펩타이드가 세포 내에서 분해효소에 의하여 절단되어 프로세싱되는 부위에 태그를 삽입할 수 있다. 본 발명의 일 구체예에 따르면, 태그 유전자를 RELN 유전자의 시작 코돈에서부터 시작하는 시그널 펩타이드 뒤쪽에 삽입할 수 있다. 이와 같이 외래 프로모터와 태그 유전자를 서로 숙주 세포의 유전체 내의 서로 다른 위치에 도입 (삽입)하기 위하여, 서로 다른 부위를 표적으로 하는 2개 이상의 표적 특이적 엔도뉴클레아제 시스템을 사용할 수 있다.
상기 도너 DNA 구조체는 미세주입법(microinjection), 전기천공법(electroporation), DEAE-덱스트란 처리(DEAE-dextran treatment), 리포펙션(lipofection), 나노파티클-매개 형질주입, 단백질 전달 도메인(Protein translocation domain, PTD) 매개 도입, 바이러스-매개 유전자 전달, PEG-매개 트랜스펙션 등과 같은 당업계의 다양한 방법에 의해 숙주 세포에 도입(전달)될 수 있으나, 이에 제한되는 것은 아니다.
일 예에서, 상기 표적 특이적 엔도뉴크레아제 시스템 및/또는 도너 DNA 구조체는 통상의 벡터를 통하여 숙주 세포에 도입될 수 있다. 상기 벡터는 바이러스 벡터일 수 있다. 상기 바이러스 벡터는 레트로바이러스, 아데노바이러스 파보바이러스 (예컨대, 아데노관련(adenoassociated) 바이러스 (AAV)), 코로나바이러스, 오르소믹소바이러스(orthomyxovirus)와 같은 음성 가닥 RNA 바이러스들 (예컨대 인플루엔자 바이러스), 랩도바이러스(rhabdovirus) 예컨대, 광견병 및 소포성 구내염 바이러스), 파라믹소바이러스(paramyxovirus) (예컨대, 홍역 및 센다이(Sendai), 알파바이러스(alphavirus) 및 피코르나바이러스(picornavirus)와 같은 양성 가닥 RNA 바이러스들, 및 헤르페스바이러스(예컨대, 단순포진(Herpes Simplex) 바이러스 타입들 1 및 2, 엡스타인(Epstein)-바(Barr) 바이러스, 사이토메갈로바이러스(cytomegalovirus)), 아데노바이러스를 포함하는 이중-가닥의 DNA 바이러스들, 폭스바이러스(poxvirus)(예컨대, 우두(vaccinia), 계두(fowlpox), 카나리아두창(canarypox)) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
본 명세서에 제공된 바와 같이, 숙주 세포의 유전체에 존재하는 내인성 목적 폴리펩타이드를 암호화하는 목적 유전자의 특정 위치에 외래 프로모터가 삽입됨으로써, 외래 프로모터가 삽입되지 않은 경우와 비교하여, 목적 폴리펩타이드의 발현량이 20% 이상(1.2배 이상), 30% 이상(1.3배 이상), 40% 이상(1.4배 이상), 50% 이상(1.5배 이상), 60% 이상(1.6배 이상), 70% 이상(1.7배 이상), 80% 이상(1.8배 이상), 90% 이상(1.9배 이상), 100% 이상(2배 이상), 110% 이상(2.1배 이상), 120% 이상(2.2배 이상), 130% 이상(2.3배 이상), 140% 이상(2.4배 이상), 150% 이상(2.5배 이상), 200%(3배 이상) 이상, 300% 이상 (4배 이상), 400% 이상 (5배 이상), 500% 이상 (6배 이상), 600% 이상 (7배 이상), 700% 이상 (8배 이상), 800% 이상 (9배 이상), 900% 이상 (10배 이상), 또는 1000% 이상 (11배 이상) 증가할 수 있다.
본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 프로모터 교체 및 태그 삽입은 목적 폴리펩타이드의 크기에 따른 한계를 극복할 수 있는 방법으로, 표적 특이적 엔도뉴클레아제 (예컨대, Cas9)에 의해 유도되는 상동 의존성 복구 (HDR)을 통해 원하는 서열 (외래 프로모터 및 태그)을 원하는 위치에 정확하게 삽입할 수 있고, 내인성 유전자를 발현시키므로, 유전자의 크기나 반복서열의 존재와 같이 재조합에 어려움을 주는 요소들의 영향을 전혀 받지 않고, 목적 폴리펩타이드의 안정적인 과발현이 가능하고 정제가 용이하다는 이점이 있다. 또한 유전자의 발현에는 암호화 서열 (CDS) 뿐만 아니라 비암호화 서열(UTR)이나 인트론도 영향을 끼치는 것으로 알려져 있는데, 본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 유전자 태그 삽입은 이러한 단백질이 발현되는 본래의 세포의 genetic context를 그대로 이용할 수 있으므로 유전자 발현을 위한 최적의 조건을 유지할 수 있다는 장점도 갖는다.
도 1은 일 실시예에 따른 내인성 목적 폴리펩타이드의 과발현을 위하여 프로모터와 항체 태그를 숙주 세포의 유전체 내에 삽입하는 과정을 예시적으로 보여주는 모식도이다.
도 2는 Reelin 유전자 내의 특정 표적 핵산 서열에 특이적으로 결합하는 다양한 sgRNA를 사용한 유전자 교정 결과 얻어진 DNA 돌연변이 비율을 보여주는 결과이다.
도 3a 내지 3c는 유세포 분석을 통해 RELN 유전자에 외래 과발현 프로모터와 태그 유전자가 삽입된 인간 세포의 분리 결과를 나타낸 것이다.
도 4a 및 4b는 RELN 유전자에 외래 과발현 프로모터와 태그 유전자가 삽입된 인간 단일 세포주의 배양 배지에서의 Reelin 단백질의 검출 결과(4a: western blotting; 4b: 정량결과)를 나타낸 것이다.
도 5 RELN 유전자에 외래 과발현 프로모터와 태그 유전자가 삽입된 인간 세포의 배양 배지로부터의 Reelin 단백질의 검출 결과(immune-precipetation)를 나타낸 것이다.
도 6은 pAAY-hygro-sfGFP 플라스미드의 개열지도이다.
이하에서는 실시예를 들어 본 발명을 더욱 구체적으로 설명하고자 하나, 이는 예시적인 것에 불과할 뿐 본 발명의 범위를 제한하고자 함이 아니다. 아래 기재된 실시예들은 발명의 본질적인 요지를 벗어나지 않는 범위에서 변형될 수 있음은 당 업자들에게 있어 자명하다.
실시예 1: 인간 세포의 내인성 RELN 유전자에 외래 프로모터 삽입을 위한 도너 DNA 구조체의 제작
인간의 Reelin 단백질 (NP_005036.2)을 암호화는 RELN 유전자 (NG_011877.1)는 크기가 거대하고(genomic 150 kb, cDNA 11 kb) 모듈화된 반복서열이 유전자 내에 존재하여 유전자 재조합을 통해 인간세포에서 발현시키는 것이 불가능한 것으로 알려져 있다. 이러한 한계점을 극복하기 위하여 크리스퍼 유전자 가위를 이용하여 내인성 RELN 유전자에 태그와 과발현 프로모터를 삽입한 뒤 인간 세포주 (HEK293 세포)에서 Reelin 단백질의 분리 정제를 시도하였다.
도 1은 크리스퍼 유전자 가위를 이용한 과발현 프로모터와 항체 태그 삽입에 대한 모식도이다.
내인성의 RELN 유전자를 과발현 시키기 위하여, 과발현 프로모터인 CMV (Cytomegalovirus) 프로모터를 삽입하고 FLAG 항체 태그를 Reelin의 signal peptides 암호화 서열 하류(3' 말단쪽)에 연결하여 세포 내에서 signal peptide가 잘려 나가면 FLAG 태그의 N-말단이 노출되어 FLAG M1 항체에 의하여 검출 및 정제가 용이하도록 하였다. 또한, 유전자 주입된 세포를 주입되지 않은 세포와 쉽게 구분해 낼 수 있게 하기 위하여 선택 마커로 하이그로마이신 저항 유전자(하이그로마이신 포스포트랜스퍼레이즈(Hygromycin phosphotransferase) 유전자)와 super-fold Green fluorescene protein(sfGFP)가 결합된 마커(HygR-sfGFP)를 함께 삽입하였다. 이와 같이 제작한 주형 플라스미드를 Cas9 시스템을 이용하여 RELN 유전자의 시작 코돈에서부터 시작하는 시그널 펩타이드 뒤쪽에 삽입하였다. 주형 플라스미드 제작에는 pRG2 플라스미드 (ADDGENE 구입)과 pAAY-hygro-sfGFP 플라스미드(서열번호 21 및 도 6)을 사용하였다.
이와 같이 제작된 도너 DNA 구조체의 구성을 5'에서 3' 순서로 하기의 표 3에 정리하였다:
Figure 112018100768319-pat00001
실시예 2: 인간 세포의 내인성 RELN 유전자에 외래 프로모터 삽입을 위한 표적 핵산 서열 선별
상기 실시예 1에서 준비된 도너 DNA 구조체를 인간 숙주 세포(HEK293E 혹은 HEK293 c18 세포; ATCC #CRL-10852의 유전체 내에 삽입하기 위하여, Reelin의 N-말단 암호화 부위를 표적화하는 6종의 단일 가이드 RNA(sgRNA)를 포함하는 Cas9 시스템을 구축하여, 이 중에서 효율이 높은 sgRNA를 선정하였다. 상기 sgRNA는 RELN 유전자의 시작 코돈 근처의 핵산 부위 중에서 인간 유전체에서 두 개까지 미스매치를 허용하였을 때 off-targets이 존재하지 않는 핵산 서열을 표적 핵산 서열로 하여 선정하여 아래의 표 4에 나타내었다.
가이드 RNA RGEN Target sequence (5' to 3') 서열번호
RELN_sg1 GCGCTAGGAGGAAAGTCTGCCGG 14
RELN_sg2 TTTCCTCCTAGCGCTGTTGCTGG 15
RELN_sg3 TTCCTCCTAGCGCTGTTGCTGGG 16
RELN_sg4 TCCTCCTAGCGCTGTTGCTGGGG 17
RELN_sg5 CCCCCAGCAACAGCGCTAGGAGG 18
RELN_sg6 TGTTGCTGGGGGCGACGCTGAGG 19
RELN_sg7 GTTGCTGGGGGCGACGCTGAGGG 20
상기 sgRNA는 다음의 핵산 서열을 갖는다:5'-(표적화 서열)-(GUUUUAGAGCUA; 서열번호 1)-(뉴클레오타이드 링커)-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC; 서열번호 3)-3'
(상기 표적화 서열은 PAM 서열이 위치하는 가닥의 상보적 가닥의 표적 핵산 서열과 상보적인 서열을 갖는 것으로, 상기의 표 3에 기재된 RGEN Target sequence 중 3' 말단의 PAM 서열 ("NGG"; N은 임의의 뉴클레오타이드로서, A, T, G, 또는 C의 염기를 갖는 뉴클레오타이드임)를 제외한 핵산 서열에서 "T"를 "U"로 변환한 서열이며, 상기 뉴클레오타이드 링커는 GAAA의 뉴클레오타이드 서열을 가짐).
상기 선정한 표적 핵산 서열의 효율을 검증하기 위하여 상기 표적 핵산 서열을 표적화하는 표적화 서열을 포함하는 sgRNA (RELN_sg1 내지 RELN_sg7)의 암호화 DNA를 pRG2 플라스미드 (ADDGENE 구입)에 삽입하여 sgRNA 발현 플라스미드를 준비하고, sgRNA 발현 플라스미드 250 ng을 Cas9 발현 p3S-Cas9HC 플라스미드 (ADDGENE 구입) 750 ng와 함께 HEK293E 세포(ATCC #CRL-10852) 1x105개에 Lipofectamine 2000 (Invitrogen)을 이용하여 lipofection 방법으로 트랜스펙션하였다.
NGS를 이용한 targeted deep-sequencing (Jeongbin Park, Kayeong Lim, Jin-Soo Kim, Sangsu Bae; Cas-analyzer: an online tool for assessing genome editing results using NGS data, Bioinformatics, Volume 33, Issue 2, 15 January 2017, Pages 286-288 참조)으로 표적화 부위의 DNA 변이율(%; [mutated count/total count]*100)을 측정하여 도 2에 나타내었다. 도 2에 나타낸 바와 같이, 시험된 sgRNA 중, RELN_sg1, RELN_sg5, 및 RELN_sg6가 높은 효율을 보임을 확인하였다. 이 중에서 RELN_sg5 및 RELN_sg6를 선택하여 향후 실험에 사용하였다.
실시예 3: 인간 세포의 내인성 RELN 유전자에 외래 프로모터 삽입
상기 실시예 2에서 선정한 Cas9-sgRNA(RELN_sg5, sg6)와 실시예 1에서 준비한 도너 DNA 구조체를 HEK293E 세포에 트랜스펙션하여 상동 의존성 복구 (HDR)에 의한 유전자 삽입을 유도하였다. 구체적으로, sgRNA 발현 플라스미드 250 ng, Cas9 발현 플라스미드 750 ng 및 실시예 1의 도너 DNA 구조체 1000 ng를 HEK293E 세포(ATCC #CRL-10852) Lipofection 방법으로 트랜스펙션하고, DMEM (10% FBS, 1 % antibiotics / WELGENE) 배지에서 37℃, 5% CO2 조건으로 배양하였다. 트랜스펙션한 세포의 선별을 위하여 Hygromycin을 배양액에 첨가하여 유전자 삽입이 일어난 세포만 선택적으로 살아남도록 하였다. 약 2주간의 배양을 거친 세포들을 유세포 분석 (FACS: Flow Cytometry)으로 분석하여 형광 마커인 GFP 신호가 나오는 세포만 분리하고, 그 결과를 도 3a 내지 3c에 나타내었다. 도 3a 내지 3c에서, P1은 유세포 분석에 들어간 총 세포수, P2는 P1 중에서 세포의 크기 분석을 통해 정상적인 하나의 세포로 분석된 세포의 개수, P3는 P2 중에서 살아있는 세포로 분석된 세포의 개수, P4는 P3 중에서 GFP 형광을 나타내는 세포의 수 (즉, 원하는 donor가 삽입된 세포의 수), #Event는 분석한 개수(세포수), %parent는 Pn에 대한 Pn+1의 비율, %total은 all events에 대한 Pn의 비율을 각각 의미한다. 일차적으로 Hygromycin에 의한 선별을 거쳤기 때문에 높은 효율(약 87-88 %)로 형광 마커가 검출되는 세포 (외래 프로모터 삽입)를 분리하여, 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 HEK293E 세포를 얻었다.
실시예 4. 외래 프로모터 삽입된 인간 세포에서 Reelin 단백질의 과발현 확인 및 균일 세포주 확립
상기 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 인간 세포들에서 태그가 포함된 Reelin 단백질이 발현되는지 여부를 확인하기 위하여, FLAG M2 항체를 이용하여 western blotting을 진행하였다. 구체적으로, 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 HEK 293E 세포를 DMEM (10% FBS, 1 % antibiotics / WELGENE) 배지에서 37도, 5% CO2 조건으로 배양하여 얻어진 배양 배지에 FLAG M2 (MERCK F3165) 항체를 처리하고 western blotting을 수행하여 그 결과를 도 4에 나타내었다.
보다 구체적으로, 균일한 세포주를 확립하기 위하여, 상기 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 HEK293E 세포를 96-well plate의 각 웰에 1개씩 넣고 DMEM (10% FBS, 1 % antibiotics/WELGENE) 배지에서 37도, 5% CO2 조건으로 3주 동안 단일세포 배양하였다. 상기 배양 배지에 상기한 방법으로 FLAG M2 항체(MERCK F3165)를 처리하고 western blotting을 진행하여 그 결과를 도 4a에 나타내고 이를 정량한 결과를 도 4b에 나타내었다. 도 4a 및 4b에서 HT-일련번호로 표시된 것은 각 웰에서 단일세포 배양된 단일 세포주를 나타내고, M은 배양 배지, Bulk는 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 HEK293E 세포 1x106 개를 배양한 세포집락을 의미한다. 도 4a 및 4b에 나타난 바와 같이, RELN_sg5-HT6와 RELN_sg6-HT8 두 개 단일 세포주에서 bulk cell과 비교하여 매우 높은 수준의 Reelin 발현 및 분비를 보이는 것을 확인할 수 있다. 도 4a 및 4b에 나타낸 바와 같이, 상기 세포들의 배양 배지에서 FLAG 태그가 포함된 Reelin 단백질이 비교적 많은 양으로 검출됨을 확인하였고, 이는 Reelin 단백질이 발현되어 세포 밖으로 잘 분비되고 있음을 보여주는 것이다
Reelin 단백질의 정제 가능성을 타진하기 위하여 면역침강법(immune-precipetation)을 이용하여 소량 정제를 시도하였다. RELN_sg5 Bulk와 RELN_sg6 Bulk 세포 배양액을 각각 1.4 mL씩 1.5 mL 튜브에 넣고 FLAG M2 항체 레진 10 ㎕와 섞어 1시간 동안 튜브를 천천히 회전하며 섞어주었다. 원심분리를 통해 레진 및 레진에 결합한 단백질 분획을 결합하지 않은 분획으로부터 분리한 후 SDS-PAGE를 이용하여 분석하여 그 결과를 도 5에 나타내었다. 도 5에서 나타낸 SDS-PAGE의 결과와 같이, 1) 세포배양액, 2) resin에 붙지 않은 단백질, 3) 레진 및 레진에 붙은 단백질을 순서대로 젤에 로딩하여 분석하였다. 이 결과로부터 RELN_sg5 Bulk와 RELN_sg6 Bulk 세포 배양액 모두에 대해 Reelin 단백질이 FLAG M1 항체 레진에 잘 결합하여 순수하게 정제가 가능하다는 것을 확인하였다.
추가적으로 RELN_sg5 Bulk 배양액으로부터 온 FLAG M1 항체 레진 결합 단백질에 대해 질량분석 (LC-MS 분석)을 진행하였다. 상기 도 5에서 관찰된 두 개의 단백질 밴드 (Band A 및 Band B)에 대해 각각 분석을 진행하였으며, 정제된 단백질의 질량분석 결과를 하기의 표 5 및 표 6에 나타내었다:
Band A에서 정제된 단백질 질량 분석 결과
Protein의 이름 Peptide의 종류 Peptide spectrum의 합계
RELN_HUMAN 104 359
sp|P00761|TRYP_PIG 2 15
HS90B_HUMAN 3 8
EF1A1_HUMAN 3 8
G3P_HUMAN 3 7
VIME_HUMAN 3 7
TBA1A_HUMAN 3 6
TCPH_HUMAN 5 6
EF2_HUMAN 3 6
NPM_HUMAN 1 5
Band B에서 정제된 단백질 질량 분석 결과
Protein의 이름 Peptide의 종류 Peptide spectrum의 합계
RELN_HUMAN 116 580
sp|P00761|TRYP_PIG 2 16
ALBU_HUMAN 4 8
SVEP1_HUMAN 7 7
VIME_HUMAN 2 6
EF2_HUMAN 4 6
G3P_HUMAN 3 6
EF1A1_HUMAN 3 5
HNRH1_HUMAN 2 5
ACTA_HUMAN 4 5
상기 표 5 및 표 6에서와 같이, 두 밴드 모두 인간의 Reelin 단백질의 서열(RELN_HUMAN)을 가지고 있음을 검증하였다.
상기와 같이 Reelin 발현이 높게 나타나는 단일 세포주들을 대량 배양으로 키워 Reelin 단백질의 대량 생산을 가능하게 할 수 있다.
Reelin은 뇌발달과 신경세포 조절에 관여하는 중요한 분비 단백질이다. 그 중요성에도 불구하고 거대한 유전자 크기와 반복서열의 존재 때문에 아직까지 재조합을 통한 단백질 생산 및 추출에 성공한 예가 없었다. 이 때문에 Reelin 단백질의 정확한 구조도 알려지지 않았다.
본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 프로모터 교체 및 내인성 유전자 태그 삽입은 이러한 어려움을 극복할 수 있는 방법이다. 표적 특이적 엔도뉴클레아제 (예컨대, Cas9)에 의해 유도되는 상동 의존성 복구 (HDR)을 통해 원하는 서열을 원하는 위치에 정확하게 삽입할 수 있다. 또한 내인성 유전자를 발현시키므로, 유전자의 크기나 반복서열의 존재와 같이 재조합에 어려움을 주는 요소들의 영향을 전혀 받지 않는다.
또한 유전자의 발현에는 암호화 서열 (CDS) 뿐만 아니라 비암호화 서열(UTR)이나 인트론도 영향을 끼치는 것으로 알려져 있다. 본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 유전자 태그 삽입은 이러한 단백질이 발현되는 본래의 세포의 genetic context를 그대로 이용할 수 있으므로 유전자 발현을 위한 최적의 조건을 유지할 수 있다는 장점도 가지고 있다.
<110> HUB Biotech Co., Ltd. <120> Recombinant Cell and Method for Production of Endogenous Polypeptide <130> DPP20182127KR <150> KR10-2017-0143973 <151> 2017-10-31 <160> 21 <170> KopatentIn 3.0 <210> 1 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Synthetic (Essential part of crRNA) <400> 1 guuuuagagc ua 12 <210> 2 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Synthetic (3'-terminal part of crRNA) <400> 2 ugcuguuuug 10 <210> 3 <211> 60 <212> RNA <213> Artificial Sequence <220> <223> Synthetic (Essential part of tracrRNA) <400> 3 uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60 60 <210> 4 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic (Cas9 from Streptococcus pyogenes) <400> 4 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp 1365 <210> 5 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> Synthetic (General formula of SpCas9 crRNA) <220> <221> misc_feature <222> (1) <223> n is targeting sequence comprising 18-22 or 20 nucleotides <220> <221> misc_feature <222> (14) <223> n comprises 8-12 or 10 nucleotides, each of which is A, U, C, or G <400> 5 nguuuuagag cuan 14 <210> 6 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> Synthetic (General formula of SpCas9 tracrRNA) <220> <221> misc_feature <222> (1) <223> n comprises 6-20 or 8-19 nucleotides, each of which is A, U, C, or G <400> 6 nuagcaaguu aaaauaaggc uaguccguua ucaacuugaa aaaguggcac cgagucggug 60 c 61 <210> 7 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic (General formula of SpCas9 sgRNA) <220> <221> misc_feature <222> (1) <223> n is targeting sequence comprising 18-22 or 20 nucleotides <220> <221> misc_feature <222> (14) <223> n is a linker comprising 3-5 or 4 nucleotides <400> 7 nguuucaguu gcunaugcuc uguaaucauu uaaaaguauu uugaacggac cucuguuuga 60 cacgucugaa uaacuaaaaa 80 <210> 8 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic (General formula of Cpf1 crRNA) <220> <221> misc_feature <222> (1) <223> n is absent, U, A, or G <220> <221> misc_feature <222> (2) <223> n is A, or G <220> <221> misc_feature <222> (5) <223> n is U, A, or C <220> <221> misc_feature <222> (12) <223> n is absent, G, C, or A <220> <221> misc_feature <222> (13) <223> n is absent, A, U, C, or G <220> <221> misc_feature <222> (14) <223> n is U, G, or C <220> <221> misc_feature <222> (15) <223> n is U or G <400> 8 nnaunucuac unnnnguaga un 22 <210> 9 <211> 1758 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (HygR-sfGFP) <400> 9 atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60 agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120 gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180 cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240 ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300 caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 360 gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420 atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480 cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540 ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600 tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660 atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720 tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780 cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840 ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900 gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960 tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc ggatcgggag 1020 atgggggaga ctagaatgtc taagggcgag gaactgttca ccggcgtggt gcccatcctg 1080 gtggaactgg atggcgacgt gaacggccac aagttctctg tgcggggaga gggcgaaggc 1140 gacgccacaa atggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg 1200 ccttggccta ccctcgtgac cacactgacc tacggcgtgc agtgcttcag cagatacccc 1260 gaccacatga agcggcacga tttcttcaag agcgccatgc ccgagggcta tgtgcaggaa 1320 cggaccatca gcttcaagga cgacggcacc tacaagacca gagccgaagt gaagttcgag 1380 ggcgacaccc tcgtgaaccg gatcgagctg aagggcatcg acttcaaaga ggacggcaac 1440 atcctgggcc acaagctgga gtacaacttc aacagccaca acgtgtacat caccgccgac 1500 aagcagaaga acggcatcaa ggccaacttc aagatccggc acaacgtgga agatggcagc 1560 gtgcagctgg ccgaccacta ccagcagaac acccccatcg gagatggccc cgtgctgctg 1620 cccgacaacc actacctgag cacccagagc gtgctgagca aggaccccaa cgagaagcgg 1680 gaccacatgg tgctgctgga atttgtgacc gccgctggca tcacccacgg catggacgag 1740 ctgtacaagt ctagttga 1758 <210> 10 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (CMV(Cytomegalovirus) promoter) <400> 10 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360 catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420 atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480 ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540 acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagat 588 <210> 11 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (SV40 intron) <400> 11 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120 tttctctcca cag 133 <210> 12 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (signal peptide coding sequence) <400> 12 atggagcgca gtggctgggc ccggcagact tttctcctag cgctgttgct gggggcgacg 60 ctgagagcgc gcgcg 75 <210> 13 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (FLAG tag) <400> 13 gattacaagg atgacgatga caag 24 <210> 14 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (RELN_sg1) <400> 14 gcgctaggag gaaagtctgc cgg 23 <210> 15 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (RELN_sg2) <400> 15 tttcctccta gcgctgttgc tgg 23 <210> 16 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (RELN_sg3) <400> 16 ttcctcctag cgctgttgct ggg 23 <210> 17 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (RELN_sg4) <400> 17 tcctcctagc gctgttgctg ggg 23 <210> 18 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (RELN_sg5) <400> 18 cccccagcaa cagcgctagg agg 23 <210> 19 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (RELN_sg6) <400> 19 tgttgctggg ggcgacgctg agg 23 <210> 20 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (RELN_sg7) <400> 20 gttgctgggg gcgacgctga ggg 23 <210> 21 <211> 9172 <212> DNA <213> Artificial Sequence <220> <223> Synthetic (full sequence of pAAY-hygro-sfGFP plasmid) <400> 21 gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg 60 tcagcgggtg ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta 120 ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc 180 atcaggcgcc attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc 240 tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta 300 acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgggat accccgaaga 360 gtgagtttgc caagcagtca ccccacagtt ggaggagaat ccacccaaaa ggcagcctgg 420 tagacagggc tggggtggcc tctcgtgggg tccaggccaa gtaggtggcc tggggcctct 480 gggggatgca ggggaagggg gatgcagggg aacggggatg caggggaacg gggctcagtc 540 tgaagagcag agccaggaac ccctgtaggg aaggggcagg agagccaggg gcatgagatg 600 gtggacgagg aagggggaca gggaagcctg agcgcctctc ctgggcttgc caaggactca 660 aacccagaag cccagagcag ggccttaggg aagcgggacc ctgctctggg cggaggaata 720 tgtcccagat agcactgggg actctttaag gaaagaagga tggagaaaga gaaagggagt 780 agaggcggcc acgacctggt gaacacctag gacgcaccat tctcacaaag ggagttttcc 840 acacggacac ccccctcctc accacagccc tgccaggacg gggctggcta ctggccttat 900 ctcacaggta aaactgacgc acggaggaac aatataaatt ggggactaga aaggtgaaga 960 gccaaagtta gaactcagga ccaacttatt ctgattttgt ttttccaaac tgcttctcct 1020 cttgggaagt gtaaggaagc tgcagcacca ggatcagtga aacgcaccag acagccgcgt 1080 cagagcagct caggttctgg gagagggtag cgcagggtgg ccactgagaa ccgggcaggt 1140 cacgaattcg agctcggtac ccggggatcc ttcgggggtg tttggcagcc acagacgccc 1200 ggtgttcgtg tcgcgccagt acatgcggtc catgcccagg ccatccaaaa accatgggtc 1260 tgtctgctca gtccagtcgt ggacctgacc ccacgcaacg cccaaaataa taacccccac 1320 gaaccataaa ccattcccca tgggggaccc cgtccctaac ccacggggcc agtggctatg 1380 gcagggcctg ccgccccgac gttggctgcg agccctgggc cttcacccga acttgggggg 1440 tggggtgggg aaaaggaaga aacgcgggcg tattggcccc aatggggtct cggtggggta 1500 tcgacagagt gccagccctg ggaccgaacc ccgcgtttat gaacaaacga cccaacaccc 1560 gtgcgtttta ttctgtcttt ttattgccgt catagcgcgg gttccttccg gtattgtctc 1620 cttccgtgtt tcaactagac ttgtacagct cgtccatgcc gtgggtgatg ccagcggcgg 1680 tcacaaattc cagcagcacc atgtggtccc gcttctcgtt ggggtccttg ctcagcacgc 1740 tctgggtgct caggtagtgg ttgtcgggca gcagcacggg gccatctccg atgggggtgt 1800 tctgctggta gtggtcggcc agctgcacgc tgccatcttc cacgttgtgc cggatcttga 1860 agttggcctt gatgccgttc ttctgcttgt cggcggtgat gtacacgttg tggctgttga 1920 agttgtactc cagcttgtgg cccaggatgt tgccgtcctc tttgaagtcg atgcccttca 1980 gctcgatccg gttcacgagg gtgtcgccct cgaacttcac ttcggctctg gtcttgtagg 2040 tgccgtcgtc cttgaagctg atggtccgtt cctgcacata gccctcgggc atggcgctct 2100 tgaagaaatc gtgccgcttc atgtggtcgg ggtatctgct gaagcactgc acgccgtagg 2160 tcagtgtggt cacgagggta ggccaaggca cgggcagctt gccggtggtg cagatgaact 2220 tcagggtcag cttgccattt gtggcgtcgc cttcgccctc tccccgcaca gagaacttgt 2280 ggccgttcac gtcgccatcc agttccacca ggatgggcac cacgccggtg aacagttcct 2340 cgcccttaga cattctagtc tcccccatct cccgatccgg acgagtgctg gggcgtcggt 2400 ttccactatc ggcgagtact tctacacagc catcggtcca gacggccgcg cttctgcggg 2460 cgatttgtgt acgcccgaca gtcccggctc cggatcggac gattgcgtcg catcgaccct 2520 gcgcccaagc tgcatcatcg aaattgccgt caaccaagct ctgatagagt tggtcaagac 2580 caatgcggag catatacgcc cggagccgcg gcgatcctgc aagctccgga tgcctccgct 2640 cgaagtagcg cgtctgctgc tccatacaag ccaaccacgg cctccagaag aagatgttgg 2700 cgacctcgta ttgggaatcc ccgaacatcg cctcgctcca gtcaatgacc gctgttatgc 2760 ggccattgtc cgtcaggaca ttgttggagc cgaaatccgc gtgcacgagg tgccggactt 2820 cggggcagtc ctcggcccaa agcatcagct catcgagagc ctgcgcgacg gacgcactga 2880 cggtgtcgtc catcacagtt tgccagtgat acacatgggg atcagcaatc gcgcatatga 2940 aatcacgcca tgtagtgtat tgaccgattc cttgcggtcc gaatgggccg aacccgctcg 3000 tctggctaag atcggccgca gcgatcgcat ccatggcctc cgcgaccggc tgcagaacag 3060 cgggcagttc ggtttcaggc aggtcttgca acgtgacacc ctgtgcacgg cgggagatgc 3120 aataggtcag gctctcgctg aattccccaa tgtcaagcac ttccggaatc gggagcgcgg 3180 ccgatgcaaa gtgccgataa acataacgat ctttgtagaa accatcggcg cagctattta 3240 cccgcaggac atatccacgc cctcctacat cgaagctgaa agcacgagat tcttcgccct 3300 ccgagagctg catcaggtcg gagacgctgt cgaacttttc gatcagaaac ttctcgacag 3360 acgtcgcggt gagttcaggc tttttcatat ctcattgccc cccgggatct gcggcacgct 3420 gttgacgctg ttaagcgggt cgctgcaggg tcgctcggtg ttcgaggcca cacgcgtcac 3480 cttaatatgc gaagtggacc tcggaccgcg ccgccccgac tgcatctgcg tgttcgaatt 3540 cgccaatgac aagacgctgg gcggggtttg tgtcatcata gaactaaaga catgcaaata 3600 tatttcttcc ggggatgcat tagttattaa tagtaatcaa ttacggggtc attagttcat 3660 agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 3720 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 3780 gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 3840 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 3900 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 3960 gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga 4020 tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg 4080 ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg 4140 caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctgg tttagtgaac 4200 cgtcagatcg tttaaacaag ttggtcgtga ggcactgggc aggtaagtat caaggttaca 4260 agacaggttt aaggagacca atagaaactg ggcttgtcga gacagagaag actcttgcgt 4320 ttctgatagg cacctattgg tcttactgac atccactttg cctttctctc cacaggtgtc 4380 cagggtaccc gatcgggatc caccggtcgt ctcgccgggg cagggggcga attcgtcgac 4440 ctcgaggccg ccatggcagt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc 4500 ctggtcgagc tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag 4560 ggcgatgcca cctacggcaa gctgaccctg aagttcatct gcaccaccgg caagctgccc 4620 gtgccctggc ccaccctcgt gaccaccttc ggctacggcc tgcagtgctt cgcccgctac 4680 cccgaccaca tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag 4740 gagcgcacca tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc 4800 gagggcgaca ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc 4860 aacatcctgg ggcacaagct ggagtacaac tacaacagcc acaacgtcta tatcatggcc 4920 gacaagcaga agaacggcat caaggtgaac ttcaagatcc gccacaacat cgaggacggc 4980 agcgtgcagc tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg 5040 ctgcccgaca accactacct gagctaccag tccgccctga gcaaagaccc caacgagaag 5100 cgcgatcaca tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac 5160 gagctgtaca aggctgcaca ccatcaccat caccatcacc atcaccatta ggcggccgcg 5220 gctagcagcg gccgcacaga gacatctcag gtagcaccag catagaatca acctctggat 5280 tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 5340 ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 5400 tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 5460 caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 5520 accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 5580 ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 5640 tccgtggtgt tgtcggggaa gctgacgtcc tttccatggc tgctcgcctg tgttgccacc 5700 tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 5760 ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgaga tctgcctcga 5820 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 5880 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 5940 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 6000 gggaagacaa tagcaggcat gctggggatt aagggcgcga ttaggatctt cctagagcat 6060 ggctacgtag ataagtagca tggcgggttc tagagtcgac ctgcaggcat gcaagcttga 6120 ggttctggca aggagagaga tggctccagg aaatgggggt gtgtcaccag ataaggaatc 6180 tgcctaacag gaggtggggg ttagacccaa tatcaggaga ctaggaagga ggaggcctaa 6240 ggatggggct tttctgtcac caatcctgtc cctagtggcc ccactgtggg gtggagggga 6300 cagataaaag tacccagaac cagagccaca ttaaccggcc ctgggaatat aaggtggtcc 6360 cagctcgggg acacaggatc cctggaggca gcaaacatgc tgtcctgaag tggacatagg 6420 ggcccgggtt ggaggaagaa gactagctga gctctcggac ccctggaaga tgccatgaca 6480 gggggctgga agagctagca cagactagag aggtaagggg ggtaggggag ctgcccaaat 6540 gaaaggagtg agaggtgacc cgaatccaca ggagaacggg gtgtccaggc aaagaaagca 6600 agaggatgga gaggtggcta aagccaggga gacggggtac tttggggttg tccagaaaaa 6660 cggtgatgat gcaggcctac aagaagggga ggcgggacgc aagggagaca tccgtcggag 6720 aaggccatcc taagaaacga gagatggcac aggccccaga aggagaagga aaagggaacc 6780 cagcgagtga agacggcatg gggttgggtg agggaggaga gatgcccgga gaggacccag 6840 acacggggag gatccgctca gaggacatca cgtggtgcag cgccgagaag gaagtgctcc 6900 ggaaagagca tccttgggca gcaacacagc agagagcagg cgtaatcatg gtcatagctg 6960 tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 7020 aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 7080 ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 7140 gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 7200 cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 7260 tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 7320 aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 7380 catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 7440 caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 7500 ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 7560 aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 7620 gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 7680 cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 7740 ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 7800 tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 7860 tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 7920 cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 7980 tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 8040 tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 8100 tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 8160 cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 8220 ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 8280 tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 8340 gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 8400 agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 8460 atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 8520 tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 8580 gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 8640 agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 8700 cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 8760 ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 8820 ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 8880 actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 8940 ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 9000 atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 9060 caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt 9120 attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg tc 9172

Claims (23)

  1. 표적 특이적 엔도뉴클레아제 시스템 및 도너 DNA 구조체를 포함하는, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물로서,
    상기 목적 폴리펩타이드는 상기 동물 세포의 유전체에 의하여 암호화되는 내인성 폴리펩타이드이고,
    상기 표적 특이적 엔도뉴클레아제 시스템은 표적 특이적 엔도뉴클레아제 또는 이를 암호화하는 제1 핵산 분자 또는 상기 제1 핵산 분자를 포함하는 제1 재조합 벡터 및 상기 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 인접한 표적 핵산 서열과 혼성화 가능한 핵산 분자 (제2 핵산 분자) 또는 상기 제2 핵산 분자를 포함하는 제2 재조합 벡터를 포함하고,
    상기 표적 특이적 엔도뉴클레아제는 RNA-가이드 엔도뉴클레아제 (RNA-guided endonuclease, RGEN)이고, 상기 제2 핵산 분자는 상기 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 인접한 표적 핵산 서열과 혼성화 가능한 가이드 RNA이고,
    상기 도너 DNA 구조체는 상기 동물 세포와 이종 세포 유래의 외래 프로모터, 상기 외래 프로모터의 3' 말단에 연결된 상기 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 분자, 및 상기 시그널 펩타이드 암호화 핵산 분자의 3' 말단에 연결된 태그 유전자를 포함하고,
    상기 표적 특이적 엔도뉴클레아제 시스템은 상기 내인성 목적 폴리펩타이드의 시그널 펩타이드를 암호화하는 핵산 서열의 3' 말단 또는 내부를 절단하는 것인,
    동물 세포에서의 목적 폴리펩타이드 발현용 조성물.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요게네스 (Streptococcus pyogenes), 캄필로박터 제주니 (Campylobacter jejuni), 스트렙토코커스 써모필러스 (Streptococcus thermophiles), 스트렙토코커스 아우레우스 (Streptocuccus aureus), 네이세리아 메닝기디티스 (Neisseria meningitidis), 파스테우렐라 물토시다 (Pasteurella multocida), 및 프란시셀라 노비시다 (Francisella novicida)에서 유래하는 Cas9 단백질로 이루어진 군에서 선택된 1종 이상인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.
  5. 제1항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 Parcubacteria bacterium, Lachnospiraceae bacterium, Butyrivibrio proteoclasiicus, Peregrinibacteria bacterium, Acidaminococcus sp., Porphyromonas macacae, Lachnospiraceae bacterium, Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi, Smiihella sp., Leptospira inadai, Lachnospiraceae bacterium, Francisella novicida, Candidatus Methanoplasma termitum, Candidatus Paceibacter, Eubacterium eligens에서 유래하는 Cpf1 단백질로 이루어진 군에서 선택된 1종 이상인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.
  6. 제1항에 있어서, 상기 도너 DNA 구조체는 선별마커 및 SV40 인트론으로 이루어진 군에서 선택된 1종 이상을 추가로 포함하는 것인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.
  7. 제6항에 있어서, 상기 도너 DNA 구조체는 5'에서 3' 방향으로, (1) 선별 마커, (2) 외래 프로모터, (3) SV40 인트론, (4) 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열, 및 (5) 태그 암호화 핵산 서열을 순차적으로 포함하는 것인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.
  8. 제1항에 있어서, 상기 목적 폴리펩타이드는 2 내지 10,000개의 아미노산을 포함하는 것인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.
  9. 삭제
  10. 제1항 및 제4항 내지 제8항 중 어느 한 항에 있어서, 상기 동물 세포는 포유 동물 세포인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.
  11. 도너 DNA 구조체가 숙주 세포의 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자 중 시그널 펩타이드를 제외한 첫 번째 아미노산을 암호화하는 코돈의 5' 말단쪽에 삽입되고,
    상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터, 상기 외래 프로모터의 3' 말단에 연결된 상기 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 분자, 및 상기 시그널 펩타이드 암호화 핵산 분자의 3' 말단에 연결된 태그 유전자를 포함하고,
    상기 숙주세포는 동물 세포인,
    재조합 세포.
  12. 제11항에 있어서, 상기 도너 DNA 구조체는 선별마커 및 SV40 인트론으로 이루어진 군에서 선택된 1종 이상을 추가로 포함하는 것인, 재조합 세포.
  13. 제12항에 있어서, 상기 도너 DNA 구조체는 5'에서 3' 방향으로, (1) 선별 마커, (2) 외래 프로모터, (3) SV40 인트론, (4) 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열, 및 (5) 태그 암호화 핵산 서열을 순차적으로 포함하는 것인, 재조합 세포.
  14. 제11항에 있어서, 상기 내인성 목적 폴리펩타이드는 2 내지 10,000개의 아미노산을 포함하는 것인, 재조합 세포.
  15. 삭제
  16. 제11항 내지 제14항 중 어느 한 항에 있어서, 상기 숙주 세포는 포유 동물 세포인, 재조합 세포.
  17. 제16항에 있어서, 상기 숙주 세포는 분리된 인간 세포인, 재조합 세포.
  18. 제1항 및 제4항 내지 제8항 중 어느 한 항의 동물 세포에서의 목적 폴리펩타이드 발현용 조성물, 또는
    제11항 내지 제14항 중 어느 한 항의 재조합 세포
    를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물.
  19. 삭제
  20. 제18항에 있어서, 상기 동물 세포는 포유 동물 세포인, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물.
  21. 삭제
  22. 제11항 내지 제14항 중 어느 한 항의 재조합 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산 방법.
  23. 제22항에 있어서, 상기 배양하는 단계 이후에, 목적 폴리펩타이드를 분리 또는 정제하는 단계를 추가로 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산 방법.
KR1020180121984A 2017-10-31 2018-10-12 내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법 KR102061251B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20170143973 2017-10-31
KR1020170143973 2017-10-31

Publications (2)

Publication Number Publication Date
KR20190049456A KR20190049456A (ko) 2019-05-09
KR102061251B1 true KR102061251B1 (ko) 2019-12-31

Family

ID=66332936

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180121984A KR102061251B1 (ko) 2017-10-31 2018-10-12 내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법

Country Status (2)

Country Link
KR (1) KR102061251B1 (ko)
WO (1) WO2019088496A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021162243A1 (ko) * 2020-02-11 2021-08-19 재단법인 아산사회복지재단 T 세포 내 표적 위치로의 t 세포 수용체 삽입을 위한 재조합벡터 및 이를 이용한 t 세포 내 표적 위치로의 t 세포 수용체 삽입용 조성물

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016512048A (ja) 2013-03-15 2016-04-25 リージェンツ オブ ザ ユニバーシティ オブ ミネソタ CRISPR/Casシステムを使用した植物ゲノム操作
WO2016075662A2 (en) 2014-11-15 2016-05-19 Zumutor Biologics, Inc. Dna-binding domain, non-fucosylated and partially fucosylated proteins, and methods thereof
JP2016523564A (ja) 2013-07-11 2016-08-12 モデルナ セラピューティクス インコーポレイテッドModerna Therapeutics,Inc. CRISPR関連タンパク質をコードする合成ポリヌクレオチドおよび合成sgRNAを含む組成物ならびに使用方法
WO2017024319A1 (en) 2015-08-06 2017-02-09 Dana-Farber Cancer Institute, Inc. Tunable endogenous protein degradation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105492611A (zh) * 2013-06-17 2016-04-13 布罗德研究所有限公司 用于序列操纵的优化的crispr-cas双切口酶系统、方法以及组合物
KR101777367B1 (ko) * 2015-09-09 2017-09-12 연세대학교 산학협력단 Fmr1 유전자를 타겟으로 하는 엔도뉴클레아제를 이용한 cgg 반복의 교정

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016512048A (ja) 2013-03-15 2016-04-25 リージェンツ オブ ザ ユニバーシティ オブ ミネソタ CRISPR/Casシステムを使用した植物ゲノム操作
JP2016523564A (ja) 2013-07-11 2016-08-12 モデルナ セラピューティクス インコーポレイテッドModerna Therapeutics,Inc. CRISPR関連タンパク質をコードする合成ポリヌクレオチドおよび合成sgRNAを含む組成物ならびに使用方法
WO2016075662A2 (en) 2014-11-15 2016-05-19 Zumutor Biologics, Inc. Dna-binding domain, non-fucosylated and partially fucosylated proteins, and methods thereof
WO2017024319A1 (en) 2015-08-06 2017-02-09 Dana-Farber Cancer Institute, Inc. Tunable endogenous protein degradation

Non-Patent Citations (19)

* Cited by examiner, † Cited by third party
Title
ACS Synthetic Biology (2016) 5:1002-1010
Biochemical and Biophysical Research Communications (2014) 444:158-163*
BioTechniques (2017.04.) 65:165-174
Biotechnology Research International (2011) 2011:492875
BMC Biotechnology (2010) 10:26
BMC Biotechnology (2016) 16:66
Cell Reports (2015) 13:621-633
Development (2017.01.17.) 144:635-648
Genome Biology (2017) 18:35
Genome Research (2017.02.16.) 27:419-426
International Journal of Molecular Sciences (2018.03.22.) 19:946
Molecular Biology of the Cell (2014) 25:3610-3618
Nature Biotechnology (2013) 31(3):230-232
Nature Methods (2013) 10(10):977-979
Nucleic Acids Research (2017.03.02.) 45(11):e98
Plant Biotechnology Journal (2017) 15:207-216
Scientific Reports (2015) 5:9592
Scientific Reports (2016) 6:30620
Scientific Reports (2017.06.08.) 7:3036

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021162243A1 (ko) * 2020-02-11 2021-08-19 재단법인 아산사회복지재단 T 세포 내 표적 위치로의 t 세포 수용체 삽입을 위한 재조합벡터 및 이를 이용한 t 세포 내 표적 위치로의 t 세포 수용체 삽입용 조성물

Also Published As

Publication number Publication date
KR20190049456A (ko) 2019-05-09
WO2019088496A3 (ko) 2019-06-27
WO2019088496A2 (ko) 2019-05-09

Similar Documents

Publication Publication Date Title
US6451563B1 (en) Method for making linear, covalently closed DNA constructs
JP2023027162A (ja) T細胞レセプターの同族抗原との相互作用の発見及び特徴決定のための遺伝子操作された二部構成細胞デバイス
KR20200079497A (ko) 제제
KR20080026181A (ko) 암세포 및 종양 기질에 발현된 우성 및 준우성 에피토프에대한 다가 면역반응을 유발하기 위한 방법 및 조성물
CN103937836A (zh) 水通道蛋白-4自身抗体的检测方法及融合表达病毒载体和应用
CN105274141B (zh) 一种用于原始生殖细胞靶向突变的转基因载体及制备方法和用途
US6355415B1 (en) Compositions and methods for the use of ribozymes to determine gene function
KR20200074134A (ko) 지질 나노파티클을 이용한 mRNA 전달의 체외 방법
CN116157514A (zh) 新颖omni-59、61、67、76、79、80、81和82crispr核酸酶
KR20200015900A (ko) 자가-비활성화 바이러스 벡터
KR20220149588A (ko) 대사성 간 장애의 치료를 위한 조성물 및 방법
KR20200132893A (ko) 합성 dna 벡터 및 사용 방법
TW200923366A (en) Novel AS160-like protein, test systems, methods and uses involving it for the identification of diabetes type 2 therapeutics
KR102061251B1 (ko) 내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법
CN112280802A (zh) 基于piggyBac转座子系统制备稳定表达BE4蛋白的猪肾上皮细胞系的方法
CN101020064A (zh) 一种布鲁氏杆菌核酸疫苗
CN110559430B (zh) 一种抗淋巴瘤的car-t药物及其应用
US20040161756A1 (en) Substrate linked directed evolution (slide)
CN114364440B (zh) Aav介导的rpgr x连锁视网膜变性的基因编辑治疗
WO2022241455A1 (en) A synthetic circuit for buffering gene dosage variation between individual mammalian cells
CN110484517A (zh) 一种用于制备弱毒的裂谷热病毒的组合物及制备方法,rvfv减毒疫苗
CN114787344A (zh) 用于处置癌症的含有ny-eso-1的人工佐剂载体细胞
CN101684476A (zh) 转基因构建物及其在制备时空可调性肝脏损伤模型中的应用
CN111296364B (zh) 一种基因改造的小鼠动物模型基因改造方法及其应用
CN114350657B (zh) 一种促进环状rna生成的反向互补短侧翼序列及其应用

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant