KR20220070456A - 면역치료법에 사용하기 위한 조성물 및 방법 - Google Patents

면역치료법에 사용하기 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20220070456A
KR20220070456A KR1020227011467A KR20227011467A KR20220070456A KR 20220070456 A KR20220070456 A KR 20220070456A KR 1020227011467 A KR1020227011467 A KR 1020227011467A KR 20227011467 A KR20227011467 A KR 20227011467A KR 20220070456 A KR20220070456 A KR 20220070456A
Authority
KR
South Korea
Prior art keywords
gna
casx
seq
protein
cell
Prior art date
Application number
KR1020227011467A
Other languages
English (en)
Inventor
벤자민 오크스
션 히긴스
한나 스핀너
사라 데니
브렛 티 스타알
키안 테일러
캐서린 바니
이사벨 콜린
마루프 아딜
콜 우르네스
Original Assignee
스크라이브 테라퓨틱스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스크라이브 테라퓨틱스 인크. filed Critical 스크라이브 테라퓨틱스 인크.
Publication of KR20220070456A publication Critical patent/KR20220070456A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4631Chimeric Antigen Receptors [CAR]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4632T-cell receptors [TCR]; antibody T-cell receptor constructs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464402Receptors, cell surface antigens or cell surface determinants
    • A61K39/464411Immunoglobulin superfamily
    • A61K39/464412CD19 or B4
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • A61K45/06Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70517CD8
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70521CD28, CD152
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70578NGF-receptor/TNF-receptor superfamily, e.g. CD27, CD30, CD40, CD95
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70596Molecules with a "CD"-designation not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/715Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
    • C07K14/7151Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for tumor necrosis factor [TNF], for lymphotoxin [LT]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/515Animal cells
    • A61K2039/5158Antigen-pulsed cells, e.g. T-cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Oncology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

CasX:gNA 시스템과, 이와 관련된 조성물 및 방법이 본원에 제공되며, 상기 시스템은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포 유전자 변형에 유용한 CasX 단백질, 가이드 핵산(gNA), 및 선택적으로 공여자 주형 핵산을 포함하고, 본원에는 또한 이들 변형된 유전자를 포함하는 세포 집단을 생성하는 방법 및 사용하는 방법이 제공된다. 일부 구현예에서, 변형된 세포는 키메라 항원 수용체(CAR: chimeric antigen receptor) 또는 조작된 T 세포 수용체(TCR: engineered T cell receptor)를 추가로 발현한다. 이러한 시스템은 면역치료법을 위한 세포를 제조하는 데 유용하다.

Description

면역치료법에 사용하기 위한 조성물 및 방법
관련 출원의 교차 참조
본 출원은 2019년 9월 9일에 출원된 미국 임시 특허 출원 번호 제62/897,947호, 2020년 9월 4일에 출원된 제63/075,041호를 우선권으로 주장하며, 이들 각각의 내용은 그 전문이 본원에 참조로서 포함된다.
전자적으로 제출된 텍스트 파일의 설명
이와 함께 전자적으로 제출된 텍스트 파일의 내용은 그 전문이 참조로서 본원에 포함된다: 서열목록의 컴퓨터 판독가능한 형식 카피(파일명: SCRB_016_02WO_SeqList_ST25.txt, 기록된 날짜: 2020년 9월 9일, 파일 크기: 12.0 메가바이트).
많은 승인된 치료제, 예를 들어 암 치료제는 정상 세포뿐만 아니라 유병(diseased) 세포를 사멸화시키는 세포독성 약물이다. 이들 세포독성 약물의 치료적 이익은 정상 세포보다 더 민감한 유병 세포에 의존하여, 허용 불가능한 부작용을 초래하지 않는 용량을 사용하여 임상 반응이 달성되게 한다. 그러나, 본질적으로 모든 이러한 비-특이적 약물은 정상 조직에 심각하지는 않지만 어느 정도의 손상을 초래하며, 이는 종종 치료 적합성을 제한한다.
게놈 조작은 이것이 유병 세포, 예를 들어 암세포에 특이적으로 결합하고 사멸화시키도록 프로그래밍된 면역 세포의 생성을 허용한다는 점에서 세포독성 약물에 대해 상이한 접근법을 제공할 수 있다. 키메라 항원 수용체 T 세포(CAR-T; chimeric antigen receptor T cell) 기술의 출현은 소정의 유형의 암에서 치료적 이익의 새로운 양상을 유발하였다. 수혜자 대상체와 비교하여, 변형된 세포의 HLA 단백질에서 미스매치를 감소시키거나, 야생형 T 세포 수용체 또는 다른 구성요소를 감소시키거나 없애기 위해 CAR을 포함하는 세포를 조작함으로써, 이는 미스매칭된(예를 들어, 동종이계(allogenic)) 이식편(graft) 조직의 숙주 T 세포 수용체 인식 및 이에 대한 반응을 없앰으로써 이식편대숙주 질환(GVHD; host vs. graft disease)에 대한 잠재성을 감소시키거나 없앤다(예를 들어, 문헌[Takahiro Kamiya, T. 등 A novel method to generate T-cell receptor―deficient chimeric antigen receptor T cells. Blood Advances 2:517 (2018)] 참조). 따라서, 이러한 접근법은 암, 자가면역 질환 및 이식 거부와 같은 질환을 갖는 대상체에서 면역-종양학 적용에 대한 향상된 치료 지수(therapeutic index)를 갖는 면역 세포를 생산하는 데 사용될 수 있었다.
CRISPR/Cas 시스템이 진핵 세포에서 게놈 편집을 위해 개조(adapt)되었으므로, 2개 기술은 표적화된 세포에 대해 강력한 세포독성을 갖는 면역 세포의 조작을 허용하지만, 특히 이러한 세포의 동종이계 이식물의 경우 이들 세포의 이식물에 대한 원치 않는 수혜자 면역 반응을 유도하는 데 기여하는 세포 마커의 감소 또는 제거를 허용하는 잠재성을 갖는다. 이에, 변형된 세포, 및 면역치료법 치료, 예를 들어 동종이계-기초 면역치료법 치료에 사용하기 위해 이들 특성을 나타내는 조작된 CAR-T 세포로 이러한 세포를 변형시키는 방법에 대한 필요성이 존재한다.
일부 양태에서, 본 개시내용은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질을 인코딩하는 세포 유전자의 표적 핵산 서열을 변형시키는 데 사용되는 CasX:가이드 핵산 시스템(CasX:gNA 시스템)의 조성물 및 방법을 제공한다. 전술한 내용에서, 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC, 또는 TCRA), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA; class II major histocompatibility complex transactivator), T 세포 수용체 베타 불변 1(TRBC1, 또는 TCRB), T 세포 수용체 베타 불변 2(TRBC2), 프로그래밍된 세포 사멸 1(PD-1), 사이토카인 유도성 SH2(CISH), Ig 및 ITIM 도메인을 갖는 T 세포 면역수용체(TIGIT), 아데노신 A2a 수용체(ADORA2A), 살해 세포 렉틴 유사 수용체 C1(NKG2A), 세포독성 T-림프구-관련 단백질 4(CTLA-4), 림프구 활성화 3(LAG-3), T-세포 면역글로불린 및 뮤신 도메인 3(TIM-3), 2B4(CD244), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβ 수용체 2(TGFβRII), 분화 클러스터 247(CD247), CD3d 분자(CD3D), CD3e 분자(CD3E), CD3g 분자(CD3G), CD52 분자(CD52), 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 또는 FKBP 프롤릴 이소머라제 1A(FKBP1A)로 이루어진 군으로부터 선택된다. CasX:gNA 시스템은 기준 CasX 단백질, 기준 CasX에 비해 향상된 특성을 갖는 CasX 변이체 단백질, 기준 서열이거나 기준 서열에 비해 향상된 특성을 갖는 gNA 변이체인 가이드 핵산(gNA), 뿐만 아니라 표적 핵산 서열을 변형시키기 위해 CasX 뉴클레아제에 의해 도입되는 세포 내 표적 핵산 서열의 절단 부위 내로 삽입될 수 있는 공여자 주형 핵산을 포함할 수 있다. 이들 구성요소의 구현예는 본원 아래에 기재된다. 일부 양태에서, 본 개시내용은 리보핵 단백질 복합체(RNP; ribonuclear protein complex)와 복합체화된 본원에 기재된 임의의 구현예로서 CasX와 gNA의 유전자 편집 쌍(gene editing pair)을 제공한다. 일부 구현예에서, 본 개시내용은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포의 유전자를 변형시키는 방법을 제공하며, 여기서 유전자는 이러한 단백질의 발현으로부터 넉다운되거나 넉아웃된다.
CasX:gNA 시스템에 의해 변형되는 세포는 다른 것들 중에서도, 면역치료법 적용; 예를 들어 이식편대숙주 질환(GVHD)에 대한 감소된 잠재성을 갖고, 또한 대상체에서 암 또는 자가면역 질환의 치료에 사용하기 위해 하나 이상의 키메라 항원 수용체(CAR)를 발현하도록 변형된 면역 세포의 제조 및 용도에 유용하다. 이러한 세포는 또한, 이식편대숙주 합병증을 감소시키도록 또한 조작된다. 다른 구현예에서, CasX-gNA 시스템은 CAR 및/또는 조작된 T 세포 수용체(TCR)를 인코딩하는 세포 내로 핵산을 넉인(knock-in)하는 데 사용되며, CAR 및/또는 TCR은 본원 아래에 나열된 것들을 포함한 종양 세포 항원에 특이적인 결합 도메인을 포함한다. 이러한 결합 도메인은 선형 항체, 단일 도메인 항체(sdAb), 예컨대 VHH, 또는 단일-사슬 가변 단편(scFv)의 형태로 존재할 수 있다. 변형된 세포의 제조에 사용될 수 있는 세포는 전구 세포(progenitor cell), 조혈 줄기세포(hematopoietic stem cell), 만능성 줄기세포(pluripotent stem cell), 또는 T 세포, TREG 세포, NK 세포, B 세포, 대식세포, 또는 수지상 세포로 이루어진 군으로부터 선택되는 면역 세포를 포함한다.
일부 양태에서, 본 개시내용은 본원에 기재된 CasX 단백질, gNA, 유전자 편집 쌍을 인코딩하거나 포함하거나, 공여자 주형 핵산을 포함하는 폴리뉴클레오타이드 및 벡터를 제공한다. 일부 구현예에서, 벡터는 바이러스 벡터, 예컨대 아데노-관련 바이러스(AAV: Adeno-Associated Viral) 벡터 또는 렌티바이러스 벡터이다. 다른 구현예에서, 벡터는 비-바이러스 입자, 예컨대 바이러스-유사 입자(VLP) 또는 나노입자이다.
일부 양태에서, 개시내용은 세포 집단에서 표적 핵산 서열을 변형시키는 방법을 제공하며, 집단의 각각의 세포 내로: a) 본원에 개시된 임의의 구현예의 CasX:gNA 시스템; 또는 b) 본원에 개시된 임의의 구현예의 핵산; 또는 c) 본원에 개시된 임의의 구현예의 벡터; d) 본원에 개시된 임의의 구현예의 VLP; 또는 e) 상기 (a) 내지 상기 (d) 중 2개 이상의 조합을 도입하는 단계를 포함하며, 여기서 CasX 단백질로 세포의 표적 핵산 서열을 변형시킨다(예를 들어, 단일-가닥 또는 이중-가닥 절단, 또는 표적 핵산 서열 내 하나 이상의 뉴클레오타이드의 삽입, 결실, 치환, 중복, 또는 역위).
일부 양태에서, 본 개시내용은 본원에 개시된 임의의 구현예의 CasX:gNA 시스템, 벡터, 또는 VLP(또는 이들의 조합)에 의한 표적 핵산의 생체외 변형 방법에 의해 변형된 세포 집단을 제공하며, 여기서 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 MHC 클래스 I 분자, T 세포 수용체 또는 단백질의 발현은 변형된 세포에서 감소되거나 없어졌다. 일부 양태에서, 본 개시내용은 본원에 기재된 임의의 구현예의 CasX:gNA 시스템, 벡터, 또는 VLP(또는 이들의 조합)에 의한 표적 핵산의 생체외 변형 방법에 의해 변형된 세포 집단을 제공하며, 여기서 변형된 세포는 본원에 기재된 임의의 구현예의 검출 가능한 수준의 CAR 및/또는 TCR을 발현한다.
일부 양태에서, 본 개시내용은 대상체에서 항종양 면역력을 제공하는 방법을 제공하며, 치료적 유효량의 본원에 기재된 임의의 구현예의 변형된 세포를 대상체에게 투여하는 단계를 포함한다.
일부 양태에서, 본 개시내용은 종양 항원의 발현과 관련된 질환을 갖는 대상체를 치료하는 방법을 제공하며, 치료적 유효량의 본원에 기재된 임의의 구현예의 변형된 세포를 대상체에게 투여하는 단계를 포함한다.
또 다른 양태에서, 종양 항원의 발현과 관련된 질환을 갖는 대상체의 치료용 약제로서 사용하기 위한, CasX 및 gNA 유전자 편집 쌍, 및 선택적으로 공여자 주형 및/또는 CAR 및/또는 TCR을 인코딩하는 폴리뉴클레오타이드에 의해 변형된 면역 세포의 조성물이 본원에 제공된다. 전술한 내용에서, CasX는 본원에 기재된 임의의 구현예의 CasX 변이체(예를 들어, 표 4의 서열)일 수 있고, gNA는 본원에 기재된 임의의 구현예의 gNA 변이체(예를 들어, 표 2의 서열)일 수 있다. 다른 구현예에서, 개시내용은 종양 항원의 발현과 관련된 질환을 갖는 대상체의 치료용 약제로서 사용하기 위한, CasX 및 gNA의 유전자 편집 쌍, 공여자 주형 및/또는 CAR을 인코딩하는 폴리뉴클레오타이드를 포함하거나 인코딩하는 벡터에 의해 변형된 세포를 포함하는 조성물을 제공한다.
일부 양태에서, 본 개시내용은 본원에 제공된 CasX:gNA 시스템, 벡터, 또는 VLP를 포함하고, 부형제 및 용기를 추가로 포함하는 키트를 제공한다.
또 다른 양태에서, 질환 또는 장애의 치료용 약제로서 사용하기 위한, CasX:gNA 시스템, CasX:gNA 시스템을 포함하는 조성물, CasX:gNA 시스템을 포함하거나 인코딩하는 벡터, CasX:gNA 시스템을 포함하는 VLP, 또는 CasX:gNA 시스템을 사용하여 편집된 세포 집단이 본원에 제공된다.
또 다른 양태에서, 질환 또는 장애의 치료 방법에 사용하기 위한, CasX:gNA 시스템, CasX:gNA 시스템을 포함하는 조성물, 또는 CasX:gNA 시스템을 포함하거나 인코딩하는 벡터, CasX:gNA 시스템을 포함하는 VLP, 또는 CasX:gNA 시스템을 사용하여 편집된 세포 집단이 본원에 제공된다.
참조에 의한 통합
본 명세서에서 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 개별 간행물, 특허, 또는 특허 출원이 참조로서 구체적으로 그리고 개별적으로 포함되는 것으로 표시되는 바와 동일한 정도로 참조로서 본원에 포함된다. 2020년 6월 5일에 출원된 PCT/US2020/036505호의 내용은 CasX 변이체 및 gNA 변이체를 개시하며, 그 전문이 참조로서 본원에 포함된다.
본 발명의 신규 특질은 첨부된 청구항에 구체적으로 제시된다. 본 발명의 특질 및 이점의 더 양호한 이해는 본 발명의 원리가 활용되는 예시적인 구현예를 제시하는 하기 상세한 설명 및 이의 첨부된 도면을 참조하여 수득될 것이다:
도 1은 실시예 1에 기재된 바와 같이, 콜로이드 쿠마시 염색에 의해 시각화된 StX2 정제 분획의 SDS-PAGE 겔을 도시한다.
도 2는 실시예 1에 기재된 바와 같이 Superdex 200 16/600 pg 겔 여과를 사용하여 StX2의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 도시한다.
도 3은 실시예 1에 기재된 바와 같이, 콜로이드 쿠마시 염색에 의해 시각화된 StX2 정제 분획의 SDS-PAGE 겔을 도시한다.
도 4는 실시예 2에 기재된 바와 같이, CasX 작제물을 조립하는 데 사용되는 pSTX34 플라스미드에서 구성요소의 구조화를 도시하는 개략도이다.
도 5는 실시예 2에 기재된 바와 같이, CasX 119 변이체를 생성하는 단계를 도시하는 개략도이다.
도 6은 실시예 2에 기재된 바와 같이, Bio-Rad Stain-Free™ 겔 상에서 시각화된, 정제 시료의 SDS-PAGE 겔을 도시한다.
도 7은 실시예 2에 기재된 바와 같이 Superdex 200 16/600 pg 겔 여과의 크로마토그램을 도시한다.
도 8은 실시예 2에 기재된 바와 같이, 콜로이드성 쿠마시로 염색된 겔 여과 시료의 SDS-PAGE 겔을 도시한다.
도 9는 실시예 10에 기재된 바와 같이, HEK293T 세포에서 6개의 표적 유전자의 편집 검정의 결과를 도시한다. 각각의 점(dot)은 개별 스페이서를 사용한 결과를 나타낸다.
도 10은 실시예 10에 기재된 바와 같이, HEK293T 세포에서 6개의 표적 유전자의 편집 검정의 결과를 도시하고, 개별 막대는 개별 스페이서로 수득된 결과를 나타낸다.
도 11은 실시예 10에 기재된 바와 같이, HEK293T 세포에서 4개의 표적 유전자의 편집 검정의 결과를 도시한다. 각각의 점은 CTC PAM을 활용하는 개별 스페이서를 사용한 결과를 나타낸다.
도 12는 실시예 14에 기재된 바와 같이 sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 활성 분획의 정량화에 대한 검정의 결과의 그래프이다. 등몰량의 RNP 표적은 공동-인큐베이션되었고, 절단된 표적의 양은 지시된 시점에서 결정되었다. 3개의 독립적인 복제물의 평균 및 표준 편차는 각각의 시점에 대해 나타나 있다. 조합된 복제물의 이상 적합도가 나타나 있다. "2"는 SEQ ID NO: 2의 기준 CasX 단백질을 지칭한다.
도 13은 실시예 14에 기재된 바와 같이 CasX2 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 도시한다. 등몰량의 RNP 표적은 공동-인큐베이션되었고, 절단된 표적의 양은 지시된 시점에서 결정되었다. 3개의 독립적인 복제물의 평균 및 표준 편차는 각각의 시점에 대해 나타나 있다. 조합된 복제물의 이상 적합도가 나타나 있다.
도 14는 실시예 14에 기재된 바와 같이 가이드-제한 조건 하에 CasX 491 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 도시한다. 등몰량의 RNP 표적은 공동-인큐베이션되었고, 절단된 표적의 양은 지시된 시점에서 결정되었다. 데이터의 이상 적합도(biphasic fit)가 나타나 있다.
도 15는 실시예 14에 기재된 바와 같이, sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 절단율의 정량화를 도시한다. 표적 DNA를 20배 과량의 지시된 RNP와 함께 인큐베이션하였고, 절단된 표적의 양은 지시된 시점에서 결정되었다. 단일 복제물이 나타나 있는 488 및 491을 제외하고는, 3개의 독립적인 복제물의 평균 및 표준 편차는 각각의 시점에 대해 나타나 있다. 조합된 복제물의 단상 적합도가 나타나 있다.
도 16은 실시예 14에 기재된 바와 같이, CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 절단율의 정량화를 도시한다. 표적 DNA를 20배 과량의 지시된 RNP와 함께 인큐베이션하였고, 절단된 표적의 양은 지시된 시점에서 결정되었다. 3개의 독립적인 복제물의 평균 및 표준 편차는 각각의 시점에 대해 나타나 있다. 조합된 복제물의 단상 적합도가 나타나 있다.
도 17은 실시예 14에 기재된 바와 같이, CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 초기 속도의 정량화를 도시한다. 이전의 절단 실험의 처음 2개의 시점은 선형 모델로 적합화되어, 초기 절단율을 결정하였다.
도 18은 실시예 14에 기재된 바와 같이, CasX491 및 sgRNA 변이체에 의해 형성된 RNP의 절단율의 정량화를 도시한다. 표적 DNA를 10℃에서 20배 과량의 지시된 RNP와 함께 인큐베이션하였고, 절단된 표적의 양은 지시된 시점에서 결정되었다. 시점의 단상 적합도가 나타나 있다.
도 19는 실시예 17에 기재된 바와 같이, 기준 CasX 단백질 또는 단일 가이드 RNA(sgRNA), 또는 이의 변이체의 효과성을 검정하기 위한 예시적인 방법을 예시하는 형광 활성화된 세포 분류(FACS: fluorescence activated cell sorting) 플롯의 다이어그램 및 예이다. gRNA 스페이서에 상보적인 gRNA 표적 서열에 커플링된 리포터(예를 들어, GFP 리포터)는 리포터 세포주 내로 통합된다. 세포는 리포터의 gRNA 표적 서열에 상보적이고 이를 표적화하는 sgRNA의 스페이서 모티프와 함께 CasX 단백질 및/또는 sgRNA 변이체로 형질전환되거나 형질주입된다. CasX:sgRNA 리보핵단백질 복합체가 표적 서열을 절단하는 능력은 FACS에 의해 검정된다. 리포터 발현을 상실하는 세포는 CasX:sgRNA 리보핵단백질 복합체-매개 절단의 발생 및 인델(indel) 형성을 나타낸다.
도 20은 실시예 19에 기재된 바와 같이, EGFP 방해 검정에서 유전자 편집의 결과를 도시한다. 편집은 GFP 리포터를 보유하는 HEK293 세포에서 인델 형성 및 GFP 방해에 의해 측정되었다. 도 2는 10개의 표적에 걸쳐 SEQ ID NO: 5의 CasX sgRNA 변이체 대 SEQ ID NO: 4의 기준의 편집 효율에서의 향상을 도시한다. 10개 표적에 걸쳐 평균화될 때, sgRNA SEQ ID NO: 5의 편집 효율은 SEQ ID NO: 4와 비교하여 176% 향상되었다.
도 21은, 추가 편집 향상이, 서열이 실시예 20에 기재된 바와 같이 표 2에 나타낸 스캐폴드를 생성하기 위해 추가 서열에 대해 연장된 스템 루프 서열(X-축에 표시됨)을 스와핑함으로써 SEQ ID NO: 5의 sgRNA 스캐폴드에서 수득되었다는 EGFP 방해 검정에서의 유전자 편집 결과를 도시한다.
도 22는 실시예 20에 기재된 바와 같이, CasX 기준 sgRNA로서 SEQ ID NO: 5로 정규화된 DME 돌연변이에 의해 생산된 sgRNA 변이체의 배수 향상을 도시하는 그래프이다.
도 23은 향상된 절단을 보여주는 스캐폴드 스템 돌연변이, 향상된 절단을 보여주는 DME 돌연변이를 둘 다 조합하고(적층하고), 향상된 절단을 나타내는 리보자임 부착을 사용함으로써 생성된 변이체의 SEQ ID NO: 5 기준 CasX sgRNA로 정규화된 배수 향상을 도시하는 그래프이다(부록 및 이의 서열은 실시예 20의 표 15에 나열되어 있음). 생성된 sgRNA 변이체는 이 검정에서 SEQ ID NO: 5와 비교하여 절단에서 2배 이상의 향상을 산출한다. EGFP 편집 검정은 실시예 19에 기재된 E6(TGTGGTCGGGGTAGCGGCTG(SEQ ID NO: 17)) 및 E7(TCAAGTCCGCCATGCCCGAA(SEQ ID NO: 18))의 스페이서 표적 서열로 수행되었다.
도 24는 실시예 21에 기재된 바와 같이 Jurkat 및 HEK 293T에서 HLA1의 발현 수준을 도시하는 그래프이다. 세포는 HLA1을 표적화하는 형광 항체를 사용하여 유세포 분석을 통해 분석되었다.
도 25는 실시예 21에 기재된 바와 같이 Stx 2.2로 처리된 HEK 293T 게놈 DNA의 T7E1을 도시하는 아가로스 겔이다. 편집은 비표적화 스페이서(p6.2.2.0.1)가 아니라 표적화 스페이서(p6.2.2.7.37)를 갖는 B2M 좌위에서 발생하고 있다.
도 26은 실시예 21에 기재된 바와 같이, Stx 2.2와 비교하여 Stx 분자 119.64(숫자는 각각 CasX 및 가이드를 지칭함)를 사용하여 HEK 293T 세포에서 B2M의 편집(넉아웃)에서 상대 향상을 도시하는 그래프이다.
도 27은 실시예 21에 기재된 바와 같이 대등한 수준의 편집을 보여주는, 5개의 고성능 SaCas9 스페이서와 비교하여 Stx 119.64를 사용하여 HEK 293T 세포에서 B2M의 편집(넉아웃)의 비교를 도시하는 그래프이다.
도 28은 실시예 21에 기재된 바와 같이, SaCas9와 대등한 결과와 함께, Stx 2.2와 비교하여 Stx 분자 119.64.7(숫자는 각각 CasX, 가이드, 및 스페이서를 지칭함)를 사용하여 HEK 293T 세포에서 B2M의 편집(넉아웃)에서 상대 향상을 도시하는 그래프이다.
도 29는 실시예 21에 기재된 바와 같이, Stx 119.64로 80%까지 변형을 갖는, HEK 293T B2M 좌위의 편집 백분율의 NGS 분석을 도시하는 그래프이다.
도 30은 실시예 24에 기재된 바와 같이, B2M 좌위에서 RNP-매개 편집의 결과를 도시한다. Jurkat 세포는 지시된 용량 및 가이드와 함께 스페이서 7.9 또는 7.37과 함께 CasX의 변이체로 전기천공되었다. HLA 넉다운은 항체 염색 및 유세포분석으로 결정되었다.
도 31은 실시예 24에 기재된 바와 같이 스페이서 7.9(상단) 및 7.37(하단)과 함께 CasX RNP의 전기천공 후 세포 생존력 검정의 결과를 도시한다. 살아 있는 세포는 HLA 넉다운 분석 시, DAPI 염색 및 유세포분석을 통해 카운팅되었다.
도 32는 실시예 24에 기재된 바와 같이, B2M 좌위에서 RNP-매개 편집의 NGS 분석의 결과를 도시한다. Jurkat 세포는 지시된 용량의 RNP로 전기천공되고, NGS를 통해 인델 형성에 대해 분석되었다.
도 33은 실시예 25에 기재된 바와 같이 인델 형성을 나타내는 TCR □/β의 표면 발현의 소실, HDR을 나타내는 GFP의 발현, 및 생존 세포의 수에 대해 분석된 TRAC 좌위에서 편집에 의한 인델 및 HDR 속도의 결과를 도시한다. "T" 및 "B"는, ssDNA가 TRAC 유전자의 방향에 대해 상단 또는 하단 가닥인지의 여부를 나타낸다.
도 34는 실시예 26에 기재된 바와 같이, B2M 및 TRAC 좌위의 공동-편집의 결과를 도시한다. Jurkat 세포는 지시된 용량의 RNP로 전기천공되었고, B2M 및 TRAC의 편집은 HLA-1 및 TCR α/β에 대한 염색에 의해 식별되고 유세포분석에 의해 검출되었다.
도 35는 B2M 유전자(SEQ ID NO: 725-2100 및 2281-7085)를 표적화하는 gNA 표적화 서열(스페이서)의 표인 표 3A를 도시한다.
도 36은 TRAC 유전자(SEQ ID NO: 7086-27454)를 표적화하는 gNA 표적화 서열(스페이서)의 표인 표 3B를 도시한다.
도 37은 CIITA 유전자(SEQ ID NO: 27455-55572)를 표적화하는 gNA 표적화 서열(스페이서)의 표인 표 3C를 도시한다.
예시적인 구현예가 본원에 나타나고 기재되긴 하였지만, 이러한 구현예는 단지 예에 의해 제공된다는 것이 당업자에게 명백할 것이다. 많은 변이, 변화, 및 치환은 현재, 본 발명으로부터 벗어나지 않으면서 당업자에게 발생할 것이다. 본원에 기재된 발명의 구현예에 대한 다양한 대안은 발명을 실시하는 데 이용될 수 있음이 이해되어야 한다. 하기 청구항은 본 발명의 범위를 정의하고, 이들 청구항의 범위 내의 구조 및 이의 등가물은 이에 의해 망라되는 것으로 의도된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 업계의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본원에 기재된 바와 유사하거나 동등한 방법 및 재료가 본 발명의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료가 하기에 기재된다. 상충되는 경우, 정의부분을 포함하여 특허 명세서가 우선한다. 게다가, 물질, 방법 및 실시예는 예시적일 뿐이며, 제한하려는 의도는 아니다. 많은 변이, 변화, 및 치환은 현재, 본 발명으로부터 벗어나지 않으면서 당업자에게 발생할 것이다.
정의
용어 "폴리뉴클레오타이드" 및 "핵산"은 본원에서 상호 교환적으로 사용되고, 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드인 임의의 길이의 뉴클레오타이드의 다형체성 형태를 지칭한다. 그러므로, 용어 "폴리뉴클레오타이드" 및 "핵산"은 단일 가닥 DNA; 이중 가닥 DNA; 다중 가닥 DNA; 단일 가닥 RNA; 이중 가닥 RNA; 다중 가닥 RNA; 게놈 DNA; cDNA; DNA-RNA 하이브리드; 및 퓨린 및 피리미딘 염기 또는 다른 천연, 화학적으로 또는 생화학적으로 변형된, 비-천연, 또는 유도체화된 뉴클레오타이드 염기를 포함하는 중합체를 포괄한다.
"혼성화 가능한" 또는 "상보적인"은, 핵산(예를 들어, RNA, DNA)이, 이것이 비-공유적으로 결합할 수 있게 하는, 즉, 왁슨-크릭 염기쌍 및/또는 G/U 염기쌍을 형성하거나, 온도 및 용액 이온 강도의 적절한 시험관내 및/또는 생체내 조건 하에 서열-특이적인, 역평행 방식으로 또 다른 핵산에 "어닐링하거나" "혼성화할" 수 있게 하는 뉴클레오타이드의 서열을 포함함을 의미하기 위해 상호 교환적으로 사용된다. 폴리뉴클레오타이드의 서열은, 특이적으로 혼성화 가능하기 위해 이의 표적 핵산 서열과 100% 상보적인 필요는 없으며; 이는 표적 핵산 서열과 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%의 서열 동일성을 갖고 여전히 이에 혼성화 가능할 수 있는 것으로 이해된다. 더욱이, 폴리뉴클레오타이드는, 개입 또는 인접 분절이 혼성화 사건(예를 들어, 루프 구조 또는 헤어핀 구조, '벌지' 등)에 관여하지 않도록 하나 이상의 분절에 걸쳐 혼성화할 수 있다.
본 개시내용의 목적을 위해 "유전자"는 유전자 생성물(예를 들어, 단백질, RNA)을 인코딩하는 DNA 영역, 뿐만 아니라 유전자 생성물의 생성을 조절하는 모든 DNA 영역을, 이러한 조절 서열이 코딩 및/또는 전사되는 서열에 인접해 있거나 그렇지 않든 간에, 포함한다. 이에, 유전자는 프로모터 서열, 종결자, 번역 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 사일런서, 인설레이터(insulator), 경계 요소(boundary element), 복제 기원, 매트릭스 부착 부위 및 좌위 제어 영역을 포함하지만 이들로 본질적으로 제한되지 않는 조절 요소 서열을 포함할 수 있다. 코딩 서열은 전사 또는 전사와 번역 시 유전자 생성물을 인코딩하며; 개시내용의 코딩 서열은 단편을 포함할 수 있고, 전장 개방 리딩 프레임(open reading frame)을 함유할 필요는 없다. 유전자는 전사되는 가닥, 예를 들어 코딩 서열을 함유하는 가닥, 뿐만 아니라 상보적 가닥을 둘 다 포함할 수 있다.
용어 "다운스트림"은 기준 뉴클레오타이드 서열에 대해 3'에 위치하는 뉴클레오타이드 서열을 지칭한다. 소정의 구현예에서, 다운스트림 뉴클레오타이드 서열은 전사의 시작점에 후속하는 서열에 관한 것이다. 예를 들어, 유전자의 번역 개시 코돈은 전사의 시작 부위의 다운스트림에 위치한다.
용어 "업스트림"은 기준 뉴클레오타이드 서열에 대해 5'에 위치하는 뉴클레오타이드 서열을 지칭한다. 소정의 구현예에서, 업스트림 뉴클레오타이드 서열은 코딩 영역의 5' 측(side) 또는 전사의 시작점 상에 위치하는 서열에 관한 것이다. 예를 들어, 대부분의 프로모터는 전사의 시작 부위의 업스트림에 위치한다.
용어 "조절 요소"는 용어 "조절 서열"과 본원에서 상호 교환적으로 사용되며, 프로모터, 인핸서, 및 다른 발현 조절 요소(예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)를 포함하고자 한다. 예시적인 조절 요소는, CMV, CMV+인트론 A, SV40, RSV, HIV-Ltr, 신장 인자 1 알파(EF1α), MMLV-ltr, 내부 리보솜 진입 부위(IRES) 또는 단일 전사물로부터 다수의 유전자의 번역을 가능하게 하기 위해 P2A 펩타이드와 같지만 이들로 제한되지 않는 전사 프로모터, 메탈로티오네인, 전사 인핸서 요소, 전사 종결 신호, 폴리아데닐화 서열, 번역 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 적절한 조절 요소의 선택은, 발현될 인코딩된 구성요소(예를 들어, 단백질 또는 RNA)에 의존하거나, 핵산이 상이한 폴리머라제를 필요로 하는 다수의 구성요소를 포함하거나 융합 단백질로서 발현되는 것으로 의도되지 않는지의 여부에 의존할 것으로 이해될 것이다.
용어 "프로모터"는, RNA 폴리머라제 결합 부위, 전사 개시 부위, TATA 박스, 및/또는 B 인식 요소를 함유하고, 회합된 전사 가능한 폴리뉴클레오타이드 서열 및/또는 유전자(또는 이식유전자)의 전사 및 발현을 돕거나 촉진하는 DNA 서열을 지칭한다. 프로모터는 합성적으로 생성될 수 있거나, 기지의 또는 천연 발생 프로모터 서열 또는 또 다른 프로모터 서열로부터 유래될 수 있다. 프로모터는 전사될 유전자에 근위부(proximal) 또는 원위부(distal)에 있을 수 있다. 프로모터는 또한, 소정의 특성을 부여하기 위해 2개 이상의 이종성 서열의 조합을 포함하는 키메라 프로모터를 포함할 수 있다. 본 개시내용의 프로모터는, 조성이 유사하지만, 본원에 알려져 있거나 제공된 다른 프로모터 서열(들)과 유사하지만 동일하지 않는 프로모터의 변이체를 포함할 수 있다. 프로모터는, 프로모터에 작동 가능하게 연결된 회합된 코딩 또는 전사 가능한 서열 또는 유전자의 발현 패턴과 관련하여 범주에 따라, 예컨대 구성적, 발달적(developmental), 조직-특이적, 유도성 등으로 분류될 수 있다.
용어 "인핸서"는 전사 인자라고 하는 특정 단백질에 의해 결합될 때, 회합된 유전자의 발현을 조절하는 조절 DNA 서열을 지칭한다. 인핸서는 유전자의 인트론, 또는 유전자의 코딩 서열의 5' 또는 3'에 위치할 수 있다. 인핸서는 유전자에 근접하게(즉, 프로모터의 수십 또는 수백 개의 염기쌍(bp) 내에) 존재할 수 있거나, 유전자에 대해 원위부에(즉, 프로모터로부터 수천 bp, 수십만 bp, 또는 심지어 수백만 bp에) 위치할 수 있다. 단일 유전자는 하나 초과의 인핸서에 의해 조절될 수 있으며, 이들 인핸서는 모두 본 개시내용의 범위 내에 있는 것으로 여겨진다.
본원에 사용된 바와 같이, "재조합"은, 특정 핵산(DNA 또는 RNA)이, 자연 시스템에서 발견되는 내인성 핵산으로부터 구별 가능한 구조적 코딩 또는 비-코딩 서열을 갖는 작제물을 이끄는 클로닝, 제한, 및/또는 리게이션(ligation) 단계의 다양한 조합의 생성물임을 의미한다. 일반적으로, 구조적 코딩 서열을 인코딩하는 DNA 서열은 cDNA 단편 및 짧은 올리고뉴클레오타이드 링커로부터, 또는 합성 올리고뉴클레오타이드의 시리즈로부터 조립되어, 세포에 또는 세포-무함유 전사 및 번역 시스템에 함유된 재조합 전사 단위로부터 발현될 수 있는 합성 핵산을 제공할 수 있다. 이러한 서열은, 전형적으로 진핵생물 유전자에 존재하는 내부 비-번역된 서열, 또는 인트론에 의해 간섭되지 않는 개방 리딩 프레임의 형태로 제공될 수 있다. 관련 서열을 포함하는 게놈 DNA는 또한, 재조합 유전자 또는 전사 단위의 형성에 사용될 수 있다. 비-번역된 DNA의 서열은 개방 리딩 프레임으로부터 5' 또는 3'에 존재할 수 있으며, 여기서 이러한 서열은 코딩 영역의 조작 또는 발현을 간섭하지 않으며, 실제로 다양한 기전에 의한 요망되는 생성물의 생성을 조정하도록 작용할 수 있다(상기 "인핸서" 및 "프로모터" 참조).
용어 "재조합 폴리뉴클레오타이드" 또는 "재조합 핵산"은, 천연적으로 발생하지 않는, 예를 들어, 인간 개입을 통해 서열의 2개의 다르게 분리된 분절의 인공적 조합에 의해 만들어지는 것을 지칭한다. 이러한 인공적 조합은 종종 화학적 합성 수단에 의해, 또는 핵산의 단리된 분절의 인공적 조작에 의해, 예를 들어, 유전자 조작 기법에 의해 달성된다. 이러한 것은 통상 코돈을, 전형적으로 서열 인식 부위를 도입하거나 제거하는 한편, 동일한 또는 보존된 아미노산을 인코딩하는 반복 코돈(redundant codon)으로 대체하기 위해 수행된다. 대안적으로, 이는 기능의 요망되는 조합을 생성하기 위해 요망되는 기능의 핵산 분절을 함께 연결하기 위해 수행된다. 이러한 인공적 조합은 종종 화학적 합성 수단에 의해, 또는 핵산의 단리된 분절의 인공적 조작에 의해, 예를 들어, 유전자 조작 기법에 의해 달성된다.
유사하게는, 용어 "재조합 폴리펩타이드"는, 천연적으로 발생하지 않는, 예를 들어, 인간 개입을 통해 아미노산 서열의 2개의 다르게 분리된 분절의 인공적 조합에 의해 만들어지는 폴리펩타이드를 지칭한다. 그러므로, 예를 들어, 이종성 아미노산 서열을 포함하는 폴리펩타이드는 재조합적이다.
본원에 사용된 바와 같이, 용어 "접촉시키는"은, 2개 이상의 엔티티(entity) 사이에서 물리적 연결을 확립하는 것을 의미한다. 예를 들어, 표적 핵산 서열을 가이드 핵산과 접촉시키는 것은, 표적 핵산 서열 및 가이드 핵산이 물리적 연결을 공유하도록 만들어지며, 예를 들어 서열이 서열 유사성을 공유한다면 혼성화할 수 있음을 의미한다.
"해리 상수", 또는 "Kd"는 상호 교환적으로 사용되고, 리간드 "L"과 단백질 "P" 사이의 친화도, 즉, 리간드가 특정 단백질에 얼마나 밀착하여 결합하는지 의미한다. 이는 식 Kd=[L] [P]/[LP]를 사용하여 계산될 수 있으며, 이 식에서, [P], [L] 및 [LP]는 단백질, 리간드 및 복합체의 몰 농도를 각각 나타낸다.
용어 "넉아웃"은 유전자의 제거(elimination) 또는 유전자의 발현을 지칭한다. 예를 들어, 유전자는 리딩 프레임의 방해를 유발하는 뉴클레오타이드 서열의 결실 또는 첨가에 의해 넉아웃될 수 있다. 또 다른 예로, 유전자는 해당 유전자의 일부를 상관없는 서열로 대체함으로써 넉아웃될 수 있다. 본원에 사용된 바와 같이 용어 "넉다운"은 유전자 또는 이의 유전자 생성물(들)의 발현의 감소를 지칭한다. 유전자 넉다운의 결과, 단백질 활성 또는 기능은 약화될 수 있거나 단백질 수준은 감소되거나 제거될 수 있다.
본원에 사용된 바와 같이, "상동성-안내 수선"(HDR: homology-directed repair)은 세포에서 이중 가닥 절단부(break)의 수선 동안 발생하는 DNA 수선의 형태를 지칭한다. 이러한 과정은 뉴클레오타이드 서열 상동성을 필요로 하며, 표적 DNA를 수선하거나 넉아웃시키기 위해 공여자 주형을 사용하고, 표적으로의 공여자로부터의 유전자 정보의 이전(transfer)을 유발한다. 상동성-안내 수선은, 공여자 주형이 표적 DNA 서열과 상이하고 공여자 주형의 서열 중 일부 또는 모두가 표적 DNA 내로 혼입된다면, 삽입, 결실, 또는 돌연변이에 의한 표적 서열의 서열 변경을 이끌 수 있다.
본원에 사용된 바와 같이, "비-상동성 말단 접합"(NHEJ: non-homologous end joining)은 상동성 주형에 대한 필요성 없이(수선을 가이드하기 위해 상동성 서열을 필요로 하는 상동성-안내 수선과는 대조적으로) 절단 단부(break end)를 서로에게 직접 리게이션함으로써 DNA에서 이중 가닥 절단부의 수선을 지칭한다. NHEJ는 종종 이중 가닥 절단부의 부위 근처에서 뉴클레오타이드 서열의 소실(결실)을 이끈다.
본원에 사용된 바와 같이, "마이크로-상동성 매개 말단 접합"(MMEJ: micro-homology mediated end joining)은 상동성 주형에 대한 필요성 없이(수선을 가이드하기 위해 상동성 서열을 필요로 하는 상동성-안내 수선과는 대조적으로) 절단 부위를 플랭킹(flanking)하는 결실과 항상 회합되는 돌연변이형성 DSB 수선 기전을 지칭한다. MMEJ는 종종 이중 가닥 절단부의 부위 근처에서 뉴클레오타이드 서열의 소실(결실)을 이끈다.
폴리뉴클레오타이드 또는 폴리펩타이드는, 또 다른 폴리뉴클레오타이드 또는 폴리펩타이드와 소정의 비율의 "서열 유사성" 또는 "서열 동일성"을 가지며, 이는, 정렬될 때, 염기 또는 아미노산의 비율이 2개 서열을 비교할 때 동일한 상대 위치에서 동일함을 의미한다. 서열 유사성(이따금, 유사성 백분율, 동일성 백분율, 또는 상동성으로 지칭됨)은 많은 상이한 방식으로 결정될 수 있다. 서열 유사성을 결정하기 위해, 서열은 ncbi.nlm.nih.gov/BLAST에서 월드 와이드 웹에 걸쳐 입수 가능한 BLAST를 포함하여 당업계에 알려진 방법 및 컴퓨터 프로그램을 사용하여 정렬될 수 있다. 핵산 내의 핵산 서열의 특정 스트레치(stretch) 사이에서의 상보성 백분율(percent complementarity)은 임의의 편리한 방법을 사용하여 결정될 수 있다. 예시적인 방법은 BLAST 프로그램(기본적 국소 정렬 연구 툴) 및 PowerBLAST 프로그램(문헌[Altschul 등, J. Mol. Biol., 1990, 215, 403-410]; 문헌[Zhang 및 Madden, Genome Res., 1997, 7, 649-656]), 또는 갭 프로그램(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.)을 사용하여, 예를 들어, Smith 및 Waterman(문헌[Adv. Appl. Math., 1981, 2, 482-489])의 알고리즘을 사용하는 디폴트 설정을 사용함으로써 포함한다.
용어 "폴리펩타이드," 및 "단백질"은 본원에서 상호 교환적으로 사용되며, 임의의 길이의 아미노산의 다형체성 형태를 지칭하고, 이는 코딩된 아미노산 및 비-코딩된 아미노산, 화학적으로 또는 생화학적으로 변형된 또는 유도체화된 아미노산, 및 변형된 펩타이드 백본을 갖는 폴리펩타이드를 포함할 수 있다. 상기 용어는, 이종성 아미노산 서열과의 융합 단백질을 포함하지만 이로 제한되지 않는 융합 단백질을 포함한다.
"벡터" 또는 "발현 벡터"는, 또 다른 DNA 분절, 즉, "삽입물"이 부착되어 세포에서 부착된 분절의 복제 또는 발현을 야기할 수 있는 레플리콘(replicon), 예컨대 플라스미드, 파지, 바이러스, 또는 코스미드이다.
본원에 사용된 바와 같이, 핵산, 폴리펩타이드, 세포, 또는 유기체에 적용되는 바와 같이 본원에 사용되는 바와 같이 용어 "천연-발생" 또는 "비변형된" 또는 "야생형"은 자연에서 발견되는 핵산, 폴리펩타이드, 세포, 또는 유기체를 지칭한다.
본원에 사용된 바와 같이, "돌연변이"는 기준 아미노산 서열 또는 기준 뉴클레오타이드 서열과 비교하여, 하나 이상의 아미노산 또는 뉴클레오타이드의 삽입, 결실, 치환, 중복, 또는 역위를 지칭한다.
본원에 사용된 바와 같이 용어 "단리된"은, 폴리뉴클레오타이드, 폴리펩타이드, 또는 세포가 천연적으로 발생하는 환경과 상이한 환경에 존재하는 폴리뉴클레오타이드, 폴리펩타이드, 또는 세포를 기재하는 것으로 의미된다. 단리된 유전적으로 변형된 숙주 세포는 유전적으로 변형된 숙주 세포의 혼합된 집단에 존재할 수 있다.
본원에 사용된 바와 같이, "숙주 세포"는 진핵 세포, 원핵 세포, 또는 다세포성 유기체(예를 들어, 세포주에서)로부터의 세포를 의미하며, 이러한 진핵 세포 또는 원핵 세포는 핵산(예를 들어, 발현 벡터)에 대한 수혜자(recipient)로서 사용되고, 핵산에 의해 유전적으로 변형되었던 원래의 세포의 자손을 포함한다. 단일 세포의 자손은 천연적, 우연적 또는 고의적 돌연변이로 인해 원래의 모(parent)와 형태에서 또는 게놈 또는 총 DNA 보체에서 본질적으로 완전히 동일하지 않을 수 있는 것으로 이해된다. "재조합 숙주 세포"("유전적으로 변형된 숙주 세포"로도 지칭됨)는, 이종성 핵산, 예를 들어, 발현 벡터를 도입한 숙주 세포이다.
용어 "보존적 아미노산 치환"은 유사한 측쇄를 갖는 아미노산 잔기의 단백질에서의 상호 교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 군(group)은 글리신, 알라닌, 발린, 류신, 및 이소류신으로 구성되며; 지방족-하이드록실 측쇄를 갖는 아미노산의 군은 세린 및 트레오닌으로 구성되고; 아미드-함유 측쇄를 갖는 아미노산의 군은 아스파라긴 및 글루타민으로 구성되며; 방향족 측쇄를 갖는 아미노산의 군은 페닐알라닌, 티로신, 및 트립토판으로 구성되고; 염기성 측쇄를 갖는 아미노산의 군은 리신, 아르기닌, 및 히스티딘으로 구성되며; 황-함유 측쇄를 갖는 아미노산의 군은 시스테인 및 메티오닌으로 구성된다. 예시적인 보존적 아미노산 치환 군은: 발린-류신-이소류신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린, 및 아스파라긴-글루타민이다.
용어 "키메라 항원 수용체" 또는 "CAR"은 적어도 2개의 도메인을 포함하며, 이는 세포에서 발현될 때, 표적 항원에 대해 특이성을 갖는 세포, 또는 표적 항원을 보유하는 표적 세포, 전형적으로 특정 질환-관련 항원을 보유하는 유병 세포를 제공한다. 일부 구현예에서, CAR은 적어도 하나의 세포외 항원 결합 도메인(예를 들어, 질환(예를 들어 암)에 관여하는 단백질에 대해 결합 특이성을 갖는 scFv), 막관통 도메인 및 아래 제공된 바와 같은 하나 이상의 자극성 및/또는 공동자극성 분자로부터 유래되는 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인(본원에서 "세포내 신호전달 도메인"으로도 지칭됨)을 포함한다. 일부 양태에서, 폴리펩타이드의 세트는 서로 인접해(contiguous) 있다. 개시내용의 CAR의 항원 결합 도메인을 포함하는 이러한 CAR의 일부는, 항원 결합 도메인이 예를 들어, 단일 도메인 항체 단편(sdAb), 단일 사슬 항체(scFv), 인간화 항체 또는 이중특이적 항체를 포함하여 인접 폴리펩타이드 사슬의 파트로서 발현되는 여러 가지 형태로 존재할 수 있으며(문헌[Harlow 등, 1999, In: Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, NY]; 문헌[Harlow 등, 1989, In: Antibodies: A Laboratory Manual, Cold Spring Harbor, N.Y.]; 문헌[Houston 등, 1988, Proc. Natl. Acad. Sci. USA 85:5879-5883]; 문헌[Bird 등, 1988, Science 242:423-426]), 수용체에 가요성(flexibility)을 제공하는 예를 들어 면역글로불린 분자의 힌지 영역, 및 스페이서를 추가로 포함할 수 있다. 힌지, 스페이서, 및 막관통 도메인은 scFv를 활성화 도메인에 연결하고 CAR을 T-세포막에 고정시킨다(anchor). 일부 구현예에서, 개시 내용의 CAR 조성물은 항원 결합 도메인을 포함한다. 추가 구현예에서, CAR은 scFv를 포함하는 항체 단편을 포함한다. 주어진 CDR의 정확한 아미노산 서열 경계는 문헌[Kabat 등 (1991), "Sequences of Proteins of Immunological Interest," 5th Ed. Public Health Service, National Institutes of Health, Bethesda, Md. ("Kabat" numbering scheme)], 문헌[Al-Lazikani 등, (1997) JMB 273,927-948 ("Chothia" numbering scheme)]에 의해 기재된 것들 또는 이들의 조합을 포함하여 많은 잘 알려진 체계 중 임의의 체계를 사용하여 결정될 수 있다.
용어 "T 세포 수용체(TCR)"는, 주 조직적합성 복합체(MHC) 분자에 결합된 펩타이드 항원을 인식하는 것을 담당하는 T 세포의 표면 상에서 발견되는 단백질 복합체를 지칭한다. TCR은 TCR 알파 및 TCR 베타 사슬(각각 TRAC, 또는 TCRA, 및 TBRC1, 또는 TCRB에 의해 인코딩됨)을 포함하여 다수의 하위단위로 이루어지고, TCR이 결합할 항원을 결정하는 상보성 결정 영역(CDR)이 이들 사슬 내에 존재한다. 추가 하위단위는 CD-입실론(CD3E), CD3-델타(CD3D), CD3-감마(CD3G) 및 CD3-제타(CD3Z)를 포함한다. TCR 알파 및 TCR 베타 하위단위의 세포외 도메인은 네이티브(native) TCR의 항원 결합 부위를 형성한다. TCR의 세포외 도메인의 CDR은 항원 결합 섹션이고, 다양한 인식 능력은 외래 항원 또는 질환 세포에 대한 효율적인 보호 및 최적의 면역 반응의 발생을 유발한다. 일단 TCR이 항원과 적절하게 연계(engage)되면, 회합된 CD3 사슬에서 입체배좌(conformation) 변화가 유도되며, 이는 다른 인자와 함께 신호전달 과정 및 T 세포 활성화를 개시한다.
본원에 사용된 바와 같이, "조작된 TCR"은 표적 항원에 대해 특이성을 갖는 항원 결합 도메인, 또는 표적 항원을 보유하는 표적 세포, 전형적으로 특정 질환-관련 항원을 보유하는 유병 세포를 포함하도록 조작된 TCR을 지칭한다. 예를 들어, 조작된 TCR은 TCR의 TCR 알파 또는 TCR 베타 하위단위, 또는 이들의 조합에 융합된 항원 결합 도메인을 포함할 수 있다. 예를 들어, 단일 도메인 항체 단편(sdAb), 단일 사슬 항체(scFv), 인간화 항체 또는 이중특이적 항체를 포함한 임의의 항원 결합 도메인은 본원에 기재된 조작된 TCR과 함께 사용될 수 있다. 항원 결합 도메인에 융합된 하위단위 또는 하위단위들에 더하여, 조작된 TCR은 또한, 세포의 게놈에 의해 인코딩되는 야생형 하위단위를 포함할 수 있다. 예를 들어, 조작된 TCR은 TCR의 TCR 알파 또는 TCR 베타 하위단위, 뿐만 아니라 야생형 CD3-델타, CD3-감마, CD3-입실론 및 CD3-제타 하위단위에 융합된 항원 결합 도메인을 포함할 수 있다.
"신호전달 도메인"은, 제2 메신저를 생산하거나 이러한 메신저에 반응함으로써 이펙터로서 작용함으로써 정의된(defined) 신호전달 경로를 통해 세포성 활성을 조절하기 위해 세포 내에서 정보를 전달함으로써 작용하는 단백질의 기능적 부분을 지칭한다.
"세포내 신호전달 도메인"은 분자의 세포내 부분을 지칭하고, 본원에 사용된 바와 같이 CAR의 구성요소이다. T 세포-유래 신호전달 도메인의 예는 CD247 분자(CD3-제타, 또는 CD3Z), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB, 또는 41BB), 유도성 T 세포 공동자극자(ICOS), TNF 수용체 슈퍼계열 구성원 4(OX40), 또는 이들의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드로부터 유래된다. 세포내 신호전달 도메인은 CAR 함유 세포, 예를 들어, CAR-T 세포의 면역 이펙터 기능을 촉진하는 신호를 발생시킨다. 예를 들어, CAR-T 세포에서 면역 이펙터 기능의 예는 사이토카인의 분비를 포함하여 세포용해 활성 및 헬퍼 활성을 포함한다. 세포내 신호전달 도메인은 면역수용체 티로신-기초 활성화 모티프 또는 ITAM으로 알려져 있는 신호전달 모티프를 포함할 수 있다. 1차 세포질 신호전달 서열을 함유하는 ITAM의 예는 CD3제타, IgE 수용체 Ig의 Fc 단편(공통 FcR 감마, 또는 FCER1G), IgG 수용체 IIa의 Fc 단편(Fc 감마 RIIa, 또는 FCGR2A), Fc 수용체 감마 RIIB, CD3g 분자(CD3 감마, 또는 CD3G), CD3d 분자(CD3 델타, 또는 CD3D), CD3e 분자(CD3 입실론, 또는 CD3E), CD79a, CD79b, DAP10, 및 DAP12로부터 유래된 것들을 포함하지만 이들로 제한되지는 않는다.
용어 "제타" 또는 대안적으로 "제타 사슬", "CD3-제타" 또는 "TCR-제타"는 GenBan 기탁 번호 BAG36664.1로서 제공된 단백질, 또는 비-인간 종, 예를 들어, 마우스, 설치류, 또는 비-인간 영장류로부터의 동등한 잔기로서 정의되고, "제타 자극성 도메인" 또는 대안적으로 "CD3-제타 자극성 도메인" 또는 "TCR-제타 자극성 도메인"은 T 세포 활성화에 필요한 초기 신호를 기능적으로 전달하기에 충분한 제타 사슬의 세포질 도메인으로부터의 아미노산 잔기, 또는 이의 기능적 유도체로서 정의된다. 일부 구현예에서, 제타의 세포질 도메인은 GenBank 기탁 번호 BAG36664.1의 잔기 52 내지 164 또는 이의 기능적 이종상동체(ortholog)인 비-인간 종으로부터의 동등한 잔기를 포함한다.
본원에 사용된 바와 같이, "항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질"은 항원 가공, 제시, 인식, 및/또는 반응에 관여하는 세포외, 막관통 및 세포내 단백질 또는 당단백질을 지칭한다. 일부 경우, 단백질 또는 당단백질은 세포 표면 상에서 발현되고, 편리하게는 특정 세포 유형의 마커로서 역할을 할 수 있다. 예를 들어, T 세포 및 B 세포 표면 단백질은 분화 과정에서 이의 계통(lineage) 및 시기(stage)를 식별한다. 일부 경우, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질은 리간드에 대해 결합 친화도를 갖는 수용체이다.
"종양 항원"은 암세포의 표면 상에서 전체적으로 또는 단편(예를 들어, MHC 펩타이드)으로서 발현되고, 암세포로의 면역 세포의 우선적인 표적화에 유용하다. 일부 구현예에서, B 세포 상의 CD19와 같이 종양 항원은 정상 세포와 암세포 둘 다에 의해 발현되는 마커이다. 일부 구현예에서, 종양 항원은 정상 세포와 비교하여 암세포에서 과발현되는 세포 표면 분자이다.
본원에 사용된 바와 같이, 용어 "항체"는 단일클론 항체, 다클론 항체, 다중특이적 항체(예를 들어, 이중특이적 항체), 나노체(nanobody), 단일 도메인 항체, 예컨대 VHH 항체, 및 항체 단편을 포함하지만 이들로 제한되지 않는 다양한 항체 구조를, 이들이 요망되는 항원-결합 활성 또는 면역학적 활성을 나타내는 한 포괄한다. 항체는 분자의 몇몇 유형, 예컨대 IgD, IgG, IgA, IgM 및 IgE를 포함하는 분자의 큰 계열을 나타낸다.
"인간화" 항체는 비-인간 상보성-결정 영역(CDR)으로부터의 아미노산 잔기 및 인간 프레임워크 영역(FR)으로부터의 아미노산 잔기를 포함하는 항체를 지칭한다. 전형적으로, 인간화 항체는 실질적으로 모든 가변 도메인을 포함할 것이며, 이러한 가변 도메인에서 모든 또는 실질적으로 모든 CDR은 비-인간 항체(아미노산 치환을 포함할 수 있음)의 CDR에 상응하고, 모든 또는 실질적으로 모든 FR은 인간 항체의 FR에 상응한다.
본원에 사용된 바와 같이, 용어 "단일클론 항체"는 실질적으로 상동성인 항체의 집단으로부터 수득되는 항체를 지칭하며, 여기서 상기 집단은 동일하고/하거나 동일한 에피토프에 결합한다. 그러므로, 수식어 "단일클론"은 항체의 실질적으로 상동성인 집단으로부터 수득되는 바와 같이 항체의 특징을 나타내고, 임의의 특정 방법에 의한 항체의 생성을 필요로 하는 것으로 여겨져서는 안 된다.
본원에 사용된 바와 같이, "항원 결합 도메인"은, 항원에 특이적으로 결합하는("이와 면역반응하는") 항원-결합 부위를 함유하는 분자의 면역학적 활성 부분을 지칭한다. 항원 결합 도메인은, 이것이 폴리펩타이드 또는 다른 물질을 포함하는 다른 기준 항원에 결합하는 것보다 더 큰 친화도 또는 결합력(avidity)으로 결합한다면 항원"에 특이적으로 결합한다" 또는 항원"에 대해 특이적"이다. 항원 결합 도메인을 포함하는 단백질의 예는, 에피토프에 맞춰지고 이를 인식하고 이에 결합하는 특정 모양을 갖는 Fv, Fab, Fab', Fab'-SH, F(ab')2, 이중체(diabody), 선형 항체(미국 특허 제5,641,870호 참조), 단일 도메인 항체, 단일 도메인 카멜리드(camelid) 항체, 단일-사슬 단편 가변(scFv) 항체 분자, 또는 임의의 폴리펩타이드 사슬-함유 분자 구조를 포함하지만 이들로 제한되지는 않는다.
"scFv" 또는 "단일 사슬 단편 가변"은 본원에서, scFv가 항원 결합에 요망되는 구조를 형성하는 것을 가능하게 하는 짧은 가요성 펩타이드 링커에 의해 함께 결합되는 항체의 중쇄 가변 영역("VH") 및 경쇄 가변 영역("VL") 또는 VH나 VL 사슬의 2개 복사체(copy)를 포함하는 항체 단편 형식을 지칭하기 위해 상호 교환적으로 사용된다. scFv는 각각이 상보성-결정 영역(CDR)을 포함하는 면역글로불린의 중쇄 가변 영역(VH) 및 경쇄 가변 영역(VL)의 융합 단백질이고, 이들 가변 영역은 임의의 순서; VH-VL 또는 VL-VH로 존재할 수 있고, 통상 링커에 의해 결합된다.
용어 "4-1BB"는 GenBank 기탁 번호 AAA62478.2로서 제공되는 아미노산 서열, 또는 비-인간 종으로부터의 동등한 잔기를 갖는 TNF-R 슈퍼계열의 구성원을 지칭하고; "4-1BB 공동자극성 도메인"은 GenBank 기탁 번호 AAA62478.2의 아미노산 잔기 214-255, 또는 비-인간 종으로부터의 동등한 잔기로서 정의된다.
"면역 이펙터 세포"는 면역 반응에, 예를 들어, 면역 이펙터 반응의 촉진에 관여하는 세포를 지칭한다. 면역 이펙터 세포의 예는 T 세포, 예컨대 헬퍼 T 세포 및 세포독성 T 세포, 감마-델타 T 세포, 종양 침윤성 림프구, NK 세포, B 세포, 단핵구, 대식세포, 또는 수지상 세포를 포함한다.
"면역 이펙터 기능" 또는 "면역 이펙터 반응"은 표적 세포의 면역 공격을 증강시키거나 촉진하는 예를 들어, 면역 이펙터 세포의 기능 또는 반응을 지칭한다. 본 개시내용의 맥락에서, 면역 이펙터 기능 또는 반응은 표적 세포의 성장 또는 증식의 사멸 또는 저해를 촉진하는 T 세포 또는 NK 세포의 특성을 지칭한다.
본원에 사용된 바와 같이, "치료" 또는 "치료하는"은 본원에서 상호 교환적으로 사용되며, 치료적 이익 및/또는 예방적 이익을 포함하지만 이들로 제한되지 않는 유익한 또는 요망되는 결과를 수득하기 위한 접근법을 지칭한다. 치료적 이익이란, 치료되는 기저 장애 또는 질환의 근절 또는 호전을 의미한다. 치료적 이익은 또한, 향상이 대상체에서 관찰되도록 기저 질환과 관련된 증상의 하나 이상의 근절 또는 개선 또는 하나 이상의 임상적 매개변수의 향상으로 달성될 수 있으며, 그렇지만 대상체는 여전히 기저 장애를 앓고 있을 수 있다.
본원에 사용된 바와 같이, 용어 "치료적 유효량" 및 "치료적 유효 용량"은, 대상체, 예컨대 인간 또는 실험 동물에게 1회 용량 또는 반복된 용량으로 투여될 때 질환 상태 또는 병태의 임의의 증상, 양태, 측정된 매개변수 또는 특징에 대해 임의의 검출 가능한, 유익한 효과를 가질 수 있는 약물 또는 생물제(biologic)의 양을 단독으로 또는 조성물의 일부로서 지칭한다. 이러한 효과는 유익하기 위해 절대적인 필요는 없다.
본원에 사용된 바와 같이, "투여하는"은, 화합물(예를 들어, 개시내용의 조성물) 또는 조성물(예를 들어, 약학적 조성물)의 투여량을 대상체에게 제공하는 방법인 것으로 의미된다.
"대상체"는 포유류이다. 포유류는 가축, 비-인간 영장류, 인간, 토끼, 마우스, 래트 및 다른 설치류를 포함하지만 이들로 제한되지는 않는다.
I. 일반적인 방법
본 개시내용의 실시는 다르게 지시되지 않는 한, 면역학, 생화학, 화학, 분자생물학, 미생물학, 세포 생물학, 유전학 및 재조합 DNA의 종래의 기법을 이용하며, 이는 문헌[Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook 등, HaRBor Laboratory Press 2001)]; 문헌[Short Protocols in Molecular Biology, 4th Ed. (Ausubel 등 eds., John Wiley & Sons 1999)]; 단백질 방법(문헌[Bollag 등, John Wiley & Sons 1996]); 유전자 치료법을 위한 비바이러스 벡터(문헌[Wagner 등 eds., Academic Press 1999]); 바이러스 벡터(문헌[Kaplift & Loewy eds., Academic Press 1995]); 면역학 방법 매뉴얼(문헌[I. Lefkovits ed., Academic Press 1997]); 세포 및 조직 배양: 생물공학에서의 실험실 절차(문헌[Doyle & Griffiths, John Wiley & Sons 1998])과 같은 표준 교재에서 확인될 수 있다.
값의 범위가 제공되는 경우, 종점이 포함되고, 문맥상 명확하게 다르게 나타내지 않는 한 해당 범위의 상한과 하한 사이에서 하한의 단위의 1/10 및 해당하는 언급된 범위에서 임의의 다른 언급된 또는 개입 값까지 각각의 개입 값이 포괄되는 것으로 이해된다. 이들 더 작은 범위의 상한 및 하한은 독립적으로, 더 작은 범위에 포함될 수 있고, 또한 언급된 범위에서 임의의 구체적으로 배제된 한계를 받는 것으로 포괄된다. 언급된 범위가 한계 중 하나 또는 둘 다를 포함하는 경우, 이들 포함된 한계 중 어느 하나 또는 둘 다를 배제하는 범위가 또한 포함된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 업계의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본원에서 언급된 모든 간행물은 본원에서 개시내용의 참조로서 포함되고, 이 간행물이 인용되는 것과 관련하여 방법 및/또는 재료를 기재한다.
본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 명백하게 다르게 지시되지 않는 한 복수의 참조를 포함한다는 것에 유의해야 한다.
명료성을 위해 별도의 구현예의 맥락에서 기재된 본 발명의 소정의 특질은 또한, 단일 구현예에서 조합되어 제공될 수 있는 것으로 이해될 것이다. 다른 경우, 간결성을 위해 단일 구현예의 맥락에서 기재된 본 발명의 다양한 특질은 또한, 별도로 또는 임의의 적합한 하위-조합으로 제공될 수 있다. 본 발명에 관한 구현예의 모든 조합은 본 발명에 의해 구체적으로 포괄되고, 각각의 그리고 모든 조합이 개별적으로 그리고 명료하게 개시된 것처럼 본원에 개시되어 있는 것으로 의도된다. 게다가, 다양한 구현예의 모든 하위-조합 및 이의 요소는 또한, 본 발명에 의해 구체적으로 포괄되고, 각각의 그리고 모든 이러한 하위-조합이 본원에서 개별적으로 그리고 명료하게 개시된 것처럼 본원에 개시된다.
II. 항원 가공, 제시, 인식, 및/또는 반응에 관여하는 단백질의 유전적 편집을 위한 시스템
제1 양태에서, 본 개시내용은 진핵 세포의 게놈 편집에서 유용성을 갖는 CRISPR 뉴클레아제 및 하나 이상의 가이드 핵산(gNA)을 포함하는 시스템을 제공한다. 일부 구현예에서, CRISPR 뉴클레아제는 Cas9, Cas12a, Cas12b, Cas12c, Cas12d(CasY), CasX, Cas13a, Cas13b, Cas13c, Cas13d, CasX, CasY, Cas14, Cpfl, C2cl, Csn2, 및 Cas Phi로 이루어진 군으로부터 선택된다. 일부 구현예에서, CRISPR 뉴클레아제는 유형 V CRISPR 뉴클레아제이다. 일부 구현예에서, 본 개시내용은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 하나 이상의 세포 유전자의 표적 핵산 서열을 변형시키기 위해 특이적으로 설계되는 CasX 단백질 및 하나 이상의 가이드 핵산(gNA)을 포함하는 CasX:gNA 시스템을 제공한다. 개시내용의 gNA 및 CasX 단백질은 본원에서 리보핵단백질(RNP) 복합체로 지칭되는 비-공유 상호작용을 통해 복합체를 형성하고 결합할 수 있다. 예비-복합체화된 CasX:gNA의 사용은 표적 핵산 서열의 편집을 위해 세포 또는 표적 핵산 서열로의 시스템 구성요소의 전달에서 이점을 부여한다. RNP에서, gNA는, 표적 핵산의 서열에 상보적인 뉴클레오타이드 서열을 갖는 표적화 서열("스페이서")을 포함함으로써 복합체에 표적 특이성을 제공할 수 있는 한편, 예비-복합체화된 CasX:gNA의 CasX 단백질은, 가이드 NA와의 이의 회합으로 인해 표적 핵산 서열(예를 들어, 변형될 B2M 또는 TRAC 유전자) 내의 표적 부위로 가이드되는(예를 들어, 표적 부위에서 안정화되는) 부위-특이적 활성을 제공한다. 복합체의 CasX 단백질은, CasX 단백질에 의한 표적 서열의 절단 또는 틈새 형성(nicking)과 같은 복합체의 부위-특이적 활성 및/또는 키메라 CasX 단백질의 경우 융합 파트너에 의해 제공되는 활성을 제공한다. 추가로, 본 개시내용은 CasX:gNA 시스템을 사용하여, 항원 가공, 제시, 인식 및/또는 반응에 관여하는 하나 이상의 단백질의 발현을 도입하거나 조절하기 위해 세포 집단의 표적 핵산 서열을 변형시키는 데 유용한 방법을 제공한다. 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질이 하향조절되거나 제거된 이러한 변형된 세포 집단은 면역치료법에 유용하다. 개시내용의 CasX:gNA 시스템은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질의 변형을 인코딩하는 핵산을 포함하는 하나 이상의 CasX 단백질, 하나 이상의 가이드 핵산(gNA), 및 선택적으로 하나 이상의 공여자 주형 핵산을 포함하며, 여기서 핵산은 유전자 기능을 넉다운/넉아웃시키기 위해 단백질 또는 이의 조절 요소를 인코딩하는 게놈 핵산 서열 와 비교하여 하나 이상의 뉴클레오타이드의 결실, 삽입, 또는 돌연변이를 포함한다. 일부 구현예에서, 공여자 폴리뉴클레오타이드는 변형될 세포 유전자의 표적 핵산 서열의 모두 또는 일부의 적어도 약 10, 적어도 약 50, 적어도 약 100, 또는 적어도 약 200, 또는 적어도 약 300, 또는 적어도 약 400, 또는 적어도 약 500, 또는 적어도 약 600, 또는 적어도 약 700, 또는 적어도 약 800, 또는 적어도 약 900, 또는 적어도 약 1000, 또는 적어도 약 10,000, 또는 적어도 15,000개 뉴클레오타이드를 포함한다. 다른 구현예에서, 공여자 폴리뉴클레오타이드는 변형될 세포 유전자의 적어도 약 10 내지 약 10,000개 뉴클레오타이드, 또는 적어도 약 100 내지 약 8000개 뉴클레오타이드, 또는 적어도 약 400 내지 약 6000개 뉴클레오타이드, 또는 적어도 약 600 내지 약 4000개 뉴클레오타이드, 또는 적어도 약 1000 내지 약 2000개 뉴클레오타이드를 포함한다. 일부 구현예에서, 공여자 주형은 단일 가닥 DNA 주형 또는 단일 가닥 RNA 주형이다. 다른 구현예에서, 공여자 주형은 이중 가닥 DNA 주형이다.
다른 구현예에서, 본 개시내용은 질환 항원, 선택적으로 종양 세포 항원에 대해 결합 친화도를 갖는 키메라 항원 수용체(CAR)를 인코딩하는 폴리핵산을 제공하며, 이는 변형될 세포 내로 도입될 수 있고, 변형된 세포는 상기 변형된 세포에서 CAR을 발현할 수 있다. 다른 구현예에서, 본 개시내용은 질환 항원, 선택적으로 종양 세포 항원에 대해 결합 친화도를 갖는 조작된 T 세포 수용체(TCR)를 인코딩하는 폴리핵산을 제공하며, 이는 변형될 세포 내로 도입될 수 있고, 변형된 세포는 상기 변형된 세포에서 TCR을 발현할 수 있다.
CasX:gNA 시스템은 암, 자가면역 질환, 및 이식 거부를 포함한 소정의 질환 또는 병태를 갖는 대상체의 치료에서 유용성을 갖는다. CasX:gNA 시스템의 각각의 구성요소, 및 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질을 변형시키기 위해 세포 내 표적 핵산의 편집에서의 이들 구성요소 용도, 뿐만 아니라 CAR 및 조작된 TCR 하위단위 또는 하위단위들을 인코딩하는 폴리핵산의 용도가 본원에 기재된다. 본원에 기재된 CasX:gNA 시스템 및 폴리핵산은, 암, 자가면역 질환, 및 이식 거부와 같은 질환과 관련된 표적 세포를 효율적으로 사멸화시키는 변형된 세포 집단의 생성에서 유용성을 갖는다. 나아가, 변형된 세포 집단은 이러한 질환을 갖는 대상체에서 면역력을 부여하는 데 사용될 수 있다.
III. 유전자 편집을 위한 시스템의 가이드 핵산
또 다른 양태에서, 개시내용은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 유전자의 표적 가닥 내의 표적 핵산 서열에 상보적인 표적화 서열을 포함하는 가이드 핵산(gNA)에 관한 것으로서, 상기 gNA는 상보적인 비-표적 가닥에 TC 모티프를 포함하는 프로토스페이서 인접 모티프(PAM; protospacer adjacent motif) 서열에 특이적인 CRISPR 단백질과 복합체를 형성할 수 있고, 상기 PAM 서열은 표적 가닥의 표적 핵산 서열에 상보적인 비-표적 가닥 내 서열의 1개 뉴클레오타이드 5'에 위치한다.
일부 구현예에서, 본 개시내용은 진핵 세포의 게놈 편집에서 유용성을 갖는 CasX:gNA 시스템에 활용되는 가이드 핵산(gNA)에 관한 것이다. 본 개시내용은 특이적으로-설계된 가이드 핵산("gNA")을 제공하며, 여기서 표적화 서열(또는 아래에서 더 상세히 기재된 스페이서)은 유전자 편집 CasX:gNA 시스템의 구성요소로서 사용될 때, 표적 핵산 서열에 상보적이다(그리고 따라서 이와 혼성화할 수 있음). 일부 구현예에서, 다수의 gNA는 표적 핵산 서열의 변형을 위해 CasX:gNA 시스템에 의해 전달되는 것으로 여겨진다. 예를 들어, 단백질-인코딩 유전자의 넉다운/넉아웃이 요망될 때, gNA의 쌍은 유전자 내의 2개의 상이한 부위에 결합하고 절단하기 위해 사용될 수 있다.
본 개시내용은 유전자 편집 CasX:gNA 시스템의 구성요소로서 표적 핵산에 상보적인(그리고 따라서 이와 혼성화할 수 있는) 표적화 서열과 함께 특이적으로-설계된 가이드 핵산("gNA")을 제공한다. 아래에서 더 상세히 기재된 바와 같이, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포 유전자의 표적 핵산 서열에 대한 표적화 서열의 비제한적인 예는 표 3A, 3B, 및 3C에 제시된다(표 3A, 3B, 및 3C는 도 35 내지 도 37로서 제공됨). 일부 구현예에서, 다수의 gNA는 표적 핵산 서열(들)의 변형을 위해 CasX:gNA 시스템에 의해 전달되는 것으로 여겨진다. 예를 들어, 단백질-인코딩 유전자의 넉다운/넉아웃이 요망될 때, 표적 핵산 서열의 상이한 또는 중첩 영역에 대한 표적화 서열과 gNA의 쌍은, 유전자 내의 또는 이에 근접한 2개의 상이한 또는 중첩 부위에 결합하고 CasX가 절단하기 위해 사용될 수 있으며, 이는 그 후에 비-상동성 말단 접합(NHEJ; non-homologous end joining), 상동성-안내 수선(HDR(homology-directed repair), 이는 예를 들어, 인트론의 모두 또는 일부를 대체하기 위해 공여자 주형의 삽입을 포함할 수 있음), 상동성-독립적 표적화된 통합(HITI; homology-independent targeted integration), 마이크로-상동성 매개 말단 접합(MMEJ; micro-homology mediated end joining), 단일 가닥 어닐링(SSA; single strand annealing) 또는 염기 절제 수선(BER; base excision repair)에 의해 편집된다.
a. 기준 gNA 및 gNA 변이체
일부 구현예에서, 본 개시내용의 gNA는 천연-발생 gNA("기준 gNA")의 서열을 포함한다. 다른 경우, 본 개시내용의 기준 gNA는, 기준 gNA에 비해 증강된 또는 다양해진 특성을 갖는 하나 이상의 gNA 변이체를 생성하기 위해, 하나 이상의 돌연변이형성 방법, 예컨대 본원에 기재된 돌연변이형성 방법을 받을 수 있으며, 이러한 방법은 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 실수 유발 PCR, 카세트 돌연변이형성, 무작위 돌연변이형성, 엇갈린 연장 PCR, 유전자 셔플링, 또는 도메인 스와핑을 포함할 수 있다. gNA 변이체는 또한, 예를 들어 5' 또는 3' 단부에 융합되거나 내부적으로 삽입된 하나 이상의 외인성 서열을 포함하는 변이체를 포함한다. 기준 gNA의 활성은, gNA 변이체의 활성이 비교되는 벤치마크로서 사용되어, gNA 변이체의 기능 또는 다른 특징에서 향상을 측정할 수 있다. 다른 구현예에서, 기준 gNA는 gNA 변이체, 예를 들어 합리적으로 설계된 변이체를 생성하기 위해 하나 이상의 정교한 표적화된 돌연변이를 받을 수 있다. 본원에 사용된 바와 같이, 용어 gNA, gRNA, 및 gDNA는 천연-발생 분자, 뿐만 아니라 서열 변이체를 망라한다. 그러므로, 일부 구현예에서, gNA는 데옥시리보핵산 분자("gDNA")이며; 일부 구현예에서, gNA는 리보핵산 분자("gRNA")이고, 다른 구현예에서, gNA는 키메라이고, DNA와 RNA를 둘 다 포함한다.
gNA의 표적화 서열은, 코딩 서열, 코딩 서열의 보체, 비-코딩 서열을 포함한 표적 핵산 서열에, 그리고 조절 요소에 결합할 수 있다. gNA 스캐폴드(또는 "단백질-결합 서열")은 CasX 단백질과 상호작용하여(예를 들어, 이에 결합함), RNP를 형성한다(아래에 더 상세히 기재됨). 일부 구현예에서, 표적화 서열 및 스캐폴드는 각각 서로 혼성화하여 이중 가닥 듀플렉스(dgRNA에 대한 dsRNA 듀플렉스)를 형성하는 뉴클레오타이드의 상보적인 스트레치를 포함한다. CasX 단백질에 의한 표적 핵산 서열(예를 들어, 게놈 DNA)의 부위-특이적 결합 및/또는 절단은, gNA의 표적화 서열과 표적 핵산 서열 사이에서 염기쌍 형성 상보성에 의해 결정되는 하나 이상의 위치(예를 들어, 표적 핵산의 서열)에서 발생할 수 있다. 그러므로, 예를 들어, 개시내용의 gNA는, TC PAM 모티프 또는 PAM 서열, 예컨대 ATC, CTC, GTC, 또는 TTC에 상보적인 서열에 인접한 진핵 세포 내의 핵산, 예를 들어, 진핵 핵산(예를 들어, 진핵 염색체, 염색체 서열, 진핵 RNA 등)에서 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질 및/또는 이의 조절 서열에 상보적인 서열을 갖고 이에 혼성화할 수 있다.
핵산의 맥락에서, 절단은 DNA 또는 RNA인 핵산 분자의 공유 백본의 잘림(breakage)을 지칭한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하지만 이로 제한되지 않는 여러 가지 방법에 의해 개시될 수 있다. 단일-가닥 절단과 이중-가닥 절단 둘 다가 가능하고, 이중-가닥 절단은 2개의 별개의 단일-가닥 절단 사건의 결과로서 발생할 수 있다. DNA 절단은 평활 단부(blunt end) 또는 엇갈림 단부(staggered end)를 생성시킬 수 있다.
일부 구현예에서, 본 개시내용은, 유전자 편집에 사용되기 전에 함께 결합될 수 있고 따라서 리보핵 단백질 복합체(RNP)로서 "예비-복합체화"되는 본원에 기재된 임의의 구현예의 CasX 및 gNA의 유전자 편집쌍을 제공한다. 예비-복합체화된 RNP의 사용은 표적 핵산 서열의 편집을 위해 세포 또는 표적 핵산 서열로의 시스템 구성요소의 전달에서 이점을 부여한다. RNP의 CasX 단백질은, 표적 핵산 서열에 혼성화할 수 있는 표적 서열을 포함하는 가이드 RNA와의 이의 회합으로 인해 표적 핵산 서열 내의 표적 부위로 가이드되는(예를 들어, 표적 부위에서 안정화되는) 부위-특이적 활성을 제공한다.
일부 구현예에서, gNA가 gRNA인 경우, 용어 "표적자" 또는 "표적자 RNA"는 CasX 이중 가이드 RNA의(그리고 따라서, "활성자" 및 "표적자"가 예를 들어, 개입(intervening) 뉴클레오타이드에 의해 함께 연결될 때 CasX 단일 가이드 RNA의) crRNA-유사 분자(crRNA: "CRISPR RNA")를 지칭하기 위해 본원에 사용된다. 그러므로, 예를 들어, CasX 가이드 RNA(dgRNA 또는 sgRNA)는 가이드 서열 및 crRNA의 듀플렉스-형성 분절을 포함하며, 이는 또한 crRNA 반복부로 지칭될 수 있다. 가이드 서열의 서열이 표적 핵산 서열과 혼성화하기 때문에, PAM 서열의 위치가 고려되는 한, 표적자는 특정 표적 핵산 서열과 혼성화하기 위해 사용자에 의해 변형될 수 있다. 그러므로 일부 경우에, 표적자의 서열은 비-천연 발생 서열일 수 있다. 다른 경우에, 표적자의 서열은, 편집될 유전자로부터 유래되어 비-천연 발생 서열일 수 있다. 이중 가이드 RNA의 경우, 표적자 및 활성자는 각각 듀플렉스-형성 분절을 가지며, 여기서 표적자의 듀플렉스-형성 분절 및 활성자의 듀플렉스-형성 분절은 서로 상보성을 갖고 서로 혼성화하여, 이중 가닥 듀플렉스(gRNA에 대한 dsRNA 듀플렉스)를 형성한다. 일부 구현예에서, 표적자는, gRNA의 단백질-결합 분절의 dsRNA 듀플렉스의 1/2을 형성하는 뉴클레오타이드의 스트레치 및 가이드 RNA의 가이드 서열을 둘 다 포함한다. 상응하는 tracrRNA-유사 분자(활성자)는 또한, CasX 가이드 RNA의 단백질-결합 분절의 dsRNA 듀플렉스의 1/2을 형성하는 뉴클레오타이드의 듀플렉스-형성 스트레치를 포함한다. 그러므로, 상응하는 쌍으로서 표적자 및 활성자는 혼성화하여, 본원에서 "이중 가이드 NA", "이중-분자 gNA", "dgNA", "이중-분자 가이드 NA", 또는 "2-분자 가이드 NA"로 지칭되는 CasX 이중 가이드 NA를 형성한다.
일부 구현예에서, 기준 gNA의 활성자 및 표적자는 서로 공유 연결되고, 본원에서 "단일-분자 gNA," "1-분자 가이드 NA," "단일 가이드 NA", "단일 가이드 RNA", "단일-분자 가이드 RNA," "1-분자 가이드 RNA", "단일 가이드 DNA", "단일-분자 DNA," 또는 "1-분자 가이드 DNA"("sgNA", "sgRNA", 또는 "sgDNA")로 지칭되는 단일 분자를 포함한다. 일부 구현예에서, sgNA는 "활성자" 또는 "표적자"를 포함하고, 그러므로 각각 "활성자-RNA" 및 "표적자-RNA"일 수 있다.
종합하자면, 개시내용의 gNA는 4개의 별개의 영역, 또는 도메인을 포함한다: RNA 트리플렉스, 스캐폴드 스템, 연장된 스템, 및 개시내용의 구현예에서 표적 핵산에 특이적인 표적화 서열. RNA 트리플렉스, 스캐폴드 스템, 및 연장된 스템은 함께, gNA의 "스캐폴드"로서 지칭된다. 일부 구현예에서, 표적화 서열은 gNA의 3' 단부 상에 존재한다.
b. RNA 트리플렉스
본원에 제공된 가이드 NA(기준 sgNA 포함)의 일부 구현예에서, RNA-트리플렉스가 존재하며, RNA 트리플렉스는 2개의 개입 스템 루프(스캐폴드 스템 루프 및 연장된 스템 루프) 후에 AAAG로 종결되는 UUU--nX(~4-15)--UUU 스템 루프(SEQ ID NO: 19)의 서열을 포함하여, 트리플렉스를 지나 듀플렉스 유사매듭 내로 연장될 수 있는 유사매듭을 형성한다. 트리플렉스의 UU-UUU-AAA 서열은 스페이서, 스캐폴드 스템, 및 연장된 스템 사이에서 넥서스(nexus)로서 형성된다. 예시적인 기준 CasX sgNA에서, UUU-루프-UUU 영역이 먼저 코딩된 다음, 스캐폴드 스템 루프, 그 후에 연장된 스템 루프가 코딩되고, 이는 테트라루프에 의해 연결되며, 그 다음 AAAG가 트리플렉스를 폐쇄시켜 스페이서로 된다.
c. 스캐폴드 스템 루프
본 개시내용의 sgNA의 일부 구현예에서, 트리플렉스 영역에 뒤이어 스캐폴드 스템 루프가 존재한다. 스캐폴드 스템 루프는 CasX 단백질(예컨대 기준 또는 CasX 변이체 단백질)에 의해 결합되는 gNA의 영역이다. 일부 구현예에서, 스캐폴드 스템 루프는 꽤 짧고 안정한 스템 루프이다. 일부 경우, 스캐폴드 스템 루프는 많은 변화를 허용하지 않고, 일부 형태의 RNA 버블을 필요로 한다. 일부 구현예에서, 스캐폴드 스템은 CasX sgNA 기능에 필수적이다. 이는 아마도 중요한 스템 루프로서 Cas9의 넥서스 스템과 유사한 한편, 일부 구현예에서 CasX sgNA의 스캐폴드 스템은 CRISPR/Cas 시스템에서 발견되는 많은 다른 스템 루프와 상이한 필요한 벌지(RNA 버블)를 갖는다. 일부 구현예에서, 이러한 벌지(bulge)의 존재는 CasX 단백질과 상호작용하는 sgNA에 걸쳐 보존된다. gNA의 스캐폴드 스템 루프 서열의 예시적인 서열은 서열 CCAGCGACUAUGUCGUAUGG(SEQ ID NO: 20)를 포함한다. 다른 구현예에서, 개시내용은 스캐폴드 스템 루프가, 근위 5' 단부 및 3' 단부를 갖는 이종성 RNA 공급원으로부터의 RNA 스템 루프 서열, 예컨대 비제한적으로 MS2, Q β, U1 헤어핀 II, Uvsx, 또는 PP7 스템 루프로부터 선택되는 스템 루프 서열로 대체되는 gNA 변이체를 제공한다. 일부 경우, gNA의 이종성 RNA 스템 루프는 단백질, RNA 구조, DNA 서열, 또는 소분자에 결합할 수 있다.
d. 연장된 스템 루프
본 개시내용의 CasX sgNA의 일부 구현예에서, 스캐폴드 스템 루프에 뒤이어 연장된 스템 루프가 존재한다. 일부 구현예에서, 연장된 스템은, CasX 단백질에 의해 대체로 결합되지 않는 합성 tracr 및 crRNA 융합을 포함한다. 일부 구현예에서, 연장된 스템 루프는 고도로 가단성(malleable)일 수 있다. 일부 구현예에서, 단일 가이드 gRNA는 연장된 스템 루프에서 tracr과 crRNA 사이에서 GAAA 테트라루프 링커 또는 GAGAAA 링커와 함께 만들어진다. 일부 경우, CasX sgNA의 표적자 및 활성자는 개입 뉴클레오타이드에 의해 서로 연결되고, 링커는 3 내지 20개 뉴클레오타이드의 길이를 가질 수 있다. 개시내용의 CasX sgNA의 일부 구현예에서, 연장된 스템은 리보핵단백질 복합체에서 CasX 단백질의 외부에 놓인 큰 32-bp 루프이다. sgNA의 연장된 스템 루프 서열의 예시적인 서열은 서열 GCGCUUAUUUAUCGGAGAGAAAUCCGAUAAAUAAGAAGC(SEQ ID NO: 21)를 포함한다. 일부 구현예에서, 연장된 스템 루프는 GAGAAA 스페이서 서열을 포함한다. 일부 구현예에서, 개시내용은 연장된 스템 루프가, 근위(proximal) 5' 단부 및 3' 단부를 갖는 이종성 RNA 공급원으로부터의 RNA 스템 루프 서열, 예컨대 비제한적으로 MS2, Qβ, U1 헤어핀 II, Uvsx, 또는 PP7 스템 루프로부터 선택되는 스템 루프 서열로 대체되는 gNA 변이체를 제공한다. 이러한 경우, 이종성 RNA 스템 루프는 gNA의 안정성을 증가시킨다. 다른 구현예에서, 개시내용은 적어도 10, 적어도 100, 적어도 500, 적어도 1000, 또는 적어도 10,000개의 뉴클레오타이드를 포함하는 연장된 스템 루프 영역을 갖는 gNA 변이체를 제공한다.
e. 표적화 서열
본 개시내용의 gNA의 일부 구현예에서, 연장된 스템 루프에 뒤이어, 트리플렉스의 파트를 형성하는 영역, 그 다음에 표적화 서열(또는 "스페이서")이 존재한다. 표적화 서열은, CasX 리보핵단백질 완전 복합체를 변형될 유전자의 표적 핵산 서열의 특정 영역으로 표적화하도록 설계될 수 있다. 그러므로, 예를 들어, 개시내용의 gNA 표적화 서열은, PAM 서열 TTC, ATC, GTC, 또는 CTC 중 임의의 하나가 표적 서열에 상보적인 비-표적 가닥 서열에 대해 1개 뉴클레오타이드 5'에 위치할 때 RNP의 구성요소로서 진핵생물 세포 내의 핵산(예를 들어, 진핵생물 염색체, 염색체 서열, 진핵생물 RNA 등)에서 B2M 유전자의 일부에 상보적인 서열을 갖고 따라서 이와 혼성화할 수 있다. gNA의 표적화 서열은 변형될 수 있어서, PAM 서열 위치가 고려되는 한, gNA는 임의의 요망되는 표적 핵산 서열의 요망되는 서열을 표적화할 수 있다. 일부 구현예에서, gNA 스캐폴드는 표적화 서열의 5'이고, 이때 표적화 서열은 gNA의 3' 단부 상에 존재한다. 일부 구현예에서, RNP에 의해 인식되는 PAM 서열은 TC이다. 다른 구현예에서, RNP에 의해 인식되는 PAM 서열은 NTC이다.
일부 구현예에서, gNA의 표적화 서열은, 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβ 수용체 2(TGFβRII), 프로그래밍된 세포 사멸 1(PD-1), 사이토카인 유도성 SH2(CISH), 림프구 활성화 3(LAG-3), Ig 및 ITIM 도메인을 갖는 T 세포 면역수용체(TIGIT), 아데노신 A2a 수용체(ADORA2A), 살해 세포 렉틴 유사 수용체 C1(NKG2A), 세포독성 T-림프구-관련 단백질 4(CTLA-4), T-세포 면역글로불린 및 뮤신 도메인 3(TIM-3), 및 2B4(CD244)를 포함하지만 이들로 제한되지 않는, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 유전자의 일부에 특이적이고 이와 혼성화할 수 있다. 하나의 특정 구현예에서, 유전자는 B2M이다. B2M 유전자는 거의 모든 유핵(nucleated) 세포의 표면 상의 주 조직적합성 복합체(MHC) 클래스 I 중쇄와 회합되어 발견되는 혈청 단백질을 인코딩한다. 또 다른 특정 구현예에서, 유전자는 TRAC이다. TRAC 유전자는 T 세포 알파 수용체의 70개 가변 영역 중 하나에 연결된 C-말단 불변 영역을 인코딩한다. 베타 사슬의 유사한 합성 후, 알파 사슬 및 베타 사슬은 쌍을 형성하여 알파-베타 T-세포 수용체 헤테로이량체를 산출한다. 또 다른 특정 구현예에서, 유전자는 CITTA이다. CIITA 유전자는 주 조직적합성 복합체(MHC) 클래스 II의 유전자의 활성(전사)의 제어를 주로 돕는 단백질을 제조하기 위한 명령을 제공한다. 전술한 내용에서, 게놈 표적은, 단백질(예를 들어, 세포 마커 또는 세포내 단백질)이 세포에서 발현되지 않거나 더 낮은 수준으로 발현되도록 표적의 인코딩 유전자가 넉아웃 또는 넉다운되는 것을 의도하는 것이다. 일부 구현예에서, gNA의 표적화 서열은 유전자의 엑손에 특이적이다. 다른 구현예에서, gNA의 표적화 서열은 유전자의 인트론에 특이적이다. 다른 구현예에서, gNA의 표적화 서열은 유전자의 조절 요소에 특이적이다. 다른 구현예에서, gNA의 표적화 서열은 유전자의 엑손, 인트론, 및/또는 조절 요소의 연접부(junction)에 특이적이다. 다른 구현예에서, gNA의 표적화 서열은 유전자간(intergenic) 영역에 특이적이다. 표적화 서열이 조절 요소에 특이적인 경우에서, 이러한 조절 요소는 프로모터 영역, 인핸서 영역, 유전자간 영역, 5' 비번역된 영역(5' UTR), 3' 비번역된 영역(3' UTR), 보존된 요소, 및 cis-조절 요소를 포함하는 영역을 포함하지만 이들로 제한되지는 않는다. 프로모터 영역은, 인코딩 서열의 개시점의 5 kb 내의 뉴클레오타이드를 포괄하고자 하거나, 유전자 인핸서 요소 또는 보존된 요소의 경우, 표적 핵산의 유전자의 인코딩 서열로부터 수천 bp, 수십만 bp, 또는 심지어 수백만 bp 떨어져 있을 수 있다. 전술한 내용에서, 표적은, 표적화되는 단백질이 세포에서 발현되지 않거나 더 낮은 수준으로 발현되도록 표적의 인코딩 유전자가 넉아웃 또는 넉다운되는 것을 의도하는 것이다.
일부 구현예에서, gNA의 표적화 서열은 14 내지 35개의 연속적 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 14, 15, 16, 18, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 연속적 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 20개의 연속적 뉴클레오타이드로 구성된다. 일부 구현예에서, 표적화 서열은 19개의 연속적 뉴클레오타이드로 구성된다. 일부 구현예에서, 표적화 서열은 18개의 연속적 뉴클레오타이드로 구성된다. 일부 구현예에서, 표적화 서열은 17개의 연속적 뉴클레오타이드로 구성된다. 일부 구현예에서, 표적화 서열은 16개의 연속적 뉴클레오타이드로 구성된다. 일부 구현예에서, 표적화 서열은 15개의 연속적 뉴클레오타이드로 구성된다. 일부 구현예에서, 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 연속적 뉴클레오타이드를 갖고, 표적화 서열은, 표적화 서열을 포함하는 gNA를 포함하는 RNP가 표적 핵산에 관해 상보적인 결합을 형성할 수 있도록 표적 핵산 서열에 비해 0 내지 5, 0 내지 4, 0 내지 3, 또는 0 내지 2개의 미스매치를 포함하고 충분한 결합 특이성을 유지할 수 있다.
개시내용의 gNA에 포함시키기 위한 표적화 서열의 대표적이지만 비제한적인 예는 표 3A, 3B, 및 3C(도 35 내지 도 37 포함)에 제시되어, B2M, TRAC, 및 CIITA에 대한 표적화 서열을 각각 나타낸다.
B2M 유전자의 편집을 위해 CasX:gNA 시스템과 함께 활용되는 gNA 구현예의 예시적인 표적화 서열(스페이서 서열)은 표 3A(SEQ ID NO: 725-2100 및 2281-7085)에 제공된다. 일 구현예에서, B2M gNA의 표적화 서열은 표 3A에 제시된 서열로 이루어진 군으로부터 선택되는 서열과 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함한다. 또 다른 구현예에서, gNA의 표적화 서열은 표 3A에 제시된 서열로 이루어진 군으로부터 선택되는 서열로 구성된다. 전술한 구현예에서, 티미딘(T) 뉴클레오타이드는, gNA가 gDNA 또는 gRNA, 또는 RNA와 DNA의 키메라일 수 있도록 임의의 표적화 서열 내 하나 이상의 또는 모든 우라실(U) 뉴클레오타이드에 대해 치환될 수 있다. 일부 구현예에서, 표 3A의 표적화 서열은 티미딘 뉴클레오타이드에 대해 치환된 적어도 1, 2, 3, 4, 5, 또는 6개 이상의 티미딘 뉴클레오타이드를 갖는다. 다른 구현예에서, 개시내용의 gNA, gRNA, 또는 gDNA는 표 3A의 1, 2, 3개 이상의 표적화 서열, 또는 표 3A의 하나 이상의 서열과 적어도 50% 동일한, 적어도 55% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 95% 동일한 표적화 서열을 포함한다.
TRAC 유전자의 편집을 위해 CasX:gNA 시스템과 함께 활용되는 gNA 구현예의 예시적인 표적화 서열(스페이서 서열)은 표 3B에 제공된다. 일 구현예에서, TRAC gNA의 표적화 서열은 표 3B에 제시된 서열로 이루어진 군으로부터 선택되는 서열과 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함한다. 또 다른 구현예에서, gNA의 표적화 서열은 표 3B에 제시된 서열로 이루어진 군으로부터 선택되는 서열로 구성된다. 전술한 구현예에서, 티미딘(T) 뉴클레오타이드는, gNA가 gDNA 또는 gRNA, 또는 RNA와 DNA의 키메라일 수 있도록 임의의 표적화 서열 내 하나 이상의 또는 모든 우라실(U) 뉴클레오타이드에 대해 치환될 수 있다. 일부 구현예에서, 표 3B의 표적화 서열은 우라실 뉴클레오타이드에 대해 치환된 적어도 1, 2, 3, 4, 5, 또는 6개 이상의 티미딘 뉴클레오타이드를 갖는다. 다른 구현예에서, 개시내용의 gNA, gRNA, 또는 gDNA는 표 3B의 1, 2, 3개 이상의 표적화 서열, 또는 표 3B의 하나 이상의 서열과 적어도 50% 동일한, 적어도 55% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 95% 동일한 표적화 서열을 포함한다.
CIITA 유전자의 편집을 위해 CasX:gNA 시스템과 함께 활용되는 gNA 구현예의 예시적인 표적화 서열(스페이서 서열)은 표 3C에 제공된다. 일 구현예에서, TRAC gNA의 표적화 서열은 표 3C에 제시된 서열로 이루어진 군으로부터 선택되는 서열과 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함한다. 또 다른 구현예에서, gNA의 표적화 서열은 표 3C에 제시된 서열로 이루어진 군으로부터 선택되는 서열로 구성된다. 전술한 구현예에서, 티미딘(T) 뉴클레오타이드는, gNA가 gDNA 또는 gRNA, 또는 RNA와 DNA의 키메라일 수 있도록 임의의 표적화 서열 내 하나 이상의 또는 모든 우라실(U) 뉴클레오타이드에 대해 치환될 수 있다. 일부 구현예에서, 표 3C의 표적화 서열은 우라실 뉴클레오타이드에 대해 치환된 적어도 1, 2, 3, 4, 5, 또는 6개 이상의 티미딘 뉴클레오타이드를 갖는다. 다른 구현예에서, 개시내용의 gNA, gRNA, 또는 gDNA는 표 3C의 1, 2, 3개 이상의 표적화 서열, 또는 표 3C의 하나 이상의 서열과 적어도 50% 동일한, 적어도 55% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 95% 동일한 표적화 서열을 포함한다.
일부 구현예에서, CasX:gNA 시스템은 제1 gNA를 포함하고, 제2(및 선택적으로 제3, 제4, 제5 또는 그 이상)의 gNA를 추가로 포함하며, 제2 gNA 또는 추가 gNA는, 표적 핵산 내의 다수의 지점이 표적화되고 예를 들어 다수의 절단부가 CasX에 의해 표적 핵산에 도입되도록 제1 gNA의 표적화 서열과 비교하여 표적 핵산 서열의 상이한 부분 또는 중첩 부분에 상보적인 표적화 서열을 갖는다. 이러한 경우, 제2 또는 추가 gNA는 CasX 단백질의 추가 복사체와 복합체화되는 것으로 이해될 것이다. gNA의 표적화 서열의 선택에 의해, 표적 핵산 내의 특정 위치를 브래킷(bracket)하는 표적 핵산 서열의 정의된 영역은 공여자 주형의 삽입을 용이하게 하는 것을 포함하여 본원에 기재된 CasX:gNA 시스템을 사용하여 변형되거나 편집될 수 있다.
f. gNA 스캐폴드
일부 구현예에서, CasX 기준 gRNA는 델타프로테오박터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 서열은 CasX tracrRNA 서열이다. 예시적인 델타프로테오박터로부터 단리되거나 유래된 예시적인 CasX 기준 tracrRNA 서열은: ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(SEQ ID NO: 22) 및 ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(SEQ ID NO: 23)를 포함할 수 있다. 델타프로테오박터로부터 단리되거나 유래된 예시적인 crRNA 서열은 CCGAUAAGUAAAACGCAUCAAAG(SEQ ID NO: 24)의 서열을 포함할 수 있다. 일부 구현예에서, CasX 기준 gNA는 델타프로테오박터로부터 단리되거나 유래된 서열과 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 81% 동일한, 적어도 82% 동일한, 적어도 83% 동일한, 적어도 84% 동일한, 적어도 85% 동일한, 적어도 86% 동일한, 적어도 86% 동일한, 적어도 87% 동일한, 적어도 88% 동일한, 적어도 89% 동일한, 적어도 89% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 100% 동일한 서열을 포함한다.
일부 구현예에서, CasX 기준 가이드 RNA는 플랑크토마이세테스로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 서열은 CasX tracrRNA 서열이다. 플랑크토마이세테스(Planctomycetes)로부터 단리되거나 유래된 예시적인 CasX 기준 tracrRNA 서열은: UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(SEQ ID NO: 25) 및
UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(SEQ ID NO: 26)를 포함할 수 있다. 플랑크토마이세테스로부터 단리되거나 유래된 예시적인 crRNA 서열은 UCUCCGAUAAAUAAGAAGCAUCAAAG(SEQ ID NO: 27)의 서열을 포함할 수 있다. 일부 구현예에서, CasX 기준 gNA는 플랑크토마이세테스로부터 단리되거나 유래된 서열과 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 81% 동일한, 적어도 82% 동일한, 적어도 83% 동일한, 적어도 84% 동일한, 적어도 85% 동일한, 적어도 86% 동일한, 적어도 86% 동일한, 적어도 87% 동일한, 적어도 88% 동일한, 적어도 89% 동일한, 적어도 89% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 100% 동일한 서열을 포함한다.
일부 구현예에서, CasX 기준 gNA는 칸디다투스 숭박테리아(Candidatus Sungbacteria)로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 서열은 CasX tracrRNA 서열이다. 칸디다투스 숭박테리아(Candidatus Sungbacteria)로부터 단리되거나 유래된 예시적인 CasX 기준 tracrRNA 서열은: GUUUACACACUCCCUCUCAUAGGGU(SEQ ID NO: 28), GUUUACACACUCCCUCUCAUGAGGU(SEQ ID NO: 29), UUUUACAUACCCCCUCUCAUGGGAU(SEQ ID NO: 30) 및 GUUUACACACUCCCUCUCAUGGGGG(SEQ ID NO: 31)의 서열을 포함할 수 있다. 일부 구현예에서, CasX 기준 가이드 RNA는 칸디다투스 숭박테리아로부터 단리되거나 유래된 서열과 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 81% 동일한, 적어도 82% 동일한, 적어도 83% 동일한, 적어도 84% 동일한, 적어도 85% 동일한, 적어도 86% 동일한, 적어도 86% 동일한, 적어도 87% 동일한, 적어도 88% 동일한, 적어도 89% 동일한, 적어도 89% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 100% 동일한 서열을 포함한다.
표 1은 기준 gRNA tracr의 서열 및 스캐폴드 서열을 제공한다. 일부 구현예에서, 본 개시내용은 gNA 서열을 제공하며, 여기서 gNA는 표 1의 SEQ ID NO: 4-16 중 임의의 하나의 서열을 갖는 기준 gNA 서열에 비해 적어도 하나의 뉴클레오타이드 변형을 갖는 서열을 포함하는 스캐폴드를 갖는다. 이들 구현예에서, 벡터는 gNA에 대한 DNA 인코딩 서열을 포함하거나, gNA가 gDNA 또는 RNA와 DNA의 키메라인 경우, 티미딘(T) 염기가 본원에 기재된 임의의 gNA 서열 구현예의 우라실(U) 염기에 대해 치환될 수 있는 것으로 이해될 것이다.
Figure pct00001
g. gNA 변이체
또 다른 양태에서, 개시내용은 기준 gRNA 스캐폴드에 비해 하나 이상의 변형을 포함하는 가이드 핵산 변이체(본원에서 대안적으로 "gNA 변이체" 또는 "gRNA 변이체"로 지칭됨)에 관한 것이다. 본원에 사용된 바와 같이, "스캐폴드"는 스페이서 서열을 제외하고는 gNA 기능에 필요한 gNA에 대한 모든 파트를 지칭한다.
일부 구현예에서, gNA 변이체는 개시내용의 기준 gRNA 서열에 비해 하나 이상의 뉴클레오타이드 치환, 삽입, 결실, 또는 스와핑되거나 대체된 영역을 포함한다. 일부 구현예에서, 돌연변이는 기준 gRNA의 임의의 영역에서 발생하여, gNA 변이체를 생성할 수 있다. 일부 구현예에서, gNA 변이체 서열의 스캐폴드는 SEQ ID NO: 4 또는 SEQ ID NO: 5의 서열과 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 적어도 80%, 적어도 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는다.
일부 구현예에서, gNA 변이체는 기준 gRNA의 특징을 향상시키는 기준 gRNA의 하나 이상의 영역 내에 하나 이상의 뉴클레오타이드 변화를 포함한다. 예시적인 영역은 RNA 트리플렉스, 유사매듭, 스캐폴드 스템 루프, 및 연장된 스템 루프를 포함한다. 일부 경우, 변이체 스캐폴드 스템은 버블을 추가로 포함한다. 다른 경우, 변이체 스캐폴드는 트리플렉스 루프 영역을 추가로 포함한다. 더욱 다른 경우, 변이체 스캐폴드는 5' 비구조화된 영역을 추가로 포함한다. 일 구현예에서, gNA 변이체 스캐폴드는 SEQ ID NO: 14와 적어도 60% 서열 동일성을 갖는 스캐폴드 스템 루프를 포함한다. 또 다른 구현예에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(SEQ ID NO: 32)의 서열을 갖는 스캐폴드 스템 루프를 포함한다. 또 다른 구현예에서, 개시내용은 SEQ ID NO: 5에 비해, C18G 치환, G55 삽입, U1 결실, 및 원래의 6 nt 루프 및 13개의 가장-루프-근위부 염기쌍(총 32개의 뉴클레오타이드)이 Uvsx 헤어핀(4 nt 루프 및 5개의 루프-근위부 염기쌍; 총 14개의 뉴클레오타이드)에 의해 대체되고 연장된 스템의 루프-원위부 염기가 A99의 결실 및 G64U의 치환에 의해 새로운 Uvsx 헤어핀과 함께 인접한 완전 염기쌍 형성된 스템으로 전환되었던 변형된 연장된 스템 루프를 포함하는 gNA 스캐폴드를 제공한다. 전술한 구현예에서, gNA 스캐폴드는 서열 ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAGUGGGUAAAGCUCCCUCUUCGGAGGGAGCAUCAAAG(SEQ ID NO: 33)를 포함한다.
변이체 gNA가 본원에 기재된 기준 gRNA와 비교될 때 하나 이상의 향상된 기능 또는 특징을 갖거나 하나 이상의 새로운 기능을 부가하는 모든 gNA 변이체는 개시내용의 범위 내에 있는 것으로 여겨진다. 이러한 gNA 변이체의 대표적인 예는, 설계가 실시예에 기재되어 있는 가이드 174(SEQ ID NO: 2238)이다. 일부 구현예에서, gNA 변이체는, gNA 변이체를 포함하는 RNP에 새로운 기능을 부가한다. 일부 구현예에서, gNA 변이체는: 향상된 안정성; 향상된 용해도; gNA의 향상된 전사; 뉴클레아제 활성에 대한 향상된 내성; gNA의 증가된 접힘 속도(folding rate); 접힘 동안 저하된 부산물 형성; 증가된 생산적 접힘; CasX 단백질에의 향상된 결합 친화도; CasX 단백질과 복합체화될 때 표적 DNA에의 향상된 결합 친화도; CasX 단백질과 복합체화될 때 향상된 유전자 편집; CasX 단백질과 복합체화될 때 편집의 향상된 특이성; 및 CasX 단백질과 복합체화될 때 표적 DNA의 편집 시, ATC, CTC, GTC, 또는 TTC를 포함한 하나 이상의 PAM 서열의 더 큰 스펙트럼을 활용하는 향상된 능력, 또는 이들의 임의의 조합으로부터 선택되는 하나 이상의 향상된 특징을 갖는다. 일부 경우, gNA 변이체의 향상된 특징 중 하나 이상은 SEQ ID NO: 4 또는 SEQ ID NO: 5의 기준 gNA에 비해 적어도 약 1.1 내지 약 100,000배 향상된다. 다른 경우, gNA 변이체의 하나 이상의 향상된 특징은 SEQ ID NO: 4 또는 SEQ ID NO: 5의 기준 gNA에 비해, 적어도 약 1.1, 적어도 약 10, 적어도 약 100, 적어도 약 1000, 적어도 약 10,000, 적어도 약 100,000배 또는 그 이상 향상된다. 다른 경우, gNA 변이체의 하나 이상의 향상된 특징은 SEQ ID NO: 4 또는 SEQ ID NO: 5의 기준 gNA에 비해, 약 1.1 내지 100,00배, 약 1.1 내지 10,00배, 약 1.1 내지 1,000배, 약 1.1 내지 500배, 약 1.1 내지 100배, 약 1.1 내지 50배, 약 1.1 내지 20배, 약 10 내지 100,00배, 약 10 내지 10,00배, 약 10 내지 1,000배, 약 10 내지 500배, 약 10 내지 100배, 약 10 내지 50배, 약 10 내지 20배, 약 2 내지 70배, 약 2 내지 50배, 약 2 내지 30배, 약 2 내지 20배, 약 2 내지 10배, 약 5 내지 50배, 약 5 내지 30배, 약 5 내지 10배, 약 100 내지 100,00배, 약 100 내지 10,00배, 약 100 내지 1,000배, 약 100 내지 500배, 약 500 내지 100,00배, 약 500 내지 10,00배, 약 500 내지 1,000배, 약 500 내지 750배, 약 1,000 내지 100,00배, 약 10,000 내지 100,00배, 약 20 내지 500배, 약 20 내지 250배, 약 20 내지 200배, 약 20 내지 100배, 약 20 내지 50배, 약 50 내지 10,000배, 약 50 내지 1,000배, 약 50 내지 500배, 약 50 내지 200배, 또는 약 50 내지 100배 향상된다. 다른 경우, gNA 변이체의 하나 이상의 향상된 특징은 SEQ ID NO: 4 또는 SEQ ID NO: 5의 기준 gNA에 비해, 약 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 25배, 30배, 40배, 45배, 50배, 55배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 425배, 450배, 475배, 또는 500배 향상된다.
일부 구현예에서, gNA 변이체는, 개시내용의 gNA 변이체를 생성하기 위해, 기준 gRNA를 하나 이상의 돌연변이형성 방법, 예컨대 본원 아래에 기재된 돌연변이형성 방법을 받게 함으로써 생성될 수 있으며, 이러한 방법은 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 실수 유발 PCR, 카세트 돌연변이형성, 무작위 돌연변이형성, 엇갈린 연장 PCR, 유전자 셔플링, 또는 도메인 스와핑을 포함할 수 있다. 기준 gRNA의 활성은, gNA 변이체의 활성이 비교되는 벤치마크로서 사용되어, gNA 변이체의 기능에서 향상을 측정할 수 있다. 다른 구현예에서, 기준 gRNA는 gNA 변이체, 예를 들어 합리적으로-설계된 변이체를 생성하기 위해 하나 이상의 정교한 표적화된 돌연변이, 치환, 또는 도메인 스왑을 받을 수 있다. 이러한 방법에 의해 생성된 예시적인 gRNA 변이체는 실시예에 기재되어 있고, gNA 스캐폴드의 대표적인 서열은 표 2에 제시되어 있다.
일부 구현예에서, gNA 변이체는 기준 가이드 핵산 스캐폴드 서열과 비교하여 하나 이상의 변형을 포함하며, 여기서 하나 이상의 변형은: gNA 변이체의 영역에서 적어도 하나의 뉴클레오타이드 치환; gNA 변이체의 영역에서 적어도 하나의 뉴클레오타이드 결실; gNA 변이체의 영역에서 적어도 하나의 뉴클레오타이드 삽입; gNA 변이체의 영역의 전부 또는 일부의 치환; gNA 변이체의 영역의 전부 또는 일부의 결실; 또는 이들 중 임의의 조합으로부터 선택된다. 일부 경우, 변형은 하나 이상의 영역에서 gNA 변이체 내 1 내지 15개의 연속적 또는 비-연속적 뉴클레오타이드의 치환이다. 다른 경우, 변형은 하나 이상의 영역에서 gNA 변이체 내 1 내지 10개의 연속적 또는 비-연속적 뉴클레오타이드의 결실이다. 다른 경우, 변형은 하나 이상의 영역에서 gNA 변이체 내 1 내지 10개의 연속적 또는 비-연속적 뉴클레오타이드의 삽입이다. 다른 경우, 변형은 근위 5' 단부 및 3' 단부를 갖는 이종성 RNA 공급원으로부터의 RNA 스템 루프 서열로의, 스캐폴드 스템 루프 또는 연장된 스템 루프의 치환이다. 일부 경우, 개시내용의 gNA 변이체는 하나의 영역에 2개 이상의 영역에 변형을 포함한다. 다른 경우, 개시내용의 gNA 변이체는 2개 이상의 영역에 변형을 포함한다. 다른 경우, gNA 변이체는 이 단락에 기재된 전술한 변형의 임의의 조합을 포함한다.
일부 구현예에서, 5' G는 생체내에서의 발현을 위해 gNA 변이체 서열에 첨가되는데, +1 뉴클레오타이드가 G일 때 U6 프로모터로부터의 전사가 개시 부위에 관하여 더욱 효율적이고 더욱 일관되기 때문이다. 다른 구현예에서, 2개의 5' G는 생성 효율을 증가시키기 위해 시험관내 전사를 위해 gNA 변이체에 첨가되는데, T7 폴리머라제가 +1 위치에서 G를, 그리고 +2 위치에서 퓨린을 강하게 선호하기 때문이다. 일부 경우, 5' G 염기는 표 1의 기준 스캐폴드에 첨가된다. 다른 경우, 5' G 염기는 표 2의 변이체 스캐폴드에 첨가된다.
표 2는 예시적인 gNA 변이체 스캐폴드 서열을 제공한다. 표 2에서, (-)는 SEQ ID NO: 5의 기준 서열에 비해 명시된 위치(들)에서 결실을 나타내며, (+)는 SEQ ID NO: 5의 기준 서열에 비해 지시된 위치에서 명시된 염기(들)의 삽입을 나타내고, (:)는 SEQ ID NO: 5에 비해 결실 또는 치환의 명시된 개시:정지 좌표에서 염기의 범위를 나타내며, 다수의 삽입, 결실 또는 치환은 콤마에 의해 분리된다, 예를 들어, A14C, U17G. 일부 구현예에서, gNA 변이체 스캐폴드는 표 2에 나열된 서열 중 임의의 하나, SEQ ID NO: 2101-2280, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%의 서열 동일성을 갖는 서열을 포함한다. 이들 구현예에서, 벡터는 gNA에 대한 DNA 인코딩 서열을 포함하거나, gNA가 gDNA 또는 RNA와 DNA의 키메라인 경우, 티미딘(T) 염기가 본원에 기재된 임의의 gNA 서열 구현예의 우라실(U) 염기에 대해 치환될 수 있는 것으로 이해될 것이다.
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
일부 구현예에서, gNA 변이체는 서열 -UUU-N4-25-UUU-(SEQ ID NO: 34)를 포함하는 tracrRNA 스템 루프를 포함한다. 예를 들어, gNA 변이체는, 트리플렉스 영역에 기여하는 2개의 삼중(triplet) U 모티프에 의해 플랭킹된 스캐폴드 스템 루프 또는 이의 대체를 포함한다. 일부 구현예에서, 스캐폴드 스템 루프 또는 이의 대체는 적어도 4개 뉴클레오타이드, 적어도 5개 뉴클레오타이드, 적어도 6개 뉴클레오타이드, 적어도 7개 뉴클레오타이드, 적어도 7개 뉴클레오타이드, 적어도 8개 뉴클레오타이드, 적어도 9개 뉴클레오타이드, 적어도 10개 뉴클레오타이드, 적어도 11개 뉴클레오타이드, 적어도 12개 뉴클레오타이드, 적어도 13개 뉴클레오타이드, 적어도 14개 뉴클레오타이드, 적어도 15개 뉴클레오타이드, 적어도 16개 뉴클레오타이드, 적어도 17개 뉴클레오타이드, 적어도 18개 뉴클레오타이드, 적어도 19개 뉴클레오타이드, 적어도 20개 뉴클레오타이드, 적어도 21개 뉴클레오타이드, 적어도 22개 뉴클레오타이드, 적어도 23개 뉴클레오타이드, 적어도 24개 뉴클레오타이드, 또는 적어도 25개 뉴클레오타이드를 포함한다.
일부 구현예에서, gNA 변이체는 스페이서 영역에 대한 위치 5'에서 -AAAG-와 함께 crRNA 서열을 포함한다. 일부 구현예에서, -AAAG- 서열은 스페이서 영역의 바로 5'에 있다.
일부 구현예에서, gNA 변이체를 생성하기 위한 기준 gNA에 대한 적어도 하나의 뉴클레오타이드 변형은 기준 gRNA에 비해 CasX 변이체 gNA에서 적어도 하나의 뉴클레오타이드 결실을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gNA에 비해, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 연속적 또는 비-연속적 뉴클레오타이드의 결실을 포함한다. 일부 구현예에서, 적어도 하나의 결실은 기준 gNA에 비해, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 이상의 연속적 뉴클레오타이드의 결실을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gNA에 비해, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 이상의 뉴클레오타이드 결실을 포함하며, 결실은 연속적 뉴클레오타이드에 존재하지 않는다. 기준 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적 결실이 존재하는 이들 구현예에서, 본원에 기재된 바와 같이, 임의의 길이의 결실, 및 결실의 길이들의 임의의 조합은 개시내용의 범위 내에 있는 것으로 여겨진다. 예를 들어, 일부 구현예에서, gNA 변이체는 하나의 뉴클레오타이드의 제1 결실, 및 2개 뉴클레오타이드의 제2 결실을 포함할 수 있고, 2개의 결실은 연속적이지 않다. 일부 구현예에서, gNA 변이체는 기준 gRNA의 상이한 영역에 적어도 2개의 결실을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA의 동일한 영역에 적어도 2개의 결실을 포함한다. 예를 들어, 영역 은 연장된 스템 루프, 스캐폴드 스템 루프, 스캐폴드 스템 버블, 트리플렉스 루프, 유사매듭, 트리플렉스, 또는 gNA 변이체의 5' 단부일 수 있다. 기준 gRNA 내 임의의 뉴클레오타이드의 결실은 개시내용의 범위 내에 있는 것으로 간주된다.
일부 구현예에서, gNA 변이체를 생성하기 위한 기준 gRNA의 적어도 하나의 뉴클레오타이드 변형은 적어도 하나의 뉴클레오타이드 삽입을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA에 비해, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 연속적 또는 비-연속적 뉴클레오타이드의 삽입을 포함한다. 일부 구현예에서, 적어도 하나의 뉴클레오타이드 삽입은 기준 gRNA에 비해, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 이상의 연속적 뉴클레오타이드의 삽입을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA에 비해 2개 이상의 삽입을 포함하고, 삽입은 연속적이지 않다. 기준 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적 삽입이 존재하는 이들 구현예에서, 본원에 기재된 바와 같이, 임의의 길이의 삽입, 및 삽입의 길이들의 임의의 조합은 개시내용의 범위 내에 있는 것으로 여겨진다. 예를 들어, 일부 구현예에서, gNA 변이체는 하나의 뉴클레오타이드의 제1 삽입, 및 2개 뉴클레오타이드의 제2 삽입을 포함할 수 있고, 2개의 삽입은 연속적이지 않다. 일부 구현예에서, gNA 변이체는 기준 gRNA의 상이한 영역에 적어도 2개의 삽입을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA의 동일한 영역에 적어도 2개의 삽입을 포함한다. 예를 들어, 영역 은 연장된 스템 루프, 스캐폴드 스템 루프, 스캐폴드 스템 버블, 트리플렉스 루프, 유사매듭, 트리플렉스, 또는 gNA 변이체의 5' 단부일 수 있다. 기준 gRNA 내 임의의 위치에서 A, G, C, U(또는 상응하는 DNA에서 T)의 임의의 삽입 또는 이들의 조합은 개시내용의 범위 내에 있는 것으로 여겨진다.
일부 구현예에서, gNA 변이체를 생산하기 위한 기준 gRNA의 적어도 하나의 뉴클레오타이드 변형은 적어도 하나의 핵산 치환을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA에 비해, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 이상의 연속적 또는 비-연속적 치환된 뉴클레오타이드를 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA에 비해 1-4 뉴클레오타이드 치환을 포함한다. 일부 구현예에서, 적어도 하나의 치환은 기준 gRNA에 비해, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 이상의 연속적 뉴클레오타이드의 치환을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA에 비해 2개 이상의 치환을 포함하고, 치환은 연속적이지 않다. 기준 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적 치환이 존재하는 이들 구현예에서, 본원에 기재된 바와 같이, 임의의 길이의 치환된 뉴클레오타이드, 및 치환된 뉴클레오타이드의 길이들의 임의의 조합은 개시내용의 범위 내에 있는 것으로 여겨진다. 예를 들어, 일부 구현예에서, gNA 변이체는 하나의 뉴클레오타이드의 제1 치환, 및 2개 뉴클레오타이드의 제2 치환을 포함할 수 있고, 2개의 치환은 연속적이지 않다. 일부 구현예에서, gNA 변이체는 기준 gRNA의 상이한 영역에 적어도 2개의 치환을 포함한다. 일부 구현예에서, gNA 변이체는 기준 gRNA의 동일한 영역에 적어도 2개의 치환을 포함한다. 예를 들어, 영역 은 트리플렉스, 연장된 스템 루프, 스캐폴드 스템 루프, 스캐폴드 스템 버블, 트리플렉스 루프, 유사매듭, 트리플렉스, 또는 gNA 변이체의 5' 단부일 수 있다. 기준 gRNA 내 임의의 위치에서 A, G, C, U(또는 상응하는 DNA에서 T)의 임의의 치환 또는 이들의 조합은 개시내용의 범위 내에 있는 것으로 여겨진다.
본원에 기재된 임의의 치환, 삽입 및 결실은 개시내용의 gNA 변이체를 생성하기 위해 조합될 수 있다. 예를 들어, gNA 변이체는 기준 gRNA에 비해 적어도 하나의 치환 및 적어도 하나의 결실, 기준 gRNA에 비해 적어도 하나의 치환 및 적어도 하나의 삽입, 기준 gRNA에 비해 적어도 하나의 삽입 및 적어도 하나의 결실, 또는 기준 gRNA에 비해 적어도 하나의 치환, 하나의 삽입 및 하나의 결실을 포함할 수 있다.
일부 구현예에서, gNA 변이체는 SEQ ID NO: 4-16 중 임의의 하나와 적어도 20% 동일한, 적어도 30% 동일한, 적어도 40% 동일한, 적어도 50% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 또는 적어도 99% 동일한 스캐폴드 영역을 포함한다. 일부 구현예에서, gNA 변이체는 SEQ ID NO: 4-16 중 임의의 하나와 적어도 60% 상동성인(또는 동일한) 스캐폴드 영역을 포함한다.
일부 구현예에서, gNA 변이체는 SEQ ID NO: 14와 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 또는 적어도 99% 동일한 tracr 스템 루프를 포함한다. 일부 구현예에서, gNA 변이체는 SEQ ID NO: 14와 적어도 60% 상동성인(또는 동일한) tracr 스템 루프를 포함한다.
일부 구현예에서, gNA 변이체는 SEQ ID NO: 15와 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 또는 적어도 99% 동일한 연장된 스템 루프를 포함한다. 일부 구현예에서, gNA 변이체는 SEQ ID NO: 15와 적어도 60% 상동성인(또는 동일한) 연장된 스템 루프를 포함한다.
일부 구현예에서, gNA 변이체는 후속하는 바와 같이 기재된 기준 gNA로부터 이러한 차이를 갖는, 외인성 연장된 스템 루프를 포함한다. 일부 구현예에서, 외인성 연장된 스템 루프는 본원에 개시된 기준 스템 루프 영역(예를 들어, SEQ ID NO: 15)과 동일성을 거의 갖지 않거나 전혀 갖지 않는다. 일부 구현예에서, 외인성 스템 루프는 적어도 10 bp, 적어도 20 bp, 적어도 30 bp, 적어도 40 bp, 적어도 50 bp, 적어도 60 bp, 적어도 70 bp, 적어도 80 bp, 적어도 90 bp, 적어도 100 bp, 적어도 200 bp, 적어도 300 bp, 적어도 400 bp, 적어도 500 bp, 적어도 600 bp, 적어도 700 bp, 적어도 800 bp, 적어도 900 bp, 적어도 1,000 bp, 적어도 2,000 bp, 적어도 3,000 bp, 적어도 4,000 bp, 적어도 5,000 bp, 적어도 6,000 bp, 적어도 7,000 bp, 적어도 8,000 bp, 적어도 9,000 bp, 적어도 10,000 bp, 적어도 12,000 bp, 적어도 15,000 bp 또는 적어도 20,000 bp이다. 일부 구현예에서, gNA 변이체는 적어도 10, 적어도 100, 적어도 500, 적어도 1000, 또는 적어도 10,000개의 뉴클레오타이드를 포함하는 연장된 스템 루프 영역을 포함한다. 일부 구현예에서, 이종성 스템 루프는 gNA의 안정성을 증가시킨다. 일부 구현예에서, 이종성 RNA 스템 루프는 단백질, RNA 구조, DNA 서열, 또는 소분자에 결합할 수 있다. 일부 구현예에서, 외인성 스템 루프 영역은 RNA 스템 루프 또는 헤어핀, 예를 들어 열안정한 RNA, 예컨대 MS2 (ACAUGAGGAUUACCCAUGU(SEQ ID NO: 35)), Qβ (UGCAUGUCUAAGACAGCA(SEQ ID NO: 36)), U1 헤어핀 II (AAUCCAUUGCACUCCGGAUU(SEQ ID NO: 37)), Uvsx (CCUCUUCGGAGG(SEQ ID NO: 38)), PP7 (AGGAGUUUCUAUGGAAACCCU(SEQ ID NO: 39)), 파지 복제 루프 (AGGUGGGACGACCUCUCGGUCGUCCUAUCU(SEQ ID NO: 40)), 키싱 루프_a (UGCUCGCUCCGUUCGAGCA(SEQ ID NO: 41)), 키싱 루프_b1 (UGCUCGACGCGUCCUCGAGCA(SEQ ID NO: 42)), 키싱 루프_b2 (UGCUCGUUUGCGGCUACGAGCA(SEQ ID NO: 43)), G 쿼드리플렉스 M3q (AGGGAGGGAGGGAGAGG(SEQ ID NO: 44)), G 쿼드리플렉스 텔로미어 바스켓 (GGUUAGGGUUAGGGUUAGG(SEQ ID NO: 45)), 사르신-리신 루프 (CUGCUCAGUACGAGAGGAACCGCAG(SEQ ID NO: 46)) 또는 유사매듭 (UACACUGGGAUCGCUGAAUUAGAGAUCGGCGUCCUUUCAUUCUAUAUACUUUGGAGUUUUAAAAUGUCUCUAAGUACA(SEQ ID NO: 47))을 포함한다. 일부 구현예에서, 외인성 스템 루프는 RNA 스캐폴드를 포함한다. 본원에 사용된 바와 같이, "RNA 스캐폴드"는 하나 이상의 단백질과 상호작용하고 이를 구조화하거나 위치시킬 수 있는 다차원적 RNA 구조를 지칭한다. 일부 구현예에서, RNA 스캐폴드는 합성적이거나 비-천연 발생적이다. 일부 구현예에서, 외인성 스템 루프는 긴(long) 비-코딩 RNA(lncRNA)를 포함한다. 본원에 사용된 바와 같이, lncRNA는, 길이가 대략 200 bp보다 긴 비-코딩 RNA를 지칭한다. 일부 구현예에서, 외인성 스템 루프의 5' 및 3' 단부는 염기쌍 형성되며, 즉, 상호작용하여 듀플렉스 RNA의 영역을 형성한다. 일부 구현예에서, 외인성 스템 루프의 5' 및 3' 단부는 염기쌍 형성되고, 외인성 스템 루프의 5' 단부와 3' 단부 사이의 하나 이상의 영역은 염기쌍 형성되지 않는다. 일부 구현예에서, 적어도 하나의 뉴클레오타이드 변형은: (a) 하나 이상의 영역에서 gNA 변이체에 1 내지 15개의 연속적 또는 비-연속적 뉴클레오타이드의 치환; (b) 하나 이상의 영역에서 gNA 변이체에 1 내지 10개의 연속적 또는 비-연속적 뉴클레오타이드의 결실; (c) 하나 이상의 영역에서 gNA 변이체에 1 내지 10개의 연속적 또는 비-연속적 뉴클레오타이드의 삽입; (d) 근위 5' 단부 및 3' 단부를 갖는 이종성 RNA 공급원으로부터의 RNA 스템 루프 서열로의, 스캐폴드 스템 루프 또는 연장된 스템 루프의 치환; 또는 상기 a 내지 상기 d의 임의의 조합을 포함한다.
일부 구현예에서, gNA 변이체는 SEQ ID NO: 14와 적어도 60%의 동일성을 갖는 스캐폴드 스템 루프를 포함한다. 일부 구현예에서, gNA 변이체는 SEQ ID NO: 14와 적어도 60% 동일성, 적어도 70% 동일성, 적어도 80% 동일성, 적어도 90% 동일성, 적어도 95% 동일성, 적어도 98% 동일성 또는 적어도 99% 동일성을 갖는 스캐폴드 스템 루프를 포함한다. 일부 구현예에서, gNA 변이체는 SEQ ID NO: 14를 포함하는 스캐폴드 스템 루프를 포함한다.
일부 구현예에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(SEQ ID NO: 32)의 스캐폴드 스템 루프 서열을 포함한다. 일부 구현예에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(SEQ ID NO: 32)의 스캐폴드 스템 루프 서열을 이에 대한 적어도 1, 2, 3, 4, 또는 5개의 미스매치와 함께 포함한다.
일부 구현예에서, gNA 변이체는 32개 미만의 뉴클레오타이드, 31개 미만의 뉴클레오타이드, 30개 미만의 뉴클레오타이드, 29개 미만의 뉴클레오타이드, 28개 미만의 뉴클레오타이드, 27개 미만의 뉴클레오타이드, 26개 미만의 뉴클레오타이드, 25개 미만의 뉴클레오타이드, 24개 미만의 뉴클레오타이드, 23개 미만의 뉴클레오타이드, 22개 미만의 뉴클레오타이드, 21개 미만의 뉴클레오타이드, 또는 20개 미만의 뉴클레오타이드를 포함하는 연장된 스템 루프 영역을 포함한다. 일부 구현예에서, gNA 변이체는 32개 미만의 뉴클레오타이드를 포함하는 연장된 스템 루프 영역을 포함한다. 일부 구현예에서, gNA 변이체는 열안정한 스템 루프를 추가로 포함한다.
일부 구현예에서, sgRNA 변이체는 SEQ ID NO: 2104, SEQ ID NO: 2106, SEQ ID NO: 2163, SEQ ID NO: 2107, SEQ ID NO: 2164, SEQ ID NO: 2165, SEQ ID NO: 2166, SEQ ID NO: 2103, SEQ ID NO: 2167, SEQ ID NO: 2105, SEQ ID NO: 2108, SEQ ID NO: 2112, SEQ ID NO: 2160, SEQ ID NO: 2170, SEQ ID NO: 2114, SEQ ID NO: 2171, SEQ ID NO: 2112, SEQ ID NO: 2173, SEQ ID NO: 2102, SEQ ID NO: 2174, SEQ ID NO: 2175, SEQ ID NO: 2109, SEQ ID NO: 2176, SEQ ID NO: 2238, SEQ ID NO: 2239, SEQ ID NO: 2240, SEQ ID NO: 2241, SEQ ID NO: 2274, 또는 SEQ ID NO: 2275의 서열을 포함한다.
일부 구현예에서, gNA 변이체는 SEQ ID NO: 2236, 2237, 2238, 2241, 2244, 2248, 2249, 또는 2259-2280 중 임의의 하나의 서열, 또는 이와 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, gNA 변이체는 SEQ ID NO: 2201-2280 중 임의의 하나의 서열에 하나 이상의 추가 변화를 포함한다. 일부 구현예에서, gNA 변이체는 SEQ ID NO: 2236, 2237, 2238, 2241, 2244, 2248, 2249, 또는 2259-2280 중 임의의 하나의 서열을 포함한다.
일부 구현예에서, sgRNA 변이체는 SEQ ID NO: 2104, SEQ ID NO: 2163, SEQ ID NO: 2107, SEQ ID NO: 2164, SEQ ID NO: 2165, SEQ ID NO: 2166, SEQ ID NO: 2103, SEQ ID NO: 2167, SEQ ID NO: 2105, SEQ ID NO: 2108, SEQ ID NO: 2112, SEQ ID NO: 2160, SEQ ID NO: 2170, SEQ ID NO: 2114, SEQ ID NO: 2171, SEQ ID NO: 2112, SEQ ID NO: 2173, SEQ ID NO: 2102, SEQ ID NO: 2174, SEQ ID NO: 2175, SEQ ID NO: 2109, SEQ ID NO: 2176, SEQ ID NO: 2238, SEQ ID NO: 2239, SEQ ID NO: 2240, SEQ ID NO: 2241, SEQ ID NO: 2274, 또는 SEQ ID NO: 2275의 서열에 하나 이상의 추가 변화를 포함한다.
개시내용의 gNA 변이체의 일부 구현예에서, gNA 변이체는 적어도 하나의 변형을 포함하며, 여기서 SEQ ID NO: 5의 기준 가이드 스캐폴드와 비교하여 하나의 변형은: (a) 트리플렉스 루프에서의 C18G 치환; (b) 스템 버블에서의 G55 삽입; (c) U1 결실; (d) 연장된 스템 루프의 변형으로서, 여기서 (i) 6 nt 루프 및 13개의 루프-근위 염기쌍은 Uvsx 헤어핀에 의해 대체되고; (ii) 완전히 염기쌍 형성되는 루프-원위 염기를 발생시키는 A99의 결실 및 G65U의 치환 중 하나 이상으로부터 선택된다. 이러한 구현예에서, gNA 변이체는 SEQ ID NO: 2236, 2237, 2238, 2241, 2244, 2248, 2249, 또는 2259-2280 중 임의의 하나의 서열을 포함한다.
일부 구현예에서, gNA 변이체의 스캐폴드는 표 2의 SEQ ID NO: 2201-2280 중 임의의 하나의 서열을 포함한다. 일부 구현예에서, gNA의 스캐폴드는 SEQ ID NO: 2201-2280 중 임의의 하나의 서열로 구성되거나 이로 본질적으로 구성된다. 일부 구현예에서, gNA 변이체 서열의 스캐폴드는 SEQ ID NO: 2201 내지 2280 중 임의의 하나와 적어도 약 60% 동일한, 적어도 약 65% 동일한, 적어도 약 70% 동일한, 적어도 약 75% 동일한, 적어도 약 80% 동일한, 적어도 약 85% 동일한, 적어도 약 90% 동일한, 적어도 약 91% 동일한, 적어도 약 92% 동일한, 적어도 약 93% 동일한, 적어도 약 94% 동일한, 적어도 약 95% 동일한, 적어도 약 96% 동일한, 적어도 약 97% 동일한, 적어도 약 98% 동일한 또는 적어도 약 99% 동일하다.
gNA 변이체의 구현예에서, gNA는 적어도 14 내지 약 35개의 뉴클레오타이드를 포함하는 위에서 더욱 완전히 기재된 스페이서(또는 표적화 서열) 영역을 추가로 포함하며, 여기서 스페이서는 표적 DNA에 상보적인 서열과 함께 설계된다. 일부 구현예에서, gNA 변이체는 표적 DNA에 상보적인 적어도 10 내지 30개의 뉴클레오타이드의 표적화 서열을 포함한다. 일부 구현예에서, 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 뉴클레오타이드를 갖는다. 일부 구현예에서, gNA 변이체는 20개의 뉴클레오타이드를 갖는 표적화 서열을 포함한다. 일부 구현예에서, 표적화 서열은 25개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 24개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 23개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 22개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 21개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 20개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 19개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 18개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 17개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 16개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 15개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 표적화 서열은 14개의 뉴클레오타이드를 갖는다. 일부 구현예에서, 개시내용은 표 3A, 3B, 또는 3C의 서열과 적어도 50% 동일한, 적어도 55% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 95% 동일한, 또는 100% 동일한 서열을 포함하는 개시내용의 gNA 변이체에 포함되기 위한 표적화 서열을 제공한다. 일부 구현예에서, gNA 변이체의 표적화 서열은, 서열의 3' 단부로부터 단일 뉴클레오타이드가 제거된 표 3A, 3B, 또는 3C의 서열 서열을 포함한다. 다른 구현예에서, gNA 변이체의 표적화 서열은, 서열의 3' 단부로부터 2개의 뉴클레오타이드가 제거된 표 3A, 3B, 또는 3C의 서열 서열을 포함한다. 다른 구현예에서, gNA 변이체의 표적화 서열은, 서열의 3' 단부로부터 3개의 뉴클레오타이드가 제거된 표 3A, 3B, 또는 3C의 서열 서열을 포함한다. 다른 구현예에서, gNA 변이체의 표적화 서열은, 서열의 3' 단부로부터 4개의 뉴클레오타이드가 제거된 표 3A, 3B, 또는 3C의 서열 서열을 포함한다. 다른 구현예에서, gNA 변이체의 표적화 서열은, 서열의 3' 단부로부터 5개의 뉴클레오타이드가 제거된 표 3의 서열 서열을 포함한다.
표 3A. B2M에 대한 gNA 표적화 서열
표 3A는 도 35에 제공되고, 전체적으로 표 3A로 지칭된다.
표 3B. TRAC에 대한 gNA 표적화 서열
표 3B는 도 36에 제공되고, 전체적으로 표 3B로 지칭된다.
표 3C: CIITA에 대한 gNA 표적화 서열
표 3C는 도 37에 제공되고, 전체적으로 표 3C로 지칭된다.
표 3A, 3B 및 3C에서, 좌측 컬럼은 PAM 서열을 나타내고, 우측 컬럼은 상응하는 스페이서 서열(이따금 본원에서 표적화 서열로 지칭됨)의 SEQ ID NO를 나타낸다.
일부 구현예에서, gNA 변이체의 스캐폴드는 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3을 포함하는 기준 CasX 단백질과 함께 RNP의 파트이다. 다른 구현예에서, gNA 변이체의 스캐폴드는 표 4, 7, 8, 9, 또는 11의 서열 중 임의의 하나, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함하는 CasX 변이체 단백질과 함께 RNP의 파트이다. 상기 구현예에서, gNA는 스페이서 서열을 추가로 포함한다.
일부 구현예에서, gNA 변이체의 스캐폴드는 SEQ ID NO: 4 또는 SEQ ID NO: 5를 포함하는 기준 gRNA의 서열에 하나 이상의 추가 변화를 포함하는 변이체이다. 기준 gRNA의 스캐폴드가 SEQ ID NO: 4 또는 SEQ ID NO: 5로부터 유래되는 이들 구현예에서, gNA 변이체의 하나 이상의 향상된 또는 부가된 특징은 SEQ ID NO: 4 또는 SEQ ID NO: 5에서의 동일한 특징과 비교하여 향상된다.
h. CasX 단백질과의 복합체 형성
일부 구현예에서, gNA 변이체는 기준 gRNA와 비교할 때, CasX 단백질(예컨대 기준 CasX 또는 CasX 변이체 단백질)과 함께 복합체를 형성하는 향상된 능력을 갖는다. 일부 구현예에서, gNA 변이체는 기준 gRNA와 비교할 때, CasX 단백질(예컨대 기준 또는 변이체 단백질)에 대한 향상된 친화도를 가져서, 실시예에 기재된 바와 같이 CasX 단백질과 함께 리보핵단백질(RNP) 복합체를 형성하는 이의 능력을 향상시킨다. 리보핵단백질 복합체 형성을 향상시키는 것은 일부 구현예에서, 기능적 RNP가 조립되는 효율을 향상시킬 수 있다. 일부 구현예에서, 90% 초과, 93% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과 또는 99% 초과의, gNA 변이체 및 이의 스페이서를 포함하는 RNP는 표적 핵산의 유전자 편집에 적격이다.
CasX 단백질과 복합체를 형성하는 gNA 변이체의 능력을 향상시킬 수 있는 예시적인 뉴클레오타이드 변화는 일부 구현예에서, 스캐폴드 스템을 열안정한 스템 루프로 대체하는 것을 포함할 수 있다. 임의의 이론으로 결부시키고자 하는 것은 아니지만, 스캐폴드 스템을 열안정한 스템 루프로 대체하는 것은 CasX 단백질과 함께 gNA 변이체의 전반적인 결합 안정성을 증가시킬 수 있을 것이다. 대안적으로, 또는 게다가, 스템 루프의 큰 구획을 제거하는 것은 gNA 변이체 접힘 동역학을 변화시키고, 예를 들어, gNA 변이체가 그 자체에서 "얽혀지게(tangled)" 될 수 있는 정도를 약화시킴으로써, 기능적으로 접힌 gNA가 구조적으로-조립하는 것을 더 용이하고 더 신속하게 만들 수 있을 것이다. 일부 구현예에서, 스캐폴드 스템 루프 서열의 선택은 gNA에 활용되는 상이한 스페이서와 함께 변화될 수 있을 것이다. 일부 구현예에서, 스캐폴드 서열은 스페이서, 따라서 표적 서열에 맞춰질 수 있다. 실시예의 검정을 포함한 생화학적 검정은, RNP를 형성하는 gNA 변이체에 대한 CasX 단백질의 결합 친화도를 평가하는 데 사용될 수 있다. 예를 들어, 당업자는, 추가의 비표지된 "냉정한 경쟁자(cold competitor)" gNA의 농도를 증가시키는 데 대한 반응으로서, 고정된 CasX 단백질에 결합된 형광적으로 태깅된 gNA의 양의 변화를 측정할 수 있다. 대안적으로, 또는 게다가, 형광 신호는, 형광 표지된 gNA의 상이한 양이 고정된 CasX 단백질에 걸쳐 유동됨에 따라 이것이 어떻게 변하는지에 대해 모니터링되거나 알 수 있다. 대안적으로, RNP를 형성하는 능력은, 정의된 표적 핵산 서열에 대한 시험관내 절단 검정을 사용하여 평가될 수 있다.
i. gNA 안정성
일부 구현예에서, gNA 변이체는 기준 gRNA와 비교할 때, 향상된 안정성을 갖는다. 증가된 안정성 및 효율적인 접힘은 일부 구현예에서, gNA 변이체가 표적 세포 내부에서 지속되는 규모까지 증가할 수 있으며, 이는 유전자 편집과 같은 CasX 기능을 수행할 수 있는 기능적 RNP를 형성하는 기회를 증가시킬 수 있다. gNA 변이체의 증가된 안정성은 일부 구현예에서, 세포에 전달되는 더 적은 양의 gNA를 이용하여 유사한 성과를 가능하게 할 수 있으며, 이는 다시 유전자 편집 동안 표적-외 효과의 기회를 감소시킬 수 있다.
다른 구현예에서, 개시내용은, 스캐폴드 스템 루프 및/또는 연장된 스템 루프가 헤어핀 루프 또는 열안정한 RNA 스템 루프로 대체되는 gNA를 제공하며, 여기서 생성된 gNA는 증가된 안정성을 갖고, 루프의 선택에 따라, 소정의 세포성 단백질 또는 RNA와 상호작용할 수 있다. 일부 구현예에서, 대체 RNA 루프는 MS2, Qβ, U1 헤어핀 II, Uvsx, PP7, 파지 복제 루프, 키싱 루프_a, 키싱 루프_b1, 키싱 루프_b2, G 쿼드리플렉스 M3q, G 쿼드리플렉스 텔로미어 바스켓, 사르신-리신 루프 및 유사매듭으로부터 선택된다. 이러한 구성요소를 포함하는 gNA 변이체의 서열은 표 2B에 제공된다.
가이드 RNA 안정성은 예를 들어, 시험관내에서 가이드를 조립하고, 세포내 환경을 모방하는 용액 내에서 다양한 시간의 기간 동안 인큐베이션한 다음, 본원에 기재된 시험관내 절단 검정을 통해 기능적 활성을 측정하는 것을 포함한 여러 가지 방식으로 평가될 수 있다. 대안적으로, 또는 이에 더하여, gNA는, gNA 변이체가 기준 gRNA에 비해 얼마나 오래 지속되는지 결정하기 위해 gNA의 초기 형질주입/형질도입 후 다양한 시점에서 세포로부터 수합될 수 있다.
j. 용해도
일부 구현예에서, gNA 변이체는 기준 gRNA와 비교할 때, 향상된 용해도를 갖는다. 일부 구현예에서, gNA 변이체는 기준 gRNA와 비교할 때, CasX 단백질:gNA RNP의 향상된 용해도를 갖는다. 일부 구현예에서, CasX 단백질:gNA RNP의 용해도는 gNA 변이체의 5' 또는 3' 단부, 예를 들어 기준 sgRNA의 5' 또는 3'에 리보자임 서열을 첨가함으로써 향상된다. 일부 리보자임, 예컨대 M1 리보자임은 RNA 매개 단백질 접힘을 통해 단백질의 용해도를 증가시킬 수 있다.
본원에 기재된 바와 같이 gNA 변이체를 포함하는 CasX RNP의 증가된 용해도는 당업자에게 알려진 여러 가지 수단을 통해, 예컨대 CasX 및 gNA 변이체가 발현되는 용해된 이. 콜라이의 가용성 분획의 겔 상에서 밀도측정법 판독물을 얻음으로써 평가될 수 있다.
k. 뉴클레아제 활성에 대한 내성
일부 구현예에서, gNA 변이체는 기준 gRNA와 비교할 때, 뉴클레아제 활성에 대한 향상된 내성을 갖는다. 임의의 이론으로 결부시키고자 하는 것은 아니지만, 뉴클레아제, 예컨대 세포에서 발견되는 뉴클레아제에 대한 증가된 내성은 예를 들어, 세포내 환경에서 변이체 gNA의 지속성을 증가시켜, 유전자 편집을 향상시킬 수 있다.
많은 뉴클레아제는 가공성(processive)이며, 3'으로부터 5' 방식으로 RNA를 분해한다. 따라서, 일부 구현예에서, gNA의 하나의 말단 또는 양 말단에의 뉴클레아제 내성 2차 구조의 첨가, 또는 sgNA의 2차 구조를 변화시키는 뉴클레오타이드 변화는 뉴클레아제 활성에 증가된 내성을 갖는 gNA 변이체를 생성할 수 있다. 뉴클레아제 활성에 대한 내성은 당업자에게 알려진 여러 가지 방법을 통해 평가될 수 있다. 예를 들어, 뉴클레아제 활성에 대한 내성을 측정하는 시험관내 방법은 예를 들어, 기준 gNA 및 변이체를 하나 이상의 예시적인 RNA 뉴클레아제와 접촉시키고 분해를 측정하는 단계를 포함할 수 있다. 대안적으로, 또는 이에 더하여, 본원에 기재된 방법을 사용하여 세포성 환경에서 gNA 변이체의 지속성을 측정하는 것은, gNA 변이체가 뉴클레아제 내성인 정도를 나타낼 수 있다.
l. 표적 DNA에의 결합 친화도
일부 구현예에서, gNA 변이체는 기준 gRNA에 비해, 표적 DNA에 대한 향상된 친화도를 갖는다. 소정의 구현예에서, gNA 변이체를 포함하는 리보핵단백질 복합체는 기준 gRNA를 포함하는 RNP의 능력에 비해, 표적 DNA에 대한 향상된 친화도를 갖는다. 일부 구현예에서, 표적 DNA에 대한 RNP의 향상된 친화도는 표적 서열에 대한 향상된 친화도, PAM 서열에 대한 향상된 친화도, 표적 서열에 대한 DNA를 검색하는 RNP의 향상된 능력, 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 표적 DNA에 대한 향상된 친화도는 증가된 전반적인 DNA 결합 친화도의 결과이다.
CasX 단백질에서 OBD의 기능에 영향을 미치는 gNA 변이체에서의 뉴클레오타이드 변화는 프로토스페이서 인접 모티프(PAM)에 결합하는 CasX 변이체 단백질의 친화도, 뿐만 아니라 TTC, ATC, GTC, 및 CTC로 이루어진 군으로부터 선택되는 PAM 서열을 포함하여 SEQ ID NO: 2의 기준 CasX 단백질에 의해 인식되는 캐노니컬 TTC PAM 이외의 PAM 서열의 증가된 스펙트럼에 결합하거나 이를 활용하는 능력을 증가시켜, 기준 CasX와 비교하여 표적 DNA 서열에 대한 CasX 변이체 단백질의 친화도 및 다양성을 증가시켜, 편집되고/거나 결합될 수 있는 표적 핵산 서열을 실질적으로 증가시킬 수 있는 것이 가능하다. 아래에서 더 완전히 기재되는 바와 같이, 기준 CasX와 비교하여 편집될 수 있는 표적 핵산의 서열을 증가시키는 것은, PAM과 프로토스페이서 서열 둘 다, 및 비-표적 가닥의 배향에 따른 이들의 방향성을 지칭한다. 이는, 표적 가닥보다는 비-표적 가닥의 PAM 서열이 절단에 결정적이거나 표적 인식에 기계적으로 관여함을 내포하는 것은 아니다. 예를 들어, 기준이 TTC PAM일 때, 이는 사실상 표적 절단에 필요한 상보적인 GAA 서열일 수 있거나, 이는 양 말단으로부터의 뉴클레오타이드의 일부 조합일 수 있다. 본원에 개시된 CasX 단백질의 경우, PAM은, PAM을 프로토스페이서의 제1 뉴클레오타이드로부터 분리하는 적어도 단일 뉴클레오타이드와 함께 프로토스페이서의 5'에 위치한다. 대안적으로, 또는 이에 더하여, 표적 DNA 가닥에 대한 CasX 변이체 단백질의 친화도를 증가시키는 나선형 I 및/또는 나선형 II 도메인의 기능에 영향을 미치는 gNA에서의 변화는, 표적 DNA에 대한 변이체 gNA를 포함하는 CasX RNP의 친화도를 증가시킬 수 있다.
m. gNA 기능의 첨가 또는 변화
일부 구현예에서, gNA 변이체는, 기준 gRNA에 관하여 gNA 변이체의 토폴로지(topology)를 변화시키는 더 큰 구조적 변화를 포함할 수 있어서, 상이한 gNA 기능성을 가능하게 할 수 있다. 예를 들어, 일부 구현예에서, gNA 변이체는, 기준 gRNA 스캐폴드의 내인성 스템 루프를, 단백질 또는 RNA 결합 파트너와 상호작용하여 추가 모이어티를 CasX에 동원하거나 CasX를 특정 위치, 예컨대 바이러스 캡시드의 내부에 동원할 수 있는 이전에 식별된 안정한 RNA 구조 또는 스템 루프로 스와핑하였으며, 이는 상기 RNA 구조에 대한 결합 파트너를 갖는다. 다른 시나리오에서, RNA는 키싱 루프에서와 같이 서로 동원될 수 있어서, 2개의 CasX 단백질은 표적 DNA 서열에서 더 효과적인 유전자 편집을 위해 공동-위치될 수 있다. 이러한 RNA 구조는 MS2, Qβ, U1 헤어핀 II, Uvsx, PP7, 파지 복제 루프, 키싱 루프_a, 키싱 루프_b1, 키싱 루프_b2, G 쿼드리플렉스 M3q, G 쿼드리플렉스 텔로미어 바스켓, 사르신-리신 루프, 또는 유사매듭을 포함할 수 있다.
일부 구현예에서, gNA 변이체는 말단 융합 파트너를 포함한다. 예시적인 말단 융합은 자기-절단형 리보자임 또는 단백질 결합 모티프에의 gRNA의 융합을 포함할 수 있다. 본원에 사용된 바와 같이, "리보자임"은 단백질 효소와 유사한 하나 이상의 촉매적 활성을 갖는 RNA 또는 이의 분절을 지칭한다. 예시적인 리보자임 촉매적 활성은 예를 들어, RNA의 절단 및/또는 리게이션, DNA의 절단 및/또는 리게이션, 또는 펩타이드 결합 형성을 포함할 수 있다. 일부 구현예에서, 이러한 융합은 스캐폴드 접힘을 향상시키거나 DNA 수선 기구를 동원할 수 있을 것이다. 예를 들어, gRNA는 일부 구현예에서 간염 델타 바이러스(HDV) 항게놈 리보자임, HDV 게놈 리보자임, 해치트 리보자임(메타게놈 데이터로부터), env25 피스톨 리보자임 (알리스티페스 푸트레디니스(aliistipes putredinis)로부터의 대표적인 것), HH15 최소 해머헤드 리보자임, 담배 둥근무늬 바이러스(TRSV: tobacco ringspot virus) 리보자임, WT 바이러스 해머헤드 리보자임(및 합리적인 변이체), 또는 트위스티드 시스터 1 또는 RBMX 동원 모티프에 융합될 수 있다. 해머헤드 리보자임은, RNA 분자 내의 특정 부위에서 가역적인 절단 및 리게이션 반응을 촉매화하는 RNA 모티프이다. 해머헤드 리보자임은 유형 I, 유형 II 및 유형 III 해머헤드 리보자임을 포함한다. HDV, 피스톨, 및 해치트 리보자임은 자기-절단형 활성을 갖는다. 하나 이상의 리보자임을 포함하는 gNA 변이체는 gRNA 기준과 비교하여 확장된 gNA 기능을 가능하게 할 수 있다. 예를 들어, 자가-절단형 리보자임을 포함하는 gNA는 일부 구현예에서, 다시스트론성(polycistronic) 전사물의 파트로서 성숙 gNA로 전사 및 가공될 수 있다. 이러한 융합은 gNA의 5' 또는 3' 단부에서 발생할 수 있다. 일부 구현예에서, gNA 변이체는 5' 단부와 3' 단부 둘 다에서 융합을 포함하며, 여기서 각각의 융합은 독립적으로 본원에 기재된 바와 같다. 일부 구현예에서, gNA 변이체는 파지 복제 루프 또는 테트라루프를 포함한다. 일부 구현예에서, gNA는 단백질에 결합할 수 있는 헤어핀 루프를 포함한다. 예를 들어, 일부 구현예에서, 헤어핀 루프는 MS2, Qβ, U1 헤어핀 II, Uvsx, 또는 PP7 헤어핀 루프이다.
일부 구현예에서, gNA 변이체는 하나 이상의 RNA 앱타머를 포함한다. 본원에 사용된 바와 같이, "RNA 앱타머"는 표적에 높은 친화도 및 높은 특이성으로 결합하는 RNA 분자를 지칭한다.
일부 구현예에서, gNA 변이체는 하나 이상의 리보스위치(riboswitch)를 포함한다. 본원에 사용된 바와 같이, "리보스위치"는 소분자에 결합 시 상태를 변화시키는 RNA 분자를 지칭한다.
일부 구현예에서, gNA 변이체는 하나 이상의 단백질 결합 모티프를 추가로 포함한다. 단백질 결합 모티프를 개시내용의 기준 gRNA 또는 gNA 변이체에 첨가하는 것은 일부 구현예에서, CasX RNP가 추가 단백질과 회합되게 하며, 이는 예를 들어 이러한 단백질의 기능성을 CasX RNP에 추가할 수 있다.
n. 화학적으로 변형된 gNA
일부 구현예에서, 개시내용은 화학적으로-변형된 gNA에 관한 것이다. 일부 구현예에서, 본 개시내용은, 가이드 RNA 기능성을 갖고 뉴클레아제에 의한 절단에 대해 감소된 감수성(susceptibility)을 갖는 화학적으로-변형된 gNA를 제공한다. 4개의 캐노니컬 리보뉴클레오타이드 A, C, G, 및 U 이외의 임의의 뉴클레오타이드, 또는 데옥시뉴클레오타이드를 포함하는 gNA는 화학적으로 변형된 gNA이다. 일부 경우, 화학적으로-변형된 gNA는 천연 포스포디에스테르 뉴클레오타이드간 연결부 이외의 임의의 백본 또는 뉴클레오타이드간 연결부를 포함한다. 소정의 구현예에서, 유지된 기능성은 변형된 gNA가 본원에 기재된 임의의 구현예의 CasX에 결합하는 능력을 포함한다. 소정의 구현예에서, 유지된 기능성은 변형된 gNA가 표적 핵산 서열에 결합하는 능력을 포함한다. 소정의 구현예에서, 유지된 기능성은 CasX 단백질을 표적화하거나 예비-복합체화된 CasX 단백질-gNA가 표적 핵산 서열에 결합하는 능력을 포함한다. 소정의 구현예에서, 유지된 기능성은 CasX-gNA에 의해 표적 폴리뉴클레오타이드를 틈새 형성시키는 능력을 포함한다. 소정의 구현예에서, 유지된 기능성은 CasX-gNA에 의해 표적 핵산 서열을 절단하는 능력을 포함한다. 소정의 구현예에서, 유지된 기능성은 개시내용의 구현예의 CasX 단백질과 함께 CasX 시스템에서의 gNA의 임의의 다른 기지의 기능이다.
일부 구현예에서, 개시내용은 화학적으로-변형된 gNA를 제공하며, 여기서 뉴클레오타이드 당 변형은 2'-O―C1-4알킬, 예컨대 2'-O-메틸 (2'-OMe), 2'-데옥시 (2'-H), 2'-O―C1-3알킬-O―C1-3알킬, 예컨대 2'-메톡시에틸 ("2'-MOE"), 2'-플루오로 ("2'-F"), 2'-아미노 ("2'-NH2"), 2'-아라비노실 ("2'-아라비노") 뉴클레오타이드, 2'-F-아라비노실 ("2'-F-아라비노") 뉴클레오타이드, 2'-잠금(locked) 핵산 ("LNA") 뉴클레오타이드, 2'-비잠금(unlocked) 핵산 ("ULNA") 뉴클레오타이드, L 형태의 당("L-당"), 및 4'-티오리보실 뉴클레오타이드로 이루어진 군으로부터 선택되는 gNA 내로 혼입된다. 다른 구현예에서, 가이드 RNA 내에 혼입된 뉴클레오타이드간 연결부 변형은: 포스포로티오에이트 "P(S)" (P(S)), 포스포노카르복실레이트 (P(CH2)nCOOR), 예컨대 포스포노아세테이트 "PACE" (P(CH2COO)), 티오포스포노카르복실레이트 ((S)P(CH2)nCOOR), 예컨대 티오포스포노아세테이트 "티오PACE" ((S)P(CH2)nCOO)), 알킬포스포네이트 (P(C1-3알킬), 예컨대 메틸포스포네이트 -P(CH3), 보라노포스포네이트 (P(BH3)), 및 포스포로디티오에이트 (P(S)2)로 이루어진 군으로부터 선택된다.
소정의 구현예에서, 개시내용은 화학적으로-변형된 gNA를 제공하며, 여기서 핵염기("염기") 변형은: 2-티오우라실 ("2-티오U"), 2-티오시토신 ("2-티오C"), 4-티오우라실 ("4-티오U"), 6-티오구아닌 ("6-티오G"), 2-아미노아데닌 ("2-아미노A"), 2-아미노퓨린, 슈도우라실, 하이폭산틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신 ("5-메틸C"), 5-메틸우라실 ("5-메틸U"), 5-하이드록시메틸시토신, 5-하이드록시메틸우라실, 5,6-데하이드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실 ("5-알릴U"), 5-알릴시토신 ("5-알릴C"), 5-아미노알릴우라실 ("5-아미노알릴U"), 5-아미노알릴-시토신 ("5-아미노알릴C"), 무염기성(abasic) 뉴클레오타이드, Z 염기, P 염기, 비구조화된 핵산 ("UNA"), 이소구아닌 ("이소G"), 이소시토신 ("이소C"), 5-메틸-2-피리미딘, x(A,G,C,T) 및 y(A,G,C,T)로 이루어진 군으로부터 선택되는 gNA 내로 혼입된다.
다른 구현예에서, 개시내용은 화학적으로-변형된 gNA를 제공하며, 여기서 하나 이상의 동위원소 변형은 하나 이상의 15N, 13C, 14C, 중수소, 3H, 32P, 125I, 131I 원자 또는 트레이서(tracer)로서 사용되는 다른 원자 또는 원소를 포함하는 뉴클레오타이드를 포함하여, 뉴클레오타이드 당, 핵염기, 포스포디에스테르 연결부 및/또는 뉴클레오타이드 포스페이트 상에 도입된다.
일부 구현예에서, gNA 내로 혼입되는 "단부" 변형은: PEG (폴리에틸렌글리콜), 탄화수소 링커 (헤테로원자(O,S,N)-치환된 탄화수소 스페이서; 할로-치환된 탄화수소 스페이서; 케토-, 카르복실-, 아미도-, 티오닐-, 카르바모일-, 티오노카르바마오일-함유 탄화수소 스페이서), 스페르민(spermine) 링커, 링커에 부착된 형광 염료를 포함한 염료(예를 들어 플루오레세인, 로다민, 시아닌), 예를 들어 6-플루오레세인-헥실, 켄처(quencher)(예를 들어 dabcyl, BHQ) 및 다른 표지(예를 들어 비오틴, 디곡시게닌, 아크리딘, 스트렙타비딘, 아비딘, 펩타이드 및/또는 단백질)로 이루어진 군으로부터 선택된다. 일부 구현예에서, "단부" 변형은 데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드의 올리고뉴클레오타이드, 펩타이드, 단백질, 당, 올리고당, 스테로이드, 지질, 엽산, 비타민 및/또는 다른 분자를 포함하는 또 다른 분자에의 gNA의 접합(conjugation)(또는 리게이션)을 포함한다. 소정의 구현예에서, 개시내용은 화학적으로-변형된 gNA를 제공하며, 여기서 "단부" 변형(상기 기재됨)은 2-(4-부틸아미도플루오레세인)프로판-1,3-디올 비스(포스포디에스테르) 링커와 같은 링커를 통해 gNA 서열에 내부적으로 위치하고, 이는 포스포디에스테르 연결부로서 혼입되고 gNA 내의 2개의 뉴클레오타이드 사이의 임의의 곳에서 혼입될 수 있다.
일부 구현예에서, 개시내용은, 후속적으로 형광 염료, 비-형광 표지, 태그(14C에 대해, 예는 비오틴, 아비딘, 스트렙타비딘, 또는 동위원소 표지, 예컨대 15N, 13C, 중수소, 3H, 32P, 125I 등을 함유하는 모이어티), 올리고뉴클레오타이드(앱타머를 포함하여 데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드를 포함함), 아미노산, 펩타이드, 단백질, 당, 올리고당류, 스테로이드, 지질, 엽산, 및 비타민으로 이루어진 군으로부터 선택되는 요망되는 모이어티에 접합될 수 있는 말단 작용기, 예컨대 아민, 티올(또는 설피드릴), 하이드록실, 카르복실, 카르보닐, 티오닐, 티오카르보닐, 카르바모일, 티오카르바모일, 포스포릴, 알켄, 알킨, 할로겐 또는 작용기-말단화된(terminated) 링커를 포함하는 단부 변형을 갖는 화학적으로-변형된 gNA를 제공한다. 접합은 N-하이드록시숙신이미드, 이소티오시아네이트, DCC(또는 DCI)를 통한 커플링, 및/또는 문헌["Bioconjugate Techniques" by Greg T. Hermanson, Publisher Eslsevier Science, 3rd ed. (2013)]에 기재된 바와 같은 임의의 다른 표준 방법을 포함하지만 이들로 제한되지 않는, 당업계에 잘 알려진 표준 화학을 이용하며, 이의 내용은 그 전문이 참조로서 본원에 포함된다.
IV. 표적 핵산을 변형시키기 위한 단백질
본 개시내용은 진핵 세포의 게놈 편집에서 유용성을 갖는 CRISPR 뉴클레아제를 포함하는 시스템을 제공한다. 일부 구현예에서, CRISPR 뉴클레아제는 Cas9, Cas12a, Cas12b, Cas12c, Cas12d(CasY), CasX, Cas13a, Cas13b, Cas13c, Cas13d, CasX, CasY, Cas14, Cpfl, C2cl, Csn2, 및 Cas Phi로 이루어진 군으로부터 선택된다. 일부 구현예에서, CRISPR 뉴클레아제는 유형 V CRISPR 뉴클레아제이다. 일부 구현예에서, 본 개시내용은 진핵 세포에서 표적 핵산 서열을 변형시키기 위해 특이적으로 설계되는 CasX 단백질 및 하나 이상의 가이드 핵산(gNA)을 포함하는 시스템을 제공한다.
본원에 사용된 바와 같이, 용어 "CasX 단백질"은 단백질의 계열을 지칭하고, 모든 천연 발생 CasX 단백질, 천연 발생 CasX 단백질과 적어도 50% 동일성을 공유하는 단백질, 뿐만 아니라 천연-발생 기준 CasX 단백질에 비해 하나 이상의 향상된 특징을 소유하는 CasX 변이체를 포괄한다. CasX 단백질은 CRISPR-Cas 유형 V 단백질에 속한다. CasX 변이체 구현예의 예시적인 향상된 특징은, 아래에 더 완전히 기재되는 바와 같이, 변이체의 향상된 접힘, gNA에의 향상된 결합 친화도, 표적 핵산에의 향상된 결합 친화도, 표적 DNA의 편집 및/또는 결합에서 PAM 서열의 더 큰 스펙트럼을 활용하는 향상된 능력, 표적 DNA의 향상된 풀림, 증가된 활성, 향상된 편집 효율, 향상된 편집 특이성, 효율적으로 편집될 수 있는 진핵생물 게놈의 증가된 비율, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 틈새 형성에 대한 저하된 표적 가닥 로딩, 저하된 표적-외(off-target) 절단, DNA의 비-표적 가닥의 향상된 결합, 향상된 단백질 안정성, 향상된 단백질: gNA(RNP) 복합체 안정성, 향상된 단백질 용해도, 향상된 단백질: gNA(RNP) 복합체 용해도, 향상된 단백질 수율, 향상된 단백질 발현, 및 향상된 융합 특징을 포함하지만 이들로 제한되지는 않는다. 상기 구현예에서, CasX 변이체와 gNA 변이체의 RNP의 향상된 특징 중 하나 이상은 대등한 방식으로 검정될 때 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX 단백질과 표 1의 gNA의 RNP에 비해 적어도 약 1.1 내지 약 100,000배 향상된다. 다른 경우, CasX 변이체와 gNA 변이체의 RNP의 하나 이상의 향상된 특징은 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX 단백질과 표 1의 gNA의 RNP에 비해, 적어도 약 1.1, 적어도 약 10, 적어도 약 100, 적어도 약 1000, 적어도 약 10,000, 적어도 약 100,000배 또는 그 이상 향상된다. 다른 경우, CasX 변이체와 gNA 변이체의 RNP의 하나 이상의 향상된 특징은 대등한 방식으로 검정될 때, SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX 단백질과 표 1의 기준 gNA의 RNP에 비해, 약 1.1 내지 100,00배, 약 1.1 내지 10,00배, 약 1.1 내지 1,000배, 약 1.1 내지 500배, 약 1.1 내지 100배, 약 1.1 내지 50배, 약 1.1 내지 20배, 약 10 내지 100,00배, 약 10 내지 10,00배, 약 10 내지 1,000배, 약 10 내지 500배, 약 10 내지 100배, 약 10 내지 50배, 약 10 내지 20배, 약 2 내지 70배, 약 2 내지 50배, 약 2 내지 30배, 약 2 내지 20배, 약 2 내지 10배, 약 5 내지 50배, 약 5 내지 30배, 약 5 내지 10배, 약 100 내지 100,00배, 약 100 내지 10,00배, 약 100 내지 1,000배, 약 100 내지 500배, 약 500 내지 100,00배, 약 500 내지 10,00배, 약 500 내지 1,000배, 약 500 내지 750배, 약 1,000 내지 100,00배, 약 10,000 내지 100,00배, 약 20 내지 500배, 약 20 내지 250배, 약 20 내지 200배, 약 20 내지 100배, 약 20 내지 50배, 약 50 내지 10,000배, 약 50 내지 1,000배, 약 50 내지 500배, 약 50 내지 200배, 또는 약 50 내지 100배 향상된다. 다른 경우, CasX 변이체와 gNA 변이체의 RNP의 하나 이상의 향상된 특징은 대등한 방식으로 검정될 때, SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX 단백질과 표 1의 기준 gNA의 RNP에 비해, 약 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 25배, 30배, 40배, 45배, 50배, 55배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 425배, 450배, 475배, 또는 500배 향상된다.
용어 "CasX 변이체"는 융합 단백질인 변이체를 포함하며; 즉, CasX는 이종성 서열에 "융합된"다. 이는 CasX 변이체 서열을 포함하는 CasX 변이체 및 이의 이종성 단백질 또는 도메인에의 CasX의 N-말단, C-말단, 또는 내부 융합을 포함한다.
개시내용의 CasX 단백질은 하기 도메인: 비-표적 가닥 결합(NTSB) 도메인, 표적 가닥 로딩(TSL) 도메인, 나선형 I 도메인, 나선형 II 도메인, 올리고뉴클레오타이드 결합 도메인(OBD), 및 RuvC DNA 절단 도메인(이 중 마지막의 것은 촉매적 사멸 CasX 변이체에서 변형되거나 결실될 수 있음) 중 적어도 하나를 포함한다. 추가로, 개시내용의 CasX 변이체 단백질은 기준 CasX 단백질과 기준 gNA의 RNP와 비교하여, gNA와 RNP로서 복합체화될 때 TTC, ATC, GTC, 또는 CTC로부터 선택되는 PAM 서열을 활용하여 표적 DNA를 효율적으로 편집하고/하거나 이에 결합하는 증강된 능력을 갖는다. 일부 구현예에서, PAM 서열은 TC 모티프를 포함한다. 전술한 내용에서, PAM 서열은 대등한 검정 시스템에서의 기준 CasX 단백질 및 기준 gNA를 포함하는 RNP의 편집 효율 및/또는 결합과 비교하여, 검정 시스템에서의 gNA의 표적화 서열과 동일성을 갖는 프로토스페이서의 비-표적 가닥에 대해 1개 뉴클레오타이드 5'에 위치한다. 일 구현예에서, CasX 변이체와 gNA 변이체의 RNP는 표적 DNA 내 표적 서열의 편집 효율 및/또는 결합을, 대등한 검정 시스템에서의 기준 CasX 단백질과 기준 gNA를 포함하는 RNP와 비교하여 더 크게 나타내며, 여기서 표적 DNA의 PAM 서열은 TTC이다. 또 다른 구현예에서, CasX 변이체와 gNA 변이체의 RNP는 표적 DNA 내 표적 서열의 편집 효율 및/또는 결합을, 대등한 검정 시스템에서의 기준 CasX 단백질과 기준 gNA를 포함하는 RNP와 비교하여 더 크게 나타내며, 여기서 표적 DNA의 PAM 서열은 ATC이다. 또 다른 구현예에서, CasX 변이체와 gNA 변이체의 RNP는 표적 DNA 내 표적 서열의 편집 효율 및/또는 결합을, 대등한 검정 시스템에서의 기준 CasX 단백질과 기준 gNA를 포함하는 RNP와 비교하여 더 크게 나타내며, 여기서 표적 DNA의 PAM 서열은 CTC이다. 또 다른 구현예에서, CasX 변이체와 gNA 변이체의 RNP는 표적 DNA 내 표적 서열의 편집 효율 및/또는 결합을, 대등한 검정 시스템에서의 기준 CasX 단백질과 기준 gNA를 포함하는 RNP와 비교하여 더 크게 나타내며, 여기서 표적 DNA의 PAM 서열은 GTC이다. 전술한 구현예에서, 하나 이상의 PAM 서열에 대한 증가된 편집 효율 및/또는 결합 친화도는 PAM 서열에 대한 SEQ ID NO: 1-3의 CasX 단백질 중 임의의 하나와 표 1의 gNA의 RNP의 편집 효율 및/또는 결합 친화도와 비교하여 적어도 1.5배 더 크다.
일부 경우, CasX 단백질은 천연-발생 단백질(예를 들어, 원핵생물 세포에서 천연적으로 발생하거나 이로부터 단리됨)이다. 다른 구현예에서, CasX 단백질은 천연-발생 단백질이 아니다(예를 들어, CasX 단백질은 CasX 변이체 단백질, 키메라 단백질 등임). 천연-발생 CasX 단백질 (본원에서 "기준 CasX 단백질"로 지칭됨)은 표적화된 이중 가닥 DNA(dsDNA)에서 특정 서열에서 이중 가닥 절단을 촉매화하는 엔도뉴클레아제로서 작용한다. 서열 특이성은, 이것이 복합체화되는 회합된 gNA의 표적화 서열에 의해 제공되며, 이는 표적 핵산 내에서 표적 서열에 혼성화한다.
일부 구현예에서, CasX 단백질은 표적 핵산 및/또는 표적 핵산과 회합된 폴리펩타이드(예를 들어, 히스톤 테일의 메틸화 또는 아세틸화)에 결합하고/거나 이를 변형시킬 수 있다(예를 들어, 절단, 틈새 형성, 메틸화, 탈메틸화 등). 일부 구현예에서, CasX 단백질은 촉매적 사멸 (dCasX)이지만, 표적 핵산에 결합하는 능력을 유지한다. 예시적인 촉매적 사멸 CasX 단백질은 CasX 단백질의 RuvC 도메인의 활성 부위에 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 촉매적 사멸 CasX 단백질은 SEQ ID NO: 1의 잔기 672, 769 및/또는 935에서 치환을 포함한다. 일 구현예에서, 촉매적 사멸 CasX 단백질은 SEQ ID NO: 1의 기준 CasX 단백질에서 D672A, E769A 및/또는 D935A의 치환을 포함한다. 다른 구현예에서, 촉매적 사멸 CasX 단백질은 SEQ ID NO: 2의 기준 CasX 단백질에서 아미노산 659, 756 및/또는 922에서 치환을 포함한다. 일부 구현예에서, 촉매적 사멸 CasX 단백질은 SEQ ID NO: 2의 기준 CasX 단백질에서 D659A, E756A 및/또는 D922A 치환을 포함한다. 추가 구현예에서, 촉매적 사멸 CasX 단백질은 CasX 단백질의 RuvC 도메인의 모두 또는 파트에 결실을 포함한다. 동일한 상기 치환은 개시내용의 CasX 변이체 내로 유사하게 도입되어, dCasX 변이체를 생성할 수 있는 것으로 이해될 것이다. 일 구현예에서, RuvC 도메인의 전부 또는 일부는 CasX 변이체로부터 결실되어, dCasX 변이체를 생성한다. 촉매 활성이 없는 dCasX 변이체 단백질은 일부 구현예에서, 염기 편집 또는 유전자외적(epigenetic) 변형에 사용될 수 있다. DNA에 대한 더 높은 친화도와 함께, 일부 구현예에서, 촉매 활성이 없는 dCasX 변이체 단백질은 촉매적 활성 CasX에 비해, 이의 표적 핵산을 더 신속하게 찾거나, 표적 핵산에 더 오랫동안 결합된 채로 유지되거나, 표적 핵산에 더 안정한 방식으로 결합하거나, 이들의 조합을 수행하여, 절단 능력을 유지하는 CasX 변이체와 비교하여 촉매적 사멸 CasX 변이체 단백질의 이들 기능을 향상시킬 수 있다.
a. 비-표적 가닥 결합 도메인
개시내용의 기준 CasX 단백질은 비-표적 가닥 결합 도메인(NTSBD)을 포함한다. NTSBD는 임의의 Cas 단백질에서 이전에는 발견되지 않은 도메인이며; 예를 들어 이 도메인은 Cas 단백질, 예컨대 Cas9, Cas12a/Cpf1, Cas13, Cas14, CASCADE, CSM, 또는 CSY에 존재하지 않는다. 이론 또는 기전으로 결부시키고자 하는 것은 아니지만, CasX 내의 NTSBD는 비-표적 DNA 가닥에 결합하는 것을 가능하게 하며, 비-표적 가닥 및 표적 가닥의 풀림에 일조할 수 있다. NTSBD는 풀린 상태에서 비-표적 DNA 가닥의 풀림 또는 포착(capture)을 담당하는 것으로 추정된다. NTSBD는 현재까지 유래된 CryoEM 모델 구조에서 비-표적 가닥과 직접 접촉하고 있으며, 비-캐노니컬 아연 핑거 도메인을 함유할 수 있다. NTSBD는 또한, 풀림, 가이드 RNA 침범 및 R-루프 형성 동안 DNA를 안정화시키는 데 역할을 할 수 있다. 일부 구현예에서, 예시적인 NTSBD는 SEQ ID NO: 1의 아미노산 101-191 또는 SEQ ID NO: 2의 아미노산 103-192를 포함한다. 일부 구현예에서, 기준 CasX 단백질의 NTSBD는 4-가닥 베타 시트를 포함한다.
b. 표적 가닥 로딩 도메인
개시내용의 기준 CasX 단백질은 표적 가닥 로딩(TSL) 도메인을 포함한다. TSL 도메인은 소정의 Cas 단백질에서 발견되지 않는 도메인, 예컨대 Cas9, CASCADE, CSM, 또는 CSY이다. 이론 또는 기전으로 결부시키고자 하는 것은 아니지만, TSL 도메인은 CasX 단백질의 RuvC 활성 부위 내로의 표적 DNA 가닥의 로딩에 일조하는 데 담당하는 것으로 생각된다. 일부 구현예에서, TSL은, RuvC 활성 부위에서 표적 가닥 DNA 백본의 절단 가능한(scissile) 포스페이트를 배치하는 접힌 상태에서 표적-가닥을 배치하거나 포착하는 작용을 한다. TSL은 TSL의 대부분(bulk)에 의해 분리되는 cys4 (CXXC, CXXC 아연 핑거/리본 도메인(SEQ ID NO: 48))를 포함한다. 일부 구현예에서, 예시적인 TSL은 SEQ ID NO: 1의 아미노산 825-934 또는 SEQ ID NO: 2의 아미노산 813-921을 포함한다.
c. 나선형 I 도메인
개시내용의 기준 CasX 단백질은 나선형 I 도메인을 포함한다. CasX 이외의 소정의 Cas 단백질은 유사한 방식으로 명명될 수 있는 도메인을 갖는다. 그러나, 일부 구현예에서, CasX 단백질의 나선형 I 도메인은 하나 이상의 독특한 구조적 특질을 포함하거나, 비-CasX 단백질과 비교하여, 독특한 서열을 포함하거나, 이들의 조합을 포함한다. 예를 들어 일부 구현예에서, CasX 단백질의 나선형 I 도메인은, 유사한 명칭을 가질 수 있는 다른 Cas 단백질 내의 도메인과 비교하여, 하나 이상의 독특한 2차 구조를 포함한다. 예를 들어, 일부 구현예에서, CasX 단백질의 나선형 I 도메인은 다른 CRISPR 단백질과 비교하여 배열, 수 및 길이에서 독특한 구조 및 서열의 하나 이상의 알파 나선을 포함한다. 소정의 구현예에서, 나선형 I 도메인은 가이드 RNA의 스페이서 및 결합된 DNA와 상호작용하는 것을 담당한다. 이론으로 결부시키고자 하는 것은 아니지만, 일부 경우 나선형 I 도메인은 프로토스페이서 인접 모티프 (PAM)의 결합에 기여할 수 있는 것으로 생각된다. 일부 구현예에서, 예시적인 나선형 I 도메인은 SEQ ID NO: 1의 아미노산 57-100 및 192-332, 또는 SEQ ID NO: 2의 아미노산 59-102 및 193-333을 포함한다. 일부 구현예에서, 기준 CasX 단백질의 나선형 I 도메인은 하나 이상의 알파 나선을 포함한다.
d. 나선형 II 도메인
개시내용의 기준 CasX 단백질은 나선형 II 도메인을 포함한다. CasX 이외의 소정의 Cas 단백질은 유사한 방식으로 명명될 수 있는 도메인을 갖는다. 그러나, 일부 구현예에서, CasX 단백질의 나선형 II 도메인은, 유사한 명칭을 가질 수 있는 다른 Cas 단백질 내의 도메인과 비교하여, 하나 이상의 독특한 구조적 특질, 또는 독특한 서열, 또는 이들의 조합을 포함한다. 예를 들어, 일부 구현예에서, 나선형 II 도메인은 표적 DNA:가이드 RNA 채널을 따라 정렬되는 하나 이상의 독특한 구조적 알파 나선형 다발을 포함한다. 일부 구현예에서, 나선형 II 도메인을 포함하는 CasX에서, 표적 가닥 및 가이드 RNA는 나선형 II(및 나선형 I 도메인, 일부 구현예에서)와 상호작용하여, 표적 DNA에의 RuvC 도메인 접근을 가능하게 한다. 나선형 II 도메인은 가이드 RNA 스캐폴드 스템 루프뿐만 아니라 결합된 DNA에의 결합을 담당한다. 일부 구현예에서, 예시적인 나선형 II 도메인은 SEQ ID NO: 1의 아미노산 333-509 또는 SEQ ID NO: 2의 아미노산 334-501을 포함한다.
e. 올리고뉴클레오타이드 결합 도메인
개시내용의 기준 CasX 단백질은 올리고뉴클레오타이드 결합 도메인(OBD)을 포함한다. CasX 이외의 소정의 Cas 단백질은 유사한 방식으로 명명될 수 있는 도메인을 갖는다. 그러나, 일부 구현예에서, OBD는 하나 이상의 독특한 기능적 특질을 포함하거나, CasX 단백질에 독특한 서열을 포함하거나, 이들의 조합을 포함한다. 예를 들어, 일부 구현예에서 브릿지된 나선(BH), 나선형 I 도메인, 나선형 II 도메인, 및 올리고뉴클레오타이드 결합 도메인(OBD)은 함께, 가이드 RNA에의 CasX 단백질의 결합을 담당한다. 그러므로, 예를 들어, 일부 구현예에서, OBD는, 이것이 나선형 I 도메인, 또는 나선형 II 도메인, 또는 둘 다와 기능적으로 상호작용한다는 점에서 CasX 단백질에 독특하며, 이들은 각각 본원에 기재된 바와 같이 CasX 단백질에 독특할 수 있다. 구체적으로, CasX에서, OBD는 가이드 RNA 스캐폴드의 RNA 트리플렉스에 대체로 결합한다. OBD는 또한, 프로토스페이서 인접 모티프(PAM)에의 결합을 담당할 수 있다. 예시적인 OBD 도메인은 SEQ ID NO: 1의 아미노산 1-56 및 510-660, 또는 SEQ ID NO: 2의 아미노산 1-58 및 502-647을 포함한다.
f. RuvC DNA 절단 도메인
개시내용의 기준 CasX 단백질은, 2개의 부분적(partial) RuvC 도메인(RuvC-I 및 RuvC-II)을 포함하는 RuvC 도메인을 포함한다. RuvC 도메인은 모든 유형 12 CRISPR 단백질의 조상형(ancestral) 도메인이다. RuvC 도메인은 트랜스포자제(transposase)와 같은 TNPB(트랜스포자제 B)로부터 기원한다. 다른 RuvC 도메인과 유사하게, CasX RuvC 도메인은, 마그네슘(Mg) 이온을 배위시키고 DNA를 절단하는 것을 담당하는 DED 촉매적 트리아드(triad)를 갖는다. 일부 구현예에서, RuvC는, DNA의 양 가닥을 절단하는 것을 담당하는 DED 모티프 활성 부위를 갖는다(하나씩, 대체로, 우선 표적화된 서열 내로의 11-14개 뉴클레오타이드(nt)에서 비-표적 가닥, 그 후에 표적 서열 후에 2-4개 뉴클레오타이드에서 표적 가닥). CasX에서 구체적으로, RuvC 도메인은, 이것이 CasX 기능에 중요한 가이드 RNA 스캐폴드 스템 루프를 결합하는 데에도 담당한다는 점에서 독특하다. 예시적인 RuvC 도메인은 SEQ ID NO: 1의 아미노산 661-824 및 935-986, 또는 SEQ ID NO: 2의 아미노산 648-812 및 922-978을 포함한다.
g. 기준 CasX 단백질
본 개시내용은 기준 CasX 단백질을 제공한다. 일부 구현예에서, 기준 CasX 단백질은 천연-발생 단백질이다. 예를 들어, 기준 CasX 단백질은 천연 발생 원핵생물, 예컨대 델타프로테오박테리아, 플랑크토마이세테스, 또는 칸디다투스 숭박테리아 종으로부터 단리될 수 있다. 기준 CasX 단백질(이따금 본원에서 기준 CasX 단백질로 지칭됨)은, 가이드 NA와 상호작용하여 리보핵단백질(RNP) 복합체를 형성할 수 있는 단백질의 CasX(이따금 Cas12e로 지칭됨)에 속하는 유형 II CRISPR/Cas 엔도뉴클레아제이다. 일부 구현예에서, 기준 CasX 단백질을 포함하는 RNP 복합체는 gNA의 표적화 서열(또는 스페이서)과 표적 핵산 내의 표적 서열 사이에서의 염기쌍 형성을 통해 표적 핵산 내의 특정 부위로 표적화될 수 있다. 일부 구현예에서, 기준 CasX 단백질을 포함하는 RNP는 표적 DNA를 절단할 수 있다. 일부 구현예에서, 기준 CasX 단백질을 포함하는 RNP는 표적 DNA를 틈새 형성할 수 있다. 일부 구현예에서, 기준 CasX 단백질을 포함하는 RNP는 표적 DNA를 편집할 수 있으며, 예를 들어 이들 구현예에서 기준 CasX 단백질은 DNA를 절단하거나 틈새 형성시키고, 뒤이어 비-상동성 말단 접합(NHEJ), 상동성-안내 수선(HDR), 상동성-독립적 표적화된 통합(HITI), 마이크로-상동성 매개 말단 접합(MMEJ), 단일 가닥 어닐링(SSA) 또는 염기 절제 수선(BER)을 수행할 수 있다. 일부 구현예에서, CasX 단백질을 포함하는 RNP는 상기에서 더 완전히 기재된, 촉매적 사멸(촉매 활성이 없거나 절단 활성을 실질적으로 갖지 않음) CasX 단백질(dCasX)이지만, 표적 DNA에 결합하는 능력을 유지한다.
일부 경우, 기준 CasX 단백질은 델타프로테오박테리아로부터 단리되거나 유래된다. 일부 구현예에서, CasX 단백질은 하기의 서열과 적어도 50% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 81% 동일한, 적어도 82% 동일한, 적어도 83% 동일한, 적어도 84% 동일한, 적어도 85% 동일한, 적어도 86% 동일한, 적어도 86% 동일한, 적어도 87% 동일한, 적어도 88% 동일한, 적어도 89% 동일한, 적어도 89% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 100% 동일한 서열을 포함한다:
1 MEKRINKIRK KLSADNATKP VSRSGPMKTL LVRVMTDDLK KRLEKRRKKP EVMPQVISNN
61 AANNLRMLLD DYTKMKEAIL QVYWQEFKDD HVGLMCKFAQ PASKKIDQNK LKPEMDEKGN
121 LTTAGFACSQ CGQPLFVYKL EQVSEKGKAY TNYFGRCNVA EHEKLILLAQ LKPEKDSDEA
181 VTYSLGKFGQ RALDFYSIHV TKESTHPVKP LAQIAGNRYA SGPVGKALSD ACMGTIASFL
241 SKYQDIIIEH QKVVKGNQKR LESLRELAGK ENLEYPSVTL PPQPHTKEGV DAYNEVIARV
301 RMWVNLNLWQ KLKLSRDDAK PLLRLKGFPS FPVVERRENE VDWWNTINEV KKLIDAKRDM
361 GRVFWSGVTA EKRNTILEGY NYLPNENDHK KREGSLENPK KPAKRQFGDL LLYLEKKYAG
421 DWGKVFDEAW ERIDKKIAGL TSHIEREEAR NAEDAQSKAV LTDWLRAKAS FVLERLKEMD
481 EKEFYACEIQ LQKWYGDLRG NPFAVEAENR VVDISGFSIG SDGHSIQYRN LLAWKYLENG
541 KREFYLLMNY GKKGRIRFTD GTDIKKSGKW QGLLYGGGKA KVIDLTFDPD DEQLIILPLA
601 FGTRQGREFI WNDLLSLETG LIKLANGRVI EKTIYNKKIG RDEPALFVAL TFERREVVDP
661 SNIKPVNLIG VDRGENIPAV IALTDPEGCP LPEFKDSSGG PTDILRIGEG YKEKQRAIQA
721 AKEVEQRRAG GYSRKFASKS RNLADDMVRN SARDLFYHAV THDAVLVFEN LSRGFGRQGK
781 RTFMTERQYT KMEDWLTAKL AYEGLTSKTY LSKTLAQYTS KTCSNCGFTI TTADYDGMLV
841 RLKKTSDGWA TTLNNKELKA EGQITYYNRY KRQTVEKELS AELDRLSEES GNNDISKWTK
901 GRRDEALFLL KKRFSHRPVQ EQFVCLDCGH EVHADEQAAL NIARSWLFLN SNSTEFKSYK
961 SGKQPFVGAW QAFYKRRLKE VWKPNA (SEQ ID NO: 1).
일부 경우, 기준 CasX 단백질은 플랑크토마이세테스로부터 단리되거나 유래된다. 일부 구현예에서, CasX 단백질은 하기의 서열과 적어도 50% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 81% 동일한, 적어도 82% 동일한, 적어도 83% 동일한, 적어도 84% 동일한, 적어도 85% 동일한, 적어도 86% 동일한, 적어도 86% 동일한, 적어도 87% 동일한, 적어도 88% 동일한, 적어도 89% 동일한, 적어도 89% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 100% 동일한 서열을 포함한다:
1 MQEIKRINKI RRRLVKDSNT KKAGKTGPMK TLLVRVMTPD LRERLENLRK KPENIPQPIS
61 NTSRANLNKL LTDYTEMKKA ILHVYWEEFQ KDPVGLMSRV AQPAPKNIDQ RKLIPVKDGN
121 ERLTSSGFAC SQCCQPLYVY KLEQVNDKGK PHTNYFGRCN VSEHERLILL SPHKPEANDE
181 LVTYSLGKFG QRALDFYSIH VTRESNHPVK PLEQIGGNSC ASGPVGKALS DACMGAVASF
241 LTKYQDIILE HQKVIKKNEK RLANLKDIAS ANGLAFPKIT LPPQPHTKEG IEAYNNVVAQ
301 IVIWVNLNLW QKLKIGRDEA KPLQRLKGFP SFPLVERQAN EVDWWDMVCN VKKLINEKKE
361 DGKVFWQNLA GYKRQEALLP YLSSEEDRKK GKKFARYQFG DLLLHLEKKH GEDWGKVYDE
421 AWERIDKKVE GLSKHIKLEE ERRSEDAQSK AALTDWLRAK ASFVIEGLKE ADKDEFCRCE
481 LKLQKWYGDL RGKPFAIEAE NSILDISGFS KQYNCAFIWQ KDGVKKLNLY LIINYFKGGK
541 LRFKKIKPEA FEANRFYTVI NKKSGEIVPM EVNFNFDDPN LIILPLAFGK RQGREFIWND
601 LLSLETGSLK LANGRVIEKT LYNRRTRQDE PALFVALTFE RREVLDSSNI KPMNLIGIDR
661 GENIPAVIAL TDPEGCPLSR FKDSLGNPTH ILRIGESYKE KQRTIQAAKE VEQRRAGGYS
721 RKYASKAKNL ADDMVRNTAR DLLYYAVTQD AMLIFENLSR GFGRQGKRTF MAERQYTRME
781 DWLTAKLAYE GLPSKTYLSK TLAQYTSKTC SNCGFTITSA DYDRVLEKLK KTATGWMTTI
841 NGKELKVEGQ ITYYNRYKRQ NVVKDLSVEL DRLSEESVNN DISSWTKGRS GEALSLLKKR
901 FSHRPVQEKF VCLNCGFETH ADEQAALNIA RSWLFLRSQE YKKYQTNKTT GNTDKRAFVE
961 TWQSFYRKKL KEVWKPAV (SEQ ID NO: 2).
일부 구현예에서, CasX 단백질은 SEQ ID NO: 2의 서열, 또는 이와 적어도 60%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 2의 서열, 또는 이와 적어도 80%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 2의 서열, 또는 이와 적어도 90%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 2의 서열, 또는 이와 적어도 95%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 2의 서열로 구성된다. 일부 구현예에서, CasX 단백질은, SEQ ID NO: 2의 서열에 비해, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40 또는 적어도 50개의 돌연변이를 갖는 서열을 포함하거나 이로 구성된다. 이들 돌연변이는 삽입, 결실, 아미노산 치환, 또는 이들의 임의의 조합일 수 있다.
일부 경우, 기준 CasX 단백질은 칸디다투스 숭박테리아로부터 단리되거나 유래된다. 일부 구현예에서, CasX 단백질은 하기의 서열과 적어도 50% 동일한, 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 81% 동일한, 적어도 82% 동일한, 적어도 83% 동일한, 적어도 84% 동일한, 적어도 85% 동일한, 적어도 86% 동일한, 적어도 86% 동일한, 적어도 87% 동일한, 적어도 88% 동일한, 적어도 89% 동일한, 적어도 89% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 100% 동일한 서열을 포함한다:
1 MDNANKPSTK SLVNTTRISD HFGVTPGQVT RVFSFGIIPT KRQYAIIERW FAAVEAARER
61 LYGMLYAHFQ ENPPAYLKEK FSYETFFKGR PVLNGLRDID PTIMTSAVFT ALRHKAEGAM
121 AAFHTNHRRL FEEARKKMRE YAECLKANEA LLRGAADIDW DKIVNALRTR LNTCLAPEYD
181 AVIADFGALC AFRALIAETN ALKGAYNHAL NQMLPALVKV DEPEEAEESP RLRFFNGRIN
241 DLPKFPVAER ETPPDTETII RQLEDMARVI PDTAEILGYI HRIRHKAARR KPGSAVPLPQ
301 RVALYCAIRM ERNPEEDPST VAGHFLGEID RVCEKRRQGL VRTPFDSQIR ARYMDIISFR
361 ATLAHPDRWT EIQFLRSNAA SRRVRAETIS APFEGFSWTS NRTNPAPQYG MALAKDANAP
421 ADAPELCICL SPSSAAFSVR EKGGDLIYMR PTGGRRGKDN PGKEITWVPG SFDEYPASGV
481 ALKLRLYFGR SQARRMLTNK TWGLLSDNPR VFAANAELVG KKRNPQDRWK LFFHMVISGP
541 PPVEYLDFSS DVRSRARTVI GINRGEVNPL AYAVVSVEDG QVLEEGLLGK KEYIDQLIET
601 RRRISEYQSR EQTPPRDLRQ RVRHLQDTVL GSARAKIHSL IAFWKGILAI ERLDDQFHGR
661 EQKIIPKKTY LANKTGFMNA LSFSGAVRVD KKGNPWGGMI EIYPGGISRT CTQCGTVWLA
721 RRPKNPGHRD AMVVIPDIVD DAAATGFDNV DCDAGTVDYG ELFTLSREWV RLTPRYSRVM
781 RGTLGDLERA IRQGDDRKSR QMLELALEPQ PQWGQFFCHR CGFNGQSDVL AATNLARRAI
841 SLIRRLPDTD TPPTP (SEQ ID NO: 3).
일부 구현예에서, CasX 단백질은 SEQ ID NO: 3의 서열, 또는 이와 적어도 60%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 3의 서열, 또는 이와 적어도 80%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 3의 서열, 또는 이와 적어도 90%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 3의 서열, 또는 이와 적어도 95%의 유사성을 포함한다. 일부 구현예에서, CasX 단백질은 SEQ ID NO: 3의 서열로 구성된다. 일부 구현예에서, CasX 단백질은, SEQ ID NO: 3의 서열에 비해, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40 또는 적어도 50개의 돌연변이를 갖는 서열을 포함하거나 이로 구성된다. 이들 돌연변이는 삽입, 결실, 아미노산 치환, 또는 이들의 임의의 조합일 수 있다.
h. CasX 변이체 단백질
본 개시내용은 기준 CasX 단백질의 변이체(본원에서 상호 교환적으로 "CasX 변이체" 또는 "CasX 변이체 단백질"로 지칭됨)를 제공하며, 여기서 CasX 변이체는, SEQ ID NOS:1-3의 서열을 포함하여 기준 CasX 단백질의 적어도 하나의 도메인에 적어도 하나의 변형을 포함한다. 일부 구현예에서, CasX 변이체는 기준 CasX 단백질과 비교하여 적어도 하나의 향상된 특징을 나타낸다. 본원에 기재된 기준 CasX와 비교될 때 CasX 변이체 단백질의 하나 이상의 기능 또는 특징을 향상시키는 모든 변이체는 개시내용의 범위 내에 있는 것으로 여겨진다. 일부 구현예에서, 변형은 기준 CasX의 하나 이상의 아미노산에서의 돌연변이이다. 다른 구현예에서, 변형은 상이한 CasX로부터의 하나 이상의 도메인으로의 기준 CasX의 하나 이상의 도메인의 치환이다. 일부 구현예에서, 삽입은 상이한 CasX 단백질로부터의 도메인 중 일부 또는 모두의 삽입을 포함한다. 돌연변이는 기준 CasX 단백질의 임의의 하나 이상의 도메인에서 발생할 수 있으며, 예를 들어, 하나 이상의 도메인 중 일부 또는 모두의 결실, 또는 기준 CasX 단백질의 임의의 도메인에서 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함할 수 있다. CasX 단백질의 도메인은 비-표적 가닥 결합(NTSB) 도메인, 표적 가닥 로딩(TSL) 도메인, 나선형 I 도메인, 나선형 II 도메인, 올리고뉴클레오타이드 결합 도메인(OBD), 및 RuvC DNA 절단 도메인을 포함한다. CasX 단백질의 향상된 특징을 유발하는 기준 CasX 단백질에서 아미노산 서열의 임의의 변화는 개시내용의 CasX 변이체 단백질인 것으로 여겨진다. 예를 들어, CasX 변이체는 기준 CasX 단백질 서열에 비해, 하나 이상의 아미노산 치환, 삽입, 결실, 또는 스와핑된 도메인, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 1-3의 서열을 포함하여 기준 CasX 단백질의 2개의 도메인 중 적어도 각각에서 적어도 하나의 변형을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질의 적어도 2개 도메인, 적어도 3개 도메인, 적어도 4개 도메인 또는 적어도 5개 도메인에 적어도 하나의 변형을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질의 적어도 하나의 도메인에 2개 이상의 변형을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질의 적어도 하나의 도메인에 적어도 2개의 변형, 기준 CasX 단백질의 적어도 하나의 도메인에 적어도 3개의 변형 또는 기준 CasX 단백질의 적어도 하나의 도메인에 적어도 4개의 변형을 포함한다. CasX 변이체가 기준 CasX 단백질과 비교하여 2개 이상의 변형을 포함하는 일부 구현예에서, 각각의 변형은 NTSBD, TSLD, 나선형 I 도메인, 나선형 II 도메인, OBD, 및 RuvC DNA 절단 도메인으로 이루어진 군으로부터 독립적으로 선택되는 도메인에서 이루어진다.
일부 구현예에서, CasX 변이체 단백질의 적어도 하나의 변형은 SEQ ID NO: 1-3의 서열을 포함하여 기준 CasX의 하나의 도메인 단백질의 적어도 일부의 결실을 포함한다. 일부 구현예에서, 결실은 NTSBD, TSLD, 나선형 I 도메인, 나선형 II 도메인, OBD, 또는 RuvC DNA 절단 도메인에 존재한다.
개시내용의 CasX 변이체 단백질을 생성하는 데 적합한 돌연변이형성 방법은 예를 들어, 심층 돌연변이 진화 (DME), 심층 돌연변이 스캐닝 (DMS), 실수 유발 PCR, 카세트 돌연변이형성, 무작위 돌연변이형성, 엇갈린 연장 PCR, 유전자 셔플링, 또는 도메인 스와핑을 포함할 수 있다. 일부 구현예에서, CasX 변이체는 예를 들어 기준 CasX에 하나 이상의 요망되는 돌연변이를 선택함으로써 설계된다. 소정의 구현예에서, 기준 CasX 단백질의 활성은, 하나 이상의 CasX 변이체의 활성이 비교되는 벤치마크로서 사용되어, CasX 변이체의 기능에서 향상을 측정할 수 있다. CasX 변이체의 예시적인 향상은, 아래에 더 완전히 기재되는 바와 같이, 변이체의 향상된 접힘, gNA에의 향상된 결합 친화도, 표적 DNA에의 향상된 결합 친화도, 하나 이상의 PAM 서열에의 변경된 결합 친화도, 표적 DNA의 향상된 풀림, 증가된 활성, 향상된 편집 효율, 향상된 편집 특이성, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 틈새 형성(nicking)에 대한 저하된 표적 가닥 로딩, 저하된 표적-외 절단, DNA의 비-표적 가닥의 향상된 결합, 향상된 단백질 안정성, 향상된 CasX: gNA 복합체 안정성, 향상된 단백질 용해도, 향상된 CasX: gNA 복합체 용해도, 향상된 단백질 수율, 향상된 단백질 발현, 및 향상된 융합 특징을 포함하지만 이들로 제한되지는 않는다.
본원에 기재된 CasX 변이체의 일부 구현예에서, 적어도 하나의 변형은: (a) SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX와 비교하여 CasX 변이체에서 1 내지 100개의 연속적 또는 비-연속적 아미노산의 치환; (b) 기준 CasX와 비교하여 CasX 변이체에서 1 내지 100개의 연속적 또는 비-연속적 아미노산의 결실; (c) 기준 CasX와 비교하여 CasX 변이체에서 1 내지 100개의 연속적 또는 비-연속적 아미노산의 삽입; 또는 (d) (a)-(c)의 임의의 조합을 포함한다. 일부 구현예에서, 적어도 하나의 변형은: (a) SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX와 비교하여 CasX 변이체에서 5 내지 10개의 연속적 또는 비-연속적 아미노산의 치환; (b) 기준 CasX와 비교하여 CasX 변이체에서 1 내지 5개의 연속적 또는 비-연속적 아미노산의 결실; (c) 기준 CasX와 비교하여 CasX 변이체에서 1 내지 5개의 연속적 또는 비-연속적 아미노산의 삽입; 또는 (d) (a)-(c)의 임의의 조합을 포함한다.
일부 구현예에서, CasX 변이체 단백질은, SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 서열에 비해, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40 또는 적어도 50개의 돌연변이를 갖는 서열을 포함하거나 이로 구성된다. 이들 돌연변이는 삽입, 결실, 아미노산 치환, 또는 이들의 임의의 조합일 수 있다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질의 적어도 하나의 도메인에 적어도 하나의 아미노산 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 적어도 약 1-4개 아미노산 치환, 1-10개 아미노산 치환, 1-20개 아미노산 치환, 1-30개 아미노산 치환, 1-40개 아미노산 치환, 1-50개 아미노산 치환, 1-60개 아미노산 치환, 1-70개 아미노산 치환, 1-80개 아미노산 치환, 1-90개 아미노산 치환, 1-100개 아미노산 치환, 2-10개 아미노산 치환, 2-20개 아미노산 치환, 2-30개 아미노산 치환, 3-10개 아미노산 치환, 3-20개 아미노산 치환, 3-30개 아미노산 치환, 4-10개 아미노산 치환, 4-20개 아미노산 치환, 3-300개 아미노산 치환, 5-10개 아미노산 치환, 5-20개 아미노산 치환, 5-30개 아미노산 치환, 10-50개 아미노산 치환, 또는 20-50개 아미노산 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 적어도 약 100개 아미노산 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 아미노산 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 단일 도메인에서 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 치환은 보존적 치환이다. 다른 구현예에서, 치환은 비-보존적이며; 예를 들어, 극성 아미노산은 비극성 아미노산에 대해 치환되거나, 그 반대이다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 1 아미노산 치환, 2-3 연속적 아미노산 치환, 2-4 연속적 아미노산 치환, 2-5 연속적 아미노산 치환, 2-6 연속적 아미노산 치환, 2-7 연속적 아미노산 치환, 2-8 연속적 아미노산 치환, 2-9 연속적 아미노산 치환, 2-10 연속적 아미노산 치환, 2-20 연속적 아미노산 치환, 2-30 연속적 아미노산 치환, 2-40 연속적 아미노산 치환, 2-50 연속적 아미노산 치환, 2-60 연속적 아미노산 치환, 2-70 연속적 아미노산 치환, 2-80 연속적 아미노산 치환, 2-90 연속적 아미노산 치환, 2-100 연속적 아미노산 치환, 3-10 연속적 아미노산 치환, 3-20 연속적 아미노산 치환, 3-30 연속적 아미노산 치환, 4-10 연속적 아미노산 치환, 4-20 연속적 아미노산 치환, 3-300 연속적 아미노산 치환, 5-10 연속적 아미노산 치환, 5-20 연속적 아미노산 치환, 5-30 연속적 아미노산 치환, 10-50 연속적 아미노산 치환 또는 20-50 연속적 아미노산 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속적 아미노산 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 적어도 약 100개 연속적 아미노산의 치환을 포함한다. 본원에 사용된 바와 같이 "연속적 아미노산"은 폴리펩타이드의 일차 서열에 인접해 있는 아미노산을 지칭한다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 2개 이상의 치환을 포함하고, 2개 이상의 치환은 기준 CasX 서열의 연속적 아미노산에 존재하지 않는다. 예를 들어, 제1 치환은 기준 CasX 단백질의 제1 도메인에 존재할 수 있고, 제2 치환은 기준 CasX 단백질의 제2 도메인에 존재할 수 있다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 비-연속적 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 적어도 약 20개의 비-연속적 치환을 포함한다. 각각의 비-연속적 치환은 본원에 기재된 임의의 길이의 아미노산, 예를 들어, 1-4개 아미노산, 1-10개 아미노산 등일 수 있다. 일부 구현예에서, 기준 CasX 단백질에 비해 2개 이상의 치환은 동일한 길이가 아니며, 예를 들어, 하나의 치환은 하나의 아미노산이고 제2 치환은 3개 아미노산이다. 일부 구현예에서, 기준 CasX 단백질에 비해 2개 이상의 치환은 동일한 길이이며, 예를 들어, 두 치환 모두는 길이가 2개의 연속적 아미노산이다.
임의의 아미노산은 본원에 기재된 치환에서 임의의 다른 아미노산에 대해 치환될 수 있다. 치환은 보존적 치환일 수 있다(예를 들어, 염기성 아미노산은 또 다른 염기성 아미노산으로 치환됨). 치환은 비-보존적 치환일 수 있다(예를 들어, 염기성 아미노산은 산성 아미노산으로 치환되거나 그 반대임). 예를 들어, 기준 CasX 단백질에서 프롤린은 아르기닌, 히스티딘, 리신, 아스파르트산, 글루탐산, 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 글리신, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신 또는 발린 중 임의의 것에 대해 치환되어, 개시내용의 CasX 변이체 단백질을 생성할 수 있다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 적어도 하나의 아미노산 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 1-4 아미노산, 1-10 아미노산, 1-20 아미노산, 1-30 아미노산, 1-40 아미노산, 1-50 아미노산, 1-60 아미노산, 1-70 아미노산, 1-80 아미노산, 1-90 아미노산, 1-100 아미노산, 2-10 아미노산, 2-20 아미노산, 2-30 아미노산, 3-10 아미노산, 3-20 아미노산, 3-30 아미노산, 4-10 아미노산, 4-20 아미노산, 3-300 아미노산, 5-10 아미노산, 5-20 아미노산, 5-30 아미노산, 10-50 아미노산 또는 20-50 아미노산의 결실을 포함한다. 일부 구현예에서, CasX 단백질은 기준 CasX 단백질에 비해, 적어도 약 100 연속적 아미노산의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 또는 100 연속적 아미노산의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 연속적 아미노산의 결실을 포함한다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 2개 이상의 결실을 포함하고, 2개 이상의 결실은 연속적 아미노산이 아니다. 예를 들어, 제1 결실은 기준 CasX 단백질의 제1 도메인에 존재할 수 있고, 제2 결실은 기준 CasX 단백질의 제2 도메인에 존재할 수 있다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 비-연속적 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 적어도 약 20개의 비-연속적 결실을 포함한다. 각각의 비-연속적 결실은 본원에 기재된 임의의 길이의 아미노산, 예를 들어, 1-4개 아미노산, 1-10개 아미노산 등일 수 있다.
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NOS:1, 2, 또는 3의 서열에 비해 적어도 하나의 아미노산 삽입을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 1 아미노산의 삽입, 2-3 연속적 아미노산, 2-4 연속적 아미노산, 2-5 연속적 아미노산, 2-6 연속적 아미노산, 2-7 연속적 아미노산, 2-8 연속적 아미노산, 2-9 연속적 아미노산, 2-10 연속적 아미노산, 2-20 연속적 아미노산, 2-30 연속적 아미노산, 2-40 연속적 아미노산, 2-50 연속적 아미노산, 2-60 연속적 아미노산, 2-70 연속적 아미노산, 2-80 연속적 아미노산, 2-90 연속적 아미노산, 2-100 연속적 아미노산, 3-10 연속적 아미노산, 3-20 연속적 아미노산, 3-30 연속적 아미노산, 4-10 연속적 아미노산, 4-20 연속적 아미노산, 3-300 연속적 아미노산, 5-10 연속적 아미노산, 5-20 연속적 아미노산, 5-30 연속적 아미노산, 10-50 연속적 아미노산 또는 20-50 연속적 아미노산의 삽입을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속적 아미노산의 삽입을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 적어도 약 100개 연속적 아미노산의 삽입을 포함한다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 2개 이상의 삽입을 포함하고, 2개 이상의 삽입은 서열의 연속적 아미노산이 아니다. 예를 들어, 제1 삽입은 기준 CasX 단백질의 제1 도메인에 존재할 수 있고, 제2 삽입은 기준 CasX 단백질의 제2 도메인에 존재할 수 있다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 비-연속적 삽입을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 적어도 약 10 내지 약 20개 이상의 비-연속적 삽입을 포함한다. 각각의 비-연속적 삽입은 본원에 기재된 임의의 길이의 아미노산, 예를 들어, 1-4개 아미노산, 1-10개 아미노산 등일 수 있다.
임의의 아미노산, 또는 아미노산들의 조합은 본원에 기재된 삽입에서 삽입될 수 있다. 예를 들어, 프롤린, 아르기닌, 히스티딘, 리신, 아스파르트산, 글루탐산, 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 글리신, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신 또는 발린 또는 이들의 임의의 조합은 개시내용의 기준 CasX 단백질 내로 삽입되어, CasX 변이체 단백질을 생성할 수 있다.
본원에 기재된 치환, 삽입 및 결실의 임의의 순열(permutation)은 개시내용의 CasX 변이체 단백질을 생성하기 위해 조합될 수 있다. 예를 들어, CasX 변이체 단백질은 기준 CasX 변이체 단백질에 비해 적어도 하나의 치환 및 적어도 하나의 결실, 기준 CasX 변이체 단백질에 비해 적어도 하나의 치환 및 적어도 하나의 삽입, 기준 CasX 변이체 단백질에 비해 적어도 하나의 삽입 및 적어도 하나의 결실, 또는 기준 CasX 변이체 단백질에 비해 적어도 하나의 치환, 하나의 삽입 및 하나의 결실을 포함할 수 있다.
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3 중 하나와 적어도 약 60% 서열 유사성, 적어도 70% 유사성, 적어도 80% 유사성, 적어도 85% 유사성, 적어도 86% 유사성, 적어도 87% 유사성, 적어도 88% 유사성, 적어도 89% 유사성, 적어도 90% 유사성, 적어도 91% 유사성, 적어도 92% 유사성, 적어도 93% 유사성, 적어도 94% 유사성, 적어도 95% 유사성, 적어도 96% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 적어도 99.5% 유사성, 적어도 99.6% 유사성, 적어도 99.7% 유사성, 적어도 99.8% 유사성 또는 적어도 99.9% 유사성을 갖는다.
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2 또는 이의 일부와 적어도 약 60% 서열 유사성을 갖는다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 Y789T의 치환, SEQ ID NO: 2의 P793의 결실, SEQ ID NO: 2의 Y789D의 치환, SEQ ID NO: 2의 T72S의 치환, SEQ ID NO: 2의 I546V의 치환, SEQ ID NO: 2의 E552A의 치환, SEQ ID NO: 2의 A636D의 치환, SEQ ID NO: 2의 F536S의 치환, SEQ ID NO: 2의 A708K의 치환, SEQ ID NO: 2의 Y797L의 치환, SEQ ID NO: 2의 L792G의 치환, SEQ ID NO: 2의 A739V의 치환, SEQ ID NO: 2의 G791M의 치환, SEQ ID NO: 2의 위치 661에서 A의 삽입, SEQ ID NO: 2의 A788W의 치환, SEQ ID NO: 2의 K390R의 치환, SEQ ID NO: 2의 A751S의 치환, SEQ ID NO: 2의 E385A의 치환, SEQ ID NO: 2의 위치 696에서 P의 삽입, SEQ ID NO: 2의 위치 773에서 M의 삽입, SEQ ID NO: 2의 G695H의 치환, SEQ ID NO: 2의 위치 793에서 AS의 삽입, SEQ ID NO: 2의 위치 795에서 AS의 삽입, SEQ ID NO: 2의 C477R의 치환, SEQ ID NO: 2의 C477K의 치환, SEQ ID NO: 2의 C479A의 치환, SEQ ID NO: 2의 C479L의 치환, SEQ ID NO: 2의 I55F의 치환, SEQ ID NO: 2의 K210R의 치환, SEQ ID NO: 2의 C233S의 치환, SEQ ID NO: 2의 D231N의 치환, SEQ ID NO: 2의 Q338E의 치환, SEQ ID NO: 2의 Q338R의 치환, SEQ ID NO: 2의 L379R의 치환, SEQ ID NO: 2의 K390R의 치환, SEQ ID NO: 2의 L481Q의 치환, SEQ ID NO: 2의 F495S의 치환, SEQ ID NO: 2의 D600N의 치환, SEQ ID NO: 2의 T886K의 치환, SEQ ID NO: 2의 A739V의 치환, SEQ ID NO: 2의 K460N의 치환, SEQ ID NO: 2의 I199F의 치환, SEQ ID NO: 2의 G492P의 치환, SEQ ID NO: 2의 T153I의 치환, SEQ ID NO: 2의 R591I의 치환, SEQ ID NO: 2의 위치 795에서 AS의 삽입, SEQ ID NO: 2의 위치 796에서 AS의 삽입, SEQ ID NO: 2의 위치 889에서 L의 삽입, SEQ ID NO: 2의 E121D의 치환, SEQ ID NO: 2의 S270W의 치환, SEQ ID NO: 2의 E712Q의 치환, SEQ ID NO: 2의 K942Q의 치환, SEQ ID NO: 2의 E552K의 치환, SEQ ID NO: 2의 K25Q의 치환, SEQ ID NO: 2의 N47D의 치환, SEQ ID NO: 2의 위치 696에서 T의 삽입, SEQ ID NO: 2의 L685I의 치환, SEQ ID NO: 2의 N880D의 치환, SEQ ID NO: 2의 Q102R의 치환, SEQ ID NO: 2의 M734K의 치환, SEQ ID NO: 2의 A724S의 치환, SEQ ID NO: 2의 T704K의 치환, SEQ ID NO: 2의 P224K의 치환, SEQ ID NO: 2의 K25R의 치환, SEQ ID NO: 2의 M29E의 치환, SEQ ID NO: 2의 H152D의 치환, SEQ ID NO: 2의 S219R의 치환, SEQ ID NO: 2의 E475K의 치환, SEQ ID NO: 2의 G226R의 치환, SEQ ID NO: 2의 A377K의 치환, SEQ ID NO: 2의 E480K의 치환, SEQ ID NO: 2의 K416E의 치환, SEQ ID NO: 2의 H164R의 치환, SEQ ID NO: 2의 K767R의 치환, SEQ ID NO: 2의 I7F의 치환, SEQ ID NO: 2의 M29R의 치환, SEQ ID NO: 2의 H435R의 치환, SEQ ID NO: 2의 E385Q의 치환, SEQ ID NO: 2의 E385K의 치환, SEQ ID NO: 2의 I279F의 치환, SEQ ID NO: 2의 D489S의 치환, SEQ ID NO: 2의 D732N의 치환, SEQ ID NO: 2의 A739T의 치환, SEQ ID NO: 2의 W885R의 치환, SEQ ID NO: 2의 E53K의 치환, SEQ ID NO: 2의 A238T의 치환, SEQ ID NO: 2의 P283Q의 치환, SEQ ID NO: 2의 E292K의 치환, SEQ ID NO: 2의 Q628E의 치환, SEQ ID NO: 2의 R388Q의 치환, SEQ ID NO: 2의 G791M의 치환, SEQ ID NO: 2의 L792K의 치환, SEQ ID NO: 2의 L792E의 치환, SEQ ID NO: 2의 M779N의 치환, SEQ ID NO: 2의 G27D의 치환, SEQ ID NO: 2의 K955R의 치환, SEQ ID NO: 2의 S867R의 치환, SEQ ID NO: 2의 R693I의 치환, SEQ ID NO: 2의 F189Y의 치환, SEQ ID NO: 2의 V635M의 치환, SEQ ID NO: 2의 F399L의 치환, SEQ ID NO: 2의 E498K의 치환, SEQ ID NO: 2의 E386R의 치환, SEQ ID NO: 2의 V254G의 치환, SEQ ID NO: 2의 P793S의 치환, SEQ ID NO: 2의 K188E의 치환, SEQ ID NO: 2의 QT945KI의 치환, SEQ ID NO: 2의 T620P의 치환, SEQ ID NO: 2의 T946P의 치환, SEQ ID NO: 2의 TT949PP의 치환, SEQ ID NO: 2의 N952T의 치환, SEQ ID NO: 2의 K682E의 치환, SEQ ID NO: 2의 K975R의 치환, SEQ ID NO: 2의 L212P의 치환, SEQ ID NO: 2의 E292R의 치환, SEQ ID NO: 2의 I303K의 치환, SEQ ID NO: 2의 C349E의 치환, SEQ ID NO: 2의 E385P의 치환, SEQ ID NO: 2의 E386N의 치환, SEQ ID NO: 2의 D387K의 치환, SEQ ID NO: 2의 L404K의 치환, SEQ ID NO: 2의 E466H의 치환, SEQ ID NO: 2의 C477Q의 치환, SEQ ID NO: 2의 C477H의 치환, SEQ ID NO: 2의 C479A의 치환, SEQ ID NO: 2의 D659H의 치환, SEQ ID NO: 2의 T806V의 치환, SEQ ID NO: 2의 K808S의 치환, SEQ ID NO: 2의 위치 797에서 AS의 삽입, SEQ ID NO: 2의 V959M의 치환, SEQ ID NO: 2의 K975Q의 치환, SEQ ID NO: 2의 W974G의 치환, SEQ ID NO: 2의 A708Q의 치환, SEQ ID NO: 2의 V711K의 치환, SEQ ID NO: 2의 D733T의 치환, SEQ ID NO: 2의 L742W의 치환, SEQ ID NO: 2의 V747K의 치환, SEQ ID NO: 2의 F755M의 치환, SEQ ID NO: 2의 M771A의 치환, SEQ ID NO: 2의 M771Q의 치환, SEQ ID NO: 2의 W782Q의 치환, SEQ ID NO: 2의 G791F의 치환, SEQ ID NO: 2의 L792D의 치환, SEQ ID NO: 2의 L792K의 치환, SEQ ID NO: 2의 P793Q의 치환, SEQ ID NO: 2의 P793G의 치환, SEQ ID NO: 2의 Q804A의 치환, SEQ ID NO: 2의 Y966N의 치환, SEQ ID NO: 2의 Y723N의 치환, SEQ ID NO: 2의 Y857R의 치환, SEQ ID NO: 2의 S890R의 치환, SEQ ID NO: 2의 S932M의 치환, SEQ ID NO: 2의 L897M의 치환, SEQ ID NO: 2의 R624G의 치환, SEQ ID NO: 2의 S603G의 치환, SEQ ID NO: 2의 N737S의 치환, SEQ ID NO: 2의 L307K의 치환, SEQ ID NO: 2의 I658V의 치환, SEQ ID NO: 2의 위치 688에서 PT의 삽입, SEQ ID NO: 2의 위치 794에서 SA의 삽입, SEQ ID NO: 2의 S877R의 치환, SEQ ID NO: 2의 N580T의 치환, SEQ ID NO: 2의 V335G의 치환, SEQ ID NO: 2의 T620S의 치환, SEQ ID NO: 2의 W345G의 치환, SEQ ID NO: 2의 T280S의 치환, SEQ ID NO: 2의 L406P의 치환, SEQ ID NO: 2의 A612D의 치환, SEQ ID NO: 2의 A751S의 치환, SEQ ID NO: 2의 E386R의 치환, SEQ ID NO: 2의 V351M의 치환, SEQ ID NO: 2의 K210N의 치환, SEQ ID NO: 2의 D40A의 치환, SEQ ID NO: 2의 E773G의 치환, SEQ ID NO: 2의 H207L의 치환, SEQ ID NO: 2의 T62A의 치환, SEQ ID NO: 2의 T287P의 치환, SEQ ID NO: 2의 T832A의 치환, SEQ ID NO: 2의 A893S의 치환, SEQ ID NO: 2의 위치 14에서 V의 삽입, SEQ ID NO: 2의 위치 13에서 AG의 삽입, SEQ ID NO: 2의 R11V의 치환, SEQ ID NO: 2의 R12N의 치환, SEQ ID NO: 2의 R13H의 치환, SEQ ID NO: 2의 위치 13에서 Y의 삽입, SEQ ID NO: 2의 R12L의 치환, SEQ ID NO: 2의 위치 13에서 Q의 삽입, SEQ ID NO: 2의 V15S의 치환, SEQ ID NO: 2의 위치 17에서 D의 삽입 또는 이들의 조합을 포함한다.
일부 구현예에서, CasX 변이체는 NTSB 도메인에 적어도 하나의 변형을 포함한다.
일부 구현예에서, CasX 변이체는 TSL 도메인에 적어도 하나의 변형을 포함한다. 일부 구현예에서, TSL 도메인 내 적어도 하나의 변형은 SEQ ID NO: 2의 아미노산 Y857, S890, 또는 S932 중 하나 이상의 아미노산 치환을 포함한다.
일부 구현예에서, CasX 변이체는 나선형 I 도메인에 적어도 하나의 변형을 포함한다. 일부 구현예에서, 나선형 I 도메인 내 적어도 하나의 변형은 SEQ ID NO: 2의 아미노산 S219, L249, E259, Q252, E292, L307, 또는 D318 중 하나 이상의 아미노산 치환을 포함한다.
일부 구현예에서, CasX 변이체는 나선형 II 도메인에 적어도 하나의 변형을 포함한다. 일부 구현예에서, 나선형 II 도메인 내 적어도 하나의 변형은 SEQ ID NO: 2의 아미노산 D361, L379, E385, E386, D387, F399, L404, R458, C477, 또는 D489 중 하나 이상의 아미노산 치환을 포함한다.
일부 구현예에서, CasX 변이체는 OBD 도메인에 적어도 하나의 변형을 포함한다. 일부 구현예에서, OBD 내 적어도 하나의 변형은 SEQ ID NO: 2의 아미노산 F536, E552, T620, 또는 I658 중 하나 이상의 아미노산 치환을 포함한다.
일부 구현예에서, CasX 변이체는 RuvC DNA 절단 도메인에 적어도 하나의 변형을 포함한다. 일부 구현예에서, RuvC DNA 절단 도메인 내 적어도 하나의 변형은 SEQ ID NO: 2의 아미노산 K682, G695, A708, V711, D732, A739, D733, L742, V747, F755, M771, M779, W782, A788, G791, L792, P793, Y797, M799, Q804, S819, 또는 Y857 중 하나 이상의 아미노산 치환 또는 아미노산 P793의 결실을 포함한다.
일부 구현예에서, CasX 변이체는 SEQ ID NO: 2의 기준 CasX 서열과 비교하여 적어도 하나의 변형을 포함하고, (a) L379R의 아미노산 치환; (b) A708K의 아미노산 치환; (c) T620P의 아미노산 치환; (d) E385P의 아미노산 치환; (e) Y857R의 아미노산 치환; (f) I658V의 아미노산 치환; (g) F399L의 아미노산 치환; (h) Q252K의 아미노산 치환; (i) L404K의 아미노산 치환; 및 (j) P793의 아미노산 결실 중 하나 이상으로부터 선택된다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질 아미노산 서열에 적어도 2개의 아미노산 변화를 포함한다. 적어도 2개의 아미노산 변화는 기준 CasX 단백질 아미노산 서열의 치환, 삽입, 또는 결실, 또는 이들의 임의의 조합일 수 있다. 치환, 삽입 또는 결실은 본원에 기재된 기준 CasX 단백질의 서열에서의 임의의 치환, 삽입 또는 결실일 수 있다. 일부 구현예에서, 변화는 기준 CasX 단백질 서열에 대한 인접성 아미노산 변화, 비-인접성 아미노산 변화, 또는 인접성 아미노산 변화와 비-인접성 아미노산 변화의 조합이다. 일부 구현예에서, 기준 CasX 단백질은 SEQ ID NO: 2이다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질 서열에 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 30, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95 또는 적어도 100개의 아미노산 변화를 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질 서열에 1-50, 3-40, 5-30, 5-20, 5-15, 5-10, 10-50, 10-40, 10-30, 10-20, 15-50, 15-40, 15-30, 2-25, 2-24, 2-22, 2-23, 2-22, 2-21, 2-20, 2-19, 2-18, 2-17, 2-16, 2-15, 2-14, 2-12, 2-11, 2-10, 2-9, 2-8, 2-7, 2-6, 2-5, 2-4, 2-3, 3-25, 3-24, 3-22, 3-23, 3-22, 3-21, 3-20, 3-19, 3-18, 3-17, 3-16, 3-15, 3-14, 3-12, 3-11, 3-10, 3-9, 3-8, 3-7, 3-6, 3-5, 3-4, 4-25, 4-24, 4-22, 4-23, 4-22, 4-21, 4-20, 4-19, 4-18, 4-17, 4-16, 4-15, 4-14, 4-12, 4-11, 4-10, 4-9, 4-8, 4-7, 4-6, 4-5, 5-25, 5-24, 5-22, 5-23, 5-22, 5-21, 5-20, 5-19, 5-18, 5-17, 5-16, 5-15, 5-14, 5-12, 5-11, 5-10, 5-9, 5-8, 5-7 또는 5-6개의 아미노산 변화를 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질 서열에 15-20개의 아미노산 변화를 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질 서열에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 아미노산 변화를 포함한다. 일부 구현예에서, 기준 CasX 변이체 단백질의 서열에 대한 적어도 2개의 아미노산 변화는 SEQ ID NO: 2의 Y789T의 치환, SEQ ID NO: 2의 P793의 결실, SEQ ID NO: 2의 Y789D의 치환, SEQ ID NO: 2의 T72S의 치환, SEQ ID NO: 2의 I546V의 치환, SEQ ID NO: 2의 E552A의 치환, SEQ ID NO: 2의 A636D의 치환, SEQ ID NO: 2의 F536S의 치환, SEQ ID NO: 2의 A708K의 치환, SEQ ID NO: 2의 Y797L의 치환, SEQ ID NO: 2의 L792G의 치환, SEQ ID NO: 2의 A739V의 치환, SEQ ID NO: 2의 G791M의 치환, SEQ ID NO: 2의 위치 661에서 A의 삽입, SEQ ID NO: 2의 A788W의 치환, SEQ ID NO: 2의 K390R의 치환, SEQ ID NO: 2의 A751S의 치환, SEQ ID NO: 2의 E385A의 치환, SEQ ID NO: 2의 위치 696에서 P의 삽입, SEQ ID NO: 2의 위치 773에서 M의 삽입, SEQ ID NO: 2의 G695H의 치환, SEQ ID NO: 2의 위치 793에서 AS의 삽입, SEQ ID NO: 2의 위치 795에서 AS의 삽입, SEQ ID NO: 2의 C477R의 치환, SEQ ID NO: 2의 C477K의 치환, SEQ ID NO: 2의 C479A의 치환, SEQ ID NO: 2의 C479L의 치환, SEQ ID NO: 2의 I55F의 치환, SEQ ID NO: 2의 K210R의 치환, SEQ ID NO: 2의 C233S의 치환, SEQ ID NO: 2의 D231N의 치환, SEQ ID NO: 2의 Q338E의 치환, SEQ ID NO: 2의 Q338R의 치환, SEQ ID NO: 2의 L379R의 치환, SEQ ID NO: 2의 K390R의 치환, SEQ ID NO: 2의 L481Q의 치환, SEQ ID NO: 2의 F495S의 치환, SEQ ID NO: 2의 D600N의 치환, SEQ ID NO: 2의 T886K의 치환, SEQ ID NO: 2의 A739V의 치환, SEQ ID NO: 2의 K460N의 치환, SEQ ID NO: 2의 I199F의 치환, SEQ ID NO: 2의 G492P의 치환, SEQ ID NO: 2의 T153I의 치환, SEQ ID NO: 2의 R591I의 치환, SEQ ID NO: 2의 위치 795에서 AS의 삽입, SEQ ID NO: 2의 위치 796에서 AS의 삽입, SEQ ID NO: 2의 위치 889에서 L의 삽입, SEQ ID NO: 2의 E121D의 치환, SEQ ID NO: 2의 S270W의 치환, SEQ ID NO: 2의 E712Q의 치환, SEQ ID NO: 2의 K942Q의 치환, SEQ ID NO: 2의 E552K의 치환, SEQ ID NO: 2의 K25Q의 치환, SEQ ID NO: 2의 N47D의 치환, SEQ ID NO: 2의 위치 696에서 T의 삽입, SEQ ID NO: 2의 L685I의 치환, SEQ ID NO: 2의 N880D의 치환, SEQ ID NO: 2의 Q102R의 치환, SEQ ID NO: 2의 M734K의 치환, SEQ ID NO: 2의 A724S의 치환, SEQ ID NO: 2의 T704K의 치환, SEQ ID NO: 2의 P224K의 치환, SEQ ID NO: 2의 K25R의 치환, SEQ ID NO: 2의 M29E의 치환, SEQ ID NO: 2의 H152D의 치환, SEQ ID NO: 2의 S219R의 치환, SEQ ID NO: 2의 E475K의 치환, SEQ ID NO: 2의 G226R의 치환, SEQ ID NO: 2의 A377K의 치환, SEQ ID NO: 2의 E480K의 치환, SEQ ID NO: 2의 K416E의 치환, SEQ ID NO: 2의 H164R의 치환, SEQ ID NO: 2의 K767R의 치환, SEQ ID NO: 2의 I7F의 치환, SEQ ID NO: 2의 M29R의 치환, SEQ ID NO: 2의 H435R의 치환, SEQ ID NO: 2의 E385Q의 치환, SEQ ID NO: 2의 E385K의 치환, SEQ ID NO: 2의 I279F의 치환, SEQ ID NO: 2의 D489S의 치환, SEQ ID NO: 2의 D732N의 치환, SEQ ID NO: 2의 A739T의 치환, SEQ ID NO: 2의 W885R의 치환, SEQ ID NO: 2의 E53K의 치환, SEQ ID NO: 2의 A238T의 치환, SEQ ID NO: 2의 P283Q의 치환, SEQ ID NO: 2의 E292K의 치환, SEQ ID NO: 2의 Q628E의 치환, SEQ ID NO: 2의 R388Q의 치환, SEQ ID NO: 2의 G791M의 치환, SEQ ID NO: 2의 L792K의 치환, SEQ ID NO: 2의 L792E의 치환, SEQ ID NO: 2의 M779N의 치환, SEQ ID NO: 2의 G27D의 치환, SEQ ID NO: 2의 K955R의 치환, SEQ ID NO: 2의 S867R의 치환, SEQ ID NO: 2의 R693I의 치환, SEQ ID NO: 2의 F189Y의 치환, SEQ ID NO: 2의 V635M의 치환, SEQ ID NO: 2의 F399L의 치환, SEQ ID NO: 2의 E498K의 치환, SEQ ID NO: 2의 E386R의 치환, SEQ ID NO: 2의 V254G의 치환, SEQ ID NO: 2의 P793S의 치환, SEQ ID NO: 2의 K188E의 치환, SEQ ID NO: 2의 QT945KI의 치환, SEQ ID NO: 2의 T620P의 치환, SEQ ID NO: 2의 T946P의 치환, SEQ ID NO: 2의 TT949PP의 치환, SEQ ID NO: 2의 N952T의 치환, SEQ ID NO: 2의 K682E의 치환, SEQ ID NO: 2의 K975R의 치환, SEQ ID NO: 2의 L212P의 치환, SEQ ID NO: 2의 E292R의 치환, SEQ ID NO: 2의 I303K의 치환, SEQ ID NO: 2의 C349E의 치환, SEQ ID NO: 2의 E385P의 치환, SEQ ID NO: 2의 E386N의 치환, SEQ ID NO: 2의 D387K의 치환, SEQ ID NO: 2의 L404K의 치환, SEQ ID NO: 2의 E466H의 치환, SEQ ID NO: 2의 C477Q의 치환, SEQ ID NO: 2의 C477H의 치환, SEQ ID NO: 2의 C479A의 치환, SEQ ID NO: 2의 D659H의 치환, SEQ ID NO: 2의 T806V의 치환, SEQ ID NO: 2의 K808S의 치환, SEQ ID NO: 2의 위치 797에서 AS의 삽입, SEQ ID NO: 2의 V959M의 치환, SEQ ID NO: 2의 K975Q의 치환, SEQ ID NO: 2의 W974G의 치환, SEQ ID NO: 2의 A708Q의 치환, SEQ ID NO: 2의 V711K의 치환, SEQ ID NO: 2의 D733T의 치환, SEQ ID NO: 2의 L742W의 치환, SEQ ID NO: 2의 V747K의 치환, SEQ ID NO: 2의 F755M의 치환, SEQ ID NO: 2의 M771A의 치환, SEQ ID NO: 2의 M771Q의 치환, SEQ ID NO: 2의 W782Q의 치환, SEQ ID NO: 2의 G791F의 치환, SEQ ID NO: 2의 L792D의 치환, SEQ ID NO: 2의 L792K의 치환, SEQ ID NO: 2의 P793Q의 치환, SEQ ID NO: 2의 P793G의 치환, SEQ ID NO: 2의 Q804A의 치환, SEQ ID NO: 2의 Y966N의 치환, SEQ ID NO: 2의 Y723N의 치환, SEQ ID NO: 2의 Y857R의 치환, SEQ ID NO: 2의 S890R의 치환, SEQ ID NO: 2의 S932M의 치환, SEQ ID NO: 2의 L897M의 치환, SEQ ID NO: 2의 R624G의 치환, SEQ ID NO: 2의 S603G의 치환, SEQ ID NO: 2의 N737S의 치환, SEQ ID NO: 2의 L307K의 치환, SEQ ID NO: 2의 I658V의 치환, SEQ ID NO: 2의 위치 688에서 PT의 삽입, SEQ ID NO: 2의 위치 794에서 SA의 삽입, SEQ ID NO: 2의 S877R의 치환, SEQ ID NO: 2의 N580T의 치환, SEQ ID NO: 2의 V335G의 치환, SEQ ID NO: 2의 T620S의 치환, SEQ ID NO: 2의 W345G의 치환, SEQ ID NO: 2의 T280S의 치환, SEQ ID NO: 2의 L406P의 치환, SEQ ID NO: 2의 A612D의 치환, SEQ ID NO: 2의 A751S의 치환, SEQ ID NO: 2의 E386R의 치환, SEQ ID NO: 2의 V351M의 치환, SEQ ID NO: 2의 K210N의 치환, SEQ ID NO: 2의 D40A의 치환, SEQ ID NO: 2의 E773G의 치환, SEQ ID NO: 2의 H207L의 치환, SEQ ID NO: 2의 T62A의 치환, SEQ ID NO: 2의 T287P의 치환, SEQ ID NO: 2의 T832A의 치환, SEQ ID NO: 2의 A893S의 치환, SEQ ID NO: 2의 위치 14에서 V의 삽입, SEQ ID NO: 2의 위치 13에서 AG의 삽입, SEQ ID NO: 2의 R11V의 치환, SEQ ID NO: 2의 R12N의 치환, SEQ ID NO: 2의 R13H의 치환, SEQ ID NO: 2의 위치 13에서 Y의 삽입, SEQ ID NO: 2의 R12L의 치환, SEQ ID NO: 2의 위치 13에서 Q의 삽입, SEQ ID NO: 2의 V15S의 치환, 및 SEQ ID NO: 2의 위치 17에서 D의 삽입으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 기준 CasX 단백질에 대한 적어도 2개의 아미노산 변화는 표 4의 서열에 개시된 아미노산 변화로부터 선택된다. 일부 구현예에서, CasX 변이체는 이 단락의 전술한 구현예의 임의의 조합을 포함한다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질 아미노산 서열의 하나 초과의 치환, 삽입 및/또는 결실을 포함한다. 일부 구현예에서, 기준 CasX 단백질은 SEQ ID NO: 2를 포함하거나 이로 본질적으로 구성된다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 S794R의 치환 및 Y797L의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 K416E의 치환 및 A708K의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 A708K의 치환 및 P793의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 P793의 결실 및 위치 795에서 AS의 삽입을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 Q367K의 치환 및 I425S의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 A708K의 치환, 위치 793에서 P의 결실 및 치환 A793V를 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 Q338R의 치환 및 A339E의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 Q338R의 치환 및 A339K의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 S507G의 치환 및 G508R의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 C477K의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 M779N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 M771N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, 708K의 치환, 위치 793에서 P의 결실 및 D489S의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739T의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 D732N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 G791M의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, 708K의 치환, 위치 793에서 P의 결실 및 Y797L의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 M779N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 M771N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 D489S의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739T의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 D732N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 G791M의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 Y797L의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 T620P의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 A708K의 치환, 위치 793에서 P의 결실 및 E386S의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 E386R의 치환, F399L의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 R581I의 치환 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체는 이 단락의 전술한 구현예의 임의의 조합을 포함한다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질 아미노산 서열의 하나 초과의 치환, 삽입 및/또는 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 C477K의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 T620P의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 M771A의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 D732N의 치환을 포함한다. 일부 구현예에서, CasX 변이체는 이 단락의 전술한 구현예의 임의의 조합을 포함한다.
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 W782Q의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 M771Q의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 R458I의 치환 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 M771N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739T의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 D489S의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 D732N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 V711K의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 Y797L의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환, 위치 793에서 P의 결실 및 M771N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 A708K의 치환, 위치 793에서 P의 치환 및 E386S의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477K의 치환, A708K의 치환 및 위치 793에서 P의 결실을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L792D의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 G791F의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, A708K의 치환, 위치 793에서 P의 결실 및 A739V의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 C477K의 치환, A708K의 치환 및 위치 793에서 P의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L249I의 치환 및 M771N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 V747K의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 L379R의 치환, C477의 치환, A708K의 치환, 위치 793에서 P의 결실 및 M779N의 치환을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 F755M의 치환을 포함한다. 일부 구현예에서, CasX 변이체는 이 단락의 전술한 구현예의 임의의 조합을 포함한다.
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 기준 CasX 서열과 비교하여 적어도 하나의 변형을 포함하고, 적어도 하나의 변형은 L379R의 아미노산 치환; A708K의 아미노산 치환; T620P의 아미노산 치환; E385P의 아미노산 치환; Y857R의 아미노산 치환; I658V의 아미노산 치환; F399L의 아미노산 치환; Q252K의 아미노산 치환; 및 [P793]의 아미노산 결실 중 하나 이상으로부터 선택된다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 기준 CasX 서열과 비교하여 적어도 하나의 변형을 포함하고, 적어도 하나의 변형은 L379R의 아미노산 치환; A708K의 아미노산 치환; T620P의 아미노산 치환; E385P의 아미노산 치환; Y857R의 아미노산 치환; I658V의 아미노산 치환; F399L의 아미노산 치환; Q252K의 아미노산 치환; L404K의 아미노산 치환; 및 [P793]의 아미노산 결실 중 하나 이상으로부터 선택된다. 다른 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 2의 기준 CasX 서열과 비교하여 전술한 치환 또는 결실의 임의의 조합을 포함한다. 다른 구현예에서, CasX 변이체 단백질은 전술한 치환 또는 결실에 더하여, SEQ ID NO: 1의 기준 CasX로부터의 NTSB 및/또는 나선형 1b 도메인의 치환을 추가로 포함할 수 있다.
일부 구현예에서, CasX 변이체 단백질은 400 내지 2000개 아미노산, 500 내지 1500개 아미노산, 700 내지 1200개 아미노산, 800 내지 1100개 아미노산 또는 900 내지 1000개 아미노산을 포함한다.
일부 구현예에서, CasX 변이체 단백질은, gNA:표적 DNA 복합체화가 발생하는 비-인접성 잔기의 영역에 하나 이상의 변형을 포함한다. 일부 구현예에서, CasX 변이체 단백질은, gNA와 결합하는 계면을 형성하는 비-인접성 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 예를 들어, 기준 CasX 단백질의 일부 구현예에서, 나선형 I, 나선형 II 및 OBD 도메인은 모두 gNA:표적 DNA 복합체와 접촉하거나 이에 근접하게 존재하고, 임의의 이들 도메인 내의 비-인접 잔기에 대한 하나 이상의 변형은 CasX 변이체 단백질의 기능을 향상시킬 수 있다.
일부 구현예에서, CasX 변이체 단백질은, 비-표적 가닥 DNA와 결합하는 채널을 형성하는 비-인접성 잔기의 영역에 하나 이상의 변형을 포함한다. 예를 들어, CasX 변이체 단백질은 NTSBD의 비-인접성 잔기에 하나 이상의 변형을 포함할 수 있다. 일부 구현예에서, CasX 변이체 단백질은, PAM과 결합하는 계면을 형성하는 비-인접성 잔기의 영역에 하나 이상의 변형을 포함한다. 예를 들어, CasX 변이체 단백질은 나선형 I 도메인 또는 OBD의 비-인접성 잔기에 하나 이상의 변형을 포함할 수 있다. 일부 구현예에서, CasX 변이체 단백질은 비-인접성 표면-노출된 잔기의 영역을 포함하는 하나 이상의 변형을 포함할 수 있다. 본원에 사용된 바와 같이, "표면-노출된 잔기"는, CasX 단백질의 표면 상의 아미노산, 또는 아미노산의 적어도 일부, 예컨대 백본 또는 측쇄의 파트가 단백질의 표면 상에 존재하는 아미노산을 지칭한다. 수성 세포내 환경에 노출되는 세포성 단백질, 예컨대 CasX의 표면 노출된 잔기는 빈번하게는, 양으로 하전된 친수성 아미노산, 예컨대 아르기닌, 아스파라긴, 아스파르테이트, 글루타민, 글루타메이트, 히스티딘, 리신, 세린, 및 트레오닌으로부터 선택된다. 그러므로 예를 들어, 본원에 제공된 변이체의 일부 구현예에서, 표면-노출된 잔기의 영역은 기준 CasX 단백질과 비교하여 하나 이상의 삽입, 결실, 또는 치환을 포함한다. 일부 구현예에서, 하나 이상의 양으로 하전된 잔기는 하나 이상의 다른 양으로 하전된 잔기, 또는 음으로 하전된 잔기, 또는 비하전된 잔기, 또는 이들의 임의의 조합에 대해 치환된다. 일부 구현예에서, 치환을 위한 하나 이상의 아미노산 잔기는 결합된 핵산 부근에 있으며, 예를 들어 표적 DNA와 접촉하는 RuvC 도메인 또는 나선형 I 도메인 내의 잔기, 또는 gNA에 결합하는 OBD 또는 나선형 II 도메인 내의 잔기는 하나 이상의 양으로 하전된 또는 극성 아미노산에 대해 치환될 수 있다.
일부 구현예에서, CasX 변이체 단백질은, 기준 CasX 단백질의 도메인에서 소수성 패킹을 통해 코어를 형성하는 비-인접 잔기의 영역에 하나 이상의 변형을 포함한다. 임의의 이론으로 결부시키고자 하는 것은 아니지만, 소수성 패킹을 통해 코어를 형성하는 영역은 소수성 아미노산, 예컨대 발린, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 및 시스테인이 풍부하다. 예를 들어, 일부 기준 CasX 단백질에서, RuvC 도메인은 활성 부위에 인접한 소수성 포켓을 포함한다. 일부 구현예에서, 영역의 2 내지 15개의 잔기는 하전되거나, 극성이거나, 염기-적층된다. 하전된 아미노산(이따금 본원에서 잔기로 지칭됨)은 예를 들어, 아르기닌, 리신, 아스파르트산, 및 글루탐산을 포함할 수 있고, 이들 아미노산에 대한 측쇄는 염 브릿지를 형성할 수 있으며, 단, 브릿지 파트너가 또한 존재한다. 극성 아미노산은 예를 들어, 글루타민, 아스파라긴, 히스티딘, 세린, 트레오닌, 티로신, 및 시스테인을 포함할 수 있다. 극성 아미노산은 일부 구현예에서, 이의 측쇄에 따라, 양성자 공여기 또는 수용기로서 수소 결합을 형성할 수 있다. 본원에 사용된 바와 같이, "염기-적층"은 아미노산 잔기의 방향족 측쇄(예컨대 트립토판, 티로신, 페닐알라닌, 또는 히스티딘)와 핵산 내의 적층된 뉴클레오타이드 염기와의 상호작용을 포함한다. CasX 변이체 단백질의 기능적 파트를 형성하기 위해 닫힌 공간적으로 근접하게 존재하는 비-인접 아미노산의 영역에 대한 임의의 변형은 개시내용의 범위 내에 있는 것으로 여겨진다.
i. 다수의 공급원 단백질로부터의 도메인을 갖는 CasX 변이체 단백질
소정의 구현예에서, 개시내용은 본원에 기재된 바와 같이 2개 이상의 상이한 CasX 단백질, 예컨대 2개 이상의 기준 CasX 단백질, 또는 2개 이상의 CasX 변이체 단백질 서열로부터의 단백질 도메인을 포함하는 키메라 CasX 단백질을 제공한다. 본원에 사용된 바와 같이, "키메라 CasX 단백질"은 상이한 공급원, 예컨대 2개의 천연 발생 단백질로부터 단리되거나 유래된 적어도 2개의 도메인을 함유하는 CasX를 지칭하며, 이는 일부 경우 상이한 종으로부터 단리될 수 있다. 예를 들어, 일부 구현예에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 제1 파트 및 제2의 상이한 CasX 단백질로부터의 제2 도메인을 포함한다. 일부 구현예에서, 제1 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD, 및 RuvC 도메인으로 이루어진 군으로부터 선택될 수 있다. 일부 구현예에서, 제2 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD, 및 RuvC 도메인으로 이루어진 군으로부터 선택되며, 제2 도메인은 상기 제1 도메인과 상이하다. 예를 들어, 키메라 CasX 단백질은 SEQ ID NO: 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 I, 나선형 II, OBD 도메인, 및 SEQ ID NO: 1의 CasX 단백질로부터의 RuvC 도메인을 포함할 수 있거나, 그 반대일 수 있다. 추가의 예로서, 키메라 CasX 단백질은 SEQ ID NO: 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD 및 RuvC 도메인 및 SEQ ID NO: 1의 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있거나, 그 반대일 수 있다. 그러므로 소정의 구현예에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD 및 RuvC 도메인 및 제2 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있다. 키메라 CasX 단백질의 일부 구현예에서, 제1 CasX 단백질의 도메인은 SEQ ID NO: 1, SEQ ID NO: 2 또는 SEQ ID NO: 3의 서열로부터 유래되며, 제2 CasX 단백질의 도메인은 SEQ ID NO: 1, SEQ ID NO: 2 또는 SEQ ID NO: 3의 서열로부터 유래되고, 제1 CasX 단백질 및 제2 CasX 단백질은 동일하지 않다. 일부 구현예에서, 제1 CasX 단백질의 도메인은 SEQ ID NO: 1로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 SEQ ID NO: 2로부터 유래된 서열을 포함한다. 일부 구현예에서, 제1 CasX 단백질의 도메인은 SEQ ID NO: 1로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 SEQ ID NO: 3으로부터 유래된 서열을 포함한다. 일부 구현예에서, 제1 CasX 단백질의 도메인은 SEQ ID NO: 2로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 SEQ ID NO: 3으로부터 유래된 서열을 포함한다. 일부 구현예에서, CasX 변이체는 CasX 변이체 387, 388, 389, 390, 395, 485, 486, 487, 488, 489, 490, 및 491로 이루어진 군으로부터 선택되며, 이의 서열은 표 4에 제시되어 있다.
일부 구현예에서, CasX 변이체 단백질은 제1 CasX 단백질로부터의 제1 파트 및 제2의 상이한 CasX 단백질로부터의 제2 파트를 포함하는 적어도 하나의 키메라 도메인을 포함한다. 본원에 사용된 바와 같이, "키메라 도메인"은 상이한 공급원으로부터 단리되거나 유래된 적어도 2개의 파트를 함유하는 도메인, 예컨대 2개의 기준 CasX 단백질로부터의 도메인의 2개의 천연 발생 단백질 또는 부분을 지칭한다. 적어도 하나의 키메라 도메인은 본원에 기재된 바와 같이 NTSB, TSL, 나선형 I, 나선형 II, OBD 또는 RuvC 도메인 중 임의의 것일 수 있다. 일부 구현예에서, CasX 도메인의 제1 부분은 SEQ ID NO: 1의 서열을 포함하고, CasX 도메인의 제2 부분은 SEQ ID NO: 2의 서열을 포함한다. 일부 구현예에서, CasX 도메인의 제1 부분은 SEQ ID NO: 1의 서열을 포함하고, CasX 도메인의 제2 부분은 SEQ ID NO: 3의 서열을 포함한다. 일부 구현예에서, CasX 도메인의 제1 부분은 SEQ ID NO: 2의 서열을 포함하고, CasX 도메인의 제2 부분은 SEQ ID NO: 3의 서열을 포함한다. 일부 구현예에서, 적어도 하나의 키메라 도메인은 키메라 RuvC 도메인을 포함한다. 전술한 내용의 일례로서, 키메라 RuvC 도메인은 SEQ ID NO: 1의 아미노산 661 내지 824 및 SEQ ID NO: 2의 아미노산 922 내지 978을 포함한다. 전술한 내용의 대안적인 예로서, 키메라 RuvC 도메인은 SEQ ID NO: 2의 아미노산 648 내지 812 및 SEQ ID NO: 1의 아미노산 935 내지 986을 포함한다. 일부 구현예에서, CasX 단백질은 제1 CasX 단백질로부터의 제1 도메인 및 제2 CasX 단백질로부터의 제2 도메인, 및 이 단락에서 기재된 구현예의 접근법을 사용하여 상이한 CasX 단백질로부터 단리된 적어도 2개의 파트를 포함하는 적어도 하나의 키메라 도메인을 포함한다. 상기 구현예에서, SEQ ID NO: 1, 2 및 3으로부터 유래된 도메인 또는 도메인의 일부를 갖는 키메라 CasX 단백질은 본원에 개시된 임의의 구현예의 아미노산 삽입, 결실, 또는 치환을 추가로 포함할 수 있다.
일부 구현예에서, CasX 변이체 단백질은 표 4, 7, 8, 9 또는 11에 제시된 서열을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 표 4에 제시된 서열로 구성된다. 다른 구현예에서, CasX 변이체 단백질은 표 4, 7, 8, 9 또는 11에 제시된 서열과 적어도 60% 동일한, 적어도 65% 동일한, 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 81% 동일한, 적어도 82% 동일한, 적어도 83% 동일한, 적어도 84% 동일한, 적어도 85% 동일한, 적어도 86% 동일한, 적어도 86% 동일한, 적어도 87% 동일한, 적어도 88% 동일한, 적어도 89% 동일한, 적어도 89% 동일한, 적어도 90% 동일한, 적어도 91% 동일한, 적어도 92% 동일한, 적어도 93% 동일한, 적어도 94% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 서열을 포함한다. 다른 구현예에서, CasX 변이체 단백질은 표 4에 제시된 서열을 포함하고, N-말단, C-말단, 또는 둘 다에서 또는 그 부근에서 본원에 개시된 하나 이상의 NLS를 추가로 포함한다. 일부 경우, 표의 CasX 변이체의 N-말단 메티오닌은 번역-후 변형 동안 발현된 CasX 변이체로부터 제거된다.
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 49-143, 438, 440, 442, 444, 446, 448-460, 472, 474, 478, 480, 482, 484, 486, 488, 490, 612 및 613으로 이루어진 군으로부터 선택되는 서열을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 49-143, 438, 440, 442, 444, 446, 448-460, 472, 474, 478, 480, 482, 484, 486, 488, 490, 612 및 613으로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 49-143으로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 49-143으로 이루어진 군으로부터 선택되는 서열을 포함한다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질, 예를 들어 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 단백질과 비교할 때 CasX 단백질의 하나 이상의 향상된 특징을 갖는다. 일부 구현예에서, CasX 변이체의 적어도 하나의 향상된 특징은 기준 단백질에 비해 적어도 약 1.1 내지 약 100,000배 향상된다. 일부 구현예에서, CasX 변이체의 적어도 하나의 향상된 특징은 기준 CasX 단백질보다 적어도 약 1.1 내지 약 10,000배 향상된, 적어도 약 1.1 내지 약 1,000배 향상된, 적어도 약 1.1 내지 약 500배 향상된, 적어도 약 1.1 내지 약 400배 향상된, 적어도 약 1.1 내지 약 300배 향상된, 적어도 약 1.1 내지 약 200배 향상된, 적어도 약 1.1 내지 약 100배 향상된, 적어도 약 1.1 내지 약 50배 향상된, 적어도 약 1.1 내지 약 40배 향상된, 적어도 약 1.1 내지 약 30배 향상된, 적어도 약 1.1 내지 약 20배 향상된, 적어도 약 1.1 내지 약 10배 향상된, 적어도 약 1.1 내지 약 9배 향상된, 적어도 약 1.1 내지 약 8배 향상된, 적어도 약 1.1 내지 약 7배 향상된, 적어도 약 1.1 내지 약 6배 향상된, 적어도 약 1.1 내지 약 5배 향상된, 적어도 약 1.1 내지 약 4배 향상된, 적어도 약 1.1 내지 약 3배 향상된, 적어도 약 1.1 내지 약 2배 향상된, 적어도 약 1.1 내지 약 1.5배 향상된, 적어도 약 1.5 내지 약 3배 향상된, 적어도 약 1.5 내지 약 4배 향상된, 적어도 약 1.5 내지 약 5배 향상된, 적어도 약 1.5 내지 약 10배 향상된, 적어도 약 5 내지 약 10배 향상된, 적어도 약 10 내지 약 20배 향상된, 적어도 10 내지 약 30배 향상된, 적어도 10 내지 약 50배 향상된, 또는 적어도 10 내지 약 100배 향상된다. 일부 구현예에서, CasX 변이체의 적어도 하나의 향상된 특징은 기준 CasX 단백질에 비해 적어도 약 10 내지 약 1000배 향상된다.
일부 구현예에서, CasX 변이체 단백질의 하나 이상의 향상된 특징은 기준 CasX 단백질에 비해, 적어도 약 5, 적어도 약 10, 적어도 약 20, 적어도 약 30, 적어도 약 40, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 250, 적어도 약 500, 또는 적어도 약 1000, 적어도 약 5,000, 적어도 약 10,000, 또는 적어도 약 100,000배 향상된다. 일부 구현예에서, CasX 변이체 단백질의 향상된 특징은 기준 CasX 단백질에 비해, 적어도 약 1.1, 적어도 약 1.2, 적어도 약 1.3, 적어도 약 1.4, 적어도 약 1.5, 적어도 약 1.6, 적어도 약 1.7, 적어도 약 1.8, 적어도 약 1.9, 적어도 약 2, 적어도 약 2.1, 적어도 약 2.2, 적어도 약 2.3, 적어도 약 2.4, 적어도 약 2.5, 적어도 약 2.6, 적어도 약 2.7, 적어도 약 2.8, 적어도 약 2.9, 적어도 약 3, 적어도 약 3.5, 적어도 약 4, 적어도 약 4.5, 적어도 약 5, 적어도 약 5.5, 적어도 약 6, 적어도 약 6.5, 적어도 약 7.0, 적어도 약 7.5, 적어도 약 8, 적어도 약 8.5, 적어도 약 9, 적어도 약 9.5, 적어도 약 10, 적어도 약 11, 적어도 약 12, 적어도 약 13, 적어도 약 14, 적어도 약 15, 적어도 약 20, 적어도 약 30, 적어도 약 40, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90 적어도 약 100, 적어도 약 500, 적어도 약 1,000, 적어도 약 10,000, 또는 적어도 약 100,000배 향상된다. 다른 경우, CasX 변이체의 하나 이상의 향상된 특징은 SEQ ID NO: 1, SEQ ID NO: 2 또는 SEQ ID NO: 3의 CasX에 비해, 약 1.1 내지 100,00배, 약 1.1 내지 10,00배, 약 1.1 내지 1,000배, 약 1.1 내지 500배, 약 1.1 내지 100배, 약 1.1 내지 50배, 약 1.1 내지 20배, 약 10 내지 100,00배, 약 10 내지 10,00배, 약 10 내지 1,000배, 약 10 내지 500배, 약 10 내지 100배, 약 10 내지 50배, 약 10 내지 20배, 약 2 내지 70배, 약 2 내지 50배, 약 2 내지 30배, 약 2 내지 20배, 약 2 내지 10배, 약 5 내지 50배, 약 5 내지 30배, 약 5 내지 10배, 약 100 내지 100,00배, 약 100 내지 10,00배, 약 100 내지 1,000배, 약 100 내지 500배, 약 500 내지 100,00배, 약 500 내지 10,00배, 약 500 내지 1,000배, 약 500 내지 750배, 약 1,000 내지 100,00배, 약 10,000 내지 100,00배, 약 20 내지 500배, 약 20 내지 250배, 약 20 내지 200배, 약 20 내지 100배, 약 20 내지 50배, 약 50 내지 10,000배, 약 50 내지 1,000배, 약 50 내지 500배, 약 50 내지 200배, 또는 약 50 내지 100배 향상된다. 다른 경우, CasX 변이체의 하나 이상의 향상된 특징은 SEQ ID NO: 1, SEQ ID NO: 2 또는 SEQ ID NO: 3의 CasX에 비해, 약 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 25배, 30배, 40배, 45배, 50배, 55배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 425배, 450배, 475배, 또는 500배 이상 향상된다. 기준 CasX 단백질에서의 동일한 특징에 비해 CasX 변이체에서 향상될 수 있는 예시적인 특징은, 변이체의 향상된 접힘, gNA에의 향상된 결합 친화도, 표적 DNA에의 향상된 결합 친화도, 표적 DNA의 편집 및/또는 결합에서 PAM 서열의 더 큰 스펙트럼을 활용하는 향상된 능력, 표적 DNA의 향상된 풀림, 증가된 활성, 향상된 편집 효율, 향상된 편집 특이성, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 틈새 형성에 대한 저하된 표적 가닥 로딩, 저하된 표적-외 절단, DNA의 비-표적 가닥의 향상된 결합, 향상된 단백질 안정성, 향상된 CasX: gNA RNA 복합체 안정성, 향상된 단백질 용해도, 향상된 CasX: gNA RNP 복합체 용해도, gNA와 함께 절단-적격(cleavage-competent) RNP를 형성하는 향상된 능력, 향상된 단백질 수율, 향상된 단백질 발현, 및 향상된 융합 특징을 포함하지만 이들로 제한되지는 않는다. 일부 구현예에서, 변이체는 적어도 하나의 향상된 특징을 포함한다. 다른 구현예에서, 변이체는 적어도 2개의 향상된 특징을 포함한다. 추가의 구현예에서, 변이체는 적어도 3개의 향상된 특징을 포함한다. 일부 구현예에서, 변이체는 적어도 4개의 향상된 특징을 포함한다. 더욱 추가의 구현예에서, 변이체는 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13개 이상의 향상된 특징을 포함한다.
예시적인 향상된 특징은 일례로, 향상된 편집 효율을 포함한다. 일부 구현예에서, 20 pM 이하의 농도에서 개시내용의 CasX 단백질과 gNA를 포함하는 RNP는 이중 가닥 DNA 표적을 적어도 80%의 효율로 절단할 수 있다. 일부 구현예에서, 20 pM 이하의 농도에서 RNP는 이중 가닥 DNA 표적을 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%의 효율로 절단할 수 있다. 일부 구현예에서, 50 pM 이하, 40 pM 이하, 30 pM 이하, 20 pM 이하, 10 pM 이하, 또는 5 pM 이하의 농도에서 RNP는 이중 가닥 DNA 표적을 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%의 효율로 절단할 수 있다.
이들 향상된 특징은 아래에서 더욱 상세히 기재된다.
j. 단백질 안정성
일부 구현예에서, 개시내용은 기준 CasX 단백질에 비해 향상된 안정성을 갖는 CasX 변이체 단백질을 제공한다. 일부 구현예에서, CasX 변이체 단백질의 향상된 안정성은 단백질의 더 높은 정상 상태(steady state)의 발현을 이끌며, 이는 편집 효율을 향상시킨다. 일부 구현예에서, CasX 변이체 단백질의 향상된 안정성은, 기능적 입체배좌(conformation)로 접힌 채로 유지되는 CasX 단백질의 더 큰 분획을 생성하고, 편집 효율을 향상시키거나 제조 목적을 위해 정제성을 향상시킨다. 본원에 사용된 바와 같이, "기능적 입체배좌"는, 단백질이 gNA 및 표적 DNA에 결합할 수 있는 입체배좌로 존재하는 CasX 단백질을 지칭한다. CasX 변이체가 이를 촉매적 사멸이 되게 하는 하나 이상의 돌연변이를 보유하지 않는 구현예에서, CasX 변이체는 표적 DNA를 절단하거나, 틈새 형성시키거나, 그렇지 않다면 변형시킬 수 있다. 예를 들어, 기능적 CasX 변이체는 일부 구현예에서, 유전자-편집에 사용될 수 있으며, 기능적 입체배좌는 "편집-적격" 입체배좌를 지칭한다. CasX 변이체 단백질이, 기능적 입체배좌로 접힌 채로 유지되는 CasX 단백질의 더 큰 분획을 생성하는 이들 구현예를 포함하여 일부 예시적인 구현예에서, 기준 CasX 단백질과 비교하여 더 낮은 농도의 CasX 변이체가 유전자 편집과 같은 적용에 필요하다. 그러므로, 일부 구현예에서, 향상된 안정성을 갖는 CasX 변이체는 하나 이상의 유전자 편집 맥락에서 기준 CasX와 비교하여 효율을 갖는다.
일부 구현예에서, 개시내용은 기준 CasX 단백질에 비해 향상된 열안정성을 갖는 CasX 변이체 단백질을 제공한다. 일부 구현예에서, CasX 변이체 단백질은 특정 온도 범위에서 CasX 변이체 단백질의 향상된 열안정성을 갖는다. 임의의 이론으로 결부시키고자 하는 것은 아니지만, 일부 기준 CasX 단백질은 본래 지하수 및 침전물에 틈새(niche)를 갖는 유기체에서 작용하며; 그러므로, 일부 기준 CasX 단백질은 소정의 적용에 바람직할 수 있는 더 낮은 또는 더 높은 온도에서 최적의 기능을 나타내도록 진화하였을 수 있다. 예를 들어, CasX 변이체 단백질의 하나의 적용은 포유류 세포의 유전자 편집이며, 이는 전형적으로 약 37℃에서 수행된다. 일부 구현예에서, 본원에 기재된 바와 같이 CasX 변이체 단백질은 적어도 16℃, 적어도 18℃, 적어도 20℃, 적어도 22℃, 적어도 24℃, 적어도 26℃, 적어도 28℃, 적어도 30℃, 적어도 32℃, 적어도 34℃, 적어도 35℃, 적어도 36℃, 적어도 37℃, 적어도 38℃, 적어도 39℃, 적어도 40℃, 적어도 41℃, 적어도 42℃, 적어도 44℃, 적어도 46℃, 적어도 48℃, 적어도 50℃, 적어도 52℃ 이상의 온도에서 기준 CasX 단백질과 비교하여 향상된 열안정성을 갖는다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질과 비교하여 향상된 열안정성 및 기능성을 가지며, 이는 인간 유전자 편집 적용을 포함할 수 있는 포유류 유전자 편집 적용과 같은 향상된 유전자 편집 기능성을 이끈다.
일부 구현예에서, 개시내용은, RNP가 기능성 형태로 유지되도록 기준 CasX 단백질:gNA 복합체에 비해 CasX 변이체 단백질:gNA 복합체의 향상된 안정성을 갖는 CasX 변이체 단백질을 제공한다. 안정성 향상은 증가된 열안정성, 단백용해적 분해에 대한 내성, 증강된 약물동력학적 특성, pH 조건 범위에 걸친 안정성, 염 조건, 및 장성(tonicity)을 포함할 수 있다. 복합체의 향상된 안정성은 일부 구현예에서, 향상된 편집 효율을 유발할 수 있다. 일부 구현예에서, CasX 변이체와 gNA 변이체의 RNP는 SEQ ID NO: 1-3의 기준 CasX와 표 1의 SEQ ID NO: 4-16 중 임의의 하나의 gNA의 RNP와 비교하여 적어도 5%, 적어도 10%, 적어도 15%, 또는 적어도 20%, 또는 적어도 5-20% 더 높은 백분율의 절단-적격(competent) RNP를 갖는다.
일부 구현예에서, 개시내용은 기준 CasX 단백질:gNA 복합체에 비해 CasX 변이체 단백질:gNA 복합체의 향상된 열안정성을 갖는 CasX 변이체 단백질을 제공한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 향상된 열안정성을 갖는다. 일부 구현예에서, CasX 변이체 단백질:gNA 복합체는 적어도 16℃, 적어도 18℃, 적어도 20℃, 적어도 22℃, 적어도 24℃, 적어도 26℃, 적어도 28℃, 적어도 30℃, 적어도 32℃, 적어도 34℃, 적어도 35℃, 적어도 36℃, 적어도 37℃, 적어도 38℃, 적어도 39℃, 적어도 40℃, 적어도 41℃, 적어도 42℃, 적어도 44℃, 적어도 46℃, 적어도 48℃, 적어도 50℃, 적어도 52℃ 이상의 온도에서 기준 CasX 단백질을 포함하는 복합체에 비해 향상된 열안정성을 갖는다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질:gNA 복합체와 비교하여 CasX 변이체 단백질:gNA 복합체의 향상된 열안정성을 가지며, 이는 인간 유전자 편집 적용을 포함할 수 있는 포유류 유전자 편집 적용과 같은 유전자 편집 적용에 대해 향상된 기능을 이끈다.
일부 구현예에서, CasX 변이체 단백질의 향상된 안정성 및/또는 열안정성은 기준 CasX 단백질에 비해 CasX 변이체 단백질의 더 신속한 접힘 동역학, 기준 CasX 단백질에 비해 CasX 변이체 단백질의 더 느린 풀림 동역학, 기준 CasX 단백질에 비해 CasX 변이체 단백질의 접힘 시 더 큰 자유 에너지 방출, 기준 CasX 단백질에 비해 CasX 변이체 단백질의 50%가 폴리는 더 높은 온도(Tm), 또는 이들의 임의의 조합을 포함한다. 이들 특징은 광범위한 값만큼 향상될 수 있으며; 예를 들어, 기준 CasX 단백질과 비교하여 적어도 1.1, 적어도 1.5, 적어도 10, 적어도 50, 적어도 100, 적어도 500, 적어도 1,000, 적어도 5,000, 또는 적어도 10,000배 향상될 수 있다. 일부 구현예에서, CasX 변이체 단백질의 향상된 열안정성은 기준 CasX 단백질에 비해 CasX 변이체 단백질의 더 높은 Tm을 포함한다. 일부 구현예에서, CasX 변이체 단백질의 Tm은 약 20℃ 내지 약 30℃, 약 30℃ 내지 약 40℃, 약 40℃ 내지 약 50℃, 약 50℃ 내지 약 60℃, 약 60℃ 내지 약 70℃, 약 70℃ 내지 약 80℃, 약 80℃ 내지 약 90℃ 또는 약 90℃ 내지 약 100℃이다. 열안정성은 "용융 온도"(Tm)를 측정함으로써 결정되며, 이는 분자 중 절반이 변성되는 온도로서 정의된다. 단백질 안정성의 특징, 예컨대 Tm 및 풀림의 자유 에너지를 측정하는 방법은 당업자에게 알려져 있고, 시험관에서 표준 생화학적 기법을 사용하여 측정될 수 있다. 예를 들어, Tm은, 시료 및 기준의 온도를 증가시키는 데 필요한 열의 양의 차이가 온도의 함수로서 측정되는 열분석 기법인 시차 주사 열량계를 사용하여 측정될 수 있다(문헌[Chen 등 (2003) Pharm Res 20:1952-60]; 문헌[Ghirlando 등 (1999) Immunol Lett 68:47-52]). 대안적으로, 또는 이에 더하여, CasX 변이체 단백질 Tm은 ThermoFisher 단백질 열이동 시스템과 같은 상업적으로 입수 가능한 방법을 사용하여 측정될 수 있다. 대안적으로, 또는 이에 더하여, 원편광 이색성(circular dichroism)은 접힘 및 풀림의 동역학, 뿐만 아니라 Tm을 측정하는 데 사용될 수 있다(문헌[Murray 등 (2002) J. Chromatogr Sci 40:343-9]). 원편광 이색성(CD)은 단백질과 같이 비대칭 분자에 의한 좌선성 및 우선성 원형 편광(circularly polarized light)의 동일하지 않은 흡수에 의존한다. 단백질의 소정의 구조, 예를 들어 알파-나선 및 베타-시트는 특징적인 CD 스펙트럼을 갖는다. 이에, 일부 구현예에서, CD는 CasX 변이체 단백질의 2차 구조를 결정하는 데 사용될 수 있다.
일부 구현예에서, CasX 변이체 단백질의 향상된 안정성 및/또는 열안정성은 기준 CasX 단백질에 비해 CasX 변이체 단백질의 향상된 접힘 동역학을 포함한다. 일부 구현예에서, CasX 변이체 단백질의 접힘 동역학은 기준 CasX 단백질에 비해, 적어도 약 5, 적어도 약 10, 적어도 약 50, 적어도 약 100, 적어도 약 500, 적어도 약 1,000, 적어도 약 2,000, 적어도 약 3,000, 적어도 약 4,000, 적어도 약 5,000, 또는 적어도 약 10,000배만큼의 향상이다. 일부 구현예에서, CasX 변이체 단백질의 접힘 동역학은 기준 CasX 단백질에 비해, 적어도 약 1 kJ/mol, 적어도 약 5 kJ/mol, 적어도 약 10 kJ/mol, 적어도 약 20 kJ/mol, 적어도 약 30 kJ/mol, 적어도 약 40 kJ/mol, 적어도 약 50 kJ/mol, 적어도 약 60 kJ/mol, 적어도 약 70 kJ/mol, 적어도 약 80 kJ/mol, 적어도 약 90 kJ/mol, 적어도 약 100 kJ/mol, 적어도 약 150 kJ/mol, 적어도 약 200 kJ/mol, 적어도 약 250 kJ/mol, 적어도 약 300 kJ/mol, 적어도 약 350 kJ/mol, 적어도 약 400 kJ/mol, 적어도 약 450 kJ/mol, 또는 적어도 약 500 kJ/mol만큼 향상된다.
기준 CasX 단백질에 비해 CasX 변이체 단백질의 안정성을 증가시킬 수 있는 예시적인 아미노산 변화는, CasX 변이체 단백질 내에서 수소 결합의 수를 증가시키는 아미노산 변화, CasX 변이체 단백질 내에서 이황화 브릿지의 수를 증가시키는 아미노산 변화, CasX 변이체 단백질 내에서 염 브릿지의 수를 증가시키는 아미노산 변화, CasX 변이체 단백질의 파트 사이에서의 상호작용을 강화시키는 아미노산 변화, CasX 변이체 단백질의 포매된(buried) 소수성 표면적을 증가시키는 아미노산 변화, 또는 이들의 임의의 조합을 포함할 수 있지만 이들로 제한되지는 않는다.
k. 단백질 수율
일부 구현예에서, 개시내용은 기준 CasX 단백질에 비해 발현 및 정제 동안 향상된 수율을 갖는 CasX 변이체 단백질을 제공한다. 일부 구현예에서, 박테리아 또는 진핵생물 숙주 세포로부터 정제된 CasX 변이체 단백질의 수율은 기준 CasX 단백질에 비해 향상된다. 일부 구현예에서, 박테리아 숙주 세포는 에스케리키아 콜라이 세포이다. 일부 구현예에서, 진핵생물 세포는 효모, 식물(예를 들어, 담배), 곤충(예를 들어, 스포돕테라 프루기페르다(spodoptera frugiperda) sf9 세포), 마우스, 래트, 햄스터, 기니피그, 원숭이, 또는 인간 세포이다. 일부 구현예에서, 진핵생물 숙주 세포는 인간 배아 신장 293(HEK293) 세포, 새끼 햄스터 신장(BHK) 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, NIH3T3 세포, COS, HeLa, 또는 차이니즈 햄스터 난소(CHO) 세포를 포함하지만 이들로 제한되지 않는 포유류 세포이다.
일부 구현예에서, CasX 변이체 단백질의 향상된 수율은 코돈 최적화를 통해 달성된다. 세포는 64개의 상이한 코돈을 사용하며, 이 중 61개는 20개의 표준 아미노산을 인코딩하는 한편, 또 다른 3개는 정지 코돈으로서 작용한다. 일부 경우, 단일 아미노산은 하나 초과의 코돈에 의해 인코딩된다. 상이한 유기체는 동일한 천연 발생 아미노산에 대해 상이한 코돈의 사용으로의 편향(bias)을 나타낸다. 따라서, 단백질에서 코돈의 선택, 및 단백질이 발현될 유기체에의 코돈 선택의 매칭은 일부 경우, 단백질 발현, 따라서 단백질 발현 수준에 유의하게 영향을 미칠 수 있다. 일부 구현예에서, CasX 변이체 단백질은 코돈 최적화되었던 핵산에 의해 인코딩된다. 일부 구현예에서, CasX 변이체 단백질을 인코딩하는 핵산은 박테리아 세포, 효모 세포, 곤충 세포, 식물 세포, 또는 포유류 세포에서 발현을 위해 코돈 최적화되었다. 일부 구현예에서, 포유류 세포는 마우스, 래트, 햄스터, 기니피그, 원숭이, 또는 인간이다. 일부 구현예에서, CasX 변이체 단백질은 인간 세포에서 발현을 위해 코돈 최적화되었던 핵산에 의해 인코딩된다. 일부 구현예에서, CasX 변이체 단백질은, 원핵생물 및 진핵생물에서 번역 속도를 감소시키는 뉴클레오타이드 서열이 제거되었던 핵산에 의해 인코딩된다. 예를 들어, 연속해서 3개 초과의 티미딘 잔기의 전개(run)는 소정의 유기체에서 번역 속도를 감소시킬 수 있거나, 내부 폴리아데닐화 신호는 번역을 감소시킬 수 있다.
일부 구현예에서, 본원에 기재된 바와 같이, 용해도 및 안정성에서의 향상은 기준 CasX 단백질에 비해 CasX 변이체 단백질의 향상된 수율을 이끈다.
발현 및 정제 동안 향상된 단백질 수율은 당업계에 알려진 방법에 의해 평가될 수 있다. 예를 들어, CasX 변이체 단백질의 양은 단백질을 SDS-page 겔 상에서 전개시키고, 양 또는 농도가 미리 알려져 있는 대조군과 CasX 변이체 단백질을 비교하여 단백질의 절대 수준을 결정함으로써 결정될 수 있다. 대안적으로, 또는 이에 더하여, 정제된 CasX 변이체 단백질은 동일한 정제 과정을 받는 기준 CasX 단백질 다음에 SDS-page 겔 상에서 전개되어, CasX 변이체 단백질 수율에서 상대 향상을 결정할 수 있다. 대안적으로, 또는 이에 더하여, 단백질의 수준은 면역조직학적 방법, 예컨대 CasX에 대한 항체를 이용하는 웨스턴 블롯 또는 ELISA를 사용하여, 또는 HPLC에 의해 측정될 수 있다. 용액 중 단백질에 대해, 농도는 단백질의 내재성 UV 흡광도의 측정에 의해, 또는 단백질-의존적 색상 변화를 사용하는 방법, 예컨대 로리(Lowry) 검정, 스미스(Smith) 구리/비시초닌(bicinchoninic) 검정 또는 브래드포드 염료 검정에 의해 결정될 수 있다. 이러한 방법은 소정의 조건 하에 발현에 의해 수득되는 총 단백질(예를 들어, 총 가용성 단백질) 수율을 계산하는 데 사용될 수 있다. 이는 예를 들어, 유사한 발현 조건 하에 기준 CasX 단백질의 단백질 수율과 비교될 수 있다.
l. 단백질 용해도
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 향상된 용해도를 갖는다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질을 포함하는 리보핵단백질 복합체에 비해, CasX:gNA 리보핵단백질 복합체 변이체의 향상된 용해도를 갖는다.
일부 구현예에서, 단백질 용해도에서의 향상은 이. 콜라이로부터의 정제와 같은 단백질 정제 기법으로부터 단백질의 더 높은 수율을 유발한다. CasX 변이체 단백질의 향상된 용해도는 일부 구현예에서, 세포에서 더 효율적인 활성을 가능하게 할 수 있는데, 더 가용성인 단백질은 세포에서 응집되는 경향이 더 낮을 수 있기 때문이다. 단백질 응집물은 소정의 구현예에서 세포에 독성이거나 부담이 될 수 있으며, 임의의 이론으로 결부시키고자 하는 것은 아니지만, CasX 변이체 단백질의 증가된 용해도는 단백질 응집의 이러한 결과를 호전시킬 수 있다. 나아가, CasX 변이체 단백질의 향상된 용해도는 예를 들어 요망되는 유전자 편집 적용에서 더 높은 유효 용량의 기능성 단백질의 전달을 허용하는 증강된 제형을 가능하게 할 수 있다. 일부 구현예에서, 기준 CasX 단백질에 비해 CasX 변이체 단백질의 향상된 용해도는 정제 동안 CasX 변이체 단백질의 향상된 수율을 적어도 약 5, 적어도 약 10, 적어도 약 20, 적어도 약 30, 적어도 약 40, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 250, 적어도 약 500, 또는 적어도 약 1000배 더 큰 수율로 이끈다. 일부 구현예에서, 기준 CasX 단백질에 비해 CasX 변이체 단백질의 향상된 용해도는 세포에서 CasX 변이체 단백질의 활성을 적어도 약 1.1, 적어도 약 1.2, 적어도 약 1.3, 적어도 약 1.4, 적어도 약 1.5, 적어도 약 1.6, 적어도 약 1.7, 적어도 약 1.8, 적어도 약 1.9, 적어도 약 2, 적어도 약 2.1, 적어도 약 2.2, 적어도 약 2.3, 적어도 약 2.4, 적어도 약 2.5, 적어도 약 2.6, 적어도 약 2.7, 적어도 약 2.8, 적어도 약 2.9, 적어도 약 3, 적어도 약 3.5, 적어도 약 4, 적어도 약 4.5, 적어도 약 5, 적어도 약 5.5, 적어도 약 6, 적어도 약 6.5, 적어도 약 7.0, 적어도 약 7.5, 적어도 약 8, 적어도 약 8.5, 적어도 약 9, 적어도 약 9.5, 적어도 약 10, 적어도 약 11, 적어도 약 12, 적어도 약 13, 적어도 약 14, 또는 적어도 약 15배 더 큰 활성만큼 향상시킨다.
CasX 단백질 용해도, 및 CasX 변이체 단백질에서 이의 향상을 측정하는 방법은 당업자에게 쉽게 명백할 것이다. 예를 들어, CasX 변이체 단백질 용해도는 일부 구현예에서, 용해된 이. 콜라이의 가용성 분획의 겔 상에서 밀도측정법 판독물에 의해 측정될 수 있다. 대안적으로, 또는 이에 더하여, CasX 변이체 단백질 용해도에서의 향상은 전체 단백질 정제의 과정을 통해 가용성 단백질 생성물의 유지를 측정함으로써 측정될 수 있다. 예를 들어, 가용성 단백질 생성물은 겔 친화도 정제, 태그 절단, 양이온 교환 정제, 사이징(sizing) 컬럼 상에서의 단백질의 전개 중 하나 이상의 단계에서 측정될 수 있다. 일부 구현예에서, 겔 상에서 단백질의 모든 밴드의 밀도측정법은 정제 과정에서 각각의 단계 후에 판독된다. 향상된 용해도를 갖는 CasX 변이체 단백질은 일부 구현예에서, 기준 CasX 단백질과 비교할 때 단백질 정제 과정 중 하나 이상의 단계에서 더 높은 농도를 유지시킬 수 있는 한편, 불용성 단백질 변이체는 완충제 교환, 여과 단계, 정제 컬럼과의 상호작용 등으로 인해 하나 이상의 단계에서 소실될 수 있다.
일부 구현예에서, CasX 변이체 단백질의 용해도를 향상시키는 것은 기준 CasX 단백질과 비교할 때 단백질 정제 동안 단백질의 mg/L의 측면에서 더 높은 수율을 이끈다.
일부 구현예에서, CasX 변이체 단백질의 용해도를 향상시키는 것은 본원에 기재된 EGFP 방해 검정과 같은 편집 검정에서 평가될 때 덜 가용성인 단백질과 비교하여 더 많은 양의 편집 사건을 가능하게 한다.
m. gNA에 대한 단백질 친화도
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 gNA에 대해 향상된 친화도를 가지며, 이는 리보핵단백질 복합체의 형성을 유발한다. gNA에 대한 CasX 변이체 단백질의 증가된 친화도는 예를 들어, RNP 복합체의 생성에 대해 더 낮은 Kd를 이끌 수 있으며, 이는 일부 경우, 더 안정한 리보핵단백질 복합체 형성을 이끌 수 있다. 일부 구현예에서, gNA에 대한 CasX 변이체 단백질의 증가된 친화도는, 인간 세포에게 전달될 때 리보핵단백질 복합체의 증가된 안정성을 이끈다. 이러한 증가된 안정성은 대상체의 세포에서 복합체의 기능 및 유용성에 영향을 미칠 수 있을 뿐만 아니라, 대상체에게 전달될 때 혈액에서 향상된 약물동력학적 특성을 이끌 수 있다. 일부 구현예에서, CasX 변이체 단백질의 증가된 친화도, 및 리보핵단백질 복합체의 결과적인 증가된 안정성은, 요망되는 활성, 예를 들어 생체내 또는 시험관내 유전자 편집을 여전히 가지면서도 더 낮은 용량의 CasX 변이체 단백질이 대상체 또는 세포에게 전달되는 것을 가능하게 한다.
일부 구현예에서, gNA에 대한 CasX 변이체 단백질의 더 높은 친화도(더 밀접한 결합)는, CasX 변이체 단백질과 gNA가 둘 다 RNP 복합체에서 유지될 때 더 많은 양의 편집 사건을 가능하게 한다. 증가된 편집 사건은 본원에 기재된 EGFP 방해 및 검정과 같은 편집 검정을 사용하여 평가될 수 있다.
일부 구현예에서, gNA에 대한 CasX 변이체 단백질의 Kd는 기준 CasX 단백질에 비해, 적어도 약 1.1, 적어도 약 1.2, 적어도 약 1.3, 적어도 약 1.4, 적어도 약 1.5, 적어도 약 1.6, 적어도 약 1.7, 적어도 약 1.8, 적어도 약 1.9, 적어도 약 2, 적어도 약 3, 적어도 약 4, 적어도 약 5, 적어도 약 6, 적어도 약 7, 적어도 약 8, 적어도 약 9, 적어도 약 10, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 또는 적어도 약 100배만큼 증가된다. 일부 구현예에서, CasX 변이체는 SEQ ID NO: 2의 기준 CasX 단백질과 비교하여 gNA에 대해 약 1.1 내지 약 10배 증가된 결합 친화도를 갖는다.
이론으로 결부시키고자 하는 것은 아니지만, 일부 구현예에서, 나선형 I 도메인에서의 아미노산 변화는 gNA 표적화 서열과의 CasX 변이체 단백질의 결합 친화도를 증가시킬 수 있는 한편, 나선형 II 도메인에서의 변화는 gNA 스캐폴드 스템 루프와 CasX 변이체 단백질과의 결합 친화도를 증가시킬 수 있고, 올리고뉴클레오타이드 결합 도메인(OBD)에서의 변화는 gRNA 트리플렉스와 CasX 변이체 단백질의 결합 친화도를 증가시킨다.
gNA에 대한 CasX 단백질 결합 친화도를 측정하는 방법은 정제된 CasX 단백질 및 gNA를 사용하는 시험관내 방법을 포함한다. 기준 CasX 및 변이체 단백질에 대한 결합 친화도는, gNA 또는 CasX 단백질이 형광단으로 태깅된다면 형광 편광에 의해 측정될 수 있다. 대안적으로, 또는 이에 더하여, 결합 친화도는 생체층 간섭측정법(biolayer interferometry), 전기영동 이동성 변화 검정(EMSA), 또는 필터 결합에 의해 측정될 수 있다. 특정 gNA, 예컨대 기준 gNA 및 이의 변이체에 대한 RNA 결합 단백질, 예컨대 개시내용의 기준 CasX 및 변이체 단백질의 절대 친화도를 정량화하기 위한 추가의 표준 기법은 등온 열량분석(ITC), 및 표면 플라즈몬 공명(SPR), 뿐만 아니라 실시예의 방법을 포함하지만 이들로 제한되지는 않는다.
n. 표적 DNA에 대한 친화도
일부 구현예에서, CasX 변이체 단백질은 표적 핵산에 대한 기준 CasX 단백질의 친화도에 비해 표적 핵산 서열에 대한 향상된 결합 친화도를 갖는다. 일부 구현예에서, 표적 핵산에 대한 향상된 친화도는 표적 핵산 서열에 대한 향상된 친화도, PAM 서열에 대한 향상된 친화도, 표적 핵산 서열에 대한 DNA를 검색하는 향상된 능력, 또는 이들의 임의의 조합을 포함한다. 이론으로 결부시키고자 하는 것은 아니지만, CRISPR/Cas 시스템 단백질, 예컨대 CasX는 DNA 분자를 따라 1차원적 확산에 의해 이의 표적 핵산 서열을 찾을 수 있는 것으로 생각된다. 그 과정은 (1) DNA 분자에의 리보핵단백질의 결합, 뒤이어 (2) 표적 핵산 서열에서의 스톨링(stalling)을 포함하며, 이들 중 어느 하나는 일부 구현예에서, 표적 핵산 서열에 대한 CasX 단백질의 향상된 친화도에 의해 영향을 받아, 기준 CasX 단백질과 비교하여 CasX 변이체 단백질의 기능을 향상시킬 수 있다.
일부 구현예에서, 향상된 표적 핵산 친화도를 갖는 CasX 변이체 단백질은 DNA에 대한 증가된 전체 친화도를 갖는다. 일부 구현예에서, 향상된 표적 핵산 친화도를 갖는 CasX 변이체 단백질은, TTC, ATC, GTC, 및 CTC로 이루어진 군으로부터 선택되는 PAM 서열에 대한 결합 친화도를 포함하여 SEQ ID NO: 2의 기준 CasX 단백질에 의해 인식되는 캐노니컬 TTC PAM 이외의 특정 PAM 서열에 대해 증가된 친화도를 갖는다. 이론으로 결부시키고자 하는 것은 아니지만, 이들 단백질은 DNA와 전반적으로 더 강하게 상호작용할 것이고, 야생형 Cas X를 능가하여 추가 PAM 서열에 결합하는 능력으로 인해 표적 DNA 내에서 서열에 접근하고 이를 편집하는 증가된 능력을 가질 것이어서, 표적 서열에 대한 CasX 단백질의 더 효율적인 검색 과정을 할 수 있게 하는 것이 가능하다. 일부 구현예에서, DNA에 대한 더 높은 전체 친화도는 또한, CasX 단백질이 결합 및 풀림 단계를 효과적으로 시작하고 종료하여, 표적 가닥 침범 및 R-루프 형성, 그리고 궁극적으로 표적 핵산 서열의 절단을 용이하게 할 수 있는 빈도를 증가시킬 수 있다.
이론으로 결부시키고자 하는 것은 아니지만, 풀린 상태에서 비-표적 DNA 가닥의 풀림 또는 포착의 효율을 증가시키는 NTSBD에서의 아미노산 변화는 표적 DNA에 대한 CasX 변이체 단백질의 친화도를 증가시킬 수 있는 것이 가능하다. 대안적으로, 또는 이에 더하여, 풀림 동안 DNA를 안정화시키는 NTSBD의 능력을 증가시키는 NTSBD에서의 아미노산 변화는 표적 DNA에 대한 CasX 변이체 단백질의 친화도를 증가시킬 수 있다. 대안적으로, 또는 이에 더하여, OBD에서의 아미노산 변화는 프로토스페이서 인접 모티프(PAM)에의 CasX 변이체 단백질 결합의 친화도를 증가시켜, 표적 핵산에 대한 CasX 변이체 단백질의 친화도를 증가시킬 수 있다. 대안적으로, 또는 이에 더하여, 표적 핵산 가닥에 대한 CasX 변이체 단백질의 친화도를 증가시키는 나선형 I 및/또는 나선형 II, RuvC 및 TSL 도메인에서의 아미노산 변화는, 표적 핵산에 대한 CasX 변이체 단백질의 친화도를 증가시킬 수 있다.
일부 구현예에서, CasX 변이체 단백질은 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 단백질과 비교하여 표적 핵산 서열에 대해 증가된 결합 친화도를 갖는다. 일부 구현예에서, 표적 핵산 분자에 대한 개시내용의 CasX 변이체 단백질의 친화도는 기준 CasX 단백질에 비해, 적어도 약 1.1, 적어도 약 1.2, 적어도 약 1.3, 적어도 약 1.4, 적어도 약 1.5, 적어도 약 1.6, 적어도 약 1.7, 적어도 약 1.8, 적어도 약 1.9, 적어도 약 2, 적어도 약 3, 적어도 약 4, 적어도 약 5, 적어도 약 6, 적어도 약 7, 적어도 약 8, 적어도 약 9, 적어도 약 10, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 또는 적어도 약 100배만큼 증가된다.
일부 구현예에서, CasX 변이체 단백질은 표적 핵산의 비-표적 가닥에 대한 향상된 결합 친화도를 갖는다. 본원에 사용된 바와 같이, 용어 "비-표적 가닥"은, gNA에서의 표적화 서열과 왓슨 및 크릭 염기쌍을 형성하지 않는 DNA 표적 핵산 서열의 가닥을 지칭하고, 표적 가닥에 상보적이다.
표적 핵산 분자에 대한 CasX 단백질(예컨대 기준 또는 변이체) 친화도를 측정하는 방법은 전기영동 이동성 변화 검정(EMSA), 필터 결합, 등온 열량분석(ITC), 및 표면 플라즈몬 공명(SPR), 형광 편광(fluorescence polarization) 및 생체층 간섭측정법(BLI)을 포함할 수 있다. 표적에 대한 CasX 단백질 친화도를 측정하는 추가 방법은 시간 경과에 걸쳐 DNA 절단 사건을 측정하는 시험관내 생화학적 검정을 포함한다.
일부 구현예에서, 표적 핵산에 대해 더 높은 친화도를 갖는 CasX 변이체 단백질은, 표적 핵산에 대해 증가된 친화도를 갖지 않는 기준 CasX 단백질보다 표적 핵산 서열을 더 신속하게 절단할 수 있다.
일부 구현예에서, CasX 변이체 단백질을 촉매적으로 사멸(dead)이다(dCasX). 일부 구현예에서, 개시내용은 표적 DNA에 결합하는 능력을 유지하는 촉매적-사멸 CasX 단백질을 포함하는 RNP를 제공한다. 예시적인 촉매적-사멸 CasX 변이체 단백질은 CasX 단백질의 RuvC 도메인의 활성 부위에 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 촉매적-사멸 CasX 변이체 단백질은 SEQ ID NO: 1의 잔기 672, 769 및/또는 935에서 치환을 포함한다. 일부 구현예에서, 촉매적-사멸 CasX 변이체 단백질은 SEQ ID NO: 1의 기준 CasX 단백질에서 D672A, E769A 및/또는 D935A의 치환을 포함한다. 일부 구현예에서, 촉매적-사멸 CasX 단백질은 SEQ ID NO: 2의 아미노산 659, 765 및/또는 922에서 치환을 포함한다. 일부 구현예에서, 촉매적-사멸 CasX 단백질은 SEQ ID NO: 2의 기준 CasX 단백질에서 D659A, E756A 및/또는 D922A 치환을 포함한다. 추가 구현예에서, 촉매적-사멸 CasX 변이체 단백질은 기준 CasX 단백질의 RuvC 도메인의 모두 또는 파트에 결실을 포함한다.
일부 구현예에서, CasX 변이체 단백질의 DNA에 대한 향상된 친화도는 또한, CasX 변이체 단백질의 촉매 활성이 없는 버전의 기능을 향상시킨다. 일부 구현예에서, CasX 변이체 단백질의 촉매 활성이 없는 버전은 RuvC의 DED 모티프에 하나 이상의 돌연변이를 포함한다. 촉매적 사멸 CasX 변이체 단백질은 일부 구현예에서, 염기 편집 또는 유전자외적 변형에 사용될 수 있다. DNA에 대한 더 높은 친화도와 함께, 일부 구현예에서, 촉매적 사멸 CasX 변이체 단백질은 촉매적 활성 CasX에 비해, 이의 표적 DNA를 더 신속하게 찾거나, 표적 DNA에 더 오랫동안 결합된 채로 유지되거나, 표적 DNA에 더 안정한 방식으로 결합하거나, 이들의 조합을 수행하여, 촉매적 사멸 CasX 변이체 단백질의 기능을 향상시킬 수 있다.
o. 표적 부위에 대한 개선된 특이성
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 표적 DNA 서열에 대한 향상된 특이성을 갖는다. 본원에 사용된 바와 같이, 이따금 "표적 특이성"으로 지칭되는 "특이성"은, CRISPR/Cas 시스템 리보핵단백질 복합체가, 표적 DNA 서열과 유사하지만 동일하지 않은 표적-외 서열을 절단하는 정도를 지칭하며; 예를 들어, 더 높은 특이성 정도를 갖는 CasX 변이체 RNP는 기준 CasX 단백질에 비해 서열의 감소된 표적-외 절단을 나타낼 것이다. CRISPR/Cas 시스템 단백질의 특이성, 및 잠재적으로 유해한 표적-외 효과의 감소는 포유류 대상체에서의 사용을 위해 허용 가능한 치료적 지수(index)를 달성하기 위해 매우 중요할 수 있다.
일부 구현예에서, CasX 변이체 단백질은, gNA의 표적화 서열에 상보적인 표적 서열 내의 표적 부위에 대한 향상된 특이성을 갖는다.
이론으로 결부시키고자 하는 것은 아니지만, 표적 DNA 가닥에 대한 CasX 변이체 단백질의 특이성을 증가시키는 나선형 I 및 II 도메인에서의 아미노산 변화는, 표적 DNA 전반에 대한 CasX 변이체 단백질의 특이성을 증가시킬 수 있는 것이 가능하다. 일부 구현예에서, 표적 DNA에 대한 CasX 변이체 단백질의 특이성을 증가시키는 아미노산 변화는 또한, DNA에 대한 CasX 변이체 단백질의 저하된 친화도를 이끌 수 있다.
CasX 단백질(예컨대 변이체 또는 기준) 표적 특이성을 시험하는 방법은 가이드 및 시퀀싱에 의한 절단 효과의 시험관내 보고를 위한 원형화(CIRCLE-seq: Circularization for In vitro Reporting of Cleavage Effects by Sequencing), 또는 유사한 방법을 포함할 수 있다. 간략하게는, CIRCLE-seq 기법에서, 게놈 DNA는 전단(shear)되고 스템-루프 어댑터의 리게이션에 의해 원형화되며, 이는 스템-루프 영역에서 틈새 형성되어 4개의 뉴클레오타이드 회문형 오버행(palindromic overhang)을 노출시킨다. 이후에, 잔여의 선형 DNA의 분자내 리게이션 및 분해가 이어진다. CasX 절단 부위를 함유하는 원형 DNA 분자는 후속적으로, CasX로 선형화되고, 어댑터 어댑터는 노출된 단부에 리게이션되며, 뒤이어 고-처리량 시퀀싱이 수행되어, 표적-외 부위에 대한 정보를 함유하는 쌍형성된 단부 판독물이 생성된다. 표적-외 사건, 따라서 CasX 단백질 특이성을 검출하는 데 사용될 수 있는 추가 검정은, 선택된 표적-외 부위에서 형성되는 인델(삽입 및 결실)을 검출하고 정량화하는 데 사용되는 검정, 예컨대 미스매치-검출 뉴클레아제 검정 및 차세대 시퀀싱(NGS)을 포함한다. 예시적인 미스매치-검출 검정은, CasX 및 sgNA로 처리된 세포로부터의 게놈 DNA가 PCR 증폭되며, 변성되고 재혼성화되어, 하나의 야생형 가닥 및 인델을 갖는 하나의 가닥을 함유하는 헤테로-듀플렉스 DNA를 형성하는 뉴클레아제 검정을 포함한다. 미스매치는 미스매치 검출 뉴클레아제, 예컨대 서베이어(Surveyor) 뉴클레아제 또는 T7 엔도뉴클레아제 I에 의해 인식되고 절단된다.
p. DNA의 풀림
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해, DNA를 풀리게 하는 향상된 능력을 갖는다. 일부 구현예에서, CasX 변이체 단백질은 증강된 DNA 풀림 특징을 갖는다. 불량한 dsDNA 풀림은 이전에, DNA를 절단하는 CRISPR/Cas 시스템 단백질 anaCas9 또는 Cas14s의 능력을 손상시키거나 방지하는 것으로 나타났다. 따라서, 임의의 이론으로 결부시키고자 하는 것은 아니지만, 일부 CasX 변이체 단백질에 의한 증가된 DNA 절단 활성은 적어도 부분적으로, 표적 부위에서 dsDNA를 찾고 풀리게 하는 증가된 능력으로 인한 것으로 생각된다.
이론으로 결부시키고자 하는 것은 아니지만, NTSB 도메인에서의 아미노산 변화는 증가된 DNA 풀림 특징을 갖는 CasX 변이체 단백질을 생성할 수 있는 것으로 생각된다. 대안적으로, 또는 이에 더하여, OBD, 또는 PAM과 상호작용하는 나선형 도메인 영역 에서의 아미노산 변화는 또한, 증가된 DNA 풀림 특징을 갖는 CasX 변이체 단백질을 생성할 수 있다.
DNA를 풀리게 하는 CasX 단백질(예컨대 변이체 또는 기준)의 능력을 측정하는 방법은, 형광 편광 또는 생체층 간섭측정법에서 dsDNA 표적의 증가된 온 레이트(on rate)를 관찰하는 시험관내 검정을 포함하지만 이로 제한되지는 않는다.
q. 촉매적 활성
본원에 개시된 CasX:gNA 시스템의 리보핵단백질 복합체는, 표적 핵산 서열에 결합하고 표적 핵산 서열을 절단하는 기준 CasX 단백질 또는 이의 변이체를 포함한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질에 비해 향상된 촉매적 활성을 갖는다. 이론으로 결부시키고자 하는 것은 아니지만, 일부 경우 표적 가닥의 절단은 dsDNA 절단부를 생성하는 데 있어서 Cas12-유사 분자에 대한 제한 인자일 수 있는 것으로 생각된다. 일부 구현예에서, CasX 변이체 단백질은 이 DNA의 표적 가닥의 굽힘(bending) 및 이 가닥의 절단을 향상시켜, CasX 리보핵단백질 복합체에 의한 dsDNA 절단의 전체 효율에서 향상을 이끈다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질과 비교하여 증가된 뉴클레아제 활성을 갖는다. 증가된 뉴클레아제 활성을 갖는 변이체는 예를 들어, RuvC 뉴클레아제 도메인에서 아미노산 변화를 통해 생성될 수 있다. 일 구현예에서, CasX 변이체는 닉카제(nickase) 활성을 갖는 뉴클레아제 도메인을 포함한다. 전술한 구현예에서, CasX:gNA 시스템의 CasX 닉카제는 비-표적 가닥에서 PAM 부위의 10-18개 뉴클레오타이드 3' 내에서 단일 가닥 절단부를 생성한다. 또 다른 구현예에서, CasX 변이체는 이중 가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함한다. 전술한 구현예에서, CasX:gNA 시스템의 CasX는 표적 가닥 상의 PAM 부위의 18-26개 뉴클레오타이드 5' 및 비-표적 가닥 상에서 10-18개 뉴클레오타이드 3' 내에서 이중 가닥 절단부를 생성한다. 뉴클레아제 활성은 실시예의 방법을 포함한 여러 가지 방법에 의해 검정될 수 있다. 일 구현예에서, CasX 변이체는 기준 야생형 CasX와 비교하여, 적어도 2배, 또는 적어도 3배, 또는 적어도 4배, 또는 적어도 5배, 또는 적어도 6배, 또는 적어도 7배, 또는 적어도 8배, 또는 적어도 9배, 또는 적어도 10배 더 큰 K절단 상수를 갖는다.
일부 구현예에서, CasX 변이체 단백질은 이중 가닥 절단에 대한 증가된 표적 가닥 로딩을 갖는다. 증가된 표적 가닥 로딩 활성을 갖는 변이체는 예를 들어, TLS 도메인에서 아미노산 변화를 통해 생성될 수 있다.
이론으로 결부시키고자 하는 것은 아니지만, TSL 도메인에서의 아미노산 변화는 향상된 촉매적 특징을 갖는 CasX 변이체 단백질을 이끌 수 있다. 대안적으로, 또는 이에 더하여, RNA:DNA 듀플렉스에 대한 결합 채널 주변에서의 아미노산 변화는 또한, CasX 변이체 단백질의 촉매적 활성을 향상시킬 수 있다.
일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질과 비교하여 증가된 부수적인 절단 활성을 갖는다. 본원에 사용된 바와 같이, "부수적인 절단 활성"은 표적 핵산 서열의 인식 및 절단 후 핵산의 추가적인, 비-표적화된 절단을 지칭한다. 일부 구현예에서, CasX 변이체 단백질은 기준 CasX 단백질과 비교하여 저하된 부수적인 절단 활성을 갖는다.
일부 구현예, 예를 들어 표적 DNA 절단이 요망되는 성과가 아닌 적용을 포괄하는 구현예에서, CasX 변이체 단백질의 촉매적 활성을 향상시키는 것은 CasX 변이체 단백질의 촉매적 활성을 변경시키거나, 감소시키거나, 무효화시키는 것을 포함한다. 일부 구현예에서, CasX 변이체 단백질을 포함하는 리보핵단백질 복합체는 표적 DNA에 결합하고, 표적 DNA를 절단하지는 않는다.
일부 구현예에서, CasX 변이체 단백질을 포함하는 CasX 리보핵단백질 복합체는 표적 DNA에 결합하지만 표적 DNA에서 단일 가닥 틈새를 생성하지 않는다. 일부 구현예, 특히 CasX 단백질이 닉카제인 이들 구현예에서, CasX 변이체 단백질은 단일 가닥 틈새 형성에 대해 저하된 표적 가닥 로딩을 갖는다. 저하된 표적 가닥 로딩을 갖는 변이체는 예를 들어, TSL 도메인에서 아미노산 변화를 통해 생성될 수 있다.
CasX 단백질의 촉매적 활성을 특징화하는 예시적인 방법은 시험관내 절단 검정을 포함할 수 있지만 이들로 제한되지는 않는다. 일부 구현예에서, 아가로스 겔 상에서의 DNA 생성물의 전기영동은 가닥 절단의 동역학을 조사할 수 있다.
r. 표적 DNA 및 RNA에 대한 친화도
일부 구현예에서, 기준 CasX 단백질 또는 이의 변이체를 포함하는 리보핵단백질 복합체는 표적 DNA에 결합하고 표적 DNA를 절단한다. 일부 구현예에서, 기준 CasX 단백질의 변이체는, 기준 CasX 단백질과 비교할 때 표적 RNA에 대한 CasX 변이체 단백질의 특이성을 증가시키고, 표적 RNA에 대한 CasX 변이체 단백질의 활성을 증가시킨다. 예를 들어, CasX 변이체 단백질은, 기준 CasX 단백질과 비교할 때, 표적 RNA에 대한 증가된 결합 친화도, 또는 표적 RNA의 증가된 절단을 나타낼 수 있다. 일부 구현예에서, CasX 변이체 단백질을 포함하는 리보핵단백질 복합체는 표적 RNA에 결합하고/거나 표적 RNA를 절단한다. 일 구현예에서, CasX 변이체는 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 단백질과 비교하여 표적 핵산 서열에 대해 적어도 약 2배 내지 약 10배 증가된 결합 친화도를 갖는다.
s. 돌연변이의 조합
일부 구현예에서, 본 개시내용은 별개의 CasX 변이체 단백질로부터의 돌연변이의 조합인 변이체를 제공한다. 일부 구현예에서, 본원에 기재된 임의의 도메인에 대한 임의의 변이체는 본원에 기재된 다른 변이체와 조합될 수 있다. 일부 구현예에서, 본원에 기재된 임의의 도메인 내의 임의의 변이체는 동일한 도메인에서 본원에 기재된 다른 변이체와 조합될 수 있다. 상이한 아미노산 변화의 조합은 일부 구현예에서 새로운 최적화된 변이체를 생성할 수 있으며, 이의 기능은 아미노산 변화의 조합에 의해 더 향상된다. 일부 구현예에서, CasX 단백질 기능에 미치는 아미노산 변화의 조합의 효과는 선형이다. 본원에 사용된 바와 같이, 선형인 조합은, 기능에 미치는 효과가, 단리물에서 검정될 때 각각의 개별적인 아미노산 변화의 효과의 합계와 동일한 조합을 지칭한다. 일부 구현예에서, CasX 단백질 기능에 미치는 아미노산 변화의 조합의 효과는 상승작용적이다. 본원에 사용된 바와 같이, 상승작용적인 변이체의 조합은, 기능에 미치는 효과가, 단리물에서 검정될 때 각각의 개별적인 아미노산 변화의 효과의 합계보다 더 큰 조합을 지칭한다. 일부 구현예에서, 아미노산 변화를 조합하는 것은, CasX 단백질의 하나 초과의 기능이 기준 CasX 단백질에 비해 향상된 CasX 변이체 단백질을 생성한다.
t. CasX 융합 단백질
일부 구현예에서, 개시내용은 CasX에 융합된 이종성 단백질을 포함하는 CasX 단백질을 제공한다. 일부 경우, CasX는 기준 CasX 단백질이다. 다른 경우, CasX는 본원에 기재된 임의의 구현예의 CasX 변이체이다.
일부 구현예에서, CasX 변이체 단백질은 상이한 관심 활성을 갖는 하나 이상의 단백질 또는 이의 도메인에 융합된다(즉, 융합 단백질의 일부가 됨). 예를 들어, 일부 구현예에서, CasX 변이체 단백질은, 전사를 저해하거나, 표적 핵산 서열을 변형시키거나, 핵산과 회합된 폴리펩타이드를 변형시키는(예를 들어, 히스톤 변형) 단백질(또는 이의 도메인)에 융합된다.
일부 구현예에서, 이종성 폴리펩타이드(또는 이종성 아미노산, 예컨대 시스테인 잔기 또는 비-천연 아미노산)는 CasX 단백질 내의 하나 이상의 위치에 삽입되어, CasX 융합 단백질을 생성할 수 있다. 다른 구현예에서, 시스테인 잔기는 CasX 단백질 내의 하나 이상의 위치에 삽입되고, 뒤이어 아래 기재된 이종성 폴리펩타이드의 접합이 수행될 수 있다. 일부 대안적인 구현예에서, 이종성 폴리펩타이드 또는 이종성 아미노산은 기준 또는 CasX 변이체 단백질의 N- 또는 C-말단에 첨가될 수 있다. 다른 구현예에서, 이종성 폴리펩타이드 또는 이종성 아미노산은 CasX 단백질의 서열 내에 내부적으로 삽입될 수 있다.
일부 구현예에서, 기준 CasX 또는 변이체 융합 단백질은 표적 핵산 결합 및 절단 활성에 특이적인 RNA-가이드 서열을 유지한다. 일부 경우, 기준 CasX 또는 변이체 융합 단백질은, 기준 CasX 또는 이종성 단백질의 삽입을 갖지 않는 상응하는 변이체 단백질의 활성(예를 들어, 절단 및/또는 결합 활성)의 50% 이상을 갖는다(유지함). 일부 경우, 기준 CasX 또는 변이체 융합 단백질은, 이종성 단백질의 삽입을 갖지 않는 상응하는 CasX 단백질의 활성(예를 들어, 절단 및/또는 결합 활성)의 적어도 약 60%, 또는 적어도 약 70% 이상, 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 92%, 또는 적어도 약 95%, 또는 적어도 약 98%, 또는 적어도 약 100%를 유지한다.
일부 경우, 기준 CasX 또는 변이체 융합 폴리펩타이드는, 삽입된 이종성 아미노산 또는 이종성 폴리펩타이드가 없는 CasX 단백질의 활성에 비해 표적 핵산 결합 활성을 유지한다(가짐). 예를 들어, 일부 경우, 기준 CasX 또는 변이체 융합 폴리펩타이드는, 상응하는 CasX 단백질(삽입을 갖지 않는 CasX 단백질)의 결합 활성의 50% 이상을 갖는다(유지함). 예를 들어, 일부 경우, 기준 CasX 또는 변이체 융합 폴리펩타이드는, 상응하는 모(parent) CasX 단백질(삽입을 갖지 않는 CasX 단백질)의 결합 활성의 60% 이상(70% 이상, 80% 이상, 90% 이상, 92% 이상, 95% 이상, 98% 이상, 또는 100%)을 갖는다(유지함).
일부 경우, 기준 CasX 또는 변이체 융합 폴리펩타이드는, 삽입된 이종성 아미노산 또는 이종성 폴리펩타이드가 없는 모 CasX 단백질의 활성에 비해 표적 핵산 결합 및/또는 절단 활성을 유지한다(가짐). 예를 들어, 일부 경우, 기준 CasX 또는 변이체 융합 폴리펩타이드는, 상응하는 모 CasX 단백질(삽입을 갖지 않는 CasX 단백질)의 결합 및/또는 절단 활성의 50% 이상을 갖는다(유지함). 예를 들어, 일부 경우, 기준 CasX 또는 변이체 융합 폴리펩타이드는, 상응하는 CasX 모 단백질(삽입을 갖지 않는 CasX 단백질)의 결합 및/또는 절단 활성의 60% 이상(70% 이상, 80% 이상, 90% 이상, 92% 이상, 95% 이상, 98% 이상, 또는 100%)을 갖는다(유지함). CasX 단백질 및/또는 CasX 융합 폴리펩타이드의 절단 및/또는 결합 활성을 측정하는 방법은 당업자에게 알려져 있을 것이며, 임의의 편리한 방법이 사용될 수 있다.
여러 가지 이종성 폴리펩타이드는 개시내용의 기준 CasX 또는 CasX 변이체 융합 단백질에 포함시키기에 적합하다. 일부 경우, 융합 파트너는 표적 DNA의 전사를 조정(예를 들어, 전사를 저해, 전사를 증가)할 수 있다. 예를 들어 일부 경우, 융합 파트너는, 전사를 저해하는 단백질(또는 단백질로부터의 도메인)(예를 들어, 전사 억제자, 전사 저해자 단백질의 동원, 표적 DNA의 변형, 예컨대 메틸화, DNA 변형제의 동원, 표적 DNA와 회합된 히스톤의 조정, 히스톤 변형제, 예컨대 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 히스톤 변형제의 동원 등을 통해 작용하는 단백질)이다. 일부 경우, 융합 파트너는, 전사를 증가시키는 단백질(또는 단백질로부터의 도메인)(예를 들어, 전사 활성자, 전사 활성자 단백질의 동원, 표적 DNA의 변형, 예컨대 메틸화, DNA 변형제의 동원, 표적 DNA와 회합된 히스톤의 조정, 히스톤 변형제, 예컨대 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 히스톤 변형제의 동원 등을 통해 작용하는 단백질)이다.
일부 경우, 융합 파트너는, 표적 핵산 서열을 변형시키는 효소적 활성(예를 들어, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 수선 활성, DNA 손상 활성, 탈아민화 활성, 디스뮤타제(dismutase) 활성, 알킬화 활성, 탈퓨린화(depurination) 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제(integrase) 활성, 트랜스포자제 활성, 리컴비나제(recombinase) 활성, 폴리머라제 활성, 리가제(ligase) 활성, 헬리카제 활성, 포톨리아제(photolyase) 활성 또는 글리코실라제 활성)을 갖는다.
일부 경우, 융합 파트너는, 표적 핵산과 회합된 폴리펩타이드(예를 들어, 히스톤)를 변형시키는 효소적 활성(예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제(deacetylase) 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화(SUMOylating) 활성, 탈SUMO일화(deSUMOylating) 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성)을 갖는다.
전사를 증가시키기 위해 융합 파트너로서 사용될 수 있는 단백질(또는 이의 단편)의 예는: 전사 활성자, 예컨대 VP16, VP64, VP48, VP160, p65 하위도메인(예를 들어, NFkB로부터의 것), 및 EDLL의 활성화 도메인 및/또는 TAL 활성화 도메인(예를 들어, 식물에서의 활성을 위해); 히스톤 리신 메틸트랜스퍼라제, 예컨대 SET 도메인 함유 1A, 히스톤 리신 메틸트랜스퍼라제(SET1A), SET 도메인 함유 1B, 히스톤 리신 메틸트랜스퍼라제(SET1B), 리신 메틸트랜스퍼라제 2A(MLL1 내지 5), ASCL1(ASH1) 아캐트-스큐트(achaete-scute) 계열 bHLH 전사 인자 1(ASH1), SET 및 MYND 도메인 함유 2(SYMD2), 핵 수용체 결합 SET 도메인 단백질 1(NSD1) 등; 히스톤 리신 데메틸라제, 예컨대 리신 데메틸라제 3A(JHDM2a)/ 리신-특이적 데메틸라제 3B(JHDM2b), 리신 데메틸라제 6A(UTX), 리신 데메틸라제 6B(JMJD3) 등; 히스톤 아세틸트랜스퍼라제, 예컨대 리신 아세틸트랜스퍼라제 2A(GCN5), 리신 아세틸트랜스퍼라제 2B(PCAF), CREB 결합 단백질(CBP), E1A 결합 단백질 p300(p300), TATA-박스 결합 단백질 회합된 인자 1(TAF1), 리신 아세틸트랜스퍼라제 5(TIP60/PLIP), 리신 아세틸트랜스퍼라제 6A(MOZ/MYST3), 리신 아세틸트랜스퍼라제 6B(MORF/MYST4), SRC 프로토-종양유전자, 비-수용체 티로신 키나제(SRC1), 핵 수용체 공동활성자 3(ACTR), MYB 결합 단백질 1a(P160), 시계 생물학적 조절자(CLOCK: clock circadian regulator) 등; 및 DNA 데메틸라제, 예컨대 10-11 전좌(TET) 디옥시게나제 1(TET1CD), tet 메틸시토신 디옥시게나제 1(TET1), 데메테르(DME: demeter), 데메테르-유사 1(DML1), 데메테르-유사 2(DML2), 단백질 ROS1(ROS1) 등을 포함하지만 이들로 제한되지는 않는다.
전사를 저하시키기 위해 융합 파트너로서 사용될 수 있는 단백질(또는 이의 단편)은: 전사 억제자, 예컨대 크루펠(Kruppel) 회합된 박스(KRAB 또는 SKD); KOX1 억제 도메인; Mad mSIN3 상호작용 도메인(SID); ERF 억제자 도메인(ERD), SRDX 억제 도메인(예를 들어, 식물에서의 억제를 위해) 등; 히스톤 리신 메틸트랜스퍼라제, 예컨대 PR/SET 도메인 함유 단백질(Pr-SET7/8), 리신 메틸트랜스퍼라제 5B(SUV4- 20H1), PR/SET 도메인 2(RIZ1) 등; 히스톤 리신 데메틸라제, 예컨대 리신 데메틸라제 4A(JMJD2A/JHDM3A), 리신 데메틸라제 4B(JMJD2B), 리신 데메틸라제 4C(JMJD2C/GASC1), 리신 데메틸라제 4D(JMJD2D), 리신 데메틸라제 5A(JARID1A/RBP2), 리신 데메틸라제 5B(JARID1B/PLU-1), 리신 데메틸라제 5C(JARID 1C/SMCX), 리신 데메틸라제 5D(JARID1D/SMCY) 등; 히스톤 리신 데아세틸라제(deacetylase), 예컨대 히스톤 데아세틸라제 1(HDAC1), HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, 시르투인 1(SIRT1: sirtuin 1), SIRT2, HDAC11 등; DNA 메틸라제, 예컨대 HhaI DNA m5c-메틸트랜스퍼라제(M.HhaI), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), 메틸트랜스퍼라제 1(MET1), S-아데노실-L-메티오닌-의존적 메틸트랜스퍼라제 슈퍼계열 단백질(DRM3)(식물), DNA 시토신 메틸트랜스퍼라제 MET2a(ZMET2), 크로모메틸라제(chromomethylase) 1(CMT1), 크로모메틸라제 2(CMT2)(식물) 등; 및 말초 동원 요소, 예컨대 라민 A, 라민 B 등을 포함하지만 이들로 제한되지는 않는다.
일부 경우, 융합 파트너는, 표적 핵산 서열(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성의 예는: 뉴클레아제 활성, 예컨대 제한 효소(예를 들어, FokI 뉴클레아제)에 의해 제공되는 것, 메틸트랜스퍼라제 활성, 예컨대 메틸트랜스퍼라제(예를 들어, Hhal DNA m5c-메틸트랜스퍼라제(M.Hhal), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), METI, DRM3(식물), ZMET2, CMT1, CMT2(식물), 등)에 의해 제공되는 것; 데메틸라제 활성, 예컨대 데메틸라제(예를 들어, 10-11 전좌(TET: Ten-Eleven Translocation) 디옥시게나제(dioxygenase) 1(TET 1 CD), TET1, DME, DML1, DML2, ROS1 등)에 의해 제공되는 것, DNA 수선 활성, DNA 손상 활성, 탈아민화 활성, 예컨대 데아미나제(deaminase)(예를 들어, 시토신 데아미나제 효소, 예를 들어, APOBEC 단백질, 예컨대 래트 APOBECl)에 의해 제공되는 것, 디스뮤타제(dismutase) 활성, 알킬화 활성, 탈퓨린화(depurination) 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 예컨대 인테그라제 및/또는 리졸바제(resolvase)(예를 들어, Gin 인버타제(invertase), 예컨대 Gin 인버타제의 과활동성(hyperactive) 돌연변이체, GinH106Y; 인간 면역결핍 바이러스 유형 1 인테그라제(IN); Tn3 리졸바제 등)에 의해 제공되는 것, 트랜스포자제 활성, 리컴비나제 활성, 예컨대 리컴비나제(예를 들어, Gin 리컴비나제의 촉매적 도메인)에 의해 제공되는 것, 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 포톨리아제 활성, 및 글리코실라제 활성)을 포함하지만 이들로 제한되지는 않는다.
일부 경우, 본 개시내용의 기준 CasX 또는 Cas X 변이체 단백질은: 전사를 증가시키기 위한 도메인(예를 들어, VP16 도메인, VP64 도메인), 전사를 저하시키기 위한 도메인(예를 들어, Kox1 단백질로부터의 예를 들어, KRAB 도메인), 히스톤 아세틸트랜스퍼라제(예를 들어, 히스톤 아세틸트랜스퍼라제 p300)의 코어 촉매적 도메인, 검출 가능한 신호를 제공하는 단백질/도메인(예를 들어, 형광 단백질, 예컨대 GFP), 뉴클레아제 도메인(예를 들어, Fokl 뉴클레아제), 및 염기 편집자(예를 들어, 시티딘 데아미나제, 예컨대 APOBEC1)로부터 선택되는 폴리펩타이드에 융합된다.
일부 경우, 융합 파트너는, 표적 핵산 서열(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)과 회합된 단백질(예를 들어, 히스톤, RNA 결합 단백질, DNA 결합 단백질 등)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성(표적 핵산과 회합된 단백질을 변형시킴)의 예는: 메틸트랜스퍼라제 활성, 예컨대 히스톤 메틸트랜스퍼라제(HMT)에 의해 제공되는 것(예를 들어, 잡색(variegation) 3-9 상동체 1의 억제자(SUV39H1, KMT1A로도 알려져 있음), 진정 염색질 히스톤 리신 메틸트랜스퍼라제 2(G9A, KMT1C 및 EHMT2로도 알려져 있음), SUV39H2, ESET/SETDB 1 등, SET1A, SET1B, MLL1 내지 5, ASH1, SYMD2, NSD1, DOT1L, Pr-SET7/8, SUV4-20H1, EZH2, RIZ1), 데메틸라제 활성, 예컨대 히스톤 데메틸라제에 의해 제공되는 것(예를 들어, 리신 데메틸라제 1A(LSD1로도 알려져 있는 KDM1A), JHDM2a/b, JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, JARID1A/RBP2, JARID1B/PLU-1, JARID1C/SMCX, JARID1D/SMCY, UTX, JMJD3 등), 아세틸트랜스퍼라제 활성, 예컨대 히스톤 아세틸라제 트랜스퍼라제에 의해 제공되는 것(예를 들어, 인간 아세틸트랜스퍼라제 p300, GCN5, PCAF, CBP, TAF1, TIP60/PLIP, MOZ/MYST3, MORF/MYST4, HB01/MYST2, HMOF/MYST1, SRC1, ACTR, P160, CLOCK 등의 촉매적 코어/단편), 데아세틸라제 활성, 예컨대 히스톤 데아세틸라제에 의해 제공되는 것(예를 들어, HDAC1, HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, SIRT1, SIRT2, HDAC11 등), 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 및 탈미리스토일화 활성을 포함하지만 이들로 제한되지는 않는다.
적합한 융합 파트너의 추가 예는 (i) 화학적으로 제어 가능한 대상체 RNA-가이드 폴리펩타이드 또는 조건적으로 활성인 RNA-가이드 폴리펩타이드를 생성하기 위해 디하이드로폴레이트 리덕타제(DHFR) 탈안정화 도메인, 및 (ii) 엽록체 수송 펩타이드(chloroplast transit peptide)이다.
적합한 엽록체 수송 펩타이드는: MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGR VKCMQVWPPIGKKKFETLSYLPPLTRDSRA(SEQ ID NO: 144); MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(SEQ ID NO: 145); MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQV WPPIEKKKFETLSYLPDLTDSGGRVNC(SEQ ID NO: 146); MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC(SEQ ID NO: 147); MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC(SEQ ID NO: 148); MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLF CSFRISASVATAC(SEQ ID NO: 149); MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPH RFDRRCLSMVV(SEQ ID NO: 150); MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQ QRSVQRGSRRFPSVVVC(SEQ ID NO: 151); MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(SEQ ID NO: 152); MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVIS RSAAAA(SEQ ID NO: 153); 및 MGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(SEQ ID NO: 154)를 포함하지만 이로 제한되지 않는다.
일부 경우, 본 개시내용의 기준 CasX 또는 변이체 폴리펩타이드는 엔도솜 탈출 펩타이드(endosomal escape peptide)를 포함할 수 있다. 일부 경우, 엔도솜 탈출 폴리펩타이드는 아미노산 서열 GLFXALLXLLXSLWXLLLXA(SEQ ID NO: 155)를 포함하며, 여기서 각각의 X는 독립적으로, 리신, 히스티딘, 및 아르기닌으로부터 선택된다. 일부 경우, 엔도솜 탈출 폴리펩타이드는 아미노산 서열 GLFHALLHLLHSLWHLLLHA(SEQ ID NO: 156), 또는 HHHHHHHHH(SEQ ID NO: 157)를 포함한다.
ssRNA 표적 핵산 서열을 표적화할 때 사용하기 위한 융합 파트너의 비제한적인 예는: 스플라이싱 인자(예를 들어, RS 도메인); 단백질 번역 구성요소(예를 들어, 번역 개시, 신장, 및/또는 방출 인자; 예를 들어, eIF4G); RNA 메틸라제; RNA 편집 효소(예를 들어, RNA 데아미나제, 예를 들어, A 내지 I 및/또는 C 내지 U 편집 효소를 포함하여 RNA에 작용하는 아데노신 데아미나제(ADAR)); 헬리카제; RNA-결합 단백질; 등을 포함하지만 이들로 제한되지는 않는다. 이종성 폴리펩타이드는 전체 단백질을 포함할 수 있거나, 일부 경우 단백질의 단편(예를 들어, 기능성 도메인)을 포함할 수 있다.
융합 파트너는, 일시적으로 또는 비가역적으로, 직접적으로 또는 간접적으로이든지 간에, 하기를 포함하는 군으로부터 선택되는 이펙터 도메인을 포함하지만 이들로 제한되지 않는 ssRNA와 상호작용할 수 있는 임의의 도메인(본 개시내용의 목적을 위해 분자내 및/또는 분자간 2차 구조, 예를 들어, 이중 가닥 RNA 듀플렉스, 예컨대 헤어핀, 스템-루프 등을 포함함)일 수 있다; 엔도뉴클레아제(예를 들어 RNase III, CRR22 DYW 도메인, 다이서(Dicer), 및 단백질, 예컨대 SMG5 및 SMG6으로부터의 PIN(PilT N-말단) 도메인); RNA 절단을 자극시키는 것을 담당하는 단백질 및 단백질 도메인(예를 들어 CPSF, CstF, CFIm 및 CFIIm); 엑소뉴클레아제(예를 들어 XRN-1 또는 엑소뉴클레아제 T); 탈아데닐라제(deadenylase)(예를 들어 HNT3); 넌센스 매개 RNA 붕괴(decay)를 담당하는 단백질 및 단백질 도메인(예를 들어 UPF1, UPF2, UPF3, UPF3b, RNP SI, Y14, DEK, REF2, 및 SRm160); RNA를 안정화시키는 것을 담당하는 단백질 및 단백질 도메인(예를 들어 PABP); 번역을 억제시키는 것을 담당하는 단백질 및 단백질 도메인(예를 들어 Ago2 및 Ago4); 번역을 자극시키는 것을 담당하는 단백질 및 단백질 도메인(예를 들어 스타우펜(Staufen)); 번역을 조정하는 것을 담당하는(예를 들어, 조정할 수 있는) 단백질 및 단백질 도메인(예를 들어, 번역 인자, 예컨대 개시 인자, 신장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 담당하는 단백질 및 단백질 도메인(예를 들어 PAP1, GLD-2, 및 Star- PAP); RNA의 폴리우리딘화(polyuridinylation)를 담당하는 단백질 및 단백질 도메인(예를 들어 CI D1 및 말단 우리딜레이트 트랜스퍼라제); RNA 위치를 담당하는 단백질 및 단백질 도메인 (예를 들어 IMP1, ZBP1, She2p, She3p, 및 비카우달(Bicaudal)-D); RNA의 핵 체류를 담당하는 단백질 및 단백질 도메인(예를 들어 Rrp6); RNA의 핵 외수송을 담당하는 단백질 및 단백질 도메인(예를 들어 TAP, NXF1, THO, TREX, REF, 및 Aly); RNA 스플라이싱의 억제를 담당하는 단백질 및 단백질 도메인(예를 들어 PTB, Sam68, 및 hnRNP A1); RNA 스플라이싱의 자극을 담당하는 단백질 및 단백질 도메인 (예를 들어 세린/아르기닌-풍부 (SR) 도메인); 전사의 효율을 감소시키는 것을 담당하는 단백질 및 단백질 도메인(예를 들어 FUS (TLS)); 및 전사를 자극시키는 것을 담당하는 단백질 및 단백질 도메인 (예를 들어 CDK7 및 HIV Tat). 대안적으로, 이펙터 도메인은, 엔도뉴클레아제; RNA 절단을 자극시킬 수 있는 단백질 및 단백질 도메인; 엑소뉴클레아제; 데아데닐라제; 넌센스 매개 RNA 붕괴 활성을 갖는 단백질 및 단백질 도메인; RNA를 안정화시킬 수 있는 단백질 및 단백질 도메인; 번역을 억제시킬 수 있는 단백질 및 단백질 도메인; 번역을 자극시킬 수 있는 단백질 및 단백질 도메인; 번역을 조정할 수 있는 단백질 및 단백질 도메인(예를 들어, 번역 인자, 예컨대 개시 인자, 신장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 가능하게 할 수 있는 단백질 및 단백질 도메인; RNA의 폴리우리딘화를 가능하게 할 수 있는 단백질 및 단백질 도메인; RNA 위치 활성을 갖는 단백질 및 단백질 도메인; RNA의 핵 체류를 가능하게 할 수 있는 단백질 및 단백질 도메인; RNA 핵 외수송 활성을 갖는 단백질 및 단백질 도메인; RNA 스플라이싱의 억제를 가능하게 할 수 있는 단백질 및 단백질 도메인; RNA 스플라이싱의 자극을 가능하게 할 수 있는 단백질 및 단백질 도메인; 전사의 효율을 감소시킬 수 있는 단백질 및 단백질 도메인; 및 전사를 자극시킬 수 있는 단백질 및 단백질 도메인을 포함하는 군으로부터 선택될 수 있다. 또 다른 적합한 이종성 폴리펩타이드는 PUF RNA-결합 도메인이며, 이는 국제공개 WO2012068627호에 더 상세히 기재되어 있으며, 이는 그 전문이 본원에 참조로서 포함된다.
융합 파트너로서 사용될 수 있는(전체적으로 또는 이의 단편으로서) 일부 RNA 스플라이싱 인자는 별도의 서열-특이적 RNA 결합 모듈 및 스플라이싱 이펙터 도메인과 함께 모듈형 구조를 갖는다. 예를 들어, 세린/아르기닌-풍부(SR) 단백질 계열의 구성원은, pre-mRNA 내 엑손 스플라이싱 인핸서(ESE)에 결합하는 N-말단 RNA 인식 모티프(RRM) 및 엑손 포함을 촉진하는 C-말단 RS 도메인을 함유한다. 또 다른 예로서, hnRNP 단백질 hnRNP Al은 이의 RRM 도메인을 통해 엑손 스플라이싱 사일런서(ESS)에 결합하고, C-말단 글리신-풍부 도메인을 통해 엑손 포함을 저해한다. 일부 스플라이싱 인자는 2개의 대안적인 부위 사이에서 조절 서열에 결합함으로써 스플라이스 부위(ss)의 대안적으로 사용을 조절할 수 있다. 예를 들어, ASF/SF2는 ESE를 인식하고 인트론 근접 부위의 사용을 촉진할 수 있는 반면, hnRNP Al은 ESS에 결합하고 인트론 원위 부위의 사용을 향해 스플라이싱을 이동시킬 수 있다. 이러한 인자에 대한 하나의 적용은, 내인성 유전자, 특히 질환 관련 유전자의 대안적인 스플라이싱을 조절하는 ESF를 생성하는 것이다. 예를 들어, Bcl-x pre-mRNA는 반대 기능의 단백질을 인코딩하기 위해 2개의 대안적인 5' 스플라이스 부위를 갖는 2개의 스플라이싱 이소형(isoform)을 생성한다. 긴 스플라이싱 이소형 Bcl-xL은 장수형(long-lived) 유사분열-후(post mitotic) 세포에서 발현되는 강력한 세포자멸사 저해제이고, 많은 암세포에서 상향조절되어, 세포자멸사 신호로부터 세포를 보호한다. 짧은 이소형 Bcl-xS는 전세포자멸사(pro-apoptotic) 이소형이고, 높은 교체율(turnover rate)을 갖는 세포(예를 들어, 발달중인 림프구)에서 높은 수준으로 발현된다. 2개의 Bcl-x 스플라이싱 이소형의 비(ratio)는, 코어 엑손 영역 또는 엑손 신장 영역에(즉, 2개의 대안적인 5' 스플라이스 부위 사이에) 위치하는 다수의 cc-요소에 의해 조절된다. 더 많은 예에 대해서는 국제공개 WO2010075303호를 참조하며, 이는 그 전문이 본원에 참조로서 포함된다.
추가의 적합한 융합 파트너는, 경계 요소(예를 들어, CTCF)인 단백질(또는 이의 단편), 말초 동원을 제공하는 단백질 및 이의 단편(예를 들어, 라민 A, 라민 B 등), 단백질 도킹 요소(docking element)(예를 들어, FKBP/FRB, Pill/Abyl 등)를 포함하지만 이들로 제한되지는 않는다.
일부 경우, 이종성 폴리펩타이드(융합 파트너)는 하위세포 위치를 제공하며, 즉, 이종성 폴리펩타이드는, 핵으로 표적화하기 위한 하위세포 위치 서열(예를 들어, 핵 위치 신호(NLS), 융합 단백질을 핵 밖에서 유지시키기 위한 서열, 예를 들어, 핵 외수송 서열(NES), 융합 단백질을 세포질에서 유지되게 유지시키기 위한 서열, 미토콘드리아로 표적화하기 위한 미토콘드리아 위치 신호, 엽록체로 표적화하기 위한 엽록체 위치 신호, ER 체류 신호 등)을 함유한다. 일부 구현예에서, RNA-가이드 폴리펩타이드 또는 조건적으로 활성인 RNA-가이드 폴리펩타이드 및/또는 대상체 CasX 융합 폴리펩타이드는 NLS를 포함하지 않으며, 따라서 단백질은 핵으로 표적화되지 않는다(예를 들어, 표적 핵산 서열이 세포기질에 존재하는 RNA일 때, 이는 유리할 수 있음). 일부 구현예에서, 융합 파트너는 추적 및/또는 정제의 용이성을 위한 태그(즉, 이종성 폴리펩타이드는 검출 가능한 표지임)(예를 들어, 형광 단백질, 예를 들어, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 청록색 형광 단백질(CFP), mCherry, tdTomato 등; 히스티딘 태그, 예를 들어, 6XHis 태그; 헤마글루티닌(HA) 태그; FLAG 태그; Myc 태그 등)를 제공할 수 있다.
일부 경우, 기준 또는 CasX 변이체 폴리펩타이드는 핵 위치 신호(NLS)(예를 들어, 일부 경우 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상 6개 이상, 7개 이상, 8개 이상의 NLS)를 포함한다(이에 융합됨). 그러므로 일부 경우, 기준 또는 CasX 변이체 폴리펩타이드는 하나 이상의 NLS(예를 들어, 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)를 포함한다. 일부 경우, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단 및/또는 C-말단에 또는 그 부근에(예를 들어, 50개 아미노산 내에) 위치한다. 일부 경우, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단에 또는 그 부근에(예를 들어, 50개 아미노산 내에) 위치한다. 일부 경우, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 C-말단에 또는 그 부근에(예를 들어, 50개 아미노산 내에) 위치한다. 일부 경우, 하나 이상의 NLS(3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단과 C-말단 둘 다에 또는 그 부근에(예를 들어, 50개 아미노산 내에) 위치한다. 일부 경우, NLS는 N-말단에 위치하고, NLS는 C-말단에 위치한다. 일부 경우, 기준 또는 CasX 변이체 폴리펩타이드는 1 내지 10개의 NLS(예를 들어, 1-9, 1-8, 1-7, 1-6, 1-5, 2-10, 2-9, 2-8, 2-7, 2- 6, 또는 2-5개의 NLS)를 포함한다(이에 융합됨). 일부 경우, 기준 또는 CasX 변이체 폴리펩타이드는 2 내지 5개의 NLS(예를 들어, 2-4, 또는 2-3개의 NLS)를 포함한다(이에 융합됨).
NLS의 비제한적인 예는: 아미노산 서열 PKKKRKV(SEQ ID NO: 158)를 갖는 SV40 바이러스 거대 T-항원의 NLS; 핵플라스민으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(SEQ ID NO: 159)를 갖는 핵플라스민 양분(bipartite) NLS; 아미노산 서열 PAAKRVKLD(SEQ ID NO: 160) 또는 RQRRNELKRSP(SEQ ID NO: 161)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 162)를 갖는 hRNPAl M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 163); 근종(myoma) T 단백질의 서열 VSRKRPRP(SEQ ID NO: 164) 및 PPKKARED(SEQ ID NO: 165); 인간 p53의 서열 PQPKKKPL(SEQ ID NO: 166); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: 167); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: 168) 및 PKQKKRK(SEQ ID NO: 169); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: 170); 마우스 Mxl 단백질의 서열 REKKKFLKRR(SEQ ID NO: 171); 인간 폴리(ADP-리보스) 폴리머라제의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 172); 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: 173); 보르나(Borna) 질환 바이러스 P 단백질(BDV-P1)의 서열 PRPRKIPR(SEQ ID NO: 174); 간염 C 바이러스 비구조적 단백질(HCV-NS5A)의 서열 PPRKKRTVV(SEQ ID NO: 175); LEF1의 서열 NLSKKKKRKREK(SEQ ID NO: 176); ORF57 시미래(simirae)의 서열 RRPSRPFRKP(SEQ ID NO: 177); EBV LANA의 서열 KRPRSPSS(SEQ ID NO: 178); 인플루엔자 A 단백질의 서열 KRGINDRNFWRGENERKTR(SEQ ID NO: 179); 인간 RNA 헬리카제 A(RHA)의 서열 PRPPKMARYDN(SEQ ID NO: 180); 인 RNA 헬리카제 II의 서열 KRSFSKAF(SEQ ID NO: 181); TUS-단백질의 서열 KLKIKRPVK(SEQ ID NO: 182); 임포틴-알파와 회합된 서열 PKKKRKVPPPPAAKRVKLD(SEQ ID NO: 183); HTLV-1에서 Rex 단백질로부터의 서열 PKTRRRPRRSQRKRPPT(SEQ ID NO: 184); 캐노르합디티스 엘레간스(Caenorhabditis elegans)의 EGL-13 단백질로부터의 서열 MSRRRKANPTKLSENAKKLAKEVEN(SEQ ID NO: 185); 및 서열 KTRRRPRRSQRKRPPT(SEQ ID NO: 186), RRKKRRPRRKKRR(SEQ ID NO: 187), PKKKSRKPKKKSRK(SEQ ID NO: 188), HKKKHPDASVNFSEFSK(SEQ ID NO: 189), QRPGPYDRPQRPGPYDRP(SEQ ID NO: 190), LSPSLSPLLSPSLSPL(SEQ ID NO: 191), RGKGGKGLGKGGAKRHRK(SEQ ID NO: 192), PKRGRGRPKRGRGR(SEQ ID NO: 193), PKKKRKVPPPPAAKRVKLD(SEQ ID NO: 183) 및 PKKKRKVPPPPKKKRKV(SEQ ID NO: 389)로부터 유래된 서열을 포함한다. 일반적으로, NLS(또는 다수의 NLSs)는 진핵생물 세포의 핵에서 기준 또는 CasX 변이체 융합 단백질의 축적을 유도하기에 충분한 강도로 존재한다. 핵에서 축적의 검출은 임의의 적합한 기법에 수행될 수 있다. 예를 들어, 검출 가능한 마커는, 세포 내에서의 위치가 시각화될 수 있도록 기준 또는 CasX 변이체 융합 단백질에 융합될 수 있다. 세포핵은 또한, 세포로부터 단리될 수 있으며, 그 후에 이의 함량은 단백질을 검출하기 위한 임의의 적합한 과정, 예컨대 면역조직화학, 웨스턴 블롯, 또는 효소 활성 검정에 의해 분석될 수 있다. 핵에서의 축적이 또한 결정될 수 있다.
일부 경우, 기준 또는 CasX 변이체 융합 단백질은 "단백질 형질도입 도메인" 또는 PTD(CPP - 세포 투과성 펩타이드로도 알려져 있음)를 포함하며, 이는 인지질 이중층, 미쉘, 세포막, 세포소기관 막, 또는 소낭막을 가로지르는 것을 용이하게 하는 단백질, 폴리뉴클레오타이드, 탄수화물, 또는 유기 또는 무기 화합물을 지칭한다. 작은 극성 분자로부터 큰 거대분자 및/또는 나노입자의 범위일 수 있는 또 다른 분자에 부착된 PTD는 분자가 막을 가로지르는 것, 예를 들어, 세포외 공간으로부터 세포내 공간으로, 또는 세포기질로부터 세포소기관 내로 이동하는 것을 용이하게 한다. 일부 구현예에서, PTD는 기준 또는 CasX 변이체 융합 단백질의 아미노 말단에 공유적으로 연결된다. 일부 구현예에서, PTD는 기준 또는 CasX 변이체 융합 단백질의 카르복실 말단에 공유적으로 연결된다. 일부 경우, PTD는 적합한 삽입 부위에서 기준 또는 CasX 변이체 융합 단백질의 서열에 내부적으로 삽입된다. 일부 경우, 기준 또는 CasX 변이체 융합 단백질은 하나 이상의 PTD(예를 들어, 2개 이상, 3개 이상, 4개 이상의 PTD)를 포함한다(이에 접합됨, 이에 융합됨). 일부 경우, PTD는 하나 이상의 핵 위치 신호(NLS)를 포함한다. PTD의 예는 YGRKKRRQRRR(SEQ ID NO: 195), RKKRRQRR(SEQ ID NO: 196); YARAAARQARA(SEQ ID NO: 197); THRLPRRRRRR(SEQ ID NO: 198); 및 GGRRARRRRRR(SEQ ID NO: 199)을 포함하는 HIV TAT의 펩타이드 형질도입 도메인; 세포 내로의 직접적인 진입에 충분한 수의 아르기닌(예를 들어, 3, 4, 5, 6, 7, 8, 9, 10, 또는 10-50개의 아르기닌(SEQ ID NO: 200))을 포함하는 폴리아르기닌 서열; VP22 도메인(문헌[Zender 등 (2002) Cancer Gene Ther. 9(6): 489-96]); 드로소필라 안테나페디아(Drosophila Antennapedia) 단백질 형질도입 도메인(문헌[Noguchi 등 (2003) Diabetes 52(7): 1732-1737]); 절두된 인간 칼시토닌 펩타이드(문헌[Trehin 등 (2004) Pharm. Research 21: 1248-1256]); 폴리리신(문헌[Wender 등 (2000) Proc. Natl. Acad. Sci. USA 97: 13003-13008]); RRQRRTSKLMKR(SEQ ID NO: 201); 트랜스포탄(Transportan) GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO: 202); KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO: 203); 및 RQIKIWFQNRRMKWKK(SEQ ID NO: 204)을 포함하지만 이들로 제한되지는 않는다. 일부 구현예에서, PTD는 활성 표적 CPP(ACPP)이다(Aguilera 등 (2009) Integr Biol (Camb) June; 1(5-6): 371-381). ACPP는, 절단 가능한 링커를 통해 매칭 다가음이온(polyanion)(예를 들어, Glu9 또는 "E9")에 연결된 다가양이온성(polycationic) CPP(예를 들어, Arg9 또는 "R9")를 포함하며, 이는 순전하(net charge)를 거의 제로까지 감소시켜서 세포 내로의 접착 및 흡수를 저해한다. 링커의 절단 시, 다가음이온은 방출되어, 폴리아르기닌 및 이의 고유한 접착성을 국재적으로 드러내어, ACPP가 막을 가로지르도록 "활성화시킨다".
일부 구현예에서, 기준 또는 CasX 변이체 융합 단백질은 링커 폴리펩타이드(예를 들어, 하나 이상의 링커 폴리펩타이드)를 통해 내부적으로 삽입된 이종성 아미노산 또는 이종성 폴리펩타이드(이종성 아미노산 서열)에 연결된 CasX 단백질을 포함할 수 있다. 일부 구현예에서, 기준 또는 CasX 변이체 융합 단백질은 C-말단 및/또는 N-말단 단부에서 링커 폴리펩타이드(예를 들어, 하나 이상의 링커 폴리펩타이드)를 통해 이종성 폴리펩타이드(융합 파트너)에 연결될 수 있다. 링커 폴리펩타이드는 여러 가지 아미노산 서열 중 임의의 아미노산 서열을 가질 수 있다. 단백질은 일반적으로 가요성 성질의 스페이서 펩타이드에 의해 연결될 수 있지만, 다른 화학적 연결부는 배제되지 않는다. 적합한 링커는 4개 아미노산 내지 40개 아미노산 길이, 또는 4개 아미노산 내지 25개 아미노산 길이의 폴리펩타이드를 포함한다. 이들 링커는 일반적으로, 단백질을 커플링하기 위해 합성, 링커-인코딩 올리고뉴클레오타이드를 사용함으로써 생성된다. 가요성 정도를 갖는 펩타이드 링커가 사용될 수 있다. 연결 펩타이드는 사실상 임의의 아미노산 서열을 가질 수 있으며, 바람직한 링커는 일반적으로 가요성의 펩타이드를 이끄는 서열을 가질 것임을 염두에 둔다. 작은 아미노산, 예컨대 글리신 및 알라닌의 사용은 가요성 펩타이드를 생성하는 데 사용하기 위한 것이다. 이러한 서열의 생성은 당업자에게 일상적이다. 여러 가지 상이한 링커는 상업적으로 입수 가능하고, 사용하기에 적합한 것으로 여겨진다. 예시적인 링커 폴리펩타이드는 글리신 중합체 (G)n, 글리신-세린 중합체 (예를 들어, (GS)n, GSGGSn(SEQ ID NO: 205), GGSGGSn(SEQ ID NO: 206), 및 GGGSn(SEQ ID NO: 207)을 포함함, 여기서, n은 적어도 1의 정수임), 글리신-알라닌 중합체, 알라닌-세린 중합체, 글리신-프롤린 중합체, 프롤린 중합체 및 프롤린-알라닌 중합체를 포함한다. 예시적인 링커는 GGSG (SEQ ID NO: 208), GGSGG (SEQ ID NO: 209), GSGSG (SEQ ID NO: 210), GSGGG (SEQ ID NO: 211), GGGSG (SEQ ID NO: 212), GSSSG (SEQ ID NO: 213), GPGP (SEQ ID NO: 214), GGP, PPP, PPAPPA (SEQ ID NO: 215), PPPGPPP (SEQ ID NO: 216) 등을 포함하지만 이들로 제한되지 않는 아미노산 서열을 포함할 수 있다. 당업자는, 상기 기재된 임의의 요소에 접합된 펩타이드의 설계가 링커를 포함할 수 있으며, 이러한 링커는 모두 또는 부분적으로 가요성이며, 따라서, 링커는 가요성 링커뿐만 아니라 덜 가요성인 구조를 부여하는 하나 이상의 부분을 포함할 수 있음을 인식할 것이다.
V. 항원 가공, 제시, 인식 및/또는 반응에 관여하는 단백질 및 이의 조절 영역을 인코딩하는 핵산의 변형을 위한 CasX:gNA 시스템 및 방법
본원에 제공된 CasX 단백질, 가이드 핵산, 및 이의 변이체는 치료, 진단, 및 연구를 포함한 다양한 적용에 유용하다. 유전자 편집을 위해 개시내용의 방법을 실시하기 위해, 프로그래밍 가능한 CasX:gNA 시스템이 본원에 제공된다. 본원에 제공된 CasX:gNA 시스템의 프로그래밍 가능한 성질은, 관심 단백질을 인코딩하는 유전자의 표적 핵산 서열 내의 하나 이상의 예정된 관심 영역에서 요망되는 효과(틈새 형성, 절단, 수선 등)를 달성하기 위해 정확한 표적화를 가능하게 한다. 일부 구현예에서, 본원에 제공된 CasX:gNA 시스템은, 표 4, 7, 8, 9, 또는 11의 CasX 변이체 또는 표 4의 서열과 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%의 서열 동일성을 갖는 변이체, 및 gNA(예를 들어, 표 2의 스캐폴드 변이체, 또는 표 2의 서열과 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%의 서열 동일성을 갖는 변이체를 포함하는 gNA) 또는 CasX 변이체 단백질 및 gNA를 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하며, 여기서 gNA의 표적화 서열은 표적 단백질, 이의 조절 요소, 또는 둘 다를 인코딩하는 표적 핵산 서열, 또는 이에 상보적인 서열에 상보적이고, 따라서 이와 혼성화할 수 있다. 다른 경우, CasX:gNA 시스템은 기준 CasX 또는 기준 gNA를 포함할 수 있다. 일부 경우, CasX:gNA 시스템은 공여자 주형 핵산을 추가로 포함한다.
여러 가지 전략 및 방법은, 본원에 제공된 CasX:gNA 시스템을 사용하여, 세포 표면 마커 단백질, 막관통 단백질, 또는 세포내 또는 세포외 단백질을 인코딩하는 표적 핵산 서열을 변형시키고/시키거나 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 세포 내로 도입하는 데 이용될 수 있다. 본원에 사용된 바와 같이 "변형(modifying)"은 절단, 틈새 형성(nicking), 편집, 결실, 넉킹 인(knocking in), 넉킹 아웃(knocking out), 수선/교정(repairing/correcting) 등을 포함하지만 이들로 제한되지는 않는다. 용어 "넉아웃"은 유전자의 제거 또는 유전자의 발현을 지칭한다. 예를 들어, 유전자는 리딩 프레임의 방해를 유발하는 뉴클레오타이드 서열의 결실 또는 첨가에 의해 넉아웃될 수 있다. 또 다른 예로, 유전자는 해당 유전자의 일부를 상관없는 서열 또는 하나 이상의 치환된 염기로 대체함으로써 넉아웃될 수 있다. 본원에 사용된 바와 같이 용어 "넉다운"은 유전자 또는 이의 유전자 생성물(들)의 발현의 감소를 지칭한다. 유전자 넉다운의 결과, 단백질 활성 또는 기능은 약화될 수 있거나 단백질 수준은 감소되거나 제거될 수 있다. 이러한 구현예에서, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질 또는 이의 조절 요소를 인코딩하는 유전자의 일부에 특이적인 표적화 서열 또는 이러한 서열의 보체를 갖는 gNA가 활용될 수 있다. 활용되는 CasX 단백질 및 gNA에 따라, 사건은 발현의 넉다운/넉아웃을 가능하게 하는 절단 사건일 수 있다. 일부 구현예에서, 단백질의 유전자 발현은 무작위 삽입 또는 결실(인델)을 도입함으로써, 예를 들어 부정확한 비-상동성 DNA 말단 접합(NHEJ) 수선 경로를 활용함으로써 방해되거나 제거될 수 있다. 이러한 구현예에서, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질의 표적화된 영역은 유전자의 코딩 서열(엑손)을 포함하며, 여기서 뉴클레오타이드의 삽입 또는 결실은 프레임이동 돌연변이를 발생시킬 수 있다. 이러한 접근법은 또한, 표적 유전자의 발현을 방해하기 위해 다른 비-코딩 영역, 예컨대 인트론, 또는 조절 요소에서 사용될 수 있다.
일부 구현예에서, 개시내용의 방법은 이중-가닥 DNA(dsDNA) 표적 핵산 내에서 부위-특이적 이중 가닥 절단부(DSB) 또는 단일 가닥 절단부(SSB)(예를 들어, CasX 단백질이 표적 핵산의 단지 하나의 가닥을 절단할 수 있는 닉카제일 때)를 생성하며, 이는 그 후에 비-상동성 말단 접합(NHEJ), 상동성-안내 수선(HDR), 상동성-독립적 표적화된 통합, 마이크로-상동성 매개 말단 접합(MMEJ), 단일 가닥 어닐링(SSA) 또는 염기 절제 수선(BER)에 의해 수선되어 표적 핵산 서열의 변형을 이끌 수 있는 CasX 단백질 및 하나 이상의 gNA를 제공한다. 일부 구현예에서, 각각이 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응 대립유전자에 관여하는 단백질의 상이한 영역에 특이적인 표적화 서열을 갖는 gNA 중 하나 또는 쌍(또는 3 또는 4)을 활용하고, 뒤이어 절단 부위에서 삽입될 폴리뉴클레오타이드 서열을 포함하는 공여자 주형을 도입하는 것이 바람직할 수 있다.
일 구현예에서, 개시내용은 세포 집단에서 유전자의 표적 핵산 서열을 변형시키는 방법을 제공하며, 여기서 유전자는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하고, 상기 방법은 집단의 각각의 세포 내로: a) 본원에 기재된 임의의 하나의 구현예의 CasX:gNA 시스템; b) 본원에 기재된 임의의 하나의 구현예의 CasX:gNA 시스템을 인코딩하는 핵산; c) 상기 (b)의 핵산을 포함하는 벡터; d) 본원에 기재된 임의의 하나의 구현예의 CasX:gNA 시스템을 포함하는 VLP; 또는 e) 상기 a 내지 상기 d 중 2개 이상의 조합을 도입하는 단계를 포함하며, 여기서 CasX 단백질로 세포의 표적 핵산 서열을 변형시킨다. 일 구현예에서, CasX:gNA 시스템은 RNP로서 세포 내로 도입된다. 방법의 일부 구현예에서, 세포는 설치류 세포, 마우스 세포, 래트 세포, 및 비-인간 영장류 세포로 이루어진 군으로부터 선택된다. 방법의 다른 구현예에서, 세포는 인간 세포이다. 방법의 다른 구현예에서, 세포는 전구 세포, 조혈 줄기세포, 및 만능성 줄기세포로 이루어진 군으로부터 선택된다. 방법의 다른 구현예에서, 세포는 유도 만능성 줄기세포이다. 방법의 다른 구현예에서, 세포는 T 세포, 종양 침윤성 림프구, NK 세포, B 세포, 단핵구, 대식세포, 또는 수지상 세포로 이루어진 군으로부터 선택되는 면역 세포이다. 특정 구현예에서, T 세포는 CD4+ T 세포, CD8+ T 세포, 감마-델타 T 세포, 또는 이들의 조합으로 이루어진 군으로부터 선택된다. T 세포가 변형될 세포인 경우, CD4+ T 세포와 CD8+ T 세포의 혼합물은 종종 CAR-T 세포의 조작에 선택되는데, 아마도 CD4 T 세포가 주입된 CTL의 기능 및 생존율을 유지시키기 위해 성장 인자 및 다른 신호를 제공하기 때문이다(문헌[Barrett, DM, 등 Chimeric antigen receptor (CAR) and T cell receptor (TCR) Modified T cells Enter Main Street and Wall Street. J Immunol. 195(3): 755-761(2015)]). 일부 구현예에서, 세포는 상기 세포가 투여되는 대상체에 대해 자가유래(autologous)이다. 방법의 다른 구현예에서, 세포는 상기 세포가 투여되는 대상체에 대해 동종이계(allogeneic)이다.
세포 집단 내 유전자의 표적 핵산 서열을 변형시키는 방법의 일부 구현예에서, 변형시키는 기에는, 세포 집단의 세포의 표적 핵산 서열에 하나 이상의 단일-가닥 절단부를 도입하는 단계를 포함한다. 방법의 다른 구현예에서, 변형시키기에는, 세포 집단의 세포의 표적 핵산 서열에 하나 이상의 이중-가닥 절단부를 도입하는 것이 포함된다. 방법의 다른 구현예에서, 변형시키기에는, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질을 인코딩하는 세포 집단의 세포에서 유전자의 넉다운 또는 넉아웃을 이끄는, 세포 집단의 세포의 표적 핵산 서열에 하나 이상의 뉴클레오타이드의 삽입, 결실, 치환, 중복, 또는 역위를 도입하는 것이 포함된다. 일부 구현예에서, 표적화된 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), ICP47 폴리펩타이드, 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβ 수용체 2(TGFβRII), 프로그래밍된 세포 사멸 1(PD-1), 사이토카인 유도성 SH2(CISH), 림프구 활성화 3(LAG-3), Ig 및 ITIM 도메인을 갖는 T 세포 면역수용체(TIGIT), 아데노신 A2a 수용체(ADORA2A), 살해 세포 렉틴 유사 수용체 C1(NKG2A), 세포독성 T-림프구-관련 단백질 4(CTLA-4), T-세포 면역글로불린 및 뮤신 도메인 3(TIM-3), 및 2B4(CD244)로부터 선택된다. 하나의 예시적인 구현예에서, 세포 표면 마커 단백질은 B2M이고, gNA의 표적화 서열은 표 3A의 서열로부터 선택되는 서열을 포함한다. 또 다른 예시적인 구현예에서, 세포 표면 마커 단백질은 TRAC이고, gNA의 표적화 서열은 표 3B의 서열로부터 선택되는 서열을 포함한다. 또 다른 예시적인 구현예에서, 세포내 단백질은 CIITA이고, gNA의 표적화 서열은 표 3C의 서열로부터 선택되는 서열을 포함한다. 방법의 또 다른 구현예에서, 변형될 유전자는 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택되는 단백질 중 적어도 2개이다. 전술한 내용의 일 구현예에서, 세포 집단의 세포는, 하나 이상의 단백질의 발현이, 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 변형되었다. 전술한 내용의 또 다른 구현예에서, 세포 집단의 세포는, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%의 세포가, 변형되지 않은 세포와 비교하여 하나 이상의 단백질을 검출 가능한 수준으로 발현하지 않도록 변형되었다. 방법의 또 다른 구현예에서, 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 변형된 세포가 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않도록 변형되었다. 방법의 또 다른 구현예에서, 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 변형된 세포가 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않도록 변형되었다.
일부 구현예에서, 방법은 공여자 주형을 세포 집단의 세포의 표적 핵산 서열의 절단부 부위(들) 내로 삽입하는 단계를 포함한다. 시스템이 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 넉다운/넉아웃시키거나 넉인시키기 위해 사용되는지의 여부에 따라, 공여자 주형은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질에 대한 유전자를 인코딩하는 짧은 단일-가닥 또는 이중-가닥 올리고뉴클레오타이드, 또는 긴 단일-가닥 또는 이중-가닥 올리고뉴클레오타이드일 수 있다. 넉다운/넉아웃을 위해, 공여자 주형 서열은 전형적으로, 이것이 대체하는 게놈 서열과 동일하지 않고 게놈 서열에 대해 하나 이상의 단일 염기 변화, 삽입, 결실, 역위 또는 재배열을 함유할 수 있으며, 단, 상동성-안내 수선을 뒷받침하기 위해 표적 서열과 충분한 상동성이 존재한다면 그러하고, 이는 표적 단백질이 발현되지 않거나 더 낮은 수준으로 발현되도록 프레임이동 또는 다른 돌연변이를 이끌 수 있다. 소정의 구현예에서, 넉다운/넉아웃 변형을 위해, 공여자 주형 서열은 재조합이 요망되는 표적 게놈 서열과 적어도 약 60%, 70%, 80%, 90%, 95%, 98%, 99%, 또는 99.9%의 서열 동일성을 가질 것이다. 일부 구현예에서, 공여자 주형 서열은 상동성의 2개 영역("상동성 아암(homologous arm)")에 의해 플랭킹된 비-상동성 서열을 포함하며, 따라서 표적 DNA 영역과 2개의 플랭킹 서열 사이의 상동성-안내 수선은 표적 영역에서 비-상동성 서열의 삽입을 이끈다. 업스트림 서열 및 다운스트림 서열은 표적 DNA에서 통합 부위의 어느 한 면과 서열 유사성을 공유하여, 서열의 삽입을 용이하게 한다. 일부 구현예에서, 공여자 주형 서열의 상동성 영역은, 재조합이 요망되는 표적 게놈 서열과 적어도 50%의 서열 동일성을 가질 것이다. 공여자 주형 서열은 게놈 서열과 비교하여 소정의 서열 차이, 예를 들어, 제한 부위, 뉴클레오타이드 다형성, 선택 가능한 마커(예를 들어, 약물 내성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있으며, 이는 절단 부위에서 공여자 핵산의 성공적인 삽입에 대해 평가하는 데 사용될 수 있거나 일부 경우 다른 목적을 위해(예를 들어, 표적화된 게놈 좌위에서 발현을 나타내기 위해) 사용될 수 있다. 대안적으로, 이들 서열 차이는, 마커 서열의 제거를 위해 이후에 활성화될 수 있는 FLPs, loxP 서열 등과 같은 플랭킹 재조합 서열을 포함할 수 있다. 일부 구현예에서, 공여자 주형은 표적 유전자의 적어도 약 10, 적어도 약 50, 적어도 약 100, 또는 적어도 약 200, 또는 적어도 약 300, 또는 적어도 약 400, 또는 적어도 약 500, 또는 적어도 약 600, 또는 적어도 약 700, 또는 적어도 약 800, 또는 적어도 약 900, 또는 적어도 약 1000, 또는 적어도 약 10,000, 또는 적어도 15,000개 뉴클레오타이드를 포함한다. 다른 구현예에서, 공여자 주형은 표적 유전자의 적어도 약 20 내지 약 10,000 뉴클레오타이드, 또는 적어도 약 200 내지 약 8000 뉴클레오타이드, 또는 적어도 약 400 내지 약 6000 뉴클레오타이드, 또는 적어도 약 600 내지 약 4000 뉴클레오타이드, 또는 적어도 약 1000 내지 약 2000개 뉴클레오타이드를 포함한다. 다른 구현예에서, 개시내용은 유전자의 인코딩 핵산에서 20개 이하의 뉴클레오타이드, 10개 이하의 뉴클레오타이드, 5개 이하의 뉴클레오타이드, 4개 이하의 뉴클레오타이드, 3개 이하의 뉴클레오타이드, 2개의 뉴클레오타이드, 또는 단일 뉴클레오타이드의 결실, 삽입, 또는 돌연변이를 포함하는 CasX:gNA 시스템 및 공여자 주형을 사용하여 세포의 표적 서열을 변경시키는 방법을 제공하며, 여기서 표적 단백질의 발현은 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소된다. 일부 구현예에서, 공여자 주형은 단일 가닥 DNA 서열을 포함한다. 다른 구현예에서, 공여자 주형은 단일 가닥 RNA 주형을 포함한다. 다른 구현예에서, 공여자 주형은 이중 가닥 DNA 서열을 포함한다.
다른 경우, 외인성 공여자 주형은 상동성-독립적 표적화된 통합(HITI) 기전에 의해 CasX 절단에 의해 생성된 단부 사이에 삽입된다. HITI에 의해 삽입된 외인성 서열은 임의의 길이일 수 있으며, 예를 들어, 1 내지 50개 뉴클레오타이드 길이의 상대적으로 짧은 서열, 또는 약 50-1000개 뉴클레오타이드 서열의 더 긴 서열일 수 있다. 상동성의 결여는 예를 들어, 20-50% 이하의 서열 동일성을 갖고/거나 낮은 엄격성에서 특이적인 혼성화의 결여일 수 있다. 다른 경우, 상동성의 결여는 5, 6, 7, 8, 또는 9 bp 이하의 동일성을 갖는 기준을 추가로 포함할 수 있다. 공여자 주형 삽입은 상동성-안내 수선(HDR) 또는 상동성-독립적 표적화된 통합(HITI)에 의해 매개될 수 있다. 일부 경우에, 공여자 주형의 삽입은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질을 인코딩하는 세포 집단의 세포에서 유전자의 넉다운 또는 넉아웃을 이끈다. 일부 경우에, 세포 집단의 세포는, 하나 이상의 단백질의 발현이, 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 변형되었다. 다른 경우에, 세포 집단의 세포는, 상기 세포가 하나 이상의 단백질을 검출 가능한 수준으로 발현하지 않도록 변형되었다. 특정 구현예에서, 하나 이상의 단백질은 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택된다. 일 구현예에서, 방법은 생체외에서 세포 집단에서 실시된다. 또 다른 구현예에서, 방법은 생체내에서 대상체에서 실시된다.
세포 집단 내 유전자의 표적 핵산 서열을 변형시키는 방법의 일부 구현예에서, 변형시키기에는, 아래에서 더 완전히 기재된 키메라 항원 수용체(CAR)를 인코딩하는 폴리뉴클레오타이드를 삽입하여, 세포 집단의 변형된 세포의 세포에서 검출 가능한 수준의 CAR의 발현을 이끄는 것이 추가로 포함된다. 예시적인 CAR, 및 이러한 수용체를 조작하고 세포 내로 도입하는 방법은 본원에 참조로서 포함된 예를 들어, 국제 특허 출원 공개 번호 WO2013126726호, WO2012129514호, WO2014031687호, WO2013166321호, WO2013071154호, WO2013123061호, 미국 특허 출원 공개 번호 US2002131960호, US2013287748호, US20130149337호, US 20190136230호, 미국 특허 제6,451,995호, 제7,446,190호, 제8,252,592호, 제8,339,645호, 제8,398,282호, 제7,446,179호, 제6,410,319호, 제7,070,995호, 제7,265,209호, 제7,354,762호, 제7,446,191호, 제8,324,353호, 및 제8,479,118호에 기재된 것들을 포함한다. 폴리뉴클레오타이드는 본원에 기재된 바와 같이 벡터에 의해, 또는 당업계에 알려진 종래의 방법; 예를 들어 전기천공 또는 미세주사를 사용하여 플라스미드로서, 변형될 세포 내로 도입될 수 있다.
세포 집단 내 유전자의 표적 핵산 서열을 변형시키는 방법의 일부 구현예에서, 변형시키기에는, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 요망되는 단백질에 TCR(본원에서 조작된 T 세포 수용체, 또는 조작된 TCR로서 지칭됨)을 재-표적화할 수 있는 항원 결합 도메인에 연결된 TCR의 하위단위를 포함하는 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 삽입하는 것이 추가로 포함된다. T 세포의 조작은 세포 집단의 변형된 세포에서 검출 가능한 수준의 조작된 TCR의 발현을 이끌어, 암 또는 자가면역 질환과 같은 질환의 치료에서 유용성을 갖는 제2의 정의된 특이성을 위한 TCR을 갖는 세포를 이끈다. TCR의 하나 이상의 하위단위는 TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타 중 임의의 것을 포함할 수 있다. 그러므로, 조작된 TCR은 TCR 세포외 도메인 또는 막관통 도메인의 적어도 일부, 및 항원 결합 도메인을 포함하는 융합 단백질을 포함하며, 여기서 TCR 하위단위 및 항원 결합 도메인은 작동 가능하게 연결된다. 일부 구현예에서, 조작된 TCR은 TCR 세포외 도메인 또는 막관통 도메인의 적어도 일부, 자극성 도메인을 포함하는 TCR 세포내 도메인, 및 항원 결합 도메인을 포함하는 융합 단백질을 포함하며, 여기서 TCR 하위단위 및 항원 도메인은 작동 가능하게 연결된다. 시험관내에서/생체외에서 각각의 표적 세포를 인식하고 파괴시키는 CAR 또는 제2 TCR을 발현하는 T 세포의 변형된 집단의 능력 외에도, 세포 집단의 변형된 세포는 암 또는 자가면역 질환과 같은 질환을 갖는 대상체의 치료에서 유용성을 갖는다.
일부 구현예에서, CAR 또는 조작된 TCR은 질환 항원, 선택적으로 종양 세포 항원에 대해 특이적인 결합 친화도를 갖는 항원 결합 도메인을 갖는다. 전술한 내용에서, 종양 세포 항원은 분화 클러스터 19(CD19), 분화 클러스터 3(CD3), CD3d 분자(CD3D), CD3g 분자(CD3G), CD3e 분자(CD3E), CD247 분자(CD247, 또는 CD3Z), CD8a 분자(CD8), CD7 분자(CD7), 막 메탈로엔도펩티다제(CD10), 막 경유 4-도메인 A1(CD20), CD22 분자(CD22), TNF 수용체 슈퍼계열 구성원 8(CD30), C-유형 렉틴 도메인 계열 12 구성원 A(CLL1), CD33 분자(CD33), CD34 분자(CD34), CD38 분자(CD38), 인테그린 하위단위 알파 2b(CD41), CD44 분자(인도인 혈액 군)(CD44), CD47 분자(CD47), 인테그린 알파 6(CD49f), 신경 세포 접착 분자 1(CD56), CD70 분자(CD70), CD74 분자(CD74), CD99 분자(Xg 혈액 군)(CD99), 인터루킨 3 수용체 하위단위 알파(CD123), 프로미닌 1(prominin 1)(CD133), 신데칸 1(syndecan 1)(CD138), 카르보닉스 안하이드라제 IX(CAIX; carbonix anhydrase IX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 접착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEA 세포 접착 분자 5(CEACAM5), 클라우딘 6(CLDN6; Claudin 6), CLDN18, C-유형 렉틴 도메인 계열 12 구성원 A(CLEC12A), 상피-간엽 전이 인자(cMET), 세포독성 T-림프구-관련 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), 표피 성장 인자 수용체 변이체 III(EGFRvIII), 상피 당단백질 2(EGP-2), 상피 세포 접착 분자(EGP-40 또는 EpCAM), EPH 수용체 A2(EphA2), 엑토뉴클레오타이드 피로포스파타제/포스포디에스테라제 3(ENPP3; ectonucleotide pyrophosphatase/phosphodiesterase 3), erb-b2 수용체 티로신 키나제 2(ERBB2), erb-b2 수용체 티로신 키나제 3(ERBB3), erb-b2 수용체 티로신 키나제 4(ERBB4), 폴레이트 결합 단백질(FBP), 태아 니코틴성 아세틸콜린 수용체(AChR), 폴레이트 수용체 알파(Fr알파 또는 FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사지향성 수용체 8(GRM8), 글리피칸-3(GPC3; glypican-3), 강글리오사이드 GD2, 강글리오사이드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), 인간 표피 성장 인자 수용체 3(HER3), 인테그린 B7, 세포내 세포-접착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY; Lewis-Y), 콘드로모듈린-1(LECT1; chondromodulin-1), L1 세포 접착 분자(L1CAM), 리소포스파티드산 수용체 3(LPAR3; Lysophosphatidic acid receptor 3), 흑색종-관련 항원 1(MAGE-A1), 메소텔린(MSLN; mesothelin), 뮤신 1(MUC1), 뮤신 16, 세포 표면 관련(MUC16), 흑색종-관련 항원 3(MAGEA3), 종양 단백질 p53(p53), T 세포에 의해 인식되는 흑색종 항원 1(MART1; Melanoma Antigen Recognized by T cells 1), 당단백질 100(GP100), 프로테이나제3(Proteinase3)(PR1), 에프린-A 수용체 2(EphA2; ephrin-A receptor 2), 자연 살해기 2D 리간드(NKG2D 리간드; Natural killer group 2D ligand), 뉴욕 식도 편평 세포 암종 1(NY-ESO-1), 종양태아성 항원(oncofetal antigen)(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 고아 수용체 1(ROR1; receptor tyrosine kinase-like orphan receptor 1), 영양아층 당단백질(TPBG; trophoblast glycoprotein), 종양-관련 당단백질 72(TAG-72), 종양-관련 칼슘 신호 전달자 2(TROP-2; tumor-associated calcium signal transducer 2), 티로시나제(tyrosinase), 서바이빈(survivin), 혈관 내피 성장 인자 수용체 2(VEGF- R2), 윌름 종양-1(WT-1; Wilms tumor-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현되는 항원(PRAME; Preferentially Expressed Antigen In Melanoma), T 세포 수용체 베타 불변 1(TRBC1), TRBC2, 및 (T-세포 면역글로불린 뮤신-3) TIM-3으로 이루어진 군으로부터 선택될 수 있다. 일 구현예에서, CAR 또는 조작된 TCR은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함한다. 또 다른 구현예에서, CAR은 적어도 하나의 세포내 신호전달 도메인을 추가로 포함하며, 여기서 적어도 하나의 세포내 신호전달 도메인은 CD247 분자(CD3-제타), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB), 유도성 T 세포 공동자극자(ICOS), 또는 TNF 수용체 슈퍼계열 구성원 4(OX40)로부터 단리되거나 유래되는 하나 이상의 세포내 신호전달 도메인을 포함한다. 또 다른 구현예에서, CAR은 세포외 힌지 도메인 또는 스페이서를 추가로 포함한다. 일 구현예에서, 세포외 힌지 도메인은 면역글로불린 유사 도메인이며, 여기서 힌지 도메인은 IgG1, IgG2, 또는 IgG4로부터 단리되거나 유래된다. 또 다른 구현예에서, 힌지 도메인은 CD8a 분자(CD8) 또는 CD28로부터 단리되거나 유래된다. 또 다른 구현예에서, CAR은 막관통 도메인을 추가로 포함한다. 막관통 도메인은 CD3-제타, CD4, CD8, 및 CD28로 이루어진 군으로부터 단리되거나 유래될 수 있다.
일부 구현예에서, CAR 또는 조작된 TCR의 항원 결합 도메인은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택된다. 특정 구현예에서, 항원 결합 도메인은 scFv이다. 일부 구현예에서, scFv는 종양 세포 항원 또는 표적 세포 마커에 대해 특이적인 결합 친화도를 갖는 중쇄 가변 도메인(VH) 및 경쇄 가변 도메인(VL)을 포함한다. 전형적으로, VH는 각각의 CDR을 연결하는 프레임워크 영역(FR)이 산재된 CDR-H1 영역, CDR-H2 영역, CDR-H3 영역을 포함하고, VL은 이의 산재된 FR과 함께 CDR-L1 영역, CDR-L2 영역, 및 CDR-L3 영역을 포함한다. 항원 결합 도메인은 종양 세포 항원에 대한 평형 결합 상수가 10-5 M과 10-12 M 사이의, 또는 약 10-5 M과 10-12 M 사이의, 그리고 그 안의 모든 개별 값과 범위인 친화도를 나타내고; 이러한 결합 친화도는 "특이적"이다. 다른 구현예에서, scFv는 기준 항체와 동일한 중쇄 상보성 결정 영역(CDR) 및 경쇄 CDR을 포함한다. 일부 경우, 기준 항체는 인간화 항체이다. 인간화 항체는, 비-인간 면역글로불린으로부터 유래된 최소 서열을 함유하는 특정 키메라 면역글로불린, 면역글로불린 사슬, 또는 이의 항원-결합 단편인 비-인간(예를 들어, 뮤린) 항체의 형태를 지칭한다. 대부분의 파트에 대해, 인간화 항체는, 수혜자 항체의 CDR로부터의 잔기가, 요망되는 특이성, 친화도, 및 수용력(capacity)을 갖는 비-인간 종, 예컨대 마우스, 래트, 또는 토끼의 CDR로부터의 잔기에 의해 대체되는 인간 면역글로불린이다. 일부 경우에, Fv 프레임워크 영역(FR) 잔기는 상응하는 비-인간 잔기에 의해 대체된다. 일반적으로, 인간화 항체는 실질적으로 모든 적어도 하나의, 그리고 전형적으로 2개의 가변 도메인을 포함할 것이며, 이러한 가변 도메인에서 모든 또는 실질적으로 모든 CDR 영역은 비-인간 면역글로불린의 CDR 영역에 상응하고, 모든 또는 실질적으로 모든 FR 영역은 인간 면역글로불린 컨센서스(consensus) 서열의 FR 영역에 상응한다. 방법의 일부 구현예에서, CAR의 항원 결합 도메인을 제공하기 위해 활용되는 기준 항체는 표 5에 제시된 서열로 이루어진 군으로부터 선택되는 VH와 VL 및/또는 중쇄 CDR과 경쇄 CDR을 포함한다. 표 5의 VH 서열 및 VL 서열은 CDR-H1 영역, CDR-H2 영역, CDR-H3 영역, CDR-L1 영역, CDR-L2 영역, 및 CDR-H3 영역(표 5의 밑줄표시된 서열에 의해 나타남)을 포함하고, CAR 및/또는 조작된 TCR 구현예의 항원 결합 도메인은, 표적 세포 마커에 대해 특이적인 결합 친화도를 여전히 유지하면서도, 상응하는 VH 및 VL보다 대안적인 프레임워크 영역을 활용하는 이들 CDR로 작제될 수 있는 것으로 이해될 것이다. 일부 경우에, CDR 또는 VL 및 VH는, 표적 세포 마커에 대한 특이적인 결합 친화도가 유지되는 한, 하나 이상의 아미노산 치환, 결실, 또는 삽입을 가질 수 있다. 전술한 구현예에서, 인코딩된 CAR 또는 TCR의 구성요소로서 scFv의 CDR 또는 VH 및 VL을 인코딩하는 핵산은 세포 집단을 변형시키는 데 활용된다.
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
Figure pct00070
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
일부 구현예에서, 개시내용의 CAR 및/또는 조작된 TCR은 VH 및 VL을 포함하는 항원 결합 도메인을 포함하고, VH 및 VL은 SEQ ID NO: 217과 SEQ ID NO: 218, SEQ ID NO: 219와 SEQ ID NO: 220, SEQ ID NO: 221과 SEQ ID NO: 222, SEQ ID NO: 223과 SEQ ID NO: 224, SEQ ID NO: 225와 SEQ ID NO: 226, SEQ ID NO: 227과 SEQ ID NO: 228, SEQ ID NO: 229와 SEQ ID NO: 230, SEQ ID NO: 231과 SEQ ID NO: 232, SEQ ID NO: 233과 SEQ ID NO: 234, SEQ ID NO: 235와 SEQ ID NO: 236, SEQ ID NO: 237과 SEQ ID NO: 238, SEQ ID NO: 239와 SEQ ID NO: 240, SEQ ID NO: 241과 SEQ ID NO: 242, SEQ ID NO: 243과 SEQ ID NO: 244, SEQ ID NO: 245와 SEQ ID NO: 246, SEQ ID NO: 247과 SEQ ID NO: 248, SEQ ID NO: 249와 SEQ ID NO: 250, SEQ ID NO: 251과 SEQ ID NO: 252, SEQ ID NO: 253과 SEQ ID NO: 254, SEQ ID NO: 255와 SEQ ID NO: 256, SEQ ID NO: 257과 SEQ ID NO: 258, SEQ ID NO: 259와 SEQ ID NO: 260, SEQ ID NO: 261과 SEQ ID NO: 262, SEQ ID NO: 263과 SEQ ID NO: 264, SEQ ID NO: 265와 SEQ ID NO: 266, SEQ ID NO: 267과 SEQ ID NO: 268, SEQ ID NO: 269와 SEQ ID NO: 270, SEQ ID NO: 271과 SEQ ID NO: 272, SEQ ID NO: 273과 SEQ ID NO: 274, SEQ ID NO: 275와 SEQ ID NO: 276, SEQ ID NO: 277과 SEQ ID NO: 278, SEQ ID NO: 279와 SEQ ID NO: 280, SEQ ID NO: 281과 SEQ ID NO: 282, SEQ ID NO: 283과 SEQ ID NO: 284, SEQ ID NO: 285와 SEQ ID NO: 286, SEQ ID NO: 287과 SEQ ID NO: 288, SEQ ID NO: 289와 SEQ ID NO: 290, SEQ ID NO: 291과 SEQ ID NO: 292, SEQ ID NO: 293과 SEQ ID NO: 294, SEQ ID NO: 295와 SEQ ID NO: 296, SEQ ID NO: 297과 SEQ ID NO: 298, SEQ ID NO: 299와 SEQ ID NO: 300, SEQ ID NO: 301과 SEQ ID NO: 302, SEQ ID NO: 303과 SEQ ID NO: 304, SEQ ID NO: 305와 SEQ ID NO: 306, SEQ ID NO: 307과 SEQ ID NO: 308, SEQ ID NO: 309와 SEQ ID NO: 310, SEQ ID NO: 311과 SEQ ID NO: 312, SEQ ID NO: 313과 SEQ ID NO: 314, SEQ ID NO: 315와 SEQ ID NO: 316, SEQ ID NO: 317과 SEQ ID NO: 318, SEQ ID NO: 319와 SEQ ID NO: 320, SEQ ID NO: 321과 SEQ ID NO: 322, SEQ ID NO: 323과 SEQ ID NO: 324, SEQ ID NO: 325와 SEQ ID NO: 326, SEQ ID NO: 327과 SEQ ID NO: 328, SEQ ID NO: 329와 SEQ ID NO: 330, SEQ ID NO: 331과 SEQ ID NO: 332, SEQ ID NO: 333과 SEQ ID NO: 334, SEQ ID NO: 335와 SEQ ID NO: 336, SEQ ID NO: 337과 SEQ ID NO: 338, SEQ ID NO: 339와 SEQ ID NO: 340, SEQ ID NO: 341과 SEQ ID NO: 342, SEQ ID NO: 343과 SEQ ID NO: 344, SEQ ID NO: 345와 SEQ ID NO: 346, SEQ ID NO: 347과 SEQ ID NO: 348, SEQ ID NO: 349와 SEQ ID NO: 350, SEQ ID NO: 351과 SEQ ID NO: 352, SEQ ID NO: 353과 SEQ ID NO: 354, SEQ ID NO: 355와 SEQ ID NO: 356, SEQ ID NO: 357과 SEQ ID NO: 358, SEQ ID NO: 359와 SEQ ID NO: 360, SEQ ID NO: 361과 SEQ ID NO: 362, SEQ ID NO: 363과 SEQ ID NO: 364, SEQ ID NO: 365와 SEQ ID NO: 366, SEQ ID NO: 367과 SEQ ID NO: 368, SEQ ID NO: 369와 SEQ ID NO: 370, SEQ ID NO: 371과 SEQ ID NO: 372, SEQ ID NO: 373과 SEQ ID NO: 374, SEQ ID NO: 375와 SEQ ID NO: 376, SEQ ID NO: 377과 SEQ ID NO: 378, SEQ ID NO: 379와 SEQ ID NO: 380, SEQ ID NO: 381과 SEQ ID NO: 382, SEQ ID NO: 383과 SEQ ID NO: 384, SEQ ID NO: 385와 SEQ ID NO: 386, SEQ ID NO: 387과 SEQ ID NO: 388, SEQ ID NO: 389와 SEQ ID NO: 390, SEQ ID NO: 391과 SEQ ID NO: 392, SEQ ID NO: 393과 SEQ ID NO: 394, SEQ ID NO: 395와 SEQ ID NO: 396, SEQ ID NO: 397과 SEQ ID NO: 398, SEQ ID NO: 399와 SEQ ID NO: 400, SEQ ID NO: 401과 SEQ ID NO: 402, SEQ ID NO: 403과 SEQ ID NO: 404, SEQ ID NO: 405와 SEQ ID NO: 406, SEQ ID NO: 407과 SEQ ID NO: 408, SEQ ID NO: 409와 SEQ ID NO: 410, SEQ ID NO: 411과 SEQ ID NO: 412, SEQ ID NO: 413과 SEQ ID NO: 414, SEQ ID NO: 415와 SEQ ID NO: 416, SEQ ID NO: 417과 SEQ ID NO: 418, SEQ ID NO: 419와 SEQ ID NO: 420, SEQ ID NO: 421과 SEQ ID NO: 422, SEQ ID NO: 423과 SEQ ID NO: 424, SEQ ID NO: 425와 SEQ ID NO: 426, SEQ ID NO: 427과 SEQ ID NO: 418, SEQ ID NO: 419와 SEQ ID NO: 430, SEQ ID NO: 431과 SEQ ID NO: 432. SEQ ID NO: 433과 SEQ ID NO: 434, SEQ ID NO: 435와 SEQ ID NO: 436, 또는 이와 적어도 90%, 적어도 95% 또는 적어도 99%의 동일성을 가진 서열로부터 선택된다.
일부 구현예에서, 세포 집단의 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95%의 변형된 세포가 검출 가능한 수준의 키메라 항원 수용체(CAR) 또는 조작된 TCR을 발현하도록 변형되었다. 일 구현예에서, 세포 집단에서 유전자의 표적 핵산 서열을 변형시키는 방법은 생체외에서 세포 집단에서 실시된다. 또 다른 구현예에서, 방법은 생체내에서 대상체에서 실시되며, 여기서 대상체는 설치류, 마우스, 래트, 돼지, 비-인간 영장류, 및 인간으로 이루어진 군으로부터 선택된다.
그러므로, 본원에 기재된 CasX:gNA 시스템 및 방법은 종래의 분자생물학 방법과 조합되어 사용되어, 세포 집단(이의 예는 아래에서 더 완전히 기재됨)을 변형시켜, 예를 들어, 바람직하지 못한 면역원성(예컨대 이식편대숙주(host versus graft) 반응 또는 숙주대이식편(graft versus host) 반응)을 감소시키거나 제거하거나, 주 조직적합성 복합체의 구성요소, 예를 들어, HLA 단백질, 예를 들어, HLA-A, HLA-B, HLA-C 또는 B2M(B2M 유전자에 의해 인코딩됨), 또는 주 조직적합성 복합체의 하나 이상의 구성요소의 발현을 조절하는 단백질의 유전자를 변경시킴으로써 생존율, 증식 및/또는 효능을 증가시키거나, T-세포 수용체의 파트, 예컨대 TRAC인 단백질을 제거하거나, 주 조직적합성 복합체(MHC) 클래스 I 및 II 유전자의 γ-인터페론-활성화된 전사를 조절하는 전사 공동활성자, 예컨대 CIITA의 발현을 억제시키거나, 변형된 세포가 TGFβ와 같은 인자의 면역억제성 효과를 탈출하게 하는 동종이계 CAR-조작된 또는 TCR-조작된 T 세포 기능을 갖는 세포를 생성할 수 있다. 수혜자 대상체와 비교하여, 변형된 세포의 HLA 단백질에서 미스매치를 감소시키거나, 야생형 T 세포 수용체 또는 다른 성분을 감소시키거나 제거함으로써, 이는 미스매칭된(예를 들어, 동종이계) 이식편 조직의 숙주 T 세포 수용체 인식 및 이에 대한 반응을 없앰으로써 이식편대숙주 질환(GVHD)에 대한 잠재성을 감소시키거나 없앤다(예를 들어, 문헌[Takahiro Kamiya, T. 등 A novel method to generate T-cell receptor―deficient chimeric antigen receptor T cells. Blood Advances 2:517 (2018)] 참조). 따라서, 이러한 접근법은 암, 자가면역 질환 및 이식 거부와 같은 질환을 갖는 대상체에서 면역-종양학 적용에 대한 향상된 치료 지수를 갖는 면역 세포를 생산하는 데 사용될 수 있었다.
VI. 폴리뉴클레오타이드 및 벡터
또 다른 양태에서, 본 개시내용은 본원에 기재된 임의의 구현예의 CasX 단백질을 인코딩하는 CasX:gNA 시스템의 폴리뉴클레오타이드 및 gNA(예를 들어, gDNA 및 gRNA)의 폴리뉴클레오타이드에 관한 것이다. 추가 양태에서, 개시내용은 변형된 세포에서 표적 단백질을 변형시키는 데 사용하기 위한 공여자 주형 폴리뉴클레오타이드를 제공한다. 더 추가의 양태에서, 개시내용은 본원에 기재된 CasX 단백질 및 gNA를 인코딩하는 폴리뉴클레오타이드, 뿐만 아니라 공여자 주형 및 구현예의 CAR을 인코딩하는 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다. 더 추가의 양태에서, 개시내용은 구현예의 조작된 TCR의 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다.
일부 구현예에서, 개시내용은 SEQ ID NO: 1-3의 기준 CasX를 인코딩하는 폴리뉴클레오타이드 서열을 제공한다. 다른 구현예에서, 개시내용은 본원에 기재된 임의의 구현예의 CasX 변이체를 인코딩하는 폴리뉴클레오타이드 서열을 제공한다. 일부 구현예에서, 개시내용은 표 4에 제시된 CasX 변이체 폴리펩타이드 서열을 인코딩하는 단리된 폴리뉴클레오타이드 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열을 제공한다. 일부 구현예에서, 개시내용은 본원에 기재된 임의의 구현예의 gNA 서열을 인코딩하는 단리된 폴리뉴클레오타이드 서열을 제공한다. 일부 구현예에서, 폴리뉴클레오타이드는 표 1 또는 표 2에 제시된 gNA 스캐폴드 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열을 인코딩한다. 일부 구현예에서, 폴리뉴클레오타이드는 SEQ ID NO: 2101-2280으로 이루어진 군으로부터 선택되는 gNA 스캐폴드 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열을 인코딩한다. 다른 구현예에서, 개시내용은 표 3A 3B, 또는 3C의 표적화 서열 폴리뉴클레오타이드, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열, 뿐만 아니라 표적화 서열을 인코딩하는 DNA를 제공한다. 일부 구현예에서, 스캐폴드 서열을 인코딩하는 폴리뉴클레오타이드는, CasX 및 표적 서열에 결합할 수 있는 gNA가 sgNA 또는 dgNA로서 발현될 수 있도록 표적화 서열을 인코딩하는 서열을 추가로 포함한다. 다른 구현예에서, 개시내용은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 표적 유전자와 혼성화하는 gNA 서열을 인코딩하는 단리된 폴리뉴클레오타이드 서열을 제공한다. 일부 경우에, 폴리뉴클레오타이드 서열은, 표적 유전자 엑손과 혼성화하는 gNA 서열을 인코딩한다. 다른 경우에, 폴리뉴클레오타이드 서열은, 표적 유전자 인트론과 혼성화하는 gNA 서열을 인코딩한다. 다른 경우에, 폴리뉴클레오타이드 서열은, 표적 유전자 인트론-엑손 연접부(junction)와 혼성화하는 gNA 서열을 인코딩한다. 다른 경우에, 폴리뉴클레오타이드 서열은, 표적 유전자의 유전자간 영역과 혼성화하는 gNA 서열을 인코딩한다. 일부 경우에, 폴리뉴클레오타이드 서열은, 표적 유전자의 조절 요소와 혼성화하는 gNA 서열을 인코딩한다. 일부 경우에, 세포 표면 마커 조절 요소는 유전자의 5'이다. 다른 경우에, 조절 요소는 세포 표면 마커 유전자의 3'이다. 다른 경우에, 조절 요소는 표적 유전자의 5' UTR을 포함한다. 더욱 다른 경우에, 조절 요소는 표적 유전자의 3' UTR을 포함한다.
다른 구현예에서, 개시내용은 공여자 주형 핵산을 제공하며, 여기서 공여자 주형은, 유전자 편집이 의도되는 표적 핵산의 표적 서열과 상동성을 갖지만 완전한 동일성은 갖지 않는 뉴클레오타이드 서열을 포함한다. 넉다운/넉아웃을 위해, 공여자 주형 서열은 전형적으로, 이것이 대체하는 게놈 서열과 동일하지 않고 게놈 서열에 대해 하나 이상의 단일 염기 변화, 삽입, 결실, 역위 또는 재배열을 함유할 수 있으며, 단, 상동성-안내 수선을 뒷받침하기 위해 표적 서열과 충분한 상동성이 존재한다면 그러하며, 또는 공여자 주형은 상동성 아암을 가지며, 이때 삽입은 표적 단백질이 발현되지 않거나 더 낮은 수준으로 발현되도록 프레임이동 또는 다른 돌연변이를 이끌 수 있다. 소정의 구현예에서, 넉다운/넉아웃 변형을 위해, 공여자 주형 서열은 재조합이 요망되는 표적 게놈 서열과 적어도 약 60%, 70%, 80%, 90%, 95%, 98%, 99%, 또는 99.9%의 서열 동일성을 가질 것이다. 일부 구현예에서, 표적 서열은 단백질 표적 유전자와 혼성화하는 서열을 갖고, CasX에 의해 도입되는 절단 부위에서 삽입되어 유전자 서열의 변형을 이끈다. 일부 경우에, 표적 서열은, 표적 유전자 엑손과 혼성화하는 서열을 갖는다. 다른 경우에, 표적 서열은, 표적 유전자 인트론과 혼성화하는 서열을 갖는다. 다른 경우에, 표적 서열은, 표적 유전자 인트론-엑손 연접부와 혼성화하는 서열을 갖는다. 다른 경우에, 표적 서열은, 표적 유전자의 유전자간 영역과 혼성화하는 서열을 갖는다. 더욱 다른 경우에, 표적 서열은, 표적 유전자의 조절 요소와 혼성화하는 서열을 갖는다. 전술한 구현예에서, 공여자 주형은 10-15,000개 뉴클레오타이드, 50-10,000개 뉴클레오타이드, 또는 100-1000개 뉴클레오타이드 크기의 범위일 수 있다. 일부 구현예에서, 공여자 주형은 단일-가닥 DNA 주형이다. 다른 구현예에서, 공여자 주형은 단일 가닥 RNA 주형이다. 다른 구현예에서, 공여자 주형은 이중 가닥 DNA 주형이다.
다른 구현예에서, 개시내용은 질환 항원, 선택적으로 종양 세포 항원에 특이적인 결합 도메인을 갖는 키메라 항원 수용체(CAR), 조작된 TCR, 또는 조작된 TCR의 하나 이상의 하위단위를 인코딩하는 폴리뉴클레오타이드를 제공하며, 이는 CAR 또는 조작된 TCR의 발현을 위해 집단의 표적 세포 내로 도입되어야 한다. 전술한 내용에서, 종양 세포 항원은 분화 클러스터 19(CD19), CD3, CD8, CD7, CD10, CD20, CD22, CD30, CLL1, CD33, CD34, CD38, CD41, CD44, CD47, CD49f, CD56, CD70, CD74, CD99, CD123, CD133, CD138, 카르보닉스 안하이드라제 IX(CAIX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 접착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEACAM5, 클라우딘 6(CLDN6), CLDN18, C-유형 렉틴 도메인 계열 12 구성원 A(CLEC12A), 상피-간엽 전이 인자(cMET), 세포독성 T-림프구-관련 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), EGFR-VIII, 상피 당단백질 2(EGP-2), EGP-40, EphA2, ENPP3, 상피 세포 접착 분자(EpCAM), erb-B2,3,4, 폴레이트 결합 단백질(FBP), 태아 아세틸콜린 수용체, 폴레이트 수용체-a, 폴레이트 수용체 1(FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사지향성 수용체 8(GRM8), 글리피칸-3(GPC3; glypican-3), 강글리오사이드 GD2, 강글리오사이드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), HER3, 인테그린 B7, 세포내 세포-접착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY; Lewis-Y), 콘드로모듈린-1(LECT1), L1 세포 접착 분자, 리소포스파티드산 수용체 3(LPAR3), 흑색종-관련 항원 1(MAGE-A1), 메소텔린, 뮤신 1(MUC1), MUC16, 흑색종-관련 항원 3(MAGEA3), 종양 단백질 p53(p53), T 세포에 의해 인식되는 흑색종 항원 1(MART1), 당단백질 100(GP100), 프로테이나제3(PR1), 에프린-A 수용체 2(EphA2), 자연 살해기 2D 리간드(NKG2D 리간드), 뉴욕 식도 편평 세포 암종 1(NY-ESO-1), 종양태아성 항원(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 고아 수용체 1(ROR1), 영양아층 당단백질(TPBG), 종양-관련 당단백질 72(TAG-72), 종양-관련 칼슘 신호 전달자 2(TROP-2), 티로시나제, 서바이빈, 혈관 내피 성장 인자 수용체 2(VEGF- R2), 윌름 종양-1(WT-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현되는 항원(PRAME), T 세포 수용체 베타 불변 1(TRBC1), TRBC2, 및 (T-세포 면역글로불린 뮤신-3) TIM-3으로 이루어진 군으로부터 선택될 수 있다. 일부 구현예에서, CAR 또는 조작된 TCR은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함한다. 특정 구현예에서, 항원 결합 도메인은 scFv이다. 구현예의 scFv에 사용하기에 적합한 예시적인 CDR 및 VL과 VH 서열은 표 5의 서열을 포함하여 본원에 기재되어 있다. 일 구현예에서, scFv의 VH, VL, 및/또는 CDR은 표 5의 서열에 비해 하나 이상의 아미노산 변형을 가지며, scFv는 종양 항원에 대해 결합 친화도를 유지하고, 변형은 치환, 결실, 및 삽입으로 이루어진 군으로부터 선택된다.
CAR을 포함하는 이들 구현예에서, CAR은 하나 이상의 세포내 신호전달 도메인을 추가로 포함할 수 있으며, 여기서 적어도 하나의 세포내 신호전달 도메인은 CD247 분자(CD3-제타), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB), 유도성 T 세포 공동자극자(ICOS), 또는 TNF 수용체 슈퍼계열 구성원 4(OX40)로부터 단리되거나 유래되는 적어도 하나의 세포내 신호전달 도메인을 포함한다. 또 다른 구현예에서, 적어도 하나의 세포내 신호전달 도메인은 a) CD3-제타 세포내 신호전달 도메인; b) CD3-제타 세포내 신호전달 도메인 및 4-1BB 또는 CD28 세포내 신호전달 도메인; c) CD-제타 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD28 세포내 신호전달 도메인; 또는 d) CD-제타 세포내 신호전달 도메인, CD28 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD27 또는 OX40 세포내 신호전달 도메인을 포함한다. 또 다른 구현예에서, CAR은 세포외 힌지 도메인을 추가로 포함하며, 여기서 힌지 도메인은 면역글로불린 유사 도메인이거나 힌지 도메인은 IgG1, IgG2, 또는 IgG4로부터 단리되거나 유래되거나, 힌지 도메인은 CD8a 분자(CD8) 또는 CD28로부터 단리되거나 유래된다. 또 다른 구현예에서, CAR은 막관통 도메인을 추가로 포함하며, 여기서 막관통 도메인은 CD3-제타, CD4, CD8, 및 CD28로 이루어진 군으로부터 단리되거나 유래된다.
조작된 T 세포 수용체(TCR)를 포함하는 이들 구현예에서, TCR은 TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타로 이루어진 군으로부터 선택되는 하나 이상의 하위단위를 추가로 포함할 수 있다. 일부 구현예에서, TCR은 세포내 신호전달 도메인으로부터 자극성 도메인을 포함하는 세포내 도메인을 추가로 포함하며, 여기서 TCR의 항원 결합 도메인은 하나 이상의 하위단위에 작동 가능하게 연결된다.
일부 구현예에서, 개시내용은 IL-7, IL-12, IL-15, 및 IL-18로 이루어진 군으로부터 선택되는 면역 자극성 사이토카인을 코딩하는 유도성 발현 카세트를 인코딩하는 폴리뉴클레오타이드를 추가로 제공하며, 여기서 폴리뉴클레오타이드는 CAR을 발현하는 집단의 변형된 표적 세포 내로 도입되어야 하고, 사이토카인의 발현은, 변형된 세포가 대상체에게 투여될 때 면역억제성 종양 환경에 내성이 되게 한다. 전술한 구성요소와 함께 CAR을 인코딩하는 폴리뉴클레오타이드는 아래 기재된 몇몇 종래의 방법에 의해 세포 내로 도입될 수 있다.
일부 구현예에서, 개시내용은 본원에 기재된 임의의 구현예의 기준 CasX, CasX 변이체, 또는 gNA를 이의 변이체를 포함하여 인코딩하는 폴리뉴클레오타이드 서열, 또는 표적 서열에 상보적인 서열을 생성하는 방법, 뿐만 아니라 폴리뉴클레오타이드 서열에 의해 발현되는 단백질 또는 이에 의해 전사되는 RNA를 발현시키는 방법에 관한 것이다. 일반적으로, 방법은 본원에 기재된 임의의 구현예의 기준 CasX, CasX 변이체, 또는 gNA를 코딩하는 폴리뉴클레오타이드 서열을 생성하는 단계 및 인코딩된 유전자를 숙주 세포에 적절한 발현 벡터 내로 혼입시키는 단계를 포함한다. 본원에 기재된 임의의 구현예의 인코딩된 기준 CasX, CasX 변이체, 또는 gNA의 생성을 위해, 방법은 인코딩 폴리뉴클레오타이드를 포함하는 발현 벡터로 적절한 숙주 세포를 형질전환시키는 단계, 및 본원에 기재된 임의의 구현예의 생성된 기준 CasX, CasX 변이체, 또는 gNA가 형질전환된 숙주 세포에서 발현되거나 전사되는 것을 야기하거나 허용하는 조건 하에 숙주 세포를 배양하여, 기준 CasX, CasX 변이체, 또는 gNA를 생성하는 단계를 포함하며, 이는 본원에 기재된 방법에 의해 또는 당업계에 알려진 표준 정제 방법에 의해 회수된다. 분자생물학에서의 표준 재조합 기법은 본 개시내용의 폴리뉴클레오타이드 및 발현 벡터를 만드는 데 사용된다.
개시내용에 따르면, 본원에 기재된 임의의 구현예의 면역 자극성 사이토카인에 대한 기준 CasX, CasX 변이체, gNA, CAR 또는 발현 카세트를 인코딩하는 폴리뉴클레오타이드 서열은, 적절한 숙주 세포에서 발현을 지시하는 재조합 DNA 분자를 생산하는 데 사용된다. 몇몇 클로닝 전략은 본 개시내용을 수행하는 데 적합하며, 이 중 많은 것들은 본 개시내용의 조성물, 또는 이의 보체를 코딩하는 유전자를 포함하는 작제물을 생산하는 데 사용된다. 일부 구현예에서, 클로닝 전략은, 조성물의 발현을 위해 숙주 세포를 형질전환시키는 데 사용되는 기준 CasX, CasX 변이체, 또는 gNA를 인코딩하는 뉴클레오타이드를 포함하는 작제물을 인코딩하는 유전자를 생성하는 데 사용된다.
하나의 접근법에서, 기준 CasX, CasX 변이체, 또는 gNA를 인코딩하는 DNA 서열을 함유하는 작제물이 먼저 제조된다. 이러한 작제물의 제조를 위한 예시적인 방법은 실시예에 기재되어 있다. 그 후에, 작제물은, 폴리펩타이드 작제물의 발현 및 회수를 위해 숙주 세포, 예컨대 원핵생물 또는 진핵생물 숙주 세포를 형질전환시키기에 적합한 발현 벡터를 생성하는 데 사용된다. 요망되는 경우, 숙주 세포는 이. 콜라이(E. coli)이다. 다른 구현예에서, 숙주 세포는 BHK 세포, HEK293 세포, HEK293T 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, NIH3T3 세포, COS, HeLa, CHO, 또는 효모 세포로부터 선택된다. 발현 벡터의 생성, 숙주 세포의 형질전환 및 기준 CasX, CasX 변이체, 또는 gNA의 발현과 회수를 위한 예시적인 방법은 실시예에 기재되어 있다.
기준 CasX, CasX 변이체, gNA 작제물, CAR, TCR 하위단위를 포함하는 하나 이상의 융합 폴리펩타이드, 또는 면역 자극성 사이토카인을 인코딩하는 유전자 또는 유전자들은 하나 이상의 단계에서, 실시예에 더 완전히 기재된 방법을 포함하여 완전히 합성적으로 또는 효소적 과정, 예컨대 제한 효소-매개 클로닝, PCR 및 중첩 연장과 조합된 합성에 의해 만들어질 수 있다. 본원에 개시된 방법은 요망되는 서열의 다양한 구성요소(예를 들어, CasX 및 gNA) 유전자를 인코딩하는 폴리뉴클레오타이드의 서열을 리게이션하는 데 사용될 수 있다. 폴리펩타이드 조성물을 인코딩하는 유전자는 유전자 합성의 표준 기법을 사용하여 올리고뉴클레오타이드로부터 조립된다.
일부 구현예에서, CasX 단백질, CAR, 조작된 TCR, 또는 조작된 TCR의 하나 이상의 하위단위를 인코딩하는 뉴클레오타이드 서열은 코돈 최적화된다. 이러한 유형의 최적화는 동일한 CasX 단백질, CAR 또는 TCR을 인코딩하는 한편 의도된 숙주 유기체 또는 세포의 코돈 선호도를 모방하기 위해 인코딩 뉴클레오타이드 서열의 돌연변이를 수반할 수 있다. 그러므로, 코돈은 변할 수 있지만, 인코딩된 단백질은 변하지 않은 채 남아있다. 예를 들어, CasX 단백질의 의도된 표적 세포가 인간 세포라면, 인간 코돈-최적화된 CasX-인코딩 뉴클레오타이드 서열이 사용될 수 있을 것이다. 또 다른 비제한적인 예로서, 의도된 숙주 세포가 마우스 세포라면, 마우스 코돈-최적화된 CasX-인코딩 뉴클레오타이드 서열이 생성될 수 있을 것이다. 또 다른 비제한적인 예로서, 의도된 숙주 세포가 식물 세포라면, 식물 코돈-최적화된 CasX 단백질 변이체-인코딩 뉴클레오타이드 서열이 생성될 수 있을 것이다. 또 다른 비제한적인 예로서, 의도된 숙주 세포가 곤충 세포라면, 곤충 코돈-최적화된 CasX 단백질-인코딩 뉴클레오타이드 서열이 생성될 수 있을 것이다. 유전자 설계는, 기준 CasX, CasX 변이체, 또는 gNA의 생성에 활용되는 숙주 세포에 적절한 코돈 용법 및 아미노산 조성물을 최적화하는 알고리즘을 사용하여 수행될 수 있다. 개시내용의 하나의 방법에서, 작제물의 구성요소를 인코딩하는 폴리뉴클레오타이드의 라이브러리는 상기 기재된 바와 같이 생성된 다음, 조립된다. 그 후에, 생성된 유전자는 조립되고, 생성된 유전자는 본원에 기재된 바와 같이, 숙주 세포를 형질전환시키고 이의 특성의 평가를 위해 기준 CasX, CasX 변이체, 또는 gNA 조성물을 생성하고 회수하는 데 사용된다.
일부 구현예에서, gNA를 인코딩하는 뉴클레오타이드 서열은 제어 요소, 예를 들어, 전사 제어 요소, 예컨대 프로모터에 작동 가능하게 연결된다. 일부 구현예에서, CasX 단백질을 인코딩하는 뉴클레오타이드 서열은 제어 요소, 예를 들어, 전사 제어 요소, 예컨대 프로모터에 작동 가능하게 연결된다. 일부 구현예에서, CAR을 인코딩하는 뉴클레오타이드 서열은 제어 요소, 예를 들어, 전사 제어 요소, 예컨대 프로모터에 작동 가능하게 연결된다.
전사 제어 요소는 프로모터일 수 있다. 일부 경우, 프로모터는 구성적으로 활성인 프로모터이다. 일부 경우, 프로모터는 조절 가능한 프로모터이다. 일부 경우, 프로모터는 유도성 프로모터이다. 일부 경우, 프로모터는 조직-특이적 프로모터이다. 일부 경우, 프로모터는 세포 유형-특이적 프로모터이다. 일부 경우, 전사 제어 요소(예를 들어, 프로모터)는 표적화된 세포 유형 또는 표적화된 세포 집단에서 기능적이다. 예를 들어, 일부 경우, 전사 제어 요소는 진핵생물 세포, 예를 들어, 뉴런, 척수 운동 뉴런(spinal motor neuron), 희소돌기세포(oligodendrocyte), 또는 신경교 세포(glial cell)에서 기능적일 수 있다.
진핵생물 프로모터(진핵생물 세포에서 기능적인 프로모터)의 비제한적인 예는 EF1알파, EF1알파 코어 프로모터, 사이토메갈로바이러스(CMV) 즉각 초기로부터의 것, 단순 포진 바이러스(HSV) 티미딘 키나제, 초기 및 후기 SV40, 레트로바이러스로부터의 긴 말단 반복부(LTR), 및 마우스 메탈로티오네인-I을 포함한다. 진핵생물 프로모터의 추가의 비제한적인 예는 CMV 프로모터 전장 프로모터, 최소 CMV 프로모터, 닭 β-액틴 프로모터, hPGK 프로모터, HSV TK 프로모터, 미니-TK 프로모터, 뉴런-특이적 발현을 부여하는 인간 시냅신 I 프로모터, 뉴런에서의 선택적 발현을 위한 Mecp2 프로모터, 최소 IL-2 프로모터, 라우스 육종(Rous sarcoma) 바이러스 인핸서/프로모터(단일), 비장 병소-형성 바이러스 긴 말단 반복부(LTR: long terminal repeat) 프로모터, SV40 프로모터, SV40 인핸서 및 초기(early) 프로모터, TBG 프로모터: 인간 티록신-결합 글로불린 유전자(간 특이적)로부터의 프로모터, PGK 프로모터, 인간 유비퀴틴 C 프로모터, UCOE 프로모터(HNRPA2B1-CBX3의 프로모터), 히스톤 H2 프로모터, 히스톤 H3 프로모터, U1a1 작은 핵 RNA 프로모터(226 nt), U1b2 작은 핵 RNA 프로모터(246 nt) 26, TTR 최소 인핸서/프로모터, b-키네신 프로모터, 인간 eIF4A1 프로모터, ROSA26 프로모터 및 글리세르알데하이드 3-포스페이트 데하이드로게나제(GAPDH) 프로모터를 포함한다.
적절한 벡터 및 프로모터의 선택은 당업자의 수준 내에 잘 포함되는데, 이것이 예를 들어, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질 및/또는 이의 조절 요소를 변형시키기 위해 발현을 제어하는 것과 관련이 있기 때문이다. 발현 벡터는 또한, 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 함유할 수 있다. 발현 벡터는 또한, 발현을 증폭시키기 위한 적절한 서열을 포함할 수 있다. 발현 벡터는 또한, CasX 단백질에 융합될 수 있는 단백질 태그(예를 들어, 6xHis 태그, 헤마글루티닌 태그, 형광 단백질 등)를 인코딩하는 뉴클레오타이드 서열을 포함하여, 따라서 정제 또는 검출에 사용되는 키메라 CasX 단백질을 이끌 수 있다.
일부 구현예에서, gNA 변이체 또는 CasX 단백질, CAR, 또는 면역 자극성 사이토카인에 대한 발현 카세트를 각각 인코딩하는 뉴클레오타이드 서열은 유도성 프로모터, 구성적으로 활성인 프로모터, 공간적으로 제약된 프로모터(즉, 전사 제어 요소, 인핸서, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등), 또는 시간적으로 제약된 프로모터에 작동 가능하게 연결된다. 다른 구현예에서, gNA, CasX, CAR, 또는 면역 자극성 사이토카인에 대한 발현 카세트를 인코딩하는 개별 뉴클레오타이드 서열은 전술한 프로모터 범주 중 하나에 연결되고, 이는 그 후에 하기 기재된 종래의 방법에 의해 변형될 세포 내로 도입된다.
소정의 구현예에서, 적합한 프로모터는 바이러스로부터 유래될 수 있고 따라서 바이러스 프로모터로 지칭될 수 있거나, 이러한 프로모터는 원핵생물 또는 진핵생물 유기체를 포함한 임의의 유기체로부터 유래될 수 있다. 적합한 프로모터는 임의의 RNA 폴리머라제(예를 들어, pol I, pol II, pol III)에 의한 발현을 유도하는 데 사용될 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유암 종양 바이러스 긴 말단 반복부(LTR) 프로모터; 아데노바이러스 주요 후기 프로모터(Ad MLP); 단순 포진 바이러스(HSV) 프로모터, 사이토메갈로바이러스(CMV) 프로모터, 예컨대 CMV 즉각 초기 프로모터 영역(CMVIE), 라우스 육종 바이러스(RSV) 프로모터, 인간 U6 작은 핵 프로모터(U6), 증강된 U6 프로모터, 인간 HI 프로모터(HI), POL1 프로모터, 7SK 프로모터, tRNA 프로모터 등을 포함하지만 이들로 제한되지는 않는다.
일부 구현예에서, CasX 및 gNA를 인코딩하고 선택적으로 공여자 주형 또는 CAR을 인코딩하는 폴리핵산을 포함하는 하나 이상의 뉴클레오타이드 서열은 각각 진핵생물 세포에서 작동 가능한 프로모터에(이의 제어 하에) 작동 가능하게 연결된다. 유도성 프로모터의 예는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노사이드(IPTG)-조절 프로모터, 락토스 유도 프로모터, 열 충격 프로모터, 테트라사이클린-조절 프로모터, 스테로이드-조절 프로모터, 금속-조절 프로모터, 에스트로겐 수용체-조절 프로모터 등을 포함할 수 있으나 이들로 제한되지는 않는다. 따라서 일부 구현예에서, 유도성 프로모터는 독시사이클린; 에스트로겐 및/또는 에스트로겐 유사체; IPTG 등을 포함하지만 이들로 제한되지 않는 분자에 의해 조절될 수 있다.
소정의 구현예에서, 사용하기에 적합한 유도성 프로모터는 본원에 기재되거나 당업자에게 알려진 임의의 유도성 프로모터를 포함할 수 있다. 유도성 프로모터의 예는 제한 없이, 화학적으로/생화학적으로-조절되는 및 물리적으로-조절되는 프로모터, 예컨대 알코올-조절 프로모터, 테트라사이클린-조절 프로모터(예를 들어, 안하이드로테트라사이클린(aTc)-반응성 프로모터 및 테트라사이클린 억제자 단백질(tetR), 테트라사이클린 오퍼레이터 서열(tetO) 및 테트라사이클린 트랜스활성자 융합 단백질(tTA)을 포함하는 다른 테트라사이클린-반응성 프로모터 시스템, 스테로이드-조절 프로모터(예를 들어, 래트 글루코코르티코이드 수용체, 인간 에스트로겐 수용체, 나방 엑디손 수용체에 기초한 프로모터, 및 스테로이드/레티노이드/갑상선 수용체 슈퍼계열로부터의 프로모터), 금속-조절 프로모터(예를 들어, 메탈로티오네인으로부터 유래되는 프로모터(효모, 마우스 및 인간로부터의 금속 이온)유전자에 결합하고 격리시키는 단백질), 발병-조절 프로모터(예를 들어, 살리실산, 에틸렌 또는 벤조티아디아졸(BTH)에 의해 유도됨), 온도/열-유도성 프로모터(예를 들어, 열 충격 프로모터), 및 광-조절 프로모터(예를 들어, 식물 세포로부터의 광 반응성 프로모터)를 포함한다.
일부 경우, 프로모터는 공간적으로 제약된 프로모터(즉, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이며, 따라서 다세포성 유기체에서, 프로모터는 특정 세포의 하위세트에서 활성(즉, "온")이다. 공간적으로 제약된 프로모터는 또한, 인핸서, 전사 제어 요소, 제어 서열 등으로 지칭될 수 있다. 임의의 편리한 공간적으로 제약된 프로모터는, 프로모터가 표적화된 숙주 세포(예를 들어, 진핵생물 세포; 원핵생물 세포)에서 기능적인 한, 사용될 수 있다.
일부 경우, 프로모터는 가역적 프로모터이다. 가역적 유도성 프로모터를 포함하여 적합한 가역적 프로모터는 당업계에 알려져 있다. 이러한 가역적 프로모터는 많은 유기체, 예를 들어, 진핵생물 및 원핵생물로부터 단리되고 유래될 수 있다. 제2 유기체, 예를 들어, 제1 원핵생물 및 제2 진핵생물, 제1 진핵생물 및 제2 원핵생물 등에서 사용하기 위한 제1 유기체로부터 유래된 가역적 프로모터의 변형이 당업계에 잘 알려져 있다. 이러한 가역적 프로모터, 및 이러한 가역적 프로모터에 기초할 뿐만 아니라 추가의 제어 단백질을 포함하는 시스템은, 알코올 조절 프로모터(예를 들어, 알코올 데하이드로게나제 I(alcA) 유전자 프로모터, 알코올 트랜스활성자 단백질에 반응성인 프로모터(AlcR 등), 테트라사이클린 조절 프로모터(예를 들어, Tet 활성자, TetON, TetOFF 등을 포함한 프로모터 시스템), 스테로이드 조절 프로모터(예를 들어, 래트 글루코코르티코이드 수용체 프로모터 시스템, 인간 에스트로겐 수용체 프로모터 시스템, 레티노이드 프로모터 시스템, 갑상선 프로모터 시스템, 엑디손 프로모터 시스템, 미페프리스톤(mifepristone) 프로모터 시스템 등), 금속 조절 프로모터(예를 들어, 메탈로티오네인 프로모터 시스템 등), 발병-관련 조절 프로모터(예를 들어, 살리실산 조절 프로모터, 에틸렌 조절 프로모터, 벤조티아디아졸 조절 프로모터 등), 온도 조절 프로모터(예를 들어, 열 충격 유도성 프로모터(예를 들어, HSP-70, HSP-90, 대두 열 충격 프로모터 등), 광 조절 프로모터, 합성 유도성 프로모터 등을 포함하지만 이들로 제한되지는 않는다.
개시내용의 재조합 발현 벡터는 또한, 개시내용의 CasX 단백질, gNA, 및 CAR의 강력한 발현을 용이하게 하는 요소를 포함할 수 있다. 예를 들어, 재조합 발현 벡터는 폴리아데닐화 신호(PolyA), 인트론 서열 또는 전사-후 조절 요소, 예컨대 마멋 간염 전사-후 조절 요소(WPRE) 중 하나 이상을 포함할 수 있다. 예시적인 polyA 서열은 hGH 폴리(A) 신호(짧음), HSV TK 폴리(A) 신호, 합성 폴리아데닐화 신호, SV40 폴리(A) 신호, β-글로빈 폴리(A) 신호 등을 포함한다. 당업자는, 본원에 기재된 재조합 발현 벡터에 포함될 적합한 요소를 선택할 수 있을 것이다.
그 후에, 기준 CasX, CasX 변이체, gNA 서열, 및 CAR, 조작된 TCR, 또는 조작된 TCR의 하나 이상의 하위단위를 인코딩하는 폴리뉴클레오타이드는 하나 이상의 발현 벡터 내로 개별적으로 클로닝될 수 있다. 일부 구현예에서, 본 개시내용은 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 바이러스-유사 입자(VLP), 단순 포진 바이러스(HSV) 벡터, 플라스미드, 미니서클(minicircle), 나노플라스미드, DNA 벡터, 및 RNA 벡터로 이루어진 군으로부터 선택되는 폴리뉴클레오타이드를 포함하는 벡터를 제공한다. 일부 구현예에서, 벡터는 CasX 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 재조합 발현 벡터이다. 다른 구현예에서, 개시내용은 CasX 단백질을 인코딩하는 뉴클레오타이드 서열 및 gNA를 인코딩하는 뉴클레오타이드 서열을 포함하는 재조합 발현 벡터를 제공한다. 일부 경우, CasX 단백질 변이체를 인코딩하는 뉴클레오타이드 서열 및/또는 gNA를 인코딩하는 뉴클레오타이드 서열은 선택된 유형의 세포에서 작동 가능한 프로모터에 작동 가능하게 연결된다. 다른 구현예에서, CasX 단백질 변이체를 인코딩하는 뉴클레오타이드 서열 및 gNA를 인코딩하는 뉴클레오타이드 서열은 프로모터에 작동 가능하게 연결된 별개의 벡터에서 제공된다. 다른 구현예에서, 벡터는 공여자 주형 또는 하나 이상의 CAR, 조작된 TCR, 하나 이상의 조작된 TCR 하위단위를 인코딩하는 폴리뉴클레오타이드를 포함할 수 있거나, 별도의 주형은 공여자 주형 또는 하나 이상의 CAR 또는 조작된 TCR 하위단위를 변형될 표적 세포 내로 도입하는 데 활용될 수 있다.
일부 구현예에서, (i) 공여자 주형 핵산의 뉴클레오타이드 서열로서, 상기 공여자 주형은 표적 핵산(예를 들어, 표적 게놈)의 표적 서열에 대해 상동성을 갖는 뉴클레오타이드 서열을 포함하는, 공여자 주형 핵산의 뉴클레오타이드 서열; (ii) 표적 세포, 예컨대 진핵생물 세포에서 작동 가능한 프로모터에 작동 가능하게 연결된 표적화된 게놈(예를 들어, 단일 가이드 또는 이중 가이드 RNA로서 배치됨)의 좌위의 표적 서열에 혼성화하는 gNA를 인코딩하는 뉴클레오타이드 서열; (iii) 표적 세포, 예컨대 진핵생물 세포에서 작동 가능한 프로모터에 작동 가능하게 연결된 CasX 단백질을 인코딩하는 뉴클레오타이드 서열; (iv) 표적 세포, 예컨대 진핵생물 세포에서 작동 가능한 프로모터에 작동 가능하게 연결된 CAR을 인코딩하는 뉴클레오타이드 서열; 및 (v) 표적 세포, 예컨대 진핵생물 세포에서 작동 가능한 프로모터에 작동 가능하게 연결된 면역 자극성 사이토카인에 대한 발현 벡터를 인코딩하는 뉴클레오타이드 서열 중 하나 이상을 포함하는 하나 이상의 재조합 발현 벡터가 본원에 제공된다. 일부 구현예에서, 공여자 주형, gNA, CasX 단백질, CAR, 조작된 TCR 또는 이의 하나 이상의 하위단위, 및 발현 카세트를 인코딩하는 서열은 상이한 재조합 발현 벡터에 존재하고, 다른 구현예에서 하나 이상의 폴리뉴클레오타이드 서열(공여자 주형, CasX, gNA, CAR, 조작된 TCR 또는 이의 하나 이상의 하위단위, 및 발현 카세트에 대해)은 동일한 재조합 발현 벡터에 존재한다. 다른 경우에, CasX 및 gNA는 RNP로서(예를 들어, 전기천공 또는 화학적 수단에 의해) 표적 세포에 전달되고, 공여자 주형 및/또는 CAR, 또는 조작된 TCR 또는 이의 하나 이상의 하위단위, 및 발현 카세트를 인코딩하는 폴리뉴클레오타이드는 벡터에 의해 전달된다.
폴리뉴클레오타이드 서열(들)은 여러 가지 절차에 의해 벡터 내로 삽입된다. 일반적으로, DNA는 당업계에 알려진 기법을 사용하여 적절한 제한 엔도뉴클레아제 부위(들) 내로 삽입된다. 벡터 구성요소는 일반적으로 하나 이상의 신호 서열, 복제 원점, 하나 이상의 마커 유전자, 인핸서 요소, 프로모터, 및 전사 종결 서열을 포함하지만 이들로 제한되지는 않는다. 이들 구성요소 중 하나 이상을 함유하는 적합한 벡터의 작제는 당업자에게 알려진 표준 리게이션 기법을 이용한다. 이러한 기법은 당업계에 잘 알려져 있고 과학적 및 특허 문헌에 잘 기재되어 있다. 다양한 벡터는 공개적으로 입수 가능하다. 벡터는 예를 들어, 편리하게는 재조합 DNA 절차를 받을 수 있는 플라스미드, 코스미드(cosmid), 바이러스 입자, 또는 파지의 형태로 존재할 수 있고, 벡터의 선택은 종종 이것이 도입되어야 하는 숙주 세포에 의존할 것이다. 그러므로, 벡터는 자율 복제성(autonomously replicating) 벡터, 즉, 염색체외 엔티티(extrachromosomal entity)로서 존재하는 벡터일 수 있으며, 이의 복제는 염색체 복제에 독립적이며, 예를 들어, 플라스미드이다. 대안적으로, 벡터는, 숙주 세포 내로 도입될 때, 숙주 세포 게놈 내로 통합되고 이것이 통합되었던 염색체(들)와 함께 복제되는 것일 수 있다. 일단 적합한 숙주 세포 내로 도입될 때, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질의 발현은 당업계에 알려진 임의의 핵산 또는 단백질 검정을 사용하여 결정될 수 있다. 예를 들어, 기준 CasX 또는 CasX 변이체의 전사된 mRNA의 존재는 폴리뉴클레오타이드의 임의의 영역에 상보적인 프로브를 사용하여, 종래의 혼성화 검정(예를 들어, 노던 블롯 분석), 증폭 절차(예를 들어 RT-PCR), SAGE(미국 특허 제5,695,937호), 및 어레이-기초 기술(예를 들어, 미국 특허 제5,405,783호, 제5,412,087호 및 제5,445,934호 참조)에 의해 검출되고/되거나 정량화될 수 있다.
개시내용은 숙주 세포와 융화성(compatible)이고 이에 의해 인식되며 폴리펩타이드의 제어된 발현 또는 RNA의 전사를 위해 폴리펩타이드를 인코딩하는 유전자에 작동 가능하게 연결되는 복제 및 제어 서열을 함유하는 플라스미드 발현 벡터의 사용을 제공한다. 이러한 벡터 서열은 여러 가지 박테리아, 효모, 및 바이러스에 대해 잘 알려져 있다. 사용될 수 있는 유용한 발현 벡터는 예를 들어, 염색체, 비-염색체 및 합성 DNA 서열의 분절(segment)을 포함한다. "발현 벡터"는, 적합한 숙주에서 폴리펩타이드를 인코딩하는 DNA의 발현을 실시할 수 있는 적합한 제어 서열에 작동 가능하게 연결된 DNA 서열을 함유하는 DNA 작제물을 지칭한다. 요건은, 벡터가 선택된 숙주 세포에서 복제 가능하고 생존할 수 있다는 것이다. 낮은-복사 또는 높은-복사 수 벡터가 요망되는 대로 사용될 수 있다. 벡터의 제어 서열은 전사를 실시하기 위한 프로모터, 이러한 전사를 제어하기 위한 선택적인 오퍼레이터 서열, 적합한 mRNA 리보솜 결합 부위를 인코딩하는 서열, 및 전사 및 번역의 종결을 제어하는 서열을 포함한다. 프로모터는, 선택된 숙주 세포에서 전사 활성을 나타내며 숙주 세포에 상동성이거나 이종성인 단백질을 인코딩하는 유전자로부터 유래될 수 있는 임의의 DNA 서열일 수 있다.
폴리뉴클레오타이드 및 재조합 발현 벡터는 여러 가지 방법에 의해 표적 숙주 세포로 전달될 수 있다. 이러한 방법은 바이러스 감염, 형질주입, 리포펙션, 전기천공, 칼슘 포스페이트 침전, 폴리에틸렌이민(PEI)-매개 형질주입, DEAE-덱스트란 매개 형질주입, 미세주사, 리포솜-매개 형질주입, 입자 총 기술, 핵주입, 공여자 DNA에 융합되거나 이를 동원하는 세포 투과성 CasX 단백질에 의한 직접 첨가, 세포 압착(cell squeezing), 칼슘 포스페이트 침전, 직접 미세주사, 나노입자-매개 핵산 전달, Qiagen으로부터의 상업적으로 입수 가능한 TransMessenger®, Stemgent로부터의 StemfectTM RNA 형질주입 키트, 및 Mirus Bio LLC로부터의 TransIT®-mRNA 형질주입 키트, Lonza 핵주입, Maxagen 전기천공 등을 사용하는 것 등을 포함하지만 이들로 제한되지 않는다.
재조합 발현 벡터 서열은 생체외, 시험관내 또는 생체내에서 세포의 후속적인 감염 및 형질전환을 위해 바이러스 또는 바이러스-유사 입자(본원에서 또한 "VLP" 또는 "비리온"으로 지칭됨) 내로 패키징될 수 있다. 이러한 VLP 또는 비리온은 전형적으로, 벡터 게놈을 캡시드화하거나 패키징하는 단백질을 포함할 것이다. 적합한 발현 벡터는 백시나 바이러스(vaccinia virus); 폴리오바이러스(poliovirus); 아데노바이러스(adenovirus); 레트로바이러스(retroviral) 벡터(예를 들어, 뮤린 백혈병 바이러스(Murine Leukemia Virus)), 비장 괴사 바이러스, 및 레트로바이러스, 예컨대 라우스 육종 바이러스(Rous Sarcoma Virus), 하비 육종 바이러스(Harvey Sarcoma Virus), 조류 백혈증 바이러스(avian leukosis virus), 레트로바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스(myeloproliferative sarcoma virus), 유선 종양 바이러스(mammary tumor virus) 등에 기초한 바이러스 발현 벡터를 포함할 수 있다. 일부 구현예에서, 본 개시내용의 재조합 발현 벡터는 재조합 아데노-관련 바이러스(AAV) 벡터이다. 특정 구현예에서, 본 개시내용의 재조합 발현 벡터는 재조합 레트로바이러스 벡터이다. 또 다른 특정 구현예에서, 본 개시내용의 재조합 발현 벡터는 재조합 렌티바이러스 벡터이다.
AAV는, 대상체에게 투여되기 위해 제조될 세포에 대해 생체내에서 또는 생체외에서 진핵생물 세포와 같은 세포에 전달하기 위해 바이러스 벡터를 이용하는 상황에서 인간 질환을 치료하는 데 유용한 작은(20 nm), 비병원성 바이러스이다. 작제물, 예를 들어 본원에 기재된 바와 같이 임의의 CasX 단백질 및 gNA 구현예를 인코딩하는 작제물이 생성되고, 선택적으로 공여자 주형 또는 CAR을 인코딩하는 폴리펩타이드는 AAV 역 말단 반복부(ITR) 서열과 플랭킹되어, AAV 바이러스 입자 내로의 AAV 벡터의 패키징을 가능하게 할 수 있다.
"AAV" 벡터는 천연 발생 야생형 바이러스 자체 또는 이의 유도체를 지칭할 수 있다. 용어는, 다르게 필요한 경우를 제외하고는, 모든 하위유형, 혈청형 및 위형(pseudotype), 및 천연 발생 형태와 재조합 형태 둘 다를 망라한다. 본원에 사용된 바와 같이, 용어 "혈청형"은, 정의된 항혈청과의 캡시드 단백질 반응성에 기초하여 다른 AAV에 의해 식별되고 이로부터 구별되는 AAV를 지칭하며, 예를 들어, 영장류 AAV의 많은 기지의 혈청형이 존재한다. 일부 구현예에서, AAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV 10, AAV-Rh74(레서스 원숭이(Rhesus macaque)-유래 AAV), 및 AAVRh10, 및 이들 혈청형의 변형된 캡시드로부터 선택된다. 예를 들어, 혈청형 AAV-2는, AAV-2의 캡 유전자로부터 인코딩되는 캡시드 단백질 및 동일한 AAV-2 혈청형으로부터의 5' 및 3' ITR 서열을 함유하는 게놈을 함유하는 AAV를 지칭하는 데 사용된다. 위형화된 AAV는, 하나의 혈청형으로부터의 캡시드 단백질 및 제2 혈청형의 5'-3' ITR을 포함하는 바이러스 게놈을 함유하는 AAV를 지칭한다. 위형화된 rAAV는, 캡시드 혈청형의 세포 표면 결합 특성 및 ITR 혈청형과 일관된 유전적 특성을 갖는 것으로 예상될 것이다. 위형화된 재조합 AAV(rAAV)는 당업계에 기재된 표준 기법을 사용하여 생성된다. 본원에 사용된 바와 같이, 예를 들어, rAAV1은 동일한 혈청형으로부터의 캡시드 단백질과 5'-3' ITR 둘 다를 갖는 AAV를 지칭하는 데 사용될 수 있거나, rAAV1은 혈청형 1로부터의 캡시드 단백질 및 상이한 AAV 혈청형, 예를 들어, AAV 혈청형 2로부터의 5'-3' ITR을 갖는 AAV를 지칭할 수 있다. 본원에 예시된 각각의 예에 대해, 벡터 설계 및 생성의 설명은 캡시드 및 5'-3' ITR 서열의 혈청형을 기재한다.
"AAV 바이러스" 또는 "AAV 바이러스 입자"는 적어도 하나의 AAV 캡시드 단백질(바람직하게는 야생형 AAV의 캡시드 단백질 모두에 의해) 및 캡시드화된 폴리뉴클레오타이드로 이루어진 바이러스 입자를 지칭한다. 입자가 이종성 폴리뉴클레오타이드(즉, 포유류 세포에 전달될 야생형 AAV 게놈 이외의 폴리뉴클레오타이드)를 추가로 포함한다면, 이는 전형적으로 "rAAV"로 지칭된다. 예시적인 이종성 폴리뉴클레오타이드는 본원에 기재된 임의의 구현예의 CasX 단백질 및/또는 sgNA, 및 선택적으로 공여자 주형을 포함하는 폴리뉴클레오타이드이다.
"아데노-관련 바이러스 역 말단 반복부" 또는 "AAV ITR"은, cis에서 함께 DNA 복제의 기원으로서 그리고 바이러스에 대한 패키징 신호로서 작용하는 AAV 게놈의 각각의 단부에서 발견되는 당업계에서 인식되는 영역으로 의미된다. AAV ITR은 AAV rep 코딩 영역과 함께, 2개의 플랭킹 ITR 사이에서 포유류 세포 게놈 내로 개재되는(interposed) 뉴클레오타이드 서열의 효율적인 절제 및 이로부터의 구제(rescue), 및 통합을 제공한다.
AAV ITR 영역의 뉴클레오타이드 서열은 알려져 있다. 예를 들어 문헌[Kotin, R. M. (1994) Human Gene Therapy 5:793-801]; 문헌[Berns, K. I. "Parvoviridae and their Replication" in Fundamental Virology, 2nd Edition, (B. N. Fields 및 D. M. Knipe, eds.)]을 참조한다. 본원에 사용된 바와 같이, AAV ITR이 도시된 야생형 뉴클레오타이드 서열을 가질 필요는 없으나, 예를 들어, 뉴클레오타이드의 삽입, 결실 또는 치환에 의해 변경될 수 있다. 추가로, AAV ITR은 제한 없이, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV-Rh74, 및 AAVRh10을 포함한 임의의 몇몇 AAV 혈청형, 및 이들 혈청형의 변형된 캡시드로부터 유래될 수 있다. 더욱이, AAV 벡터에서 선택된 뉴클레오타이드 서열을 플랭킹하는 5' 및 3' ITR은, 이들이 의도된 대로 작용하는 한, 즉, 숙주 세포 게놈 또는 벡터로부터 관심 서열의 절제 및 구제를 가능하게 하고, AAV rep 유전자 생성물이 세포에 존재할 때 수혜자 세포 게놈 내로의 이종성 서열의 통합을 가능하게 하는 한, 본질적으로 동일할 필요가 없거나 동일한 AAV 혈청형 또는 단리물로부터 유래될 필요는 없다. 숙주 세포 내로의 이종성 서열의 통합을 위한 AAV 혈청형의 사용은 당업계에 알려져 있다(예를 들어, 본원에 참조로서 포함된 국제공개 WO2018195555A1호 및 미국 특허출원공개 US20180258424A1호 참조).
"AAV rep 코딩 영역"이란, 복제 단백질 Rep 78, Rep 68, Rep 52 및 Rep 40을 인코딩하는 AAV 게놈의 영역을 의미한다. 이들 Rep 발현 생성물은 DNA 복제의 AAV 기원의 인식, 결합 및 틈새 형성, DNA 헬리카제 활성 및 AAV(또는 다른 이종성) 프로모터로부터의 전사의 조절을 포함한 많은 기능을 소유하는 것으로 나타났다. Rep 발현 생성물은 종합하여, AAV 게놈의 복제에 필요하다.
"AAV 캡 코딩 영역"이란, 캡시드 단백질 VP1, VP2, 및 VP3, 또는 이의 기능성 상동체를 인코딩하는 AAV 게놈의 영역을 의미한다. 이들 캡 발현 생성물은, 종합하여 바이러스 게놈을 패키징하는 데 필요한 패키징 기능을 제공한다.
일부 구현예에서, 숙주 세포로의 CasX, gNA, 및 선택적으로, CAR 및/또는 사이토카인에 대한 발현 카세트를 인코딩하는 공여자 주형 뉴클레오타이드 또는 폴리뉴클레오타이드의 전달에 활용되는 AAV 캡시드는 제한 없이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV-Rh74(레서스 원숭이-유래 AAV), 및 AAVRh10을 포함한 임의의 몇몇 AAV 혈청형으로부터 유래될 수 있고, AAV ITR은 AAV 혈청형 2로부터 유래된다.
rAAV 바이러스 입자를 생성하기 위해, AAV 발현 벡터는 기지의 기법, 예컨대 형질주입을 사용하여 적합한 숙주 세포 내로 도입된다. 패키징 세포는 전형적으로, 바이러스 입자를 형성하는 데 사용되며; 이러한 세포는 아데노바이러스를 패키징하는 HEK293 또는 HEK293T 세포(및 당업계에 알려진 다른 세포)를 포함한다. 많은 형질주입 기법은 일반적으로 당업계에 알려져 있으며; 예를 들어, 문헌[Sambrook 등 (1989) Molecular Cloning, a laboratory manual, Cold Spring Harbor Laboratories, New York]을 참조한다. 특히 적합한 형질주입 방법은 칼슘 포스페이트 공동-침전, 배양된 세포 내로의 직접 미세주사, 전기천공, 리포솜 매개 유전자 이전, 지질-매개 형질도입, 및 고속 미세투사물(microprojectile)을 사용하는 핵산 전달을 포함한다.
일부 구현예에서, 상기 기재된 AAV 발현 벡터로 형질주입된 숙주 세포는, AAV ITR에 의해 플랭킹된 뉴클레오타이드 서열을 복제하고 캡시드화하여 rAAV 바이러스 입자를 생성하기 위해, AAV 헬퍼 기능을 제공할 수 있게 된다. AAV 헬퍼 기능은 일반적으로 AAV-유래 코딩 서열이며, 이는 AAV 유전자 생성물을 제공하도록 발현될 수 있으며, 이는 다시 생산적 AAV 복제를 위해 트랜스에서 작용한다. AAV 헬퍼 기능은 본원에서, AAV 발현 벡터로부터 누락되고 있는 필요한 AAV 기능을 보완하는 데 사용된다. 그러므로, AAV 헬퍼 기능은 rep 및 cap 코딩 영역을 인코딩하는 주요 AAV ORF(개방 리딩 프레임) 중 하나 또는 둘 다, 또는 이의 기능성 상동체를 포함한다. 부속 기능은 당업자에게 알려진 방법을 사용하여 숙주 세포 내로 도입된 다음 발현될 수 있다. 보편적으로, 부속 기능은 숙주 세포를 관련이 없는 헬퍼 바이러스로 감염시킴으로써 제공된다. 일부 구현예에서, 부속 기능은 부속 기능 벡터를 사용하여 제공된다. 활용되는 부속/벡터 시스템에 따라, 구성적 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결자 등을 포함한 임의의 수의 적합한 전사 및 번역 제어 요소가 발현 벡터에 사용될 수 있다.
다른 구현예에서, 적합한 벡터는 바이러스-유사 입자(VLP)를 포함할 수 있다. 바이러스-유사 입자(VLP)는 바이러스를 밀접하게 닮아 있지만, 바이러스의 유전적 재료를 함유하지 않고 따라서 비-감염성인 입자이다. 일부 구현예에서, VLP는 관심 이식유전자(transgene), 예를 들어 본원에 기재된 임의의 CasX 단백질 및/또는 gNA 구현예를 인코딩하는 폴리뉴클레오타이드, 및 선택적으로, 공여자 주형 폴리뉴클레오타이드 또는 CAR을 인코딩하는 폴리뉴클레오타이드를 하나 이상의 바이러스 구조 단백질로 패키징된 채로 포함한다.
다른 구현예에서, 개시내용은 CasX:gNA RNP 복합체, 및 선택적으로, 공여자 주형 또는 CAR, 조작된 TCR을 인코딩하는 폴리뉴클레오타이드, 또는 조작된 TCR의 하위단위를 포함하는 융합 폴리펩타이드를 포함하는, 시험관내에서 생성된 VLP를 제공한다. 상이한 바이러스로부터의 구조 단백질들의 조합은, 파보비리대(parvoviridae)(예를 들어, 아데노-관련 바이러스), 레트로비리대(Retroviridae)(예를 들어, HIV), 플라비비리대(Flaviviridae)(예를 들어, C형 간염 바이러스), 파라믹소비리대(Paramyxoviridae)(예를 들어, 니파(Nipah)) 및 박테리오파지(예를 들어, Qβ, AP205)를 포함한 바이러스 계열로부터의 구성요소를 포함하는 VLP를 생성하는 데 사용될 수 있다. 일부 구현예에서, 개시내용은 HIV와 같은 렌티바이러스를 포함한 레트로바이러스의 구성요소를 사용하여 설계된 VLP 시스템을 제공하며, 여기서 다양한 구성요소를 인코딩하는 폴리뉴클레오타이드를 포함하는 개별 플라스미드는 패키징 세포 내로 도입되어, 다시 말해 VLP를 생성한다. 일부 구현예에서, 개시내용은 매트릭스 단백질(MA), 뉴클레오캡시드 단백질(NC), 캡시드 단백질(CA), p1-p6 단백질, 및 프로테아제 절단 부위의 군으로부터 선택되는 gag 폴리단백질의 하나 이상의 성분을 포함하는 VLP를 제공하며, 여기서 VLP 입자는 CasX:gNA RNP를 캡시드화하도록 이끌어지고, 여기서 VLP 입자는 표적 세포로의 향성(tropism)을 제공하는 표면 상의 표적화 당단백질을 추가로 포함하고, 표적 세포 내로 투여 및 진입 시, RNP 분자는 자유롭게 되어 세포의 핵 내로 수송된다. 다른 구현예에서, 개시내용은 매트릭스 단백질(MA), 뉴클레오캡시드 단백질(NC), 캡시드 단백질(CA), p1-p6 단백질, pol 폴리단백질의 하나 이상의 구성요소, 프로테아제 절단 부위의 군으로부터 선택되는 gag 폴리단백질의 하나 이상의 성분을 포함하는 VLP를 제공하며, 여기서 VLP 입자는 CasX:gNA RNP를 캡시드화하도록 이끌어지고, 여기서 VLP 입자는 표적 세포로의 향성을 제공하는 표면 상의 표적화 당단백질을 추가로 포함하고, 표적 세포 내로 투여 및 진입 시, RNP 분자는 자유롭게 되어 세포의 핵 내로 수송된다. 전술한 내용은, 분열 세포 및 비-분열 세포로의 바이러스 형질도입이 효율적이고, VLP가 대상체의 면역 감시 기전을 벗어나는 강력하고 단기-수명의 RNP를 전달한다는 점에서, 당업계의 다른 벡터를 능가하는 이점을 제공하며, 상기 면역 감시 기전은 그렇지 않으면 외래 단백질을 검출할 것이다. 일부 구현예에서, 숙주 세포에서 VLP를 만들기 위한 시스템은 i) gag 폴리단백질 또는 이의 일부; ii) 본원에 기재된 임의의 구현예의 CasX 단백질; iii) 프로테아제 절단 부위; iv) 프로테아제; v) 본원에 기재된 임의의 구현예의 가이드 RNA; vi) pol 폴리단백질 또는 이의 일부; vii) 표적 세포로의 VLP의 결합 및 융합을 제공하는 위형화(pseudotyping) 당단백질 또는 항체 단편; 및 viii) CAR 또는 조작된 TCR로부터 선택되는 하나 이상의 구성요소를 인코딩하는 폴리뉴클레오타이드를 포함한다. 외피(envelope) 단백질 또는 당단백질은 VLP에 향상을 부여하는 것으로 당업계에 알려진, 아르헨티나 출혈열 바이러스(Argentine hemorrhagic fever virus), 오스트레일리아 박쥐 바이러스(Australian bat virus), 오토그래파 캘리포니아 다중 뉴클레오폴리헤드로바이러스(Autographa californica multiple nucleopolyhedrovirus), 조류 백혈증 바이러스, 비비 내인성 바이러스(baboon endogenous virus), 볼리비아 출혈열 바이러스(Bolivian hemorrhagic fever virus), 보르나 질환 바이러스(Borna disease virus), 브레다 바이러스(Breda virus), 부니암웨라 바이러스(Bunyamwera virus), 찬디푸라 바이러스(Chandipura virus), 치쿤구니야 바이러스(Chikungunya virus), 크리미안-콩고 출혈열 바이러스(Crimean-Congo hemorrhagic fever virus), 뎅기열 바이러스(Dengue fever virus), 듀벤헤이즈 바이러스(Duvenhage virus), 동부 말 뇌염 바이러스(Eastern equine encephalitis virus), 에볼라 출혈열 바이러스(Ebola hemorrhagic fever virus), 에볼라 자이르 바이러스(Ebola Zaire virus), 장 아데노바이러스(enteric adenovirus), 에페머로바이러스(Ephemerovirus), 엡스타인-바 바이러스(EBV; Epstein-Bar virus), 유럽 박쥐 바이러스1(European bat virus 1), 유럽 박쥐 바이러스 2, 퍼그 합성 gP 융합(Fug Synthetic gP Fusion), 긴팔 원숭이 백혈병 바이러스(Gibbon ape leukemia virus), 한타바이러스(Hantavirus), 헨드라 바이러스(Hendra virus), A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 1형 단순 포진 바이러스, 2형 단순 포진 바이러스, 인간 사이토메갈로바이러스(HHV5), 인간 거품 바이러스(human foamy virus), 인간 헤르페스바이러스(HHV), 인간 헤르페스바이러스 7, 6형 인간 헤르페스바이러스, 8형 인간 헤르페스바이러스, 인간 면역결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스(human metapneumovirus), 인간 T-림프친화성 바이러스 1, A형 인플루엔자, B형 인플루엔자, C형 인플루엔자 바이러스, 일본 뇌염 바이러스, 카포시 육종-관련 헤르페스바이러스(HHV8), 카이사누르 삼림 질환 바이러스(Kaysanur Forest disease virus), 라 크로스 바이러스(La Crosse virus), 라고스 박쥐 바이러스(Lagos bat virus), 라싸열 바이러스(Lassa fever virus), 림프구성 맥락수막염 바이러스(LCMV; lymphocytic choriomeningitis virus), 마추포 바이러스(Machupo virus), 마르부르크 출혈열 바이러스(Marburg hemorrhagic fever virus), 홍역 바이러스(measles virus), 중동 호흡기 증후군-관련 코로나바이러스(Middle eastern respiratory syndrome-related coronavirus), 모콜라 바이러스(Mokola virus), 몰로니 뮤린 백혈병 바이러스(Moloney Murine leukemia virus), 원숭이 두창(monkey pox), 마우스 유선 종양 바이러스, 유행성이하선염 바이러스(mumps virus), 뮤린 감마헤르페스바이러스, 뉴캐슬 질환 바이러스(Newcastle disease virus), 니파 바이러스, 니파 바이러스, 노르워크 바이러스(Norwalk virus), 옴스크 출혈열 바이러스(Omsk hemorrhagic fever virus), 유두종 바이러스(papilloma virus), 파보바이러스(parvovirus), 가성광견병 바이러스(pseudorabies virus), 쿼란필 바이러스(Quaranfil virus), 광견병 바이러스, RD114 내인성 고양이과 레트로바이러스(RD114 Endogenous Feline Retrovirus), 호흡기 융합 바이러스(RSV; respiratory syncytial virus), 리프트 밸리열 바이러스(Rift Valley fever virus), 로쓰 리버 바이러스(Ross River virus), r로타바이러스(rRotavirus), 라우스 육종 바이러스, 풍진 바이러스(rubella virus), 사비아-관련 출혈열 바이러스(Sabia-related hemorrhagic fever virus), SARS-관련 코로나바이러스(SARS-CoV), 센다이 바이러스(Sendai virus), 타카리브 바이러스(Tacaribe virus), 토고토바이러스(Thogotovirus), 진드기-매개 뇌염 유발 바이러스(tick-borne encephalitis causing virus), 수두대상포진 바이러스(varicella zoster virus)(HHV3), 수두대상포진 바이러스(HHV3), 대두창 바이러스(variola major virus), 소두창 바이러스(variola minor virus), 베네수엘라 말 뇌염 바이러스(Venezuelan equine encephalitis virus), 베네수엘라 출혈열 바이러스(Venezuelan hemorrhagic fever virus), 수포성 구내염 바이러스(VSV; vesicular stomatitis virus), VSV-G, 수포성바이러스(Vesiculovirus), 웨스트 나일 바이러스(West Nile virus), 서부 말 뇌염 바이러스(western equine encephalitis virus), 및 지카 바이러스(Zika Virus)로 이루어진 군을 포함하지만 이들로 제한되지 않는 임의의 외피보유(enveloped) 바이러스로부터 유래될 수 있다. 일부 구현예에서, VLP의 생성에 사용되는 패키징 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2 세포, Saos-2 세포, HuH7 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO 세포, NIH3T3 세포, COS 세포, WI38 세포, MRC5 세포, A549 세포, HeLa 세포, CHO 세포, 또는 HT1080 세포로 이루어진 군으로부터 선택된다.
VII. 세포
일부 구현예에서, 본 개시내용은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 세포의 하나 이상의 단백질을 넉다운시키거나 넉아웃시키기 위해 변형된 세포 집단을 제공한다. 다른 구현예에서, 본 개시내용은 질환 항원에 대해 결합 친화도를 갖는 하나 이상의 키메라 항원 수용체(CAR) 또는 조작된 TCR의 하위단위를 포함하는 융합 폴리펩타이드를 넉인시키기 위해 변형된 세포 집단을 제공한다. 더욱 다른 구현예에서, 본 개시내용은 하나 이상의 T 세포-유래 신호전달 사슬 폴리펩타이드를 넉인시키기 위해 변형된 세포 집단을 제공한다. 일부 구현예에서, 세포 집단은 전술한 모든 변형을 포함한다; 예를 들어, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 세포의 하나 이상의 단백질의 넉다운/넉아웃, 질환 항원에 대해 특이적인 하나 이상의 키메라 항원 수용체(CAR) 또는 조작된 TCR의 융합 폴리펩타이드의 넉인. 이러한 방식으로 변경된 이러한 변형된 세포는 이를 필요로 하는 대상체에서 사용하기 위한, 면역치료법 적용, 예를 들어 CAR을 보유하는 세포의 생체외 제조에 유용하다.
일부 구현예에서, 개시내용은 CasX 단백질 및 하나 이상의 gNA를 포함하는 CasX:gNA 시스템을 포함하는 세포 집단을 제공하며, 여기서 gNA는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 제1 단백질을 인코딩하는 유전자의 표적 핵산 서열에 상보적인 표적화 서열을 포함하고, CasX 및 gNA는 단백질을 인코딩하는 유전자를 변형시키도록 설계된다. 전술한 내용의 일 구현예에서, CasX:gNA 시스템은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질을 인코딩하는 유전자를 넉다운/넉아웃시켜, 변형된 세포 집단을 이끌도록 설계된다. 전술한 내용의 또 다른 구현예에서, CasX:gNA 시스템은 MHC 클래스 I 분자를 인코딩하는 유전자를 넉다운/넉아웃시켜, 변형된 세포 집단을 이끌도록 설계된다. 일부 구현예에서, 단백질은 면역 세포 표면 마커이다. 다른 구현예에서, 단백질은 세포내 단백질이다. 일부 구현예에서, CasX 및 하나 이상의 gNA는 RNP로서 복합체화된 세포 집단 내로 도입되며, 따라서 RNP는 그 후에 표적 유전자를 변형시킬 수 있다. 다른 경우에, CasX 및 하나 이상의 gNA는 벡터를 사용하여 폴리뉴클레오타이드를 인코딩하는 세포 집단 내로 도입된다.
다른 구현예에서, 세포 집단은 세포를 CasX 단백질, 표적화 서열을 포함하는 하나 이상의 gNA, 및 공여자 주형과 접촉시킴으로써 변형되었으며, 여기서 공여자 주형은 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포 유전자의 표적 핵산 서열 모두 또는 일부 내로 삽입되거나 이를 대체한다. 전술한 구현예에서, 공여자 주형은 표적 유전자의 적어도 일부를 포함하며, 여기서 표적 유전자 부분은 엑손, 인트론, 인트론-엑손 연접부, 또는 조절 요소로부터 선택되고, 세포의 변형은 야생형 서열의 돌연변이 및 표적 유전자의 넉킹다운 또는 넉킹아웃을 이끈다. 일부 경우, 공여자 주형은 단일 가닥 DNA 주형 또는 단일 가닥 RNA 주형이다. 다른 경우, 공여자 주형은 이중 가닥 DNA 주형이다. 일부 경우, 세포는 CasX 및 gNA와 접촉되며, 여기서 gNA는 가이드 RNA(gRNA)이다. 다른 경우, 세포는 CasX 및 gNA와 접촉되며, 여기서 gNA는 가이드 DNA(gDNA)이다. 다른 경우, 세포는 CasX 및 gNA와 접촉되며, 여기서 gNA는 DNA 및 RNA를 포함하는 키메라이다. 본원에 기재된 바와 같이, 임의의 조합의 구현예에서, 각각의 상기 gNA 분자(스캐폴드와 표적화 서열의 조합으로서, sgRNA 또는 dgRNA로서 배치될 수 있음)는 본원에 기재된 CasX 분자와 복합체화된 RNP로서 제공될 수 있다. RNP는 전기천공, 주사, 핵주입(nucleofection), 리포솜을 통한 전달, 나노입자에 의한 전달을 통해, 또는 CasX:gNA의 하나 이상의 구성요소에 접합된 단백질 형질도입 도메인(PTD)을 사용하는 것을 포함하여 임의의 적합한 방법을 통해, 변형될 세포 내로 도입될 수 있다. CasX:gNA 시스템 구성요소를 사용하여 세포를 변형시키는 추가 방법은 바이러스 감염, 형질주입, 접합, 원형질 융합, 입자 총 기술(particle gun technology), 칼슘 포스페이트 침전, 직접 미세주사 등을 포함한다. 방법의 선택은 일반적으로, 형질전환되는 세포의 유형 및 형질전환이 발생하고 있는 상황; 예를 들어, 시험관내, 생체외, 또는 생체내에 의존한다. 이들 방법의 일반적인 고찰은 문헌[Ausubel, 등, Short Protocols in Molecular Biology, 3rd ed., Wiley & Sons, 1995]에서 찾을 수 있다.
예시적인 구현예에서, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), ICP47, T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), PD-1, CTLA-4, LAG-3, TIM-3, 2B4, TIGIT, CISH, ADORA2A, NKG2A, 또는 TGFβ 수용체 2(TGFβRII)로부터 선택된다. 다른 구현예에서, 단백질은 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 또는 FKBP1A로부터 선택된다. 더욱 다른 구현예에서, 세포에서 변형될 단백질은 i) 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), ICP47, T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), TIGIT, CISH ADORA2A, NKG2A, PD-1, CTLA-4, LAG-3, TIM-3, 2B4, 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), 또는 TGFβ 수용체 2(TGFβRII) 중 하나로부터 선택되고, 또 다른 것은 ii) 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 또는 FKBP1A 중 하나로부터 선택된다.
일부 구현예에서, 세포 집단은, T-세포 수용체(TCR)의 구성요소의 발현을 감소시키거나 제거한 하나 이상의 세포를 포함한다. 일부 구현예에서, T-세포 수용체는 네이티브 T-세포 수용체이다. 일부 구현예에서, T-세포 수용체(TCR)의 구성요소의 감소된 또는 제거된 발현은 TRAC의 감소된 또는 제거된 발현을 포함한다. 다른 구현예에서, T-세포 수용체(TCR)의 구성요소의 감소된 또는 제거된 발현은 TRBC1의 감소된 또는 제거된 발현을 포함한다. 더욱 다른 구현예에서, T-세포 수용체(TCR)의 구성요소의 감소된 또는 제거된 발현은 TRBC2의 감소된 또는 제거된 발현을 포함한다. 더욱 다른 구현예에서, T-세포 수용체(TCR)의 구성요소의 감소된 또는 제거된 발현은 CD3G의 감소된 또는 제거된 발현을 포함한다. 더욱 다른 구현예에서, T-세포 수용체(TCR)의 구성요소의 감소된 또는 제거된 발현은 CD3D의 감소된 또는 제거된 발현을 포함한다. 다른 구현예에서, T-세포 수용체(TCR)의 구성요소의 감소된 또는 제거된 발현은 CD3E의 감소된 또는 제거된 발현을 포함한다. 일부 경우, TCR의 상기 구성요소의 감소된 또는 제거된 발현은 TCR의 구성요소에 특이적인 본원에 기재된 하나 이상의, 예를 들어, 1 또는 2개의, 예를 들어, 1개의 gNA 분자를 세포 내로 도입한 결과이다. 예를 들어, CasX:gNA 시스템을 이용하는 방법은 TCR에 대한 gNA 분자의 표적화 도메인의 표적 서열에서 또는 그 부근에서 예를 들어, 본원에 기재된 바와 같이 인델, 예를 들어, 프레임이동(frameshift) 돌연변이를 세포 내로 도입할 수 있다. 다른 경우, TCR의 상기 구성요소의 감소된 또는 제거된 발현은, 넉다운되거나 넉아웃될 TCR과 비교하여 하나 이상의 돌연변이를 포함하는 CasX, 하나 이상의 gNA, 및 공여자 주형의 도입 결과이다. 일부 구현예에서, 세포 집단은, TCR의 구성요소; 예를 들어, TRAC의 감소된 또는 제거된 발현을 나타내는 적어도 약 50%, 예를 들어, 적어도 약 60%, 예를 들어, 적어도 약 70%, 예를 들어, 적어도 약 80%, 예를 들어, 적어도 약 90% 이상의 세포(본원에 기재된 바와 같음)를 포함한다. 구현예에서, TCR의 구성요소의 상기 감소된 또는 제거된 발현은 당업계에 알려진 유세포분석 또는 다른 방법에 의해 측정된 바와 같다. 다른 구현예에서, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 변형된 세포는 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않는다.
일부 구현예에서, (TCR의 구성요소의 감소된 또는 제거된 발현에 대안적으로 또는 이에 더한 경우를 포함하여), 세포 또는 세포 집단은 베타-2 마이크로글로불린(B2M)의 감소된 또는 제거된 발현을 갖는 하나 이상의 세포를 포함한다. 구현예에서, 상기 B2M의 상기 감소된 또는 제거된 발현은 B2M을 인코딩하는 유전자로 표적화되는 본원에 기재된 하나 이상의, 예를 들어, 1 또는 2개의, 예를 들어, 1개의 gNA 분자를 상기 세포 내로 도입한 결과이다. 전술한 구현예에서, gNA의 표적화 서열은 표 3A, 표 13, 및 표 16에 제시된 서열로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 변형된 세포는 상기 B2M에 대한 gNA 분자의 표적화 도메인의 표적 서열에서 또는 그 부근에서 본원에 기재된 바와 같이 인델, 예를 들어, 프레임이동 돌연변이를 포함한다. 일부 구현예에서, 세포 집단은, B2M의 감소된 또는 제거된 발현을 나타내는 적어도 약 50%, 예를 들어, 적어도 약 60%, 예를 들어, 적어도 약 70%, 예를 들어, 적어도 약 80%, 예를 들어, 적어도 약 90% 이상의 세포(본원에 기재된 바와 같음)를 포함한다. 구현예에서, B2M의 상기 감소된 또는 제거된 발현은 당업계에 알려진 유세포분석 또는 다른 방법에 의해 측정된 바와 같다.
소정의 구현예에서, (TCR 및/또는 B2M의 구성요소의 감소된 또는 제거된 발현에 대안적으로 또는 이에 더한 경우를 포함하여), 세포 또는 세포 집단은 CIITA의 감소된 또는 제거된 발현을 갖는 하나 이상의 세포를 포함한다. 전술한 구현예에서, gNA의 표적화 서열은 표 3C에 제시된 서열로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 상기 CIITA의 상기 감소된 또는 제거된 발현은 본원에 기재된 상기 CIITA를 인코딩하는 유전자로 표적화되는 하나 이상의, 예를 들어, 1 또는 2개의, 예를 들어, 1개의 gNA 분자를 상기 세포 내로 도입한 결과이다. 전술한 내용에서, gNA의 표적화 서열은 표 3C에 제시된 서열로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함한다. 일 구현예에서, 세포는 상기 CIITA에 대한 gNA 분자의 표적화 도메인의 표적 서열에서 또는 그 부근에서 예를 들어, 본원에 기재된 바와 같이 인델, 예를 들어, 프레임이동 돌연변이를 포함한다. 구현예에서, 세포 집단은, CIITA의 감소된 또는 제거된 발현을 나타내는 적어도 약 50%, 예를 들어, 적어도 약 60%, 예를 들어, 적어도 약 70%, 예를 들어, 적어도 약 80%, 예를 들어, 적어도 약 90% 이상의 세포(본원에 기재된 바와 같음)를 포함한다. 구현예에서, CIITA의 상기 감소된 또는 제거된 발현은 당업계에 알려진 유세포분석 또는 다른 방법에 의해 측정된 바와 같다.
다른 구현예에서, 개시내용은 세포 집단을 제공하며, 여기서 세포 집단의 세포 중 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%의 세포가 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택되는 단백질 중 적어도 2개를 검출 가능한 수준으로 발현하지 않도록 세포가 변형되었다. 더욱 다른 구현예에서, 개시내용은 세포 집단을 제공하며, 여기서 세포 집단의 세포 중 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%의 세포가 단백질 B2M, TRAC, 및 CIITA를 검출 가능한 수준으로 발현하지 않도록 세포가 변형되었다. 다른 구현예에서, 개시내용은 세포 집단을 제공하며, 여기서 변형된 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 MHC 클래스 I 분자 또는 야생형 T-세포 수용체를 검출 가능한 수준으로 발현하지 않도록 세포가 변형되었다. 다른 구현예에서, 개시내용은 CAR을 생성하도록 변형된 세포 집단을 제공하고, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%의 세포가, IL-7, IL-12, IL-15, 및 IL-18로 이루어진 군으로부터 선택되는 하나 이상의 면역 자극성 사이토카인을 코딩하는 유도성 발현 카세트를 포함하도록 추가로 변형된다.
일부 구현예에서, 본 개시내용은 i) MHC 클래스 I 분자 및/또는 야생형 T-세포 수용체의 감소된 또는 제거된 발현을 갖도록, 그리고 ii) CAR 또는 조작된 TCR을 발현하도록 변형된 세포 집단을 제공한다. 이러한 세포는 CAR 또는 조작된 TCR의 리간드인 세포의 종양 항원에 특이적으로 결합할 수 있으며, 이러한 결합 시, 변형된 세포는 i) 활성화되는 반응; ii) 변형된 세포의 증식을 유도하는 반응; iii) 변형된 세포에 의한 사이토카인 분비 반응; 또는 iv) 상기 종양 항원을 보유하는 세포의 세포독성을 유도하는 반응으로부터 선택되는 반응을 할 수 있다. 예를 들어, 세포 집단은 야생형 TRAC 및 TRBC1의 감소된 또는 제거된 발현을 갖고, 항원 결합 도메인에 융합된 TRAC 및/또는 TRBC1 막관통 및 세포내 도메인을 포함하는 융합 폴리펩타이드를 발현할 수 있다. 활성화는 클론 팽창 및 분화, IFN-γ, TNF-α, 또는 IL-2를 포함한 사이토카인의 발현을 포함한다. 사이토카인의 생성 및 세포독성의 평가는 표준 검정, 예컨대 ELISA, 51CR 방출, 유세포분석, 및 당업계에 알려진 다른 이러한 검정에 의해 결정될 수 있다.
세포 또는 세포 집단에서 T 세포 수용체의 구성요소, 예를 들어, TRAC 둘 다의 발현을 감소시키거나 제거하는 것이 의도되는 예시적인 구현예(추가 표적, 예를 들어, 하나 초과의 추가 표적의 발현 또는 기능이 또한 감소되거나 제거될 때의 구현예를 포함함)에서, TRAC를 표적화하는 gNA 표적화 서열 분자는 표 3B의 서열로부터 선택된다. 예를 들어, 세포는 TCR의 구성요소(예를 들어, TRAC, TRBC1, TRBC2, CD3E, CD3G, 및/또는 CD3D)의 감소된 또는 제거된 발현, 및 면역억제제 또는 면역 체크포인트 단백질, 예를 들어, FKBP1A, 또는 PD-1, CISH, CTLA-4, LAG-3, TIM-3, 2B4, TIGIT, ADORA2A, NKG2A, 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 및 데옥시시티딘 키나제(dCK)로 이루어진 군으로부터 선택되는 단백질의 표적의 감소된 또는 제거된 발현을 나타낸다. 본원에 기재된 바와 같이, 임의의 조합의 구현예에서, 각각의 상기 gNA 분자(스캐폴드와 표적화 서열의 조합으로서, 예를 들어, sgRNA 또는 dgRNA로서 배치될 수 있음)는 세포 집단의 변형을 위해 본원에 기재된 CasX 분자와의 RNP로서 제공될 수 있다. 임의의 조합의 다른 구현예에서, 각각의 상기 gNA 분자(스캐폴드와 표적화 서열의 조합으로서, 예를 들어, sgRNA 또는 dgRNA로서 배치될 수 있음) 및 CasX는 세포 집단의 변형을 위해 벡터 내에서 인코딩된 폴리뉴클레오타이드로서 제공될 수 있다.
일부 구현예에서, 세포 집단은 예를 들어, 설치류, 래트, 마우스, 토끼 또는 개 세포로부터 유래되는 동물 세포이다. 일부 구현예에서, 세포는 인간 세포이다. 일부 구현예에서, 세포는 비-인간 영장류 세포; 예를 들어, 시노몰구스 원숭이(cynomolgus monkey) 세포이다. 일부 구현예에서, 세포는 전구 세포, 조혈 줄기세포, 또는 만능성 줄기세포이다. 일 구현예에서, 세포는 유도 만능성 줄기세포이다. 일부 구현예에서, 세포는 면역 세포이다. 일부 구현예에서, 세포는 면역 이펙터 세포(예를 들어, 하나 이상의 면역 이펙터 세포를 포함하는 세포 집단), 예를 들어, T 세포, NK 세포, B 세포, 대식세포, 또는 수지상 세포이다. T 세포는 조절 T 세포(TREG), 감마-델타 T 세포, 헬퍼 T 세포 및 세포독성 T 세포를 포함하지만 이들로 제한되지는 않는다. 일부 구현예에서, 세포는 CD4+ T 세포, CD8+ T 세포, 또는 이들의 조합으로 이루어진 군으로부터 선택되는 T 세포이다. 일부 구현예에서, 세포 집단은 상기 세포 집단이 투여되는 대상체에 대해 자가유래 또는 동종이계(유전적으로 미스매칭됨)이다.
일부 구현예에서, 개시내용은 사익 기재된 바와 같이, CAR 또는 조작된 TCR-발현적이고, 항원 가공, 제시, 인식, 또는 반응에 관여하는 하나 이상의 단백질을 감소시키거나 제거하도록 변형된 세포 또는 세포 집단을 제공한다. 일부 구현예에서, 본원에 기재된 바와 같은 CAR 또는 조작된 TCR 세포는 CAR 또는 조작된 TCR을 인코딩하는 폴리뉴클레오타이드, 또는 상기 폴리뉴클레오타이드를 포함하는 벡터의 도입에 의해 본원에 기재된 방법에 의해 생체외에서 변형되고/되거나 변경된다. 다른 구현예에서, 본원에 기재된 바와 같은 CAR 또는 조작된 TCR 세포는, 본원에 기재된 바와 같은 세포 내로 도입되는 CasX:gNA 분자 및/또는 조성물(예를 들어, CasX, 하나 초과의 gNA 분자, 및 선택적으로, 공여자 주형, 뿐만 아니라 CAR을 인코딩하는 폴리뉴클레오타이드를 포함하는 조성물)을 활용하여 생체내에서 본원에 기재된 방법에 의해 변형되고/되거나 변경된다. 구현예에서, 세포는 본원에 기재된 바와 같이 키메라 항원 수용체(CAR) 또는 조작된 TCR을 발현하도록 변형되었거나, 변형되거나, 변형될 것이다(예를 들어, 세포는 CAR, 또는 조작된 TCR의 하위단위를 포함하는 융합 단백질을 인코딩하는 폴리뉴클레오타이드 서열을 포함하거나 포함할 것임). 구현예에서, CAR 또는 조작된 TCR은 분화 클러스터 19(CD19), CD3, CD8, CD7, CD10, CD20, CD22, CD30, CLL1, CD33, CD34, CD38, CD41, CD44, CD47, CD49f, CD56, CD70, CD74, CD99, CD123, CD133, CD138, 카르보닉스 안하이드라제 IX(CAIX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 접착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEACAM5, 클라우딘 6(CLDN6), CLDN18, C-유형 렉틴 도메인 계열 12 구성원 A(CLEC12A), 상피-간엽 전이 인자(cMET), 세포독성 T-림프구-관련 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), EGFR-VIII, 상피 당단백질 2(EGP-2), EGP-40, EphA2, ENPP3, 상피 세포 접착 분자(EpCAM), erb-B2,3,4, 폴레이트 결합 단백질(FBP), 태아 아세틸콜린 수용체, 폴레이트 수용체-a, 폴레이트 수용체 1(FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사지향성 수용체 8(GRM8), 글리피칸-3(GPC3; glypican-3), 강글리오사이드 GD2, 강글리오사이드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), HER3, 인테그린 B7, 세포내 세포-접착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY; Lewis-Y), 콘드로모듈린-1(LECT1), L1 세포 접착 분자, 리소포스파티드산 수용체 3(LPAR3), 흑색종-관련 항원 1(MAGE-A1), 메소텔린, 뮤신 1(MUC1), MUC16, 흑색종-관련 항원 3(MAGEA3), 종양 단백질 p53(p53), T 세포에 의해 인식되는 흑색종 항원 1(MART1), 당단백질 100(GP100), 프로테이나제3(PR1), 에프린-A 수용체 2(EphA2), 자연 살해기 2D 리간드(NKG2D 리간드), 뉴욕 식도 편평 세포 암종 1(NY-ESO-1), 종양태아성 항원(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 고아 수용체 1(ROR1), 영양아층 당단백질(TPBG), 종양-관련 당단백질 72(TAG-72), 종양-관련 칼슘 신호 전달자 2(TROP-2), 티로시나제, 서바이빈, 혈관 내피 성장 인자 수용체 2(VEGF- R2), 윌름 종양-1(WT-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현되는 항원(PRAME), T 세포 수용체 베타 불변 1(TRBC1), TRBC2, 및 (T-세포 면역글로불린 뮤신-3) TIM-3으로부터 선택되는 항원에 대해 특이적인 결합 친화도를 갖는다. 전술한 내용에서, CAR 또는 조작된 TCR은 도메인 항체, 선형 항체, 또는 단일-사슬 가변 단편(scFv)으로부터 선택되는 항원 결합 도메인을 포함하며, 이는 기준 항체; 예를 들어, 표 5의 항체(표 5의 VL, VH, 및/또는 CDR 서열을 가짐)로부터 유래될 수 있다. 일부 구현예에서, 항원 결합 도메인은 표적 항원에 대한 평형 결합 상수가 10-5 M과 10-12 M 사이의, 또는 약 10-5 M과 10-12 M 사이의, 그리고 그 안의 모든 개별 값과 범위(예를 들어, 10-5 M, 10-6 M, 10-7 M, 10-8 M, 10-9 M, 10-10 M, 10-11 M, 또는 10-12 M)인 친화도를 나타내고; 이러한 결합 친화도는 "특이적"이다. 일부 구현예에서, CAR 또는 조작된 TCR은 항원 결합 도메인, CD3-제타, CD4, CD8, 및 CD28로 이루어진 군으로부터 선택되는 폴리펩타이드로부터 유래된 막관통 도메인, 및 세포내 신호전달 도메인을 포함하며, 이들은 스페이서 서열에 의해 연결될 수 있다. 일부 구현예에서, 인코딩된 CAR은, 직접적으로 또는 도메인 힌지 및/또는 스페이서에 의해 CAR 항원 결합 도메인에 연결된 CD3-제타, CD27, CD28, 4-1BB (41BB), ICOS, 또는 OX40을 포함하지만 이들로 제한되지 않는 하나 이상의 T 세포-유래 신호전달 사슬 폴리펩타이드를 추가로 포함한다. 힌지 도메인은 면역글로불린-유사 힌지, 또는 CD8a 분자(CD8) 또는 CD28로부터 단리되거나 유래된 힌지 도메인일 수 있다. 힌지, 스페이서, 및 막관통 도메인은 항원 결합 도메인을 활성화 도메인에 연결하고 CAR을 T-세포막에 고정시킨다. 다른 구현예에서, 본원에 기재된 CAR 또는 조작된 TCR-발현 세포는 예를 들어, 동일한 표적 또는 상이한 표적(예를 들어, 본원에 기재된 암 관련 항원 또는 본원 상기에서 기재된 상이한 암 관련 항원 이외의 표적)에 대한 제2 CAR 또는 조작된 TCR, 예를 들어, 상이한 항원 결합 도메인을 포함하는 제2 CAR을 추가로 포함할 수 있다. 일부 구현예에서, 제2 CAR 또는 조작된 TCR은 암 관련 항원과 동일한 암세포 유형 상에서 발현되는 표적에 대한 항원 결합 도메인을 포함한다. 일부 구현예에서, CAR-발현 세포는, 1차 항원을 표적화하고 1차 신호전달 도메인이 아닌 공동자극성 신호전달 도메인을 갖는 세포내 신호전달 도메인을 포함하는 제1 CAR, 및 제2의 상이한 항원을 표적화하고 공동자극성 신호전달 도메인이 아닌 1차 신호전달 도메인을 갖는 세포내 신호전달 도메인을 포함하는 제2 CAR을 포함한다. 이론으로 결부시키고자 하는 것은 아니지만, 제1 CAR 상으로의 공동자극성 T 세포-유래 신호전달 도메인, 예를 들어, CD27, CD28, 4-1BB(41BB), ICOS, 또는 OX40의 배치, 및 제2 CAR 상에서 제1 신호전달 도메인, 예를 들어, CD3 제타는, 표적이 둘 다 발현되는 세포에 대한 CAR 활성을 제한할 수 있다. 일부 구현예에서, CAR 발현 세포는, 본원에 기재된 표적 항원에 결합하는 항원 결합 도메인, 막관통 도메인 및 공동자극성 도메인을 포함하는 제1 질환(예를 들어 암) 관련 항원 CAR 및 상이한 표적 항원(예를 들어, 제1 표적 항원과 동일한 세포 유형 상에서 발현되는 항원)을 표적화하고 항원 결합 도메인, 막관통 도메인 및 1차 신호전달 도메인을 포함하는 제2 CAR을 포함한다. 다른 구현예에서, CAR 발현 세포는, 본원에 기재된 표적 항원에 결합하는 항원 결합 도메인, 막관통 도메인 및 1차 신호전달 도메인을 포함하는 제1 CAR 및 제1 표적 항원 이외의 항원(예를 들어, 제1 표적 항원과 동일한 암세포 유형 상에서 발현되는 항원)을 표적화하고 항원에 대한 항원 결합 도메인, 막관통 도메인 및 공동자극성 신호전달 도메인을 포함하는 제2 CAR을 포함한다.
또 다른 구현예에서, 본 개시내용은 면역 자극성 사이토카인, 예컨대 IL-7, IL-12, IL-15, 및/또는 IL-18의 발현을 코딩하는 유도성 발현 카세트로 변형된 CAR 또는 조작된 TCR-발현 세포 집단을 제공하며, 여기서 사이토카인은 CAR 또는 조작된 TCR 세포 팽창 및 지속을 향상시키는 한편 대상체에게 투여될 때 면역억제성 종양 환경에 내성으로 되게 한다. 일부 구현예에서, 개시내용은 세포 집단을 제공하며, 여기서 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95%의 변형된 세포 집단은 검출 가능한 수준의 CAR 또는 조작된 TCR을 발현한다.
구현예에서, 하나 이상의 단백질의 발현 또는 기능이 본원에 기재된 방법에 의해 감소되거나 제거되었던 본 발명의 CAR 또는 조작된 TCR-발현 세포 집단은 CAR 또는 조작된 TCR과 이의 표적 항원의 결합과 같은 자극에 반응하여 활성화되고 증식되는 능력을 유지한다. 구현예에서, 증식은, 세포 집단이 확장될 수 있도록 생체외에서 발생한다. 일 구현예에서, CAR 또는 조작된 TCR-발현 세포 집단은 적절한 성장 조건 하에 적절한 배지에서의 시험관내 배양에 의해 확장된다. 다른 구현예에서, 증식은 생체내에서 발생한다. 구현예에서, 증식은 생체외와 생체내 둘 다에서 발생한다. 구현예에서, 증식 수준은 동일한 세포 유형(예를 들어, 동일한 유형의 CAR-발현 세포)에 의해 나타나는 증식 수준과 실질적으로 동일하지만, 하나 이상의 단백질의 발현 또는 기능이 감소되었거나 제거되지 않았다.
방법은, 면역 세포; 예를 들어, T 세포, TREG 세포, 감마-델타 T 세포, NK 세포, B 세포, 대식세포, 또는 수지상 세포가 당업자에게 알려진 임의의 수의 기법을 사용하여 대상체로부터 수집된 혈액 단위로부터 수득될 수 있다. 하나의 예시적인 양태에서, 개체의 순환하는 혈액으로부터의 세포는 성분채집술(apheresis)에 의해 수득된다. 성분채집술 생성물은 전형적으로, T 세포, 단핵구, 과립구, B 세포, 다른 유핵 백혈구 세포, 적혈구 세포, 및 혈소판을 포함한 림프구를 함유한다. 일부 구현예에서, T 세포는 CD4+ T 세포, CD8+ T 세포, 또는 이들의 조합이다. 성분채집술에 의해 수집된 세포는 혈장 분획을 제거하기 위해, 그리고 선택적으로 후속적인 가공 단계를 위해 적절한 완충액 또는 배지에서 세포를 배치시키기 위해 세척될 수 있다. 일부 구현예에서, T 세포는 예를 들어, PERCOLL™ 구배를 통한 원심분리에 의해 또는 역류 원심분리 용리(elutriation)에 의해 적혈구 세포를 용해시키고 단핵구를 감손시킴으로써 말초 혈액 림프구로부터 단리된다. 방법은 i) 표적 핵산의 편집을 위해 CasX:gNA 시스템 구성요소를 도입하는 단계; ii) 구현예의 CAR 및/또는 조작된 TCR의 하나 이상의 융합 폴리펩타이드를 인코딩하는 핵산을 세포에 도입하는 단계; iii) 세포를 확장시키는 단계, 및 iv) 대상체에게의 후속적인 투여를 위해 세포를 동결보존시키는 단계를 포함할 수 있다. 조혈 줄기세포 및 전구 세포의 생체외 확장을 위한 절차는 참조로서 본원에 포함된 미국 특허 제5,199,942호에 기재되어 있으며, 본 발명의 세포에 적용될 수 있다.
T 세포 및/또는 CD4+ 및/또는 CD8+ T 세포의 하위유형 및 하위집단 중에는 미접촉 T 세포, 이펙터 T 세포, 기억 T 세포 및 이의 하위유형, 예컨대 줄기세포 기억 T, 중심 기억 T, 이펙터 기억 T, 또는 말단적으로 분화된(terminally differentiated) 이펙터 기억 T 세포, 종양-침윤성 림프구, 미성숙 T 세포, 성숙 T 세포, 헬퍼 T 세포, 세포독성 T 세포, 점막-관련 in변이체 T 세포, 천연 발생 및 적응성(adaptive) 조절 T (Treg) 세포, 헬퍼 T 세포, 예컨대 TH1 세포, TH2 세포, TH3 세포, TH17 세포, TH9 세포, TH22 세포, 소포성 헬퍼 T 세포, 알파/베타 T 세포, 및 델타/감마 T 세포가 존재한다.
본원에 기재된 방법은 예를 들어, 본원에 기재된 예를 들어, 음성 선택 기법을 사용하여, T 조절 세포-감손된 집단, CD25+ 감손된 세포인 면역 이펙터 세포, 예를 들어, T 세포의 특정 하위집단의 선택을 포함할 수 있다. 바람직하게는, T 조절 감손(depleted) 세포 집단은 30%, 25%, 20%, 15%, 10%, 5%, 4%, 3%, 2%, 1% 미만의 CD25+ 세포를 함유한다. 일부 구현예에서, 방법은, T 조절 세포, 예를 들어, CD25+ T 세포가 항-CD25 항체, 또는 이의 단편, 또는 CD25-결합 리간드, IL-2를 사용하여 집단으로부터 제거됨을 제공한다. 다른 구현예에서, 항-CD25 항체는 기질(substrate), 예를 들어 비드(bead)에 접합되거나, 그렇지 않다면 세포 집단이 첨가되는 기질 상에 코팅되고 세척되어 분리를 실시한다.
또 다른 구현예에서, T 세포는 예를 들어, PERCOLL™ 구배를 통한 원심분리에 의해 또는 역류 원심분리 용리에 의해 적혈구 세포를 용해시키고 단핵구를 감손시킴으로써 말초 혈액 림프구로부터 단리된다. 세포는 전형적으로 원발성 세포, 예컨대 대상체로부터 직접 단리되고/되거나 대상체로부터 단리되고 냉동된 세포이다.
본원에 기재된 방법은, CD25를 포함하지 않는 질환 항원, 예를 들어, 종양 항원, 예를 들어, CD19, CD30, CD38, CD123, CD20, CD14 또는 CD11b를 발현하는 집단으로부터 세포를 제거하여, 본원에 기재된 CAR의 발현에 적합한 T 조절 감손된, 예를 들어, CD25+ 감손된 집단, 및 종양 항원 감손된 세포를 제공하는 단계를 추가로 포함할 수 있다. 일부 구현예에서, 종양 항원 발현 세포는 T 조절 세포, 예를 들어, CD25+ 세포와 동시에 제거된다. 예를 들어, 항-CD25 항체, 또는 이의 단편, 및 항-종양 항원 항체, 또는 이의 단편은, 예를 들어, 세포 또는 항-CD25 항체, 또는 이의 단편, 또는 항-종양 항원 항체, 또는 이의 단편을 제거하는 데 사용될 수 있는 동일한 기질, 예를 들어, 비드에 부착될 수 있으며, 별개의 비드에 부착될 수 있고, 이들의 혼합물은 세포를 제거하는 데 사용될 수 있다. 다른 구현예에서, T 조절 세포, 예를 들어, CD25+ 세포의 제거, 및 종양 항원 발현 세포의 제거는 순차적이고, 예를 들어, 임의의 순서로 발생할 수 있다.
자극을 위한 T 세포는 또한, 세척 단계 후에 냉동될 수 있고, 냉동 및 후속적인 해동 단계는 세포 집단에서 과립구와 어느 정도까지는 단핵구를 제거함으로써 더 균일한 생성물을 제공한다. 혈장 및 혈소판을 제거하는 세척 단계 후, 세포는 적합한 냉동 용액에서 현탁될 수 있다. 소정의 경우에, 동결보존된 세포는 해동 및 세척되고, 본 개시내용의 방법을 사용하여 활성화 전에 실온에서 1시간 동안 휴지기에 놓인다.
다른 구현예에서, 개시내용의 세포(예를 들어, 개시내용의 면역 세포 및/또는 본 발명의 CAR-발현 세포)는 유도 만능성 줄기세포("iPSC") 또는 배아 줄기세포(ESC)이거나, 상기 iPSC 및/또는 ESC로부터 생산된(예를 들어, 이로부터 분화된) T 세포이다. iPSC는 예를 들어, 당업계에 알려진 방법에 의해 말초 혈액 T 림프구, 예를 들어, 건강한 지원자로부터 단리된 말초 혈액 T 림프구로부터 생산될 수 있다. 이와 같이, 이러한 세포는 당업계에 알려진 방법에 의해 T 세포로 분화될 수 있다(예를 들어, 문헌[Themeli M. 등, Nat. Biotechnol. 31:928 (2013); doi:10.1038/nbt.2678]; 및 국제 특허 공보 WO2014/165707호를 참조하며, 이들 각각의 내용은 그 전문이 참조로서 본원에 포함됨).
일부 구현예에서, 개시내용은 암 또는 종양과 관련된 질환을 갖는 대상체에서 항종양 면역력을 제공하는 방법(면역치료법)에 사용하기 위한 변형된 세포 집단을 제공한다. 일부 구현예에서, 방법은 치료적 유효량의 본원에 기재된 임의의 구현예의 변형된 세포 집단을 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 전체 세포의 용량 및/또는 세포의 개별 하위-집단의 용량은 104 내지 109 세포/킬로그램(kg) 체중에서 또는 약 104 내지 약 109 세포/kg 체중, 예컨대 105 내지 106 세포/kg 체중, 예를 들어, 1×105 세포/kg, 1.5×105 세포/kg, 2×105 세포/kg, 또는 1×106 세포/kg 체중에서 또는 대략 이들 값의 범위 내에 있다. 예를 들어 일부 구현예에서, 세포는 104 내지 109 세포/킬로그램(kg) 체중에서 또는 약 104 내지 약 109 세포/kg 체중, 예컨대 105 내지 106 세포/kg 체중, 예를 들어, 1×105 세포/kg, 1.5×105 세포/kg, 2×105 세포/kg, 또는 1×106 세포/kg 체중에서 또는 대략 이들 값에서, 또는 이의 소정의 오차 범위 내에서 투여된다.
일부 구현예에서, 유효량의 변형된 세포의 투여는 대상체에서 질환과 관련된 임상적 매개변수 또는 종점에서의 향상을 이끌며, 여기서 임상적 매개변수 또는 종점은 완전, 부분 또는 불완전 반응으로서 종양 위축(shrinkage); 진행 시간(time-to-progression), 치료 실패까지의 시간(time to treatment failure), 바이오마커 반응; 무진행 생존율(progression-free survival); 무질환 생존율(disease free-survival); 재발까지의 시간(time to recurrence); 전이까지의 시간(time to metastasis); 전체 생존율의 시간(time of overall survival); 삶의 질의 향상; 및 증상의 향상으로 이루어진 군 중 하나 또는 임의의 조합으로부터 선택된다.
일부 구현예에서, 개시내용은 대상체에서의 면역치료법을 위한 세포를 제조하는 방법을 제공하며, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질의 발현을 감소시키거나 제거함으로써 면역 이펙터 세포를 변형시키는 단계를 포함한다. 일부 구현예에서, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), ICP47 폴리펩타이드, 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), PD-1, CTLA-4, LAG-3, TIM-3, 2B4, CISH, ADORA2A, TIGIT, NKG2A, 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβ 수용체 2(TGFβRII), 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 또는 FKBP1A로부터 선택된다. 일부 구현예에서, 방법은 면역 이펙터 세포의 표적 핵산 서열을 CasX 단백질 및 가이드 핵산(gNA)을 포함하는 CasX:gNA 시스템과 접촉시키는 단계를 포함하며, 여기서 gNA는 (a) 단백질을 인코딩하는 유전자 또는 유전자의 일부, 상기 유전자에 대한 조절 영역, 또는 둘 다에 대한 표적 핵산 서열에 상보적인 표적 서열을 포함하거나; (b) 하나 이상의 단백질을 인코딩하는 표적 핵산 서열의 보체에 상보적이다. 일부 구현예에서, 세포는, 하나 이상의 단백질의 발현이, 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 변형되었다. 방법의 다른 구현예에서, 세포는, 상기 세포가 하나 이상의 단백질을 검출 가능한 수준으로 발현하지 않도록 변형되었다. 방법의 예시적인 구현예에서, 넉다운되거나 넉아웃될 단백질은 B2M, TRAC, 또는 CIITA로부터 선택된다. 방법의 다른 구현예에서, 변형된 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않도록 세포는 변형되었다. 방법의 다른 구현예에서, 변형된 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않도록 세포는 변형되었다.
일부 구현예에서, 개시내용은 대상체에서의 면역치료법을 위한 세포를 제조하는 방법을 제공하며, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질의 발현을 감소시키거나 제거함으로써 면역 이펙터 세포를 변형시키는 단계에 더하여, 종양 세포 항원에 특이적인 키메라 항원 수용체(CAR)를 인코딩하는 핵산을 도입함으로써 세포를 변형시키는 단계를 추가로 포함한다. 일부 구현예에서, CAR의 종양 세포 항원 리간드는 분화 클러스터 19(CD19), CD3, CD8, CD7, CD10, CD20, CD22, CD30, CLL1, CD33, CD34, CD38, CD41, CD44, CD47, CD49f, CD56, CD70, CD74, CD99, CD123, CD133, CD138, 카르보닉스 안하이드라제 IX(CAIX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 접착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEACAM5, 클라우딘 6(CLDN6), CLDN18, C-유형 렉틴 도메인 계열 12 구성원 A(CLEC12A), 상피-간엽 전이 인자(cMET), 세포독성 T-림프구-관련 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), EGFR-VIII, 상피 당단백질 2(EGP-2), EGP-40, EphA2, ENPP3, 상피 세포 접착 분자(EpCAM), erb-B2,3,4, 폴레이트 결합 단백질(FBP), 태아 아세틸콜린 수용체, 폴레이트 수용체-a, 폴레이트 수용체 1(FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사지향성 수용체 8(GRM8), 글리피칸-3(GPC3; glypican-3), 강글리오사이드 GD2, 강글리오사이드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), HER3, 인테그린 B7, 세포내 세포-접착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY; Lewis-Y), 콘드로모듈린-1(LECT1), L1 세포 접착 분자, 리소포스파티드산 수용체 3(LPAR3), 흑색종-관련 항원 1(MAGE-A1), 메소텔린, 뮤신 1(MUC1), MUC16, 흑색종-관련 항원 3(MAGE-A3), 종양 단백질 p53(p53), T 세포에 의해 인식되는 흑색종 항원 1(MART1), 당단백질 100(GP100), 프로테이나제3(PR1), 에프린-A 수용체 2(EphA2), 자연 살해기 2D 리간드(NKG2D 리간드), 뉴욕 식도 편평 세포 암종 1(NY-ES0-1), 종양태아성 항원(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 고아 수용체 1(ROR1), 영양아층 당단백질(TPBG), 종양-관련 당단백질 72(TAG-72), 종양-관련 칼슘 신호 전달자 2(TROP-2), 티로시나제, 서바이빈, 혈관 내피 성장 인자 수용체 2(VEGF- R2), 윌름 종양-1(WT-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현되는 항원(PRAME), T 세포 수용체 베타 불변 1(TRBC1), TRBC2, 및 (T-세포 면역글로불린 뮤신-3) TIM-3으로부터 선택된다. 일부 구현예에서, CAR은 선형 항체, 단일 도메인 항체(sdAb), 또는 단일-사슬 가변 단편(scFv)으로부터 선택되는 항원 결합 도메인을 포함한다. 일부 구현예에서, 항원 결합 도메인은 종양 세포 항원에 대해 특이적인 결합 친화도를 갖는 기준 항체로부터 유래된 scFv이다. 일부 구현예에서, scFv는 표 5에 제시된 서열로 이루어진 군으로부터 선택되는 VH와 VL 및/또는 중쇄 CDR과 경쇄 CDR을 포함한다. 전술한 구현예에서, VH, VL, 및/또는 CDR은 하나 이상의 아미노산 치환을 가질 수 있으며, 여기서 scFv는 종양 항원에 대해 특이적인 결합 친화도를 유지한다.
대상체에서의 면역치료법을 위한 세포를 제조하는 방법의 다른 구현예에서, CAR을 인코딩하는 핵산은 적어도 하나의 세포내 신호전달 도메인을 인코딩하는 핵산을 추가로 포함하며, 여기서 적어도 하나의 세포내 신호전달 도메인은 CD247 분자(CD3-제타), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB), 유도성 T 세포 공동자극자(ICOS), 또는 TNF 수용체 슈퍼계열 구성원 4(OX40)로부터 단리되거나 유래되는 적어도 하나의 세포내 신호전달 도메인을 포함한다. 일 구현예에서, 적어도 하나의 세포내 신호전달 도메인은 a) CD3-제타 세포내 신호전달 도메인; b) CD3-제타 세포내 신호전달 도메인 및 4-1BB 또는 CD28 세포내 신호전달 도메인; c) CD-제타 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD28 세포내 신호전달 도메인; 또는 d) CD-제타 세포내 신호전달 도메인, CD28 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD27 또는 OX40 세포내 신호전달 도메인을 포함한다. 다른 구현예에서, CAR은 세포외 힌지 도메인을 추가로 포함하며, 여기서 힌지 도메인은 면역글로불린 유사 도메인이거나 힌지 도메인은 IgG1, IgG2, 또는 IgG4로부터 단리되거나 유래되거나, 힌지 도메인은 CD8a 분자(CD8) 또는 CD28로부터 단리되거나 유래된다. 일부 구현예에서, CAR은 막관통 도메인을 추가로 포함하며, 여기서 막관통 도메인은 CD3-제타, CD4, CD8, 및 CD28로 이루어진 군으로부터 단리되거나 유래된다. 전술한 내용에서, CAR의 구성요소는 적절한 링커와 작동 가능하게 연결되어, 단일 키메라 융합 폴리펩타이드를 형성한다.
일부 구현예에서, TCR은, 세포외 항원 결합 도메인 및 하위단위가 단일 키메라 융합 폴리펩타이드를 형성하도록 배열된 항원 결합 도메인에 작동 가능하게 연결된, TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타로 이루어진 군으로부터 선택되는 하나 이상의 하위단위를 포함한다. 일부 구현예에서, 단일 키메라 융합 폴리펩타이드는 TCR 하위단위와 항원 결합 도메인 사이에 링커를 포함한다.
일부 구현예에서, TCR은, 세포외 항원 결합 도메인, 세포내 신호전달 도메인(및 적절한 링커)이 단일 키메라 융합 폴리펩타이드를 형성하도록 배열된 세포내 신호전달 도메인을 포함하는 하나 이상의 세포내 도메인 및 항원 결합 도메인에 작동 가능하게 연결된, TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타로 이루어진 군으로부터 선택되는 하나 이상의 하위단위를 포함한다. 하나 이상의 세포내 신호전달 도메인은 CD247 분자(CD3-제타), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB), 유도성 T 세포 공동자극자(ICOS), 또는 TNF 수용체 슈퍼계열 구성원 4(OX40)로 이루어진 군으로부터 단리되거나 유래될 수 있다.
일부 구현예에서, 방법은 IL-7, IL-12, IL-15, 및 IL-18로 이루어진 군으로부터 선택되는 면역 자극성 사이토카인을 코딩하는 유도성 발현 카세트를 인코딩하는 폴리핵산을 면역 세포 내로 도입하는 단계를 추가로 포함한다. 다른 구현예에서, 방법은 이를 필요로 하는 대상체에게의 후속적인 투여를 위해, 적절한 배지 내에서 그리고 적절한 조건 하에 시험관내 배양에 의해 세포 집단을 확장시키는 단계를 추가로 포함한다.
대상체에서의 면역치료법을 위한 세포를 제조하는 방법의 일부 구현예에서, 방법은 TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타로 이루어진 군으로부터 선택되는 하나 이상의 하위단위를 포함하는 TCR을 인코딩하는 폴리핵산을 면역 세포 내로 도입하는 단계를 추가로 포함한다. 일부 구현예에서, TCR은 세포내 신호전달 도메인으로부터 자극성 도메인을 포함하는 세포내 도메인을 추가로 포함한다. 일부 구현예에서, TCR의 항원 결합 도메인은 하나 이상의 하위단위에 작동 가능하게 연결된다. 일부 경우에, TCR의 항원 결합 도메인은 표 5에 제시된 서열로 이루어진 군으로부터 선택되는 가변 중쇄(VH)와 가변 경쇄(VL) 및/또는 중쇄 CDR과 경쇄 CDR을 포함하는 scFv이다.
VIII. 치료 방법
또 다른 양태에서, 본 개시내용은 종양 항원의 발현과 관련된 질환을 갖거나 자가면역 질환을 갖는 대상체를 치료하는 방법에 관한 것이다. 일부 구현예에서, 본 개시내용은 치료를 필요로 하는 대상체에서 질환을 치료하기 위한 면역치료 방법을 제공한다. 개시내용의 일부 구현예에서, 치료 방법은 치료적 유효량의 본원에 기재된 구현예의 CasX:gNA 시스템 조성물(들) 및 폴리핵산에 의해 변형된 세포 또는 세포 집단을 대상체에게 투여함으로써 대상체의 질환을 예방하고/하거나, 치료하고/하거나 호전시킬 수 있다. 일부 구현예에서, 치료 방법은 CasX:gNA 조성물, 및 선택적으로 공여자 주형에 의해 변형된 세포 또는 세포 집단을 대상체에게 투여하는 단계를 포함하며, 여기서 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질을 인코딩하는 하나 이상의 유전자가 변형된다. 일부 경우에, 세포 또는 세포 집단은 또한 본원에 기재된 임의의 구현예의 CAR 또는 조작된 TCR을 발현하도록 변형되었다. 일 구현예에서, 질환은 암이다. 또 다른 구현예에서, 질환은 자가면역 질환이다. 항체 치료법과는 달리, 구현예의 변형된 세포는 생체내에서 복제되어, 기저 질환의 실질적인 제어를 유발할 수 있는 장기간 지속성을 이끌 수 있다. 다양한 양태에서, 대상체에게 투여되는 변형된 세포 또는 이의 자손은 변형된 세포를 대상체에게 투여한 후 적어도 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 12개월, 13개월, 14개월, 15개월, 16개월, 17개월, 18개월, 19개월, 20개월, 21개월, 22개월, 23개월, 2년, 3년, 4년, 또는 5년 동안 대상체에서 지속된다. 치료 방법에 의해, 변형된 세포의 투여는 기저 질환을 야기하거나 이와 관련이 있는 세포, 예컨대 종양 세포의 사멸화를 이끈다.
일 구현예에서, 개시내용은 종양 항원의 발현과 관련된 질환을 갖는 대상체를 치료하는 방법을 제공하며, 세포 집단을 투여하는 단계를 포함하고, 여기서 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질의 발현이 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 세포가 변형되었거나, 세포는 검출 가능한 수준의 단백질을 발현하지 않는다. 일 구현예에서, 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), ICP47 폴리펩타이드, T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 프로그래밍된 세포 사멸-1 수용체(PD-1), 세포독성 T-림프구-관련 단백질 4(CTLA-4), 림프구-활성화 유전자 3(LAG-3), T-세포 면역글로불린 및 뮤신 도메인 3(TIM-3), 2B4(CD244), CISH, ADORA2A, TIGIT, NGK2A, 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), 및 TGFβ 수용체 2(TGFβRII)로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 단백질은 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP1A로 이루어진 군으로부터 선택된다. 특정 구현예에서, 단백질은 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택된다. 일부 구현예에서, 변형될 세포는 설치류 세포, 마우스 세포, 래트 세포, 비-인간 영장류 세포, 또는 인간 세포로 이루어진 군으로부터 선택된다. 일부 구현예에서, 변형될 세포는 전구 세포, 조혈 줄기세포, 및 만능성 줄기세포로 이루어진 군으로부터 선택된다. 하나의 경우에, 세포는 유도 만능성 줄기세포이다. 일부 구현예에서, 변형될 세포는 T 세포, Treg 세포, NK 세포, B 세포, 대식세포, 또는 수지상 세포로부터 선택되는 면역 세포이다. 면역 세포가 T 세포인 경우, T 세포는 CD4+ T 세포, CD8+ T 세포, 감마-델타 T 세포, 또는 이들의 조합일 수 있다. 특정 구현예에서, 변형될 세포는 세포가 투여될 대상체에 대해 자가유래이다. 또 다른 구현예에서, 변형될 세포는 세포가 투여될 대상체에 대해 동종이계이다. 대상체에게의 투여를 위해 세포를 변형시키는 방법은 본원에 기재되어 있지만, 간략하게는, 변형시키기에는, 세포를 a) 본원에 기재된 임의의 구현예의 CasX 단백질 및 gNA를 포함하는 CasX:gNA 시스템; b) CasX 단백질 및 gNA를 인코딩하는 핵산; c) 상기 b)의 핵산을 포함하는 벡터; 또는 d) 상기 a) 내지 상기 c) 중 임의의 것과 접촉시키는 것이 포함되며, 여기서 하나 이상의 단백질(상기 나열된 것 중에서)의 발현이 감소되거나 세포가 하나 이상의 단백질을 검출 가능한 수준으로 발현하지 않는다. 전술한 표적 단백질의 경우에, 치료 방법은 하나 이상의 표적 단백질의 발현을 넉다운시키거나 넉아웃시키는 단계를 포함한다. 치료 구현예의 전술한 방법에서, 변형된 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95%가 종양 세포 항원에 특이적인 키메라 항원 수용체(CAR) 또는 조작된 TCR을 검출 가능한 수준으로 발현하도록 세포가 또한 변형될 수 있다. 전술한 내용에서, CAR 또는 조작된 TCR은 분화 클러스터 19(CD19), CD3, CD8, CD7, CD10, CD20, CD22, CD30, CLL1, CD33, CD34, CD38, CD41, CD44, CD47, CD49f, CD56, CD70, CD74, CD99, CD123, CD133, CD138, 카르보닉스 안하이드라제 IX(CAIX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 접착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEACAM5, 클라우딘 6(CLDN6), CLDN18, C-유형 렉틴 도메인 계열 12 구성원 A(CLEC12A), 상피-간엽 전이 인자(cMET), 세포독성 T-림프구-관련 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), EGFR-VIII, 상피 당단백질 2(EGP-2), EGP-40, EphA2, ENPP3, 상피 세포 접착 분자(EpCAM), erb-B2,3,4, 폴레이트 결합 단백질(FBP), 태아 아세틸콜린 수용체, 폴레이트 수용체-a, 폴레이트 수용체 1(FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사지향성 수용체 8(GRM8), 글리피칸-3(GPC3; glypican-3), 강글리오사이드 GD2, 강글리오사이드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), HER3, 인테그린 B7, 세포내 세포-접착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY; Lewis-Y), 콘드로모듈린-1(LECT1), L1 세포 접착 분자, 리소포스파티드산 수용체 3(LPAR3), 흑색종-관련 항원 1(MAGE-A1), 메소텔린, 뮤신 1(MUC1), MUC16, 흑색종-관련 항원 3(MAGEA3), 종양 단백질 p53(p53), T 세포에 의해 인식되는 흑색종 항원 1(MART1), 당단백질 100(GP100), 프로테이나제3(PR1), 에프린-A 수용체 2(EphA2), 자연 살해기 2D 리간드(NKG2D 리간드), 뉴욕 식도 편평 세포 암종 1(NY-ESO-1), 종양태아성 항원(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 고아 수용체 1(ROR1), 영양아층 당단백질(TPBG), 종양-관련 당단백질 72(TAG-72), 종양-관련 칼슘 신호 전달자 2(TROP-2), 티로시나제, 서바이빈, 혈관 내피 성장 인자 수용체 2(VEGF- R2), 윌름 종양-1(WT-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현되는 항원(PRAME), T 세포 수용체 베타 불변 1(TRBC1), TRBC2, 및 (T-세포 면역글로불린 뮤신-3) TIM-3으로 이루어진 군으로부터 선택되는 종양 세포 항원에 대해 특이적일 수 있다. 치료 방법의 일부 구현예에서, CAR 또는 조작된 TCR은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함한다. 일부 경우에, CAR은 CD3제타, CD27, CD28, 4-1BB(41BB), ICOS, 및 OX40으로 이루어진 군으로부터 선택되는 하나 이상의 폴리펩타이드를 추가로 포함한다. CD3-제타, CD27, CD28, 4-1BB (41BB), ICOS, 또는 OX40 중 하나 이상은 면역글로불린-유사 도메인 힌지 및/또는 스페이서 서열에 의해 CAR 항원 결합 도메인에 연결될 수 있고, CD3-제타, CD4, CD8, 및 CD28로 이루어진 군으로부터 선택되는 폴리펩타이드로부터 유래된 막관통 도메인을 추가로 포함한다. 다른 경우에, 세포는 IL-7, IL-12, IL-15, 및 IL-18로 이루어진 군으로부터 선택되는 면역 자극성 사이토카인을 코딩하는 유도성 발현 카세트를 인코딩하는 폴리핵산을 면역 세포 내로 도입함으로써 추가로 변형된다.
종양 항원의 발현과 관련된 질환을 갖는 대상체를 치료하는 방법의 일부 구현예에서, 치료적 유효량의 본원에 기재된 임의의 하나의 구현예의 변형된 세포 집단을 대상체에게 투여하는 단계는 대상체에서 암 또는 종양을 치료하거나(예를 들어, 치유 또는 중증도의 감소) 또는 예방하거나(예를 들어, 재발 가능성의 감소) 질환과 관련된 임상적 매개변수 또는 종점의 향상을 이끄는 것을 돕는 유익한 효과를 발휘할 수 있으며, 여기서 임상적 매개변수 또는 종점은 완전, 부분 또는 불완전 반응으로서 종양 위축; 진행 시간, 치료 실패까지의 시간, 바이오마커 반응; 무진행 생존율; 무질환 생존율; 재발까지의 시간; 전이까지의 시간; 전체 생존율의 시간; 삶의 질의 향상; 및 증상의 향상으로 이루어진 군 중 하나 또는 임의의 조합으로부터 선택된다.
전술한 구현예에서, 종양 항원의 발현과 관련된 질환은 암이다. 일부 구현예에서, 암은 고형 종양(solid tumor) 또는 액형 종양(liquid tumor)을 포함한다. 일부 구현예에서, 암은 결장암(colon cancer), 직장암(rectal cancer), 신세포 암종(renal-cell carcinoma), 간암, 폐의 비-소세포 암종(non-small cell carcinoma of the lung), 소장암(cancer of the small intestine), 식도암, 흑색종, 골암(bone cancer), 전립선암, 피부암, 두경부암, 피부 또는 안구내 악성 흑색종(cutaneous or intraocular malignant melanoma), 자궁암, 난소암, 직장암, 항문 영역의 암, 위암, 고환암, 나팔관 암종, 자궁내막 암종, 자궁경부 암종, 질 암종, 외음(vulva) 암종, 호지킨 질환(Hodgkin's Disease), 비-호지킨 림프종(non-Hodgkin's lymphoma), 내분비계암, 갑상선암, 부갑상선암, 부신암(cancer of adrenal gland), 연조직 육종, 요도암, 음경암, 소아의 고형 종양, 방광암, 신장 또는 수뇨관의 암, 신우(renal pelvis) 암종, 중추신경계(CNS)의 신생물, 원발성 CNS 림프종, 종양 혈관신생, 척추 종양(spinal axis tumor), 뇌간 신경교종(brain stem glioma), 뇌하수체 선종(pituitary adenoma), 카포시 육종(Kaposi's sarcoma), 유표피암(epidermoid cancer), 편평 세포암, T-세포 림프종, 환경적으로 유도된 암(environmentally induced cancer), 만성 림프구성 백혈병(CLL; chronic lymphocytic leukemia), 급성 백혈병, 급성 림프성 백혈병(ALL; acute lymphoid leukemia), B-세포 급성 림프성 백혈병(B-ALL), T-세포 급성 림프성 백혈병(T-ALL), 만성 골수구성 백혈병(CML; chronic myelogenous leukemia), 급성 골수성 백혈병(AML; acute myeloid leukemia), B 세포 전림프구성 백혈병(B cell prolymphocytic leukemia), 모구 형질세포양 수지상 세포 신생물(blastic plasmacytoid dendritic cell neoplasm), 버킷 림프종(Burkitt's lymphoma), 미만성 거대 B 세포 림프종(diffuse large B cell lymphoma), 소포성 림프종(follicular lymphoma), 털세포 백혈병(hairy cell leukemia), 소세포(small cell)- 또는 거대 세포-소포성 림프종, 악성 림프증식성 병태(malignant lymphoproliferative condition), MALT 림프종, 맨틀 세포 림프종(mantle cell lymphoma), 변연부 림프종(marginal zone lymphoma), 다발성 골수종(multiple myeloma), 골수이형성증(myelodysplasia) 및 골수이형성 증후군(myelodysplastic syndrome), 호지킨 림프종(Hodgkin's lymphoma), 형질모세포성 림프종(plasmablastic lymphoma), 형질세포양 수지상 세포 신생물, 발덴스트롬 거대글로불린혈증(Waldenstrom macroglobulinemia), 또는 전백혈병(pre-leukemia), 상기 암들의 조합, 또는 상기 암의 전이성 병변으로부터 선택된다. 방법에서, CAR 또는 조작된 TCR-보유 변형된 세포가 CAR 또는 조작된 TCR의 리간드를 보유하는 세포의 종양 항원에 결합 시, 투여되는 세포는 i) 활성화되는 반응; ii) 변형된 세포의 증식을 유도하는 반응; iii) 변형된 세포에 의한 사이토카인 분비 반응; 또는 iv) 상기 종양 항원을 보유하는 세포의 세포독성을 유도하는 반응을 할 수 있다. 종양 항원의 발현과 관련된 질환을 갖는 대상체를 치료하는 방법의 다른 구현예에서, 방법은 화학치료제를 투여하는 단계를 추가로 포함한다. 화학치료제의 비제한적인 예는 면역억제제, 예컨대 사이클로스포린(cyclosporin), 아자티오프린(azathioprine), 메토트렉세이트(methotrexate), 미코페놀레이트(mycophenolate), 및 FK506, 또는 다른 면역무력화제(immunoablative agent), 예컨대 알렘투주맙(alemtuzumab), 항-CD3 항체 또는 다른 항종양 항체 치료제, 사이톡신(cytoxin), 플루다라빈(fludarabine), 사이클로스포린, FK506, 라파마이신(rapamycin), 미코페놀산(mycophenolic acid), 스테로이드, FR901228, 및 사이토카인을 포함한다.
일부 구현예에서, 개시내용은 자가면역 질환을 갖는 대상체를 치료하는 방법을 제공한다. 일부 구현예에서, 자가면역 질환을 갖는 대상체는 유효량의, 항원 가공, 제시, 인식, 및/또는 반응에 관여하는 하나 이상의 단백질의 발현을 감소시키도록 변형된 동종이계 면역 세포(예를 들어, Treg 세포)의 집단을 투여받는다.
또 다른 구현예에서, 본 발명은 종양 항원의 발현과 관련된 질환을 갖는 대상체의 치료 방법을 제공하며, 치료적 유효 용량의 세포를 사용하는 하나 이상의 연속적 용량을 포함하는 치료 요법에 따라, 검출 가능한 수준의 키메라 항원 수용체(CAR) 또는 조작된 TCR을 발현하고, 감소된 또는 검출 불가능한 수준의 MHC 클래스 I 분자 및/또는 야생형 T-세포 수용체를 갖도록 변형된 복수의 세포를 대상체에게 투여하는 단계를 포함한다. 치료 요법의 일 구현예에서, 세포의 치료적 유효 용량은 단일 용량으로서 투여된다. 치료 요법의 또 다른 구현예에서, 세포의 치료적 유효 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월의 기간에 걸쳐 2개 이상의 용량으로, 또는 1년 1회, 또는 2년 또는 3년마다 대상체에게 투여된다. 일부 구현예에서, 전체 세포의 용량 및/또는 세포의 개별 하위-집단의 용량은 용량당 104 내지 109 세포/킬로그램(kg) 체중에서 또는 약 104 내지 약 109 세포/kg 체중, 예컨대 105 내지 106 세포/kg 체중, 예를 들어, 용량당 1×105 세포/kg, 1.5×105 세포/kg, 2×105 세포/kg, 또는 1×106 세포/kg 체중에서 또는 대략 이들 값의 범위 내에 있다. 예를 들어 일부 구현예에서, 세포는 용량당 104 내지 109 세포/킬로그램(kg) 체중에서 또는 약 104 내지 약 109 세포/kg 체중, 예컨대 용량당 105 내지 106 세포/kg 체중, 예를 들어, 1×105 세포/kg, 1.5×105 세포/kg, 2×105 세포/kg, 또는 1×106 세포/kg 체중에서 또는 대략 이들 값에서, 또는 이의 소정의 오차 범위 내에서 투여된다.
또 다른 구현예에서, 본 발명은 종양 항원의 발현과 관련된 질환을 갖는 대상체의 치료 방법을 제공하며, 본원에 기재된 임의의 구현예의 CAR 또는 조작된 TCR을 발현하도록 조작되고, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질의 발현이 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 추가로 변형되는 복수의 세포를 대상체에게 투여하는 단계를 포함하며, 여기서 투여는 치료적 유효 용량의 세포를 사용하는 하나 이상의 연속적 용량을 포함하는 치료 요법에 따른 것이다. 치료 요법의 일 구현예에서, 세포의 치료적 유효 용량은 단일 용량으로서 투여된다. 치료 요법의 또 다른 구현예에서, 세포의 치료적 유효 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월의 기간에 걸쳐 2개 이상의 용량으로, 또는 매년 기준으로, 또는 2년 또는 3년마다 대상체에게 투여된다. 일부 구현예에서, 치료 요법은 대상체에서 질환과 관련된 임상적 매개변수 또는 종점에서의 향상을 이끌며, 여기서 임상적 매개변수 또는 종점은 완전, 부분 또는 불완전 반응으로서 종양 위축; 진행 시간, 치료 실패까지의 시간, 바이오마커 반응; 무진행 생존율; 무질환 생존율; 재발까지의 시간; 전이까지의 시간; 전체 생존율의 시간; 삶의 질의 향상; 및 증상의 향상으로 이루어진 군 중 하나 또는 임의의 조합으로부터 선택된다. 치료 요법의 전술한 구현예에서, 하나 이상의 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), ICP47 폴리펩타이드, T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), PD-1, CTLA-4, LAG-3, TIM-3, 2B4, CISH, ADORA2A, TIGIT, NKG2A, 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), 및 TGFβ 수용체 2(TGFβRII)로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, 세포는 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP1A로 이루어진 군으로부터 선택되는 하나 이상의 단백질의 발현을 감소시키도록 추가로 변형된다.
세포는 임의의 적합한 수단에 의해, 예를 들어, 볼루스 주입에 의해, 주사에 의해, 예를 들어, 뇌실질내(intraparenchymal), 정맥내, 동맥내, 뇌실내(intracerebroventricular), 수조내(intracisternal), 수막공간내(intrathecal), 두개내(intracranial), 요추내(intra-lumbar), 복강내(intraperitoneal)에 의해, 또는 피하(subcutaneous) 주사, 안구내(intraocular) 주사, 안구주위(periocular) 주사, 망막하(subretinal) 주사, 유리체내(intravitreal) 주사, 경중격(trans-septal) 주사, 공막하(subscleral) 주사, 맥락막내(intrachoroidal) 주사, 전방내(intracameral) 주사, 서브켄젝트발(subconjectval) 주사, 결막하(subconjuntival) 주사, 테논낭하(sub-Tenon's) 주사, 구후(retrobulbar) 주사, 구주위(peribulbar) 주사, 또는 후방 공막옆(posterior juxtascleral) 전달에 의해 투여될 수 있다. 일부 구현예에서, 이들은 비경구, 폐내(intrapulmonary), 및 비강내(intranasal)에 의해, 그리고 국소 치료를 위해 요망된다면 병변내(intralesional) 투여에 의해 투여된다.
일부 구현예에서, 종양 항원의 발현과 관련된 질환을 갖는 대상체의 치료용 약제로서 사용하기 위한, CasX 및 gNA 유전자 편집 쌍, 및 선택적으로 공여자 주형 및/또는 CAR, 조작된 TCR, 또는 이의 하위단위를 포함하는 융합 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드에 의해 변형된 면역 세포의 조성물이 본원에 제공된다. 전술한 내용에서, CasX는 본원에 기재된 임의의 구현예의 CasX 변이체(예를 들어, 표 4의 서열)일 수 있고, gNA는 본원에 기재된 임의의 구현예의 gNA 변이체(예를 들어, 표 2의 서열)일 수 있다. 다른 구현예에서, 개시내용은 종양 항원의 발현과 관련된 질환을 갖는 대상체의 치료용 약제로서 사용하기 위한, CasX 및 gNA의 유전자 편집 쌍, 공여자 주형 및/또는 CAR을 인코딩하는 폴리뉴클레오타이드를 포함하거나 인코딩하는 벡터에 의해 변형된 세포를 포함하는 조성물을 제공한다.
IX. 제조의 키트 및 물품
또 다른 양태에서, 본원에 기재된 구현예의 조성물을 포함하는 키트가 본원에 제공된다. 일부 구현예에서, 키트는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포 유전자에 상보적인 표적화 서열을 포함하는 개시내용의 임의의 구현예의 CasX 단백질 및 하나의 또는 복수의 gNA, 부형제 및 적합한 용기(예를 들어 튜브, 바이얼 또는 플레이트)를 포함한다. 다른 구현예에서, 키트는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포 유전자에 상보적인 표적화 서열을 포함하는 개시내용의 임의의 구현예의 CasX 단백질 및 하나의 또는 복수의 gNA를 인코딩하는 핵산, CAR 또는 조작된 TCR을 인코딩하는 핵산, 부형제 및 적합한 용기를 포함한다. 다른 구현예에서, 키트는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포 유전자에 상보적인 표적화 서열을 포함하는 개시내용의 임의의 구현예의 CasX 단백질 및 하나의 또는 복수의 gNA를 인코딩하는 핵산, CAR 또는 조작된 TCR을 인코딩하는 핵산을 포함하는 벡터, 부형제 및 적합한 용기를 포함한다. 더욱 다른 구현예에서, 키트는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 세포 유전자에 상보적인 표적화 서열을 포함하는 개시내용의 임의의 구현예의 CasX 단백질 및 하나의 또는 복수의 gNA를 포함하는 VLP, CAR을 인코딩하는 핵산, 부형제 및 적합한 용기를 포함한다.
일부 구현예에서, 키트는 완충제, 뉴클레아제 저해제, 프로테아제 저해제, 리포솜, 치료제, 표지, 표지 시각화 시약, 또는 이들 중 임의의 조합을 추가로 포함한다. 일부 구현예에서, 키트는 약학적으로 허용 가능한 담체, 희석제 또는 부형제를 추가로 포함한다.
일부 구현예에서, 키트는 유전자 변형 적용을 위한 적절한 대조군 조성물, 및 사용 설명서를 포함한다.
본 설명은 다수의 예시적인 구성, 방법, 파라미터 등을 언급한다. 그러나, 이러한 설명은 본 개시내용의 범주를 제한하는 것으로 의도되지 않으며, 대신에 예시적인 실시형태의 설명으로서 제공된다.
개시내용의 비제한적인 구현예의 예
상기 기재된 본 주제의 구현예는 단독으로 또는 하나 이상의 다른 구현예와 조합되어 유익할 수 있다. 전술한 설명을 제한하지 않으면서, 1 내지 234로 숫자매겨진 개시내용의 소정의 비제한적인 양태는 아래에 제공된다. 본 개시내용을 읽을 때 당업자에게 명백하게 될 바와 같이, 개별적으로 숫자 매겨진 구현예는 각각 임의의 선행한 또는 하기 개별적으로 숫자 매겨진 구현예와 함께 사용되거나 조합될 수 있다. 이는 구현예의 모든 이러한 조합에 대한 뒷받침을 제공하고자 하며, 아래에 분명하게 제공된 구현예의 조합으로 제한되지는 않는다:
구현예 세트 번호 1:
1. CasX 폴리펩타이드 및 가이드 핵산(gNA)을 포함하는 CasX:gNA 시스템으로서, 상기 gNA는 (a) 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 핵산 서열에 상보적인; 또는 (b) 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 핵산 서열의 보체 또는 이의 조절 영역에 상보적인 표적화 서열을 포함하는, CasX:gNA 시스템.
2. 1에 있어서, 상기 단백질은 면역 세포 표면 마커인, CasX:gNA 시스템.
3. 1에 있어서, 상기 단백질은 세포내 단백질인, CasX:gNA 시스템.
4. 1 내지 3 중 어느 하나에 있어서, 상기 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 및 인간 백혈구 항원 B(HLA-B)로 이루어진 군으로부터 선택되는, CasX:gNA 시스템.
5. 4에 있어서, 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP1A로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 핵산 서열에 상보적인; 또는 (b) 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP1A로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 핵산 서열의 보체에 상보적인 표적화 서열을 포함하는 gNA를 추가로 포함하는, CasX:gNA 시스템.
6. 1 내지 5 중 어느 하나에 있어서, 상기 gNA는 가이드 RNA(gRNA)인, CasX:gNA 시스템.
7. 1 내지 5 중 어느 하나에 있어서, 상기 gNA는 가이드 DNA(gDNA)인, CasX:gNA 시스템.
8. 1 내지 5 중 어느 하나에 있어서, 상기 gNA는 DNA 및 RNA를 포함하는 키메라인, CasX:gNA 시스템.
9. 4에 있어서, 상기 단백질은 B2M인, CasX:gNA 시스템.
10. 9에 있어서, gNA의 표적화 서열은 표 3A에 제시된 서열로 이루어진 군으로부터 선택되는 서열과 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, CasX:gNA 시스템.
11. 4에 있어서, 상기 단백질은 TRAC인, CasX:gNA 시스템.
12. 11에 있어서, gNA의 표적화 서열은 표 3B에 제시된 서열로 이루어진 군으로부터 선택되는 서열과 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, CasX:gNA 시스템.
13. 4에 있어서, 상기 단백질은 CIITA인, CasX:gNA 시스템.
14. 1 내지 13 중 어느 하나에 있어서, 상기 gNA는 표 2의 서열과 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 또는 100%의 서열 동일성을 갖는 서열을 포함하는 스캐폴드를 갖는, CasX:gNA 시스템.
15. 1 내지 14 중 어느 하나에 있어서, 상기 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속(consecutive) 뉴클레오타이드로 구성되는, CasX:gNA 시스템.
16. 1 내지 15 중 어느 하나에 있어서, 상기 CasX 폴리펩타이드는 SEQ ID NO: 1-3 중 임의의 하나 또는 표 4의 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%의 서열 동일성을 갖는 서열을 포함하는, 조성물.
17. 1 내지 16 중 어느 하나에 있어서, 상기 CasX 폴리펩타이드 및 gNA는 리보핵 단백질 복합체(RNP)에서 함께 회합되는, CasX:gNA 시스템.
18. 1 내지 17 중 어느 하나에 있어서, 공여자 주형 핵산을 추가로 포함하는, CasX:gNA 시스템.
19. 18에 있어서, 상기 공여자 주형은 i) 질환 항원, 선택적으로 종양 세포 항원에 특이적인 키메라 항원 수용체(CAR); 및/또는 ii) 4의 단백질을 인코딩하는 핵산을 포함하는, CasX:gNA 시스템.
20. 19에 있어서, 상기 종양 세포 항원은 CD47, CD19, CD20, CD22, CD33, CD123, CD138, FLT3, BCMA, EGFR, 및 메소텔린으로 이루어진 군으로부터 선택되는, CasX:gNA 시스템.
21. 19 또는 20에 있어서, 상기 CAR은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함하는, CasX:gNA 시스템.
22. 19에 있어서, 상기 CAR은 CD3제타, CD27, CD28, 4-1BB(41BB), ICOS, 및 OX40으로 이루어진 군으로부터 선택되는 하나 이상의 폴리펩타이드를 추가로 포함하는, CasX:gNA 시스템.
23. 22에 있어서, CD3제타, CD27, CD28, 4-1BB(41BB), ICOS, 또는 OX40 중 하나 이상은 면역글로불린-유사 도메인 힌지에 의해 CAR 항원 결합 도메인, 및 선택적으로 스페이서 서열에 연결되는, CasX:gNA 시스템.
24. 18 내지 23 중 어느 하나에 있어서, 상기 공여자 주형은 4의 단백질을 인코딩하는 유전자 또는 유전자의 일부 또는 상기 유전자에 대한 조절 영역에 대한 핵산을 포함하고, 상기 핵산은 단백질 또는 이의 조절 영역을 인코딩하는 게놈 핵산 서열과 비교하여 하나 이상의 뉴클레오타이드의 결실, 삽입, 또는 돌연변이를 포함하는, CasX:gNA 시스템.
25. 1 내지 17 중 어느 하나의 CasX:gNA 시스템을 인코딩하는 서열을 포함하는 핵산.
26. 25의 핵산을 포함하는 벡터.
27. 공여자 주형을 포함하는 벡터로서, 상기 공여자 주형은 i) 질환 항원, 선택적으로 종양 세포 항원에 특이적인 키메라 항원 수용체(CAR); 및/또는 ii) 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 및 인간 백혈구 항원 B(HLA-B)로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 유전자 또는 유전자의 일부, 또는 iii) 상기 ii)의 유전자에 대한 조절 영역을 인코딩하는 핵산을 포함하는, 벡터.
28. 27에 있어서, 상기 종양 세포 항원은 CD47, CD19, CD20, CD22, CD33, CD123, CD138, FLT3, BCMA, EGFR, 및 메소텔린으로 이루어진 군으로부터 선택되는, 벡터.
29. 27 또는 28에 있어서, 상기 CAR은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함하는, 벡터.
30. 29에 있어서, 상기 CAR은 항원 결합 도메인에 연결된 CD3제타, CD27, CD28, 4-1BB(41BB), ICOS, 및 OX40으로 이루어진 군으로부터 선택되는 하나 이상의 폴리펩타이드를 추가로 포함하는, 벡터.
31. 30에 있어서, CD3제타, CD27, CD28, 4-1BB(41BB), ICOS, 또는 OX40 중 하나 이상은 면역글로불린-유사 도메인 힌지에 의해 CAR 항원 결합 도메인, 및 선택적으로 링커 서열에 연결되는, 벡터.
32. 27 내지 31 중 어느 하나에 있어서, 25의 핵산을 추가로 포함하는, 벡터.
33. 26 내지 32 중 어느 하나에 있어서, 상기 벡터는 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 단순 포진 바이러스(HSV) 벡터, 플라스미드, 미니서클(minicircle), 나노플라스미드, 및 RNA 벡터로 이루어진 군으로부터 선택되는, 벡터.
34. 세포의 표적 서열을 변경시키는 방법으로서, 상기 세포를 a) 1 내지 24 중 어느 하나의 CasX:gNA 시스템; b) 25의 핵산; c) 26 내지 33 중 어느 하나의 벡터; 또는 d) 상기 a) 내지 상기 c) 중 임의의 것과 접촉시키는 단계를 포함하는, 방법.
35. 34에 있어서, 상기 세포는, 단백질의 발현이, 조작되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 조작된 것인, 방법.
36. 34 또는 35에 있어서, 세포는, 상기 세포가 단백질을 검출 가능한 수준으로 발현하지 않도록 조작된 것인, 방법.
37. 35 또는 36에 있어서, 상기 단백질은 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택되는, 방법.
38. 34 또는 35의 방법에 의해 조작된 세포 집단으로서, 상기 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포가 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않도록 조작된 것인, 방법.
39. 34 또는 35의 방법에 의해 조작된 세포 집단으로서, 상기 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포가 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않도록 조작된 것인, 방법.
40. 38 또는 39에 있어서, 상기 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포가 검출 가능한 수준의 키메라 항원 수용체(CAR)를 발현하도록 조작된 것인, 세포 집단.
41. 38 내지 40 중 어느 하나에 있어서, 상기 세포는 비-영장류 포유류 세포, 비-인간 영장류 세포, 또는 인간 세포인, 세포 집단.
42. 38 내지 41 중 어느 하나에 있어서, 상기 세포는 전구 세포, 조혈 줄기세포, 및 만능성 줄기세포로 이루어진 군으로부터 선택되는, 세포 집단.
43. 42에 있어서, 상기 세포는 유도 만능성 줄기세포인, 세포 집단.
44. 38 내지 41 중 어느 하나에 있어서, 상기 세포는 면역 세포인, 세포 집단.
45. 44에 있어서, 상기 면역 세포는 T 세포, TREG 세포, NK 세포, B 세포, 대식세포, 또는 수지상 세포인, 세포 집단.
46. 45에 있어서, 상기 면역 세포는 T 세포이고, 상기 T 세포는 CD4+ T 세포, CD8+ T 세포, 또는 이들의 조합인, 세포 집단.
47. 38 내지 46 중 어느 하나에 있어서, 세포는 상기 세포가 투여될 환자에 대해 자가유래(autologous)인, 세포 집단.
48. 38 내지 46 중 어느 하나에 있어서, 세포는 상기 세포가 투여될 환자에 대해 동종이계(allogeneic)인, 세포 집단.
49. 1 내지 24 중 어느 하나의 CasX:gNA 시스템을 포함하는, 세포 집단.
50. 49에 있어서, 상기 세포는 i) 질환 항원, 선택적으로 종양 세포 항원에 특이적인 키메라 항원 수용체(CAR)를 발현하도록; 그리고/또는 ii) 4의 단백질의 발현을 방해하도록 조작된 것인, 세포 집단.
51. 50에 있어서, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포는 검출 가능한 수준의 CAR을 발현하는, 세포 집단.
52. 50 또는 51에 있어서, 상기 세포는, 단백질의 발현이, 조작되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 조작된 것인, 세포 집단.
53. 49 내지 52 중 어느 하나에 있어서, 세포는 상기 세포가 투여될 환자에 대해 자가유래인, 세포 집단.
54. 49 내지 52 중 어느 하나에 있어서, 세포는 상기 세포가 투여될 환자에 대해 동종이계인, 세포 집단.
55. 49 내지 54 중 어느 하나에 있어서, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포는 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않는, 세포 집단.
56. 49 내지 55 중 어느 하나에 있어서, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포는 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않는, 세포 집단.
57. 대상체에서 항종양 면역력을 제공하는 방법으로서, 유효량의 49 내지 56 중 어느 하나의 세포를 대상체에게 투여하는 단계를 포함하는, 방법.
58. 종양 항원의 발현과 관련된 질환을 갖거나 자가면역 질환을 갖는 대상체를 치료하는 방법으로서, 유효량의 49 내지 56 중 어느 하나의 세포를 대상체에게 투여하는 단계를 포함하는, 방법.
59. 58에 있어서, 종양 항원의 발현과 관련된 질환은 결장암, 직장암, 신세포 암종, 간암, 폐의 비-소세포 암종, 소장암, 식도암, 흑색종, 골암, 전립선암, 피부암, 두경부암, 피부 또는 안구내 악성 흑색종, 자궁암, 난소암, 직장암, 항문 영역의 암, 위암, 고환암, 나팔관 암종, 자궁내막 암종, 자궁경부 암종, 질 암종, 외음 암종, 호지킨 질환, 비-호지킨 림프종, 내분비계암, 갑상선암, 부갑상선암, 부신암, 연조직 육종, 요도암, 음경암, 소아의 고형 종양, 방광암, 신장 또는 수뇨관의 암, 신우 암종, 중추신경계(CNS)의 신생물, 원발성 CNS 림프종, 종양 혈관신생, 척추 종양, 뇌간 신경교종, 뇌하수체 선종, 카포시 육종, 유표피암, 편평 세포암, T-세포 림프종, 환경적으로 유도된 암, 만성 림프구성 백혈병(CLL), 급성 백혈병, 급성 림프성 백혈병(ALL), B-세포 급성 림프성 백혈병(B-ALL), T-세포 급성 림프성 백혈병(T-ALL), 만성 골수구성 백혈병(CML), 급성 골수성 백혈병(AML), B 세포 전림프구성 백혈병, 모구 형질세포양 수지상 세포 신생물, 버킷 림프종, 미만성 거대 B 세포 림프종, 소포성 림프종, 털세포 백혈병, 소세포- 또는 거대 세포-소포성 림프종, 악성 림프증식성 병태, MALT 림프종, 맨틀 세포 림프종, 변연부 림프종, 다발성 골수종, 골수이형성증 및 골수이형성 증후군, 호지킨 림프종, 형질모세포성 림프종, 형질세포양 수지상 세포 신생물, 발덴스트롬 거대글로불린혈증, 전백혈병, 상기 암들의 조합, 및 상기 암의 전이성 병변으로 이루어진 군으로부터 선택되는 암인, 방법.
60. 57 내지 59 중 어느 하나에 있어서, 화학치료제를 투여하는 단계를 추가로 포함하는, 방법.
61. 면역치료법을 위한 세포를 제조하는 방법으로서, i) 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질 또는 ii) 상기 단백질의 조절 영역의 발현을 감소시키거나 제거함으로써 면역 세포를 변형시키는 단계를 포함하는, 방법.
62. 61에 있어서, 면역 세포의 핵산을 CasX 폴리펩타이드 및 가이드 핵산(gNA)을 포함하는 CasX:gNA 시스템과 접촉시키는 단계를 포함하며, 상기 gNA는 (a) 단백질을 인코딩하는 유전자 또는 유전자의 일부 또는 상기 유전자에 대한 조절 영역에 대한 핵산 서열에 상보적인 표적 서열을 포함하거나; (b) 단백질을 인코딩하는 핵산 서열의 보체 또는 이의 조절 영역에 상보적인, 방법.
63. 61에 있어서, 상기 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 및 인간 백혈구 항원 B(HLA-B)로 이루어진 군으로부터 선택되는, 방법.
64. 63에 있어서, 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP1A로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 핵산 서열에 상보적인; 또는 (b) 분화 클러스터 247(CD247), CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP1A로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 핵산 서열의 보체에 상보적인 표적화 서열을 포함하는 gNA를 추가로 포함하는, 방법.
65. 61 내지 64 중 어느 하나에 있어서, 상기 세포는, 단백질의 발현이, 조작되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록 조작된 것인, 방법.
66. 61 내지 65 중 어느 하나에 있어서, 세포는, 상기 세포가 단백질을 검출 가능한 수준으로 발현하지 않도록 조작된 것인, 방법.
67. 65 또는 66에 있어서, 상기 단백질은 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택되는, 방법.
68. 61 내지 67 중 어느 하나에 있어서, 상기 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포가 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않도록 조작된 것인, 방법.
69. 61 내지 68 중 어느 하나에 있어서, 상기 세포는, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%의 조작된 세포가 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않도록 조작된 것인, 방법.
70. 61 내지 69 중 어느 하나에 있어서, 상기 면역 세포의 핵산을 공여자 주형 핵산과 접촉시키는 단계를 추가로 포함하며, 상기 공여자 주형은 종양 세포 항원에 특이적인 키메라 항원 수용체(CAR)를 인코딩하는 핵산을 포함하는, 방법.
71. 70에 있어서, 상기 종양 세포 항원은 CD47, CD19, CD20, CD22, CD33, CD123, CD138, FLT3, BCMA, EGFR, 및 메소텔린으로 이루어진 군으로부터 선택되는, 방법.
72. 70 또는 71에 있어서, 상기 CAR은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함하는, 방법.
73. 72에 있어서, 상기 CAR은 CD3제타, CD27, CD28, 4-1BB(41BB), ICOS, 및 OX40으로 이루어진 군으로부터 선택되는 하나 이상의 폴리펩타이드를 포함하는, 방법.
74. 73에 있어서, CD3제타, CD27, CD28, 4-1BB(41BB), ICOS, 또는 OX40 중 하나 이상은 면역글로불린-유사 도메인 힌지에 의해 CAR 항원 결합 도메인, 및 선택적으로 스페이서 서열에 연결되는, 방법.
75. 61 내지 74 중 어느 하나에 있어서, 상기 세포 집단을 확장(expand)시키는 단계를 추가로 포함하는, 방법.
76. 치료를 필요로 하는 대상체를 치료하는 방법으로서, 61 내지 75 중 어느 하나의 방법에 의해 제조된 세포를 투여하는 단계를 포함하는, 방법.
77. 치료를 필요로 하는 대상체를 치료하는 방법으로서, 61 내지 75 중 어느 하나의 방법에 의해 제조된 세포를 면역억제제와 조합하여 투여하는 단계를 포함하는, 방법.
78. 76 또는 77에 있어서, 상기 세포는 대상체에 대해 자가유래인, 방법.
79. 76 또는 77에 있어서, 상기 세포는 대상체에 대해 동종이계인, 방법.
80. 76 내지 79 중 어느 하나에 있어서, 상기 대상체는 종양 항원의 발현과 관련된 질환을 갖고 있으며, 상기 투여는 종양 항원의 발현과 관련된 상기 지로한을 치료하는, 방법.
81. 80에 있어서, 종양 항원의 발현과 관련된 질환은 결장암, 직장암, 신세포 암종, 간암, 폐의 비-소세포 암종, 소장암, 식도암, 흑색종, 골암, 전립선암, 피부암, 두경부암, 피부 또는 안구내 악성 흑색종, 자궁암, 난소암, 직장암, 항문 영역의 암, 위암, 고환암, 나팔관 암종, 자궁내막 암종, 자궁경부 암종, 질 암종, 외음 암종, 호지킨 질환, 비-호지킨 림프종, 내분비계암, 갑상선암, 부갑상선암, 부신암, 연조직 육종, 요도암, 음경암, 소아의 고형 종양, 방광암, 신장 또는 수뇨관의 암, 신우 암종, 중추신경계(CNS)의 신생물, 원발성 CNS 림프종, 종양 혈관신생, 척추 종양, 뇌간 신경교종, 뇌하수체 선종, 카포시 육종, 유표피암, 편평 세포암, T-세포 림프종, 환경적으로 유도된 암, 만성 림프구성 백혈병(CLL), 급성 백혈병, 급성 림프성 백혈병(ALL), B-세포 급성 림프성 백혈병(B-ALL), T-세포 급성 림프성 백혈병(T-ALL), 만성 골수구성 백혈병(CML), 급성 골수성 백혈병(AML), B 세포 전림프구성 백혈병, 모구 형질세포양 수지상 세포 신생물, 버킷 림프종, 미만성 거대 B 세포 림프종, 소포성 림프종, 털세포 백혈병, 소세포- 또는 거대 세포-소포성 림프종, 악성 림프증식성 병태, MALT 림프종, 맨틀 세포 림프종, 변연부 림프종, 다발성 골수종, 골수이형성증 및 골수이형성 증후군, 호지킨 림프종, 형질모세포성 림프종, 형질세포양 수지상 세포 신생물, 발덴스트롬 거대글로불린혈증, 전백혈병, 상기 암들의 조합, 및 상기 암의 전이성 병변으로 이루어진 군으로부터 선택되는 암인, 방법.
실시예
실시예 1: CasX Stx2의 생성, 발현 및 정제
1. 성장 및 발현
플랑크토마이세테스(Planctomycetes)로부터 유래된 CasX Stx2(본원에서 CasX2로도 지칭됨)에 대한 발현 작제물(SEQ ID NO: 2의 CasX 아미노산 서열을 갖고 아래 표 6의 서열에 의해 인코딩됨)을, 이. 콜라이에 대해 코돈 최적화된 유전자 단편(Twist Biosciences)으로부터 작제하였다. 조립된 작제물은 TEV-절단 가능한, C-말단, TwinStrep 태그를 함유하고, 앰피실린 내성 유전자를 함유하는 pBR322-유도 가능한 플라스미드 백본 내로 클로닝하였다. 발현 작제물을 화학적으로-적격인 BL21*(DE3) 이. 콜라이 내로 형질전환시키고, 출발 배양물을, UltraYield 플라스크(Thomson Instrument Company)에서 37℃, 200 RPM에서 카르베니실린이 보충된 LB 브로쓰(broth)에서 밤새 성장시켰다. 이튿날, 이러한 배양물을 사용하여, 발현 배양물을 1:100 비(출발 배양물:발현 배양물)로 시딩하였다. 발현 배양물은 카르베니실린이 보충되고 UltraYield 플라스크에서 37℃, 200 RPM에서 성장된 Terrific Broth(Novagen)였다. 일단 배양물이 2의 광학 밀도(OD)에 도달하면, 이들 배양물을 16℃까지 냉각시키고, IPTG(이소프로필-β-D-1-티오갈락토피라노사이드)를 1 M 스탁(stock)으로부터 1 mM의 최종 농도로 첨가하였다. 배양물을 16℃, 200 RPM에서 20시간 동안 유도한 후, 4,000xg, 4℃에서 15분 동안 원심분리에 의해 수집하였다. 세포 페이스트를 칭량하고, 세포 페이스트 그램당 5 mL의 용해 완충제의 비로 용해 완충제(50 mM HEPES-NaOH, 250 mM NaCl, 5 mM MgCl2, 1 mM TCEP, 1 mM 벤자미딘-HCL, 1 mM PMSF, 0.5% CHAPS, 10% 글리세롤, pH 8)에 재현탁시켰다. 일단 재현탁되면, 시료를 정제 시까지 -80℃에서 냉동시켰다.
Figure pct00078
2. 정제
냉동된 시료를 4℃에서 자기 교반하면서 밤새 해동시켰다. 생성된 용해물의 점도를 초음파처리에 의해 감소시키고, Emulsiflex C3(Avestin)을 사용하여 17k PSI에서 3회 통과 시 균질화에 의해 용해를 완료하였다. 용해물을 50,000xg, 4℃에서 30분 동안 원심분리에 의해 정제하고, 상층액을 수집하였다. 정제된 상층액을 중력 유동(gravity flow)에 의해 헤파린 6 Fast Flow 컬럼(GE Life Sciences)에 적용하였다. 컬럼을 5 CV의 헤파린 완충제 A(50 mM HEPES-NaOH, 250 mM NaCl, 5 mM MgCl2, 1 mM TCEP, 10% 글리세롤, pH 8)로 세척한 다음, 5 CV의 헤파린 완충제 B(500 mM까지 조정된 NaCl 농도를 갖는 완충제 A)로 세척하였다. 단백질을 5 CV의 헤파린 완충제 C(1 M까지 조정된 NaCl 농도를 갖는 완충제 A)로 용리하고, 분획으로 수집하였다. 분획을 브래드포드 검정에 의해 단백질에 대해 검정하고, 단백질-함유 분획을 풀링하였다. 풀링된 헤파린 용리물을 중력 유동에 의해 Strep-Tactin Superflow 컬럼(IBA Life Sciences)에 적용하였다. 컬럼을 5 CV의 Strep 완충제(50 mM HEPES-NaOH, 500 mM NaCl, 5 mM MgCl2, 1 mM TCEP, 10% 글리세롤, pH 8)로 세척하였다. 첨가된 50 mM D-비오틴과 함께 5 CV의 Strep 완충제를 사용하여 컬럼으로부터 단백질을 용리시키고 분획에서 수집하였다. CasX-함유 분획을 풀링하고, 4℃에서 30 kDa 컷오프 스핀 농축기를 사용하여 농축시키고, Superdex 200 pg 컬럼(GE Life Sciences) 상에서 크기 배제 크로마토그래피에 의해 정제하였다. 컬럼을 AKTA Pure FPLC 시스템(GE Life Sciences)에 의해 작동되는 SEC 완충제(25 mM 소듐 포스페이트, 300 mM NaCl, 1 mM TCEP, 10% 글리세롤, pH 7.25)로 평형화시켰다. 적절한 분자량에서 용리된 CasX-함유 분획을 풀링하고, 4℃에서 30 kDa 컷오프 회전 농축기를 사용하여 농축시키고, 분취하고, 액체 질소에서 급속-냉동시킨 다음, -80℃에서 보관하였다.
3. 결과
정제 전반으로부터의 시료를 SDS-PAGE에 의해 분해하고, 도 1 및 도 3에 도시된 바와 같이 콜로이드 쿠마시 염색에 의해 시각화하였다. 도 1에서, 좌측에서 우측으로, 레인은: 분자량, 펠렛: 세포 용해 후의 불용성 부분, 용해물: 세포 용해 후의 가용성 부분, 통과 유동: 헤파린 컬럼에 결합하지 않은 단백질, 세척: 세척 완충제에서 컬럼으로부터 용리된 단백질, 용리: 용리 완충제를 이용하여 헤파린 컬럼으로부터 용리된 단백질, 통과 유동: 스트렙택틴 XT(StrepTactinXT) 컬럼에 결합하지 않은 단백질, 용리: 용리 완충제를 이용하여 스트렙택틴 XT로부터 용리된 단백질, 주사액: s200 겔 여과 컬럼 상으로 주사된 농축 단백질, 냉동물: 농축 및 냉동되었던 s200 용리물로부터의 풀링된 분획이다. 도 3에서, 우측에서 좌측까지의 레인은 주사(겔 여과 컬럼 상으로 주사된 단백질의 시료) 분자량 마커이고, 레인 3 내지 9는 지시된 용리 부피로부터의 시료이다. 겔 여과로부터의 결과를 도 2에 도시한다. 68.36 mL 피크는 CasX의 겉보기 분자량에 상응하고, 대부분의 CasX 단백질을 함유하였다. 평균 수율은 콜로이드 쿠마시 염색에 의해 평가된 바와 같이, 75% 순도에서 배양물의 리터당 0.75 mg의 정제된 CasX 단백질이었다.
실시예 2: CasX 작제물 119, 438 및 457
CasX 119, 438, 및 457 작제물(표 7의 서열)을 생성하기 위해, 코돈-최적화된 CasX 37 작제물(융합된 NLS와 함께 A708K 치환 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 1의 CasX Stx2 작제물에 기초함)을 표준 클로닝 방법을 사용하여 포유류 발현 플라스미드(pStX; 도 4 참조) 내로 클로닝하였다. CasX 119를 제작하기 위해, CasX 37 작제물 DNA를, 프라이머 oIC539와 oIC88, 뿐만 아니라 oIC87과 oIC540를 각각 사용하여 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 2개의 반응에서 PCR 증폭시켰다(도 5 참조). CasX 457을 제작하기 위해, CasX 365 작제물 DNA를, 프라이머 oIC539와 oIC212, oIC211과 oIC376, oIC375와 oIC551, 및 oIC550과 oIC540를 각각 사용하여 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 4개의 반응에서 PCR 증폭시켰다. CasX 438을 제작하기 위해, CasX 119 작제물 DNA를, 프라이머 oIC539와 oIC689, oIC688과 oIC376, oIC375와 oIC551, 및 oIC550과 oIC540를 각각 사용하여 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 4개의 반응에서 PCR 증폭시켰다. 그 후에, 생성된 PCR 증폭 생성물을, Zymoclean DNA 클린 및 농축기(Zymo Research Cat# 4014)를 제조업체의 프로토콜에 따라 사용하여 정제하였다. XbaI 및 SpeI을 사용하여 pStX 백본을 분해하여, 플라스미드 pStx34 내 2개의 부위 사이에서 DNA의 2931 염기쌍 단편을 제거하였다. 분해된 백본 단편을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, 3개의 단편을 깁슨 조립체(New England BioLabs Cat# E2621S)를 제조업체의 프로토콜에 따라 사용하여 함께 조각화(piece)하였다. pStx34 내의 조립된 생성물을 화학적으로-적격이거나 전기-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. pStX34는 단백질에 대한 EF-1α 프로모터, 뿐만 아니라 퓨로마이신 및 카르베니실린에 대한 선택 마커를 포함한다. 관심 유전자를 표적화하는 표적화 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다. SaCas9 및 SpyCas9 대조군 플라스미드를 상기 기재된 pStX 플라스미드와 유사하게 제조하였고, 이때 pStX의 단백질 및 가이드 영역을 각각의 단백질 및 가이드에 대해 교환하였다. SaCas9 및 SpyCas9에 대한 표적화 서열을 문헌으로부터 수득하거나, 확립된 방법에 따라 합리적으로 설계하였다. CasX 119 단백질 및 CasX 457 단백질의 발현 및 회수를 실시예 1의 일반적인 방법을 사용하여 수행하였다(그러나, DNA 서열을 이. 콜라이에서 발현에 대해 코돈 최적화하였음). CasX 119에 대한 분석 검정의 결과를 도 6 내지 도 8에 도시한다. CasX 119의 평균 수율은 콜로이드 쿠마시 염색에 의해 평가된 바와 같이, 75% 순도에서 배양물의 리터당 1.56 mg의 정제된 CasX 단백질이었다. 도 6은 기재된 바와 같이, Bio-Rad Stain-Free™ 겔 상에서 시각화된, 정제 시료의 SDS-PAGE 겔을 도시한다. 좌측에서 우측으로, 레인은: 펠렛: 세포 용해 후의 불용성 부분, 용해물: 세포 용해 후의 가용성 부분, 통과 유동: 헤파린 컬럼에 결합하지 않은 단백질, 세척: 세척 완충제에서 컬럼으로부터 용리된 단백질, 용리: 용리 완충제를 이용하여 헤파린 컬럼으로부터 용리된 단백질, 통과 유동: 스트렙택틴 XT 컬럼에 결합하지 않은 단백질, 용리: 용리 완충제를 이용하여 스트렙택틴 XT로부터 용리된 단백질, 주사액: s200 겔 여과 컬럼 상으로 주사된 농축 단백질, 냉동물: 농축 및 냉동되었던 s200 용리물로부터의 풀링된 분획이다.
도 7은 기재된 바와 같이 Superdex 200 16/600 pg 겔 여과의 크로마토그램을 도시한다. CasX 변이체 119 단백질의 겔 여과 전개(run)를 용리 부피에 대해 280 nm 흡광도로서 플롯화하였다. 65.77 mL 피크는 CasX 변이체 119의 겉보기(apparent) 분자량에 상응하고, 대부분의 CasX 변이체 119 단백질을 함유하였다. 도 8은 기재된 바와 같이, 콜로이드성 쿠마시로 염색된 겔 여과 시료의 SDS-PAGE 겔을 도시한다. 지시된 분획으로부터의 시료는 SDS-PAGE에 의해 분해되었고, 콜로이드 쿠마시로 염색되었다. 우측에서 좌측으로, 주사: 겔 여과 컬럼 상으로 주사된 단백질의 시료, 분자량 마커, 레인 3 -10: 지시된 용리 부피로부터의 시료이다.
Figure pct00079
Figure pct00080
실시예 3: CasX 작제물 488 및 491
CasX 488 작제물(표 8의 서열)을 생성하기 위해, 코돈-최적화된 CasX 119 작제물(융합된 NLS와 함께 A708K 치환, L379R 치환, 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 1의 CasX Stx2 작제물에 기초함)을 표준 클로닝 방법을 사용하여 포유류 발현 플라스미드(pStX; 도 4 참조) 내로 클로닝하였다. 작제물 CasX 1(CasX SEQ ID NO: 1을 인코딩하는 실시예 1의 CasX Stx1 작제물에 기초함)을 표준 클로닝 방법을 사용하여 지정 벡터 내로 클로닝하였다. CasX 488을 제작하기 위해, CasX 119 작제물 DNA를, 프라이머 oIC765 및 oIC762를 사용하여 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 PCR 증폭시켰다(도 5 참조). CasX 1 작제물을, 프라이머 oIC766 및 oIC784를 사용하여 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 PCR 증폭시켰다. PCR 생성물을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, 2개의 단편을 깁슨 조립체(New England BioLabs Cat# E2621S)를 제조업체의 프로토콜에 따라 사용하여 함께 조각화하였다. pStx1 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카나마이신을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 그 후에, 제한 효소 클로닝을 사용하여 올바른 클론을 포유류 발현 벡터 pStx34 내로 서브클로닝하였다. pStx34 백본 및 pStx1에서의 CasX 488 클론을 각각 XbaI 및 BamHI를 이용하여 분해하였다. 분해된 백본 및 삽입물 단편을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, T4 리가제(New England Biolabs Cat# M0202L)를 제조업체의 프로토콜에 따라 사용하여 깨끗한 백본 및 삽입물을 함께 리게이션하였다. 리게이션된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다.
CasX 491(표 8의 서열)을 발생시키기 위해, CasX 484 작제물 DNA를, 프라이머 oIC765 및 oIC762를 사용하여 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 PCR 증폭시켰다(도 5 참조). CasX 1 작제물을, 프라이머 oIC766 및 oIC784를 사용하여 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 PCR 증폭시켰다. PCR 생성물을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, 2개의 단편을 깁슨 조립체(New England BioLabs Cat# E2621S)를 제조업체의 프로토콜에 따라 사용하여 함께 조각화하였다. pStx1 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카나마이신을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 그 후에, 제한 효소 클로닝을 사용하여 올바른 클론을 포유류 발현 벡터 pStx34 내로 서브클로닝하였다. pStx34 백본 및 pStx1에서의 CasX 491 클론을 각각 XbaI 및 BamHI를 이용하여 분해하였다. 분해된 백본 및 삽입물 단편을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, T4 리가제(New England Biolabs Cat# M0202L)를 제조업체의 프로토콜에 따라 사용하여 깨끗한 백본 및 삽입물을 함께 리게이션하였다. 리게이션된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. pStX34는 단백질에 대한 EF-1α 프로모터, 뿐만 아니라 퓨로마이신 및 카르베니실린에 대한 선택 마커를 포함한다. 관심 유전자를 표적화하는 표적화 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다. SaCas9 및 SpyCas9 대조군 플라스미드를 상기 기재된 pStX 플라스미드와 유사하게 제조하였고, 이때 pStX의 단백질 및 가이드 영역을 각각의 단백질 및 가이드에 대해 교환하였다. SaCas9 및 SpyCas9에 대한 표적화 서열을 문헌으로부터 수득하거나, 확립된 방법에 따라 합리적으로 설계하였다. 실시예 1 및 실시예 2의 일반적인 방법을 사용하여 CasX 작제물의 발현 및 회수를 수행하였고, 유사한 결과를 수득하였다.
Figure pct00081
실시예 4: CasX 작제물 278-280, 285-288, 290, 291, 293, 300, 492, 및 493의 설계 및 생성
CasX 278-280, 285-288, 290, 291, 293, 300, 492, 및 493 작제물(표 9의 서열)을 생성하기 위해, 포유류 발현 벡터에서 코돈-최적화된 CasX 119 작제물(융합된 NLS와 함께 A708K 치환 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 2의 CasX Stx37 작제물에 기초함)의 N-말단 및 C-말단을 조작하여 NLS 서열을 결실시키거나 첨가하였다(표 10의 서열). 작제물 278, 279, 및 280은 SV40 NLS 서열만 사용한 N-말단 및 C-말단의 조작이었다. 작제물 280은 N-말단 상에 어떠한 NLS를 갖지 않았고, 2개의 SV40 NLS 서열 사이에서 삼중 프롤린 링커와 함께 C-말단 상에 2개의 SV40 NLS를 첨가하였다. 제1 단편에 대해 각각 프라이머 oIC527 및 oIC528, oIC730 및 oIC522, 및 oIC730 및 oIC530을 사용하고 제2 단편을 생성하기 위해 각각 oIC529 및 oIC520, oIC519 및 oIC731, 및 oIC529 및 oIC731을 사용하여 pStx34.119.174.NT를 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 증폭시킴으로써 작제물 278, 279, 및 280을 제조하였다. 이들 단편을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 각각의 단편을 깁슨 조립체(New England BioLabs Cat# E2621S)를 제조업체의 프로토콜에 따라 사용하여 함께 클로닝하였다. pStx34 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 관심 유전자를 표적화하는 표적화 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다.
작제물 285-288, 290, 291, 293, 및 300을 생성하기 위해, 네스팅(nest)된 PCR을 클로닝에 사용하였다. 사용된 백본 벡터 및 PCR 주형은 CasX 119, 가이드 174, 및 비-표적화 스페이서(서열에 대해 실시예 8 및 9와 그 안의 표를 참조)를 갖는 작제물 pStx34 279.119.174.NT였다. 작제물 278은 입체배치 SV40NLS-CasX119를 갖는다. 작제물 279는 입체배치 CasX119-SV40NLS를 갖는다. 작제물 280은 입체배치 CasX119-SV40NLS-PPP 링커-SV40NLS를 갖는다. 작제물 285는 입체배치 CasX119-SV40NLS-PPP 링커-SynthNLS3을 갖는다. 작제물 286은 입체배치 CasX119-SV40NLS-PPP 링커-SynthNLS4를 갖는다. 작제물 287은 입체배치 CasX119-SV40NLS-PPP 링커-SynthNLS5를 갖는다. 작제물 288은 입체배치 CasX119-SV40NLS-PPP 링커-SynthNLS6을 갖는다. 작제물 290은 입체배치 CasX119-SV40NLS-PPP 링커-EGL-13 NLS를 갖는다. 작제물 291은 입체배치 CasX119-SV40NLS-PPP 링커-c-Myc NLS를 갖는다. 작제물 293은 입체배치 CasX119-SV40NLS-PPP 링커-인(Nucleolar) RNA 헬리카제 II NLS를 갖는다. 작제물 300은 입체배치 CasX119-SV40NLS-PPP 링커-인플루엔자 A 단백질 NLS를 갖는다. 작제물 492는 입체배치 SV40NLS-CasX119- SV40NLS-PPP 링커-SV40NLS를 갖는다. 작제물 493은 입체배치 SV40NLS-CasX119- SV40NLS-PPP 링커-c-Myc NLS를 갖는다. 각각의 변이체는 3개의 PCR 세트를 가졌다; 이 중 2개는 네스팅되었고, 겔 추출에 의해 정제되었고, 분해된 다음, 분해되고 정제된 백본 내로 리게이션되었다. pStx34 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 관심 유전자를 표적화하는 표적화 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 생성된 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다.
작제물 492 및 493을 생성하기 위해, 작제물 280 및 291을, XbaI 및 BamHI (NEB# R0145S 및 NEB# R3136S)을 제조업체의 프로토콜에 따라 사용하여 분해하였다. 다음, 이들을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 마지막으로, 이들을 T4 DNA 리가제(NEB# M0202S)를 제조업체의 프로토콜에 따라 사용하여, XbaI 및 BamHI 및 Zymoclean 겔 DNA 회수 키트를 사용하여 분해되고 정제된 pStx34.119.174.NT 내로 리게이션하였다. pStx34 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 관심 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 서열 DNA를, 표적화 스페이서 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 각각의 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 각각의 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다. 플라스미드를 사용하여, 실시예 1 및 2의 일반적인 방법을 활용하여 CasX 단백질을 생성하고 회수하였다.
Figure pct00082
Figure pct00083
Figure pct00084
Figure pct00085
Figure pct00086
Figure pct00087
Figure pct00088
Figure pct00089
실시예 5: CasX 작제물 387, 395, 485-491, 및 494의 설계 및 생성
CasX 395, CasX 485, CasX 486, CasX 487을 생성하기 위해, 코돈 최적화된 CasX 119(융합된 NLS와 함께 A708K 치환 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 2의 CasX 37 작제물에 기초함), CasX 435, CasX 438, 및 CasX 484(각각 융합된 NLS와 함께 L379R 치환, A708K 치환, 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 2의 CasX 119 작제물에 기초함)을, 표준 클로닝 방법을 사용하여, 융합된 NLS(pStx1)와 함께 KanR 마커, colE1 ori, 및 CasX를 포함하는 4 kb 스테이징 벡터 내로 각각 클로닝하였다. 깁슨 프라이머를, 그 자체의 벡터 내의 아미노산 192-331로부터의 CasX SEQ ID NO: 1 나선형 I 도메인을 증폭시켜 pStx1 내의 CasX 119, CasX 435, CasX 438, 및 CasX 484 상의 이러한 상응하는 영역(aa 193-332)으로 각각 대체하도록 설계하였다. CasX SEQ ID NO: 1로부터의 나선형 I 도메인을, Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 프라이머 oIC768 및 oIC784와 함께 증폭시켰다. 요망되는 CasX 변이체를 함유하는 목적지(destination) 벡터를, Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 프라이머 oIC765 및 oIC764와 함께 증폭시켰다. 2개의 단편을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, 삽입물 및 백본 단편을 깁슨 조립체(New England BioLabs Cat# E2621S)를 제조업체의 프로토콜에 따라 사용하여 함께 조각화하였다. pStx1 스테이징 벡터 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카나마이신을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 그 후에, 올바른 클론을 절단하고, 표준 클로닝 방법을 사용하여 포유류 발현 플라스미드(도 5 참조) 내로 붙였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 관심 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 스페이서 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다.
CasX 488, CasX 489, CasX 490, CasX 491(표 11의 서열)을 생성하기 위해, 코돈 최적화된 CasX 119(융합된 NLS와 함께 A708K 치환 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 2의 CasX 37 작제물에 기초함), CasX 435, CasX 438, 및 CasX 484(각각 융합된 NLS와 함께 L379R 치환, A708K 치환, 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 2의 CasX119 작제물에 기초함)을, 표준 클로닝 방법을 사용하여, 융합된 NLS(pStx1)와 함께 KanR 마커, colE1 ori, 및 STX로 이루어진 4 kb 스테이징 벡터 내로 각각 클로닝하였다. 깁슨 프라이머를, 그 자체의 벡터 내의 아미노산 101-191로부터의 CasX Stx1 NTSB 도메인 및 아미노산 192-331로부터의 나선형 I 도메인을 증폭시켜 pStx1 내의 CasX 119, CasX 435, CasX 438, 및 CasX 484 상의 이러한 유사한 영역(aa 103-332)으로 각각 대체하도록 설계하였다. NTSB 및 CasX SEQ ID NO: 1로부터의 나선형 I 도메인을, Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 프라이머 oIC766 및 oIC784와 함께 증폭시켰다. 요망되는 CasX 변이체를 함유하는 목적지 벡터를, Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 프라이머 oIC762 및 oIC765와 함께 증폭시켰다. 2개의 단편을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, 삽입물 및 백본 단편을 깁슨 조립체(New England BioLabs Cat# E2621S)를 제조업체의 프로토콜에 따라 사용하여 함께 조각화하였다. pStx1 스테이징 벡터 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카나마이신을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 그 후에, 올바른 클론을 절단하고, 표준 클로닝 방법을 사용하여 포유류 발현 플라스미드(도 5 참조) 내로 붙였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 관심 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 스페이서 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다.
CasX 387 및 CasX 494(표 11의 서열)를 생성하기 위해, 코돈 최적화된 CasX 119(융합된 NLS와 함께 A708K 치환 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 2의 CasX 37 작제물에 기초함), CasX 484(융합된 NLS와 함께 L379R 치환, A708K 치환, 및 [P793] 결실을 갖고 가이드 및 비-표적화 서열에 연결된, 플랑크토마이세테스 CasX SEQ ID NO: 2를 인코딩하는 실시예 2의 CasX119 작제물에 기초함)을, 표준 클로닝 방법을 사용하여, 융합된 NLS(pStx1)와 함께 KanR 마커, colE1 ori, 및 STX로 이루어진 4 kb 스테이징 벡터 내로 각각 클로닝하였다. 깁슨 프라이머를, 그 자체의 벡터 내의 아미노산 101-191로부터의 CasX Stx1 NTSB 도메인을 증폭시켜 pStx1 내의 CasX 119 및 CasX 484 상의 이러한 유사한 영역(aa 103-192)으로 각각 대체하도록 설계하였다. CasX Stx1로부터의 NTSB 도메인을, Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 프라이머 oIC766 및 oIC767과 함께 증폭시켰다. 요망되는 CasX 변이체를 함유하는 목적지 벡터를, Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 제조업체의 프로토콜에 따라 사용하여 프라이머 oIC763 및 oIC762와 함께 증폭시켰다. 2개의 단편을, Zymoclean 겔 DNA 회수 키트(Zymo Research Cat#D4002)를 제조업체의 프로토콜에 따라 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제하였다. 그 후에, 삽입물 및 백본 단편을 깁슨 조립체(New England BioLabs Cat# E2621S)를 제조업체의 프로토콜에 따라 사용하여 함께 조각화하였다. pStx1 스테이징 벡터 내의 조립된 생성물을 화학적으로-적격인 Turbo Competent 이. 콜라이 박테리아 세포 내로 형질전환시키고, 카나마이신을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 그 후에, 올바른 클론을 절단하고, 표준 클로닝 방법을 사용하여 포유류 발현 플라스미드(도 5 참조) 내로 붙였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 조립을 보장하였다. 관심 유전자를 표적화하는 표적화 서열을 인코딩하는 서열을 CasX PAM 장소에 기초하여 설계하였다. 표적화 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 pStX 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다. 생성된 작제물의 서열을 표 11에 나열한다.
Figure pct00090
Figure pct00091
Figure pct00092
Figure pct00093
Figure pct00094
Figure pct00095
실시예 6: RNA 가이드의 생성
RNA 단일 가이드 및 스페이서의 생성을 위해, 각각의 백본에 대한 주형 올리고 및 T7 프로모터와 함께 증폭 프라이머 및 스페이서 서열과 함께 Q5 폴리머라제(NEB M0491)를 이용하는 PCR을 권고된 프로토콜에 따라 수행함으로써 시험관내 전사를 위한 주형을 생성하였다. 가이드 및 스페이서에 대한 T7 프로모터, 가이드 및 스페이서에 대한 DNA 프라이머 서열을 아래 표 12에 제시한다. 각각의 스캐폴드에 대해 "백본 포워드" 및 "백본 리버스"로 표지된 주형 올리고를 각각 20 nM의 최종 농도로 포함시키고, 증폭 프라이머(T7 프로모터 및 독특한 스페이서 프라이머)를 각각 1 uM의 최종 농도로 포함시켰다. 전사 효율을 증가시키기 위해 sg2, sg32, 및 sg64가 추가의 5' G로 변형된 점을 제외하고는, sg2, sg32, sg64, 및 sg174 가이드는 각각 SEQ ID NO: 5, 2104, 2106, 및 2238에 상응한다(표 12 내지 표 2의 서열 비교). 7.37 스페이서는 베타2-마이크로글로불린(B2M)을 표적화한다. PCR 증폭 후, 주형을 세정하고, 페놀-클로로포름-이소아밀 알코올 추출에 의해 단리하고, 뒤이어 에탄올 침전시켰다.
50 mM Tris pH 8.0, 30 mM MgCl2, 0.01% Triton X-100, 2 mM 스페르미딘, 20 mM DTT, 5 mM NTPs, 0.5 μM 주형, 및 100 μg/mL T7 RNA 폴리머라제를 함유하는 완충제에서 시험관내 전사를 수행하였다. 반응을 37℃에서 밤새 인큐베이션하였다. 20 단위의 DNase I(Promega #M6101))을 1 mL의 전사 부피당 첨가하고, 1시간 동안 인큐베이션하였다. RNA 생성물을 변성 PAGE를 통해 정제하고, 에탄올 침전시키고, 1X 포스페이트 완충 식염수에 재현탁시켰다. sgRNA를 접기 위해, 시료를 70℃까지 5분 동안 가열한 다음, 실온까지 냉각시켰다. 반응을 1 mM 최종 MgCl2 농도까지 보충하고, 50℃까지 5분 동안 가열한 다음, 실온까지 냉각시켰다. 최종 RNA 가이드 생성물을 -80℃에서 보관하였다.
Figure pct00096
Figure pct00097
실시예 7: RNP 조립체
CasX 및 단일 가이드 RNA(sgRNA)의 정제된 야생형 및 RNP를 실험 직전에 제조하거나, 제조하고 액체 질소에서 급속-냉동하고 이후의 사용을 위해 -80℃에서 보관하였다. RNP 복합체를 제조하기 위해, CasX 단백질을 sgRNA와 함께 1:1.2 몰비로 인큐베이션하였다. 간략하게는, sgRNA를 완충제#1(25 mM NaPi, 150 mM NaCl, 200 mM 트레할로스, 1 mM MgCl2)에 첨가한 다음, CasX를 sgRNA 용액에 서서히 저으면서 첨가하고, 37℃에서 10분 동안 인큐베이션하여, RNP 복합체를 형성하였다. RNP 복합체를 사용 전에, 200 μl 완충제#1로 예비-습식된 0.22 μm Costar 8160 필터를 통해 여과하였다. 필요하다면, 요망되는 부피를 수득할 때까지 RNP 시료를 0.5 ml Ultra 100-Kd 컷오프 필터(Millipore part #UFC510096)를 이용하여 농축시켰다. 적격 RNP의 형성을 실시예 14에 기재된 바와 같이 평가하였다.
실시예 8: 가이드 RNA에 대한 결합 친화도의 평가
정제된 야생형 및 향상된 CasX를, 비-특이적 결합 및 응집을 방지하기 위해 마그네슘 클로라이드뿐만 아니라 헤파린을 함유하는 저염 완충제에서 3' Cy7.5 모이어티를 함유하는 합성 단일 가닥 RNA와 함께 인큐베이션할 것이다. sgRNA는 10 pM의 농도에서 유지될 것인 한편, 단백질은 별도의 결합 반응에서 1 pM 내지 100 μM로 적정될 것이다. 반응을 평형화시킨 후, 시료를, 각각 단백질 및 핵산을 결합하는 니트로셀룰로스 막 및 양으로 하전된 나일론 막을 이용하는 진공 매니폴드 필터-결합 검정을 통해 전개할 것이다. 막을 이미지화하여 가이드 RNA를 식별할 것이고, 결합된 RNA 대 비결합된 RNA의 분획을 각각의 단백질 농도에 대해 니트로셀룰로스 막 대 나일론 막 상에서 형광의 양에 의해 결정하여, 단백질-sgRNA 복합체의 해리 상수를 계산할 것이다. 실험을 또한, sgRNA의 향상된 변이체를 이용하여 수행하여, 이들 돌연변이가 야생형 단백질 및 돌연변이체 단백질에 대한 가이드의 친화도에 영향을 미치는지 결정할 것이다. 본 발명자들은 또한, 필터-결합 검정을 정성적으로 비교하고, 응집보다는 가용성 결합이 단백질-RNA 회합에 대한 주요 기여자임을 확인하기 위해 전기영동 이동성 검정(electromobility shift assay)을 수행할 것이다.
실시예 9: 표적 DNA에 대한 결합 친화도의 평가
정제된 야생형 및 조작된 CasX를, 표적 핵산에 상보적인 표적화 서열을 보유하는 단일 가닥 RNA와 복합체화할 것이다. RNP 복합체를, 비-특이적 결합 및 응집을 방지하기 위해 마그네슘 클로라이드뿐만 아니라 헤파린을 함유하는 저염 완충제에서 표적 가닥 상의 5' Cy7.5 표지와 함께 PAM 및 적절한 표적 핵산 서열을 함유하는 이중 가닥 표적 DNA와 함께 인큐베이션할 것이다. 표적 DNA는 1 nM의 농도에서 유지될 것인 한편, RNP는 별도의 결합 반응에서 1 pM 내지 100 μM로 적정될 것이다. 반응을 평형으로 되게 한 후, 시료를 네이티브 5% 폴리아크릴아미드 겔 상에서 전개시켜, 결합된 DNA 기질 및 결합되지 않은 표적 DNA를 분리할 것이다. 겔을 이미지화하여 표적 DNA의 영동 이동성(mobility shift)을 식별할 것이고, 결합된 DNA 대 비결합된 DNA의 분획을 각각의 단백질 농도에 대해 계산하여, RNP-표적 DNA 3원 복합체의 해리 상수를 결정할 것이다.
실시예 10: 유전자의 편집은 PCSK9, PMP22, TRAC, SOD1, B2M 및 HTT를 표적화한다
이 연구의 목적은 6개의 유전자 표적에서 핵산 서열을 편집하는 CasX 변이체 119 및 gNA 변이체 174의 능력을 평가하는 것이었다.
재료 및 방법
B2M 및 SOD1을 제외한 모든 표적에 대한 스페이서를, 관심의 요망되는 좌위를 표적화하기 위해 PAM 요건(TTC 또는 CTC)에 기초하여 비편향된 방식으로 설계하였다. B2M 및 SOD1을 표적화하는 스페이서를, 표적화된 엑손 내에서 이들 유전자에 대해 수행된 렌티바이러스 스페이서 스크린을 통해 이전에 식별하였었다. 다른 표적에 대한 설계된 스페이서를 Integrated DNA Technologies(IDT)로부터 단일 가닥 DNA(ssDNA) 올리고 쌍으로서 주문하였다. ssDNA 스페이서 쌍을 함께 어닐링하고, 하기 구성요소를 함유하는 염기 포유류-발현 플라스미드 작제물 내로 골든 게이트 클로닝을 통해 클로닝하였다: EF1A 프로모터 하에 코돈 최적화된 Cas X 119 단백질 + NLS, U6 프로모터 하에 가이드 스캐폴드 174, 카르베니실린 및 퓨로마이신 내성 유전자. 조립된 생성물을 화학적으로-적격인 이. 콜라이 내로 형질전환시키고, 카르베니실린을 함유하는 LB-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상에 평판배양하고, 37℃에서 인큐베이션하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 가이드 스캐폴드 영역을 통해 생어 시퀀싱(Quintara Biosciences)을 통해 시퀀싱하여, 올바른 리게이션을 보장하였다.
HEK 293T 세포를 10% 우태 혈청(FBS; Seradigm, #1500-500), 100 단위/ml 페니실린 및 100 mg/ml 스트렙토마이신(100x-Pen-Strep; GIBCO #15140-122), 소듐 피루베이트(100x, Thermofisher #11360070), 비-필수 아미노산(100x Thermofisher #11140050), HEPES 완충제(100x Thermofisher #15630080), 및 2-머캅토에탄올(1000x Thermofisher #21985023)이 보충된 Dulbecco's Modified Eagle 배지(DMEM; Corning Cellgro, #10-013-CV)에서 성장시켰다. 세포를 3-5일마다 TryplE를 사용하여 계대배양하고, 37℃ 및 5% CO2에서 인큐베이터에서 유지시켰다.
제0일에, HEK293T 세포를 96-웰의 편평-바닥 플레이트에 30k 세포/웰로 시딩하였다. 제1일에, 세포를, 리포펙타민 3000을 제조업체의 프로토콜에 따라 사용하여 100 ng 플라스미드 DNA로 형질주입하였다. 제2일에, 세포를, 퓨로마이신을 함유하는 FB 배지로 스위칭하였다. 제3일에, 이 배지를, 퓨로마이신을 함유하는 신선한 FB 배지로 대체하였다. 이 지점 후 프로토콜을 관심 유전자에 따라 나누었다. PCSK9, PMP22, 및 TRAC에 대해 제4일: 세포는 선택을 완료하고, 퓨로마이신 없는 FB 배지로 스위칭된 것으로 확증되었다. B2M, SOD1, 및 HTT에 대해 제4일: 세포를, 선택을 완료한 것으로 입증하였고, 퓨로마이신이 없는 FB 배지를 함유하는 새로운 플레이트 내로 TryplE를 사용하여 1:3으로 계대배양하였다. PCSK9, PMP22, 및 TRAC에 대해 제7일: 세포를 플레이트로부터 들어올리고, dPBS에서 세척하고, 카운팅하고, Quick Extract(Lucigen, QE09050)에 10,000 세포/μl로 재현탁시켰다. 게놈 DNA를 제조업체의 프로토콜에 따라 추출하고, -20℃에서 보관하였다. B2M, SOD1, 및 HTT에 대해 제7일: 세포를 플레이트로부터 들어 올리고, dPBS에서 세척하고, 게놈 DNA를 Quick-DNA 미니프렙 플러스 키트(Zymo, D4068)를 제조업체의 프로토콜에 따라 사용하여 추출하고, -20℃에서 보관하였다.
NGS 분석: 차세대 시퀀싱(NGS) 분석을 사용하여 각각의 실험 시료로부터의 세포에서의 편집을 검정하였다. KAPA HiFi HotStart ReadyMix PCR 키트(KR0370)를 사용하여 모든 PCR을 수행하였다. 게놈 DNA 시료 PCR에 대한 주형은 PCSK9, PMP22, 및 TRAC에 대해 10k 세포/μL에서 QE 중 5 μl의 게놈 DNA였다. 게놈 DNA 시료 PCR에 대한 주형은 B2M, SOD1, 및 HTT에 대해 수(water) 중 400 ng의 게놈 DNA였다. 표적 앰플리콘을 형성하기 위해 프라이머를 관심 표적 게놈 장소로 특이적이도록 설계하였다. 이들 프라이머는 Illumina 판독물 및 2개의 서열을 도입하기 위해 5' 단부에 추가 서열을 함유한다. 추가로, 이들은 독특한 분자 식별자(UMI)로서 작용하는 7 nt 랜더머(randomer) 서열을 함유한다. 단편 분석기 DNA 분석기 키트(Agilent, dsDNA 35-1500bp)를 사용하여 앰플리콘의 품질 및 정량화를 평가하였다. 앰플리콘을 Illumina Miseq 상에서 제조업체의 설명에 따라 시퀀싱하였다. 생성된 시퀀싱 판독물을 기준 서열에 정렬시키고, 인델에 대해 분석하였다. 추정된 절단 장소에 정렬되지 않은 편집을 갖거나 스페이서 영역에서 예상치 못한 대립유전자를 갖는 시료를 폐기하였다.
결과
여러 가지 유전자 좌위에서 CasX:gNA 119.174에 의해 영향을 받는 편집을 확증하기 위해, 클론 플라스미드 형질주입 실험을 HEK 293T 세포에서 수행하였다. 다수의 스페이서(실제 gNA 스페이서의 인코딩 DNA 서열 및 RNA 서열을 나열하는 표 13)를 설계하고, CasX 119 뉴클레아제 및 가이드 174 스캐폴드를 인코딩하는 발현 플라스미드 내로 클로닝하였다. HEK 293T 세포를 플라스미드 DNA로 형질주입하고, 퓨로마이신으로 선택하고, 형질주입-후 6일째에 게놈 DNA에 대해 수합하였다. 게놈 DNA를 차세대 시퀀싱(NGS)을 통해 분석하고, 삽입 또는 결실(인델)의 분석을 위해 기준 DNA 서열에 정렬시켰다. CasX:gNA 119.174는 도 9 및 도 10에 도시된 바와 같이, 6개의 표적 유전자에 걸쳐 인델을 효율적으로 생성할 수 있었다. 인델률은 스페이서 사이에서 다양하였으나, 편집 속도 중앙값은 일관적으로 60% 이상이었고, 일부 경우, 91%만큼 높은 인델률이 관찰되었다. 추가로, 비-캐노니컬 CTC PAM을 갖는 스페이서는 모든 시험된 표적 유전자와 함께 인델을 생성할 수 있는 것으로 확증되었다(도 11).
결과는, CasX 변이체 119 및 gNA 변이체 174가 인간 세포 내의 광범위하게 다양한 유전자 좌위에서 인델을 일관적으로 그리고 효율적으로 생성할 수 있음을 실증한다. 검정에서 사용된 많은 스페이서의 비편향된 선택은 유전자 좌위를 편집하는 119.174 RNP 분자의 전반적인 효과성을 보여주는 한편, TTC PAM과 CTC PAM 둘 다를 갖는 스페이서를 표적화하는 능력은, TTC PAM으로만 편집하는 기준 CasX와 비교하여 이의 다양성의 향상을 실증한다.
Figure pct00098
Figure pct00099
Figure pct00100
실시예 11: 시험관내에서 차별적인 PAM 인식의 평가
정제된 야생형 및 조작된 CasX 변이체를, 고정된 표적화 서열을 보유하는 단일 가닥 RNA와 복합체화할 것이다. RNP 복합체를, 100 nM의 최종 농도에서 MgCl2를 함유하는 완충제에 첨가하고, 10 nM의 농도에서 5' Cy7.5-표지된 이중 가닥 표적 DNA와 함께 인큐베이션할 것이다. 별도의 반응을, 표적 핵산 서열에 인접한 상이한 PAM을 함유하는 상이한 DNA 기질과 함께 수행할 것이다. 반응의 분취물을 고정된 시점에서 얻고, 동일 부피의 50 mM EDTA 및 95% 포름아미드의 첨가에 의해 켄칭할 것이다. 시료를 변성 폴리아크릴아미드 겔 상에서 전개시켜, 절단된 DNA 기질 및 절단되지 않은 DNA 기질을 분리할 것이다. 결과를 시각화할 것이고, CasX 변이체에 의한 비-캐노니컬 PAM의 절단율을 결정할 것이다.
실시예 12: 이중-가닥 절단에 대한 뉴클레아제 활성의 평가
정제된 야생형 및 조작된 CasX 변이체를, 고정된 PM22 표적화 서열을 보유하는 단일 가닥 RNA와 복합체화할 것이다. RNP 복합체를, 100 nM의 최종 농도에서 MgCl2를 함유하는 완충제에 첨가하고, 10 nM의 농도에서 표적 가닥 또는 비-표적 가닥 상에서 5' Cy7.5 표지를 갖는 이중 가닥 표적 DNA와 함께 인큐베이션할 것이다. 반응의 분취물을 고정된 시점에서 얻고, 동일 부피의 50 mM EDTA 및 95% 포름아미드의 첨가에 의해 켄칭할 것이다. 시료를 변성 폴리아크릴아미드 겔 상에서 전개시켜, 절단된 DNA 기질 및 절단되지 않은 DNA 기질을 분리할 것이다. 결과를 시각화할 것이고, 야생형 및 조작된 변이체에 의한 표적 가닥 및 비-표적 가닥의 절단율을 결정할 것이다. 표적 결합에의 변화 대 핵용해 반응 자체의 촉매작용 속도 사이를 더 분명하게 구별하기 위해, 단백질 농도를 10 nM 내지 1 uM 범위에 걸쳐 적정할 것이고, 절단율을 각각의 농도에서 결정하여, 슈도-마이클-멘텐 적합도를 생성하고 kcat* 및 KM*을 결정할 것이다. KM*에의 변화는 변경된 결합을 나타내는 한편, kcat*에의 변화는 변경된 촉매작용을 나타낸다.
실시예 13: 절단에 대한 표적 가닥 로딩의 평가
정제된 야생형 및 조작된 CasX 119를, 고정된 PM22 표적화 서열을 보유하는 단일 가닥 RNA와 복합체화할 것이다. RNP 복합체를, 100 nM의 최종 농도에서 MgCl2를 함유하는 완충제에 첨가하고, 10 nM의 농도에서 표적 가닥 상에서 5' Cy7.5 표지 또는 비-표적 가닥 상에서 5' Cy5 표지를 갖는 이중 가닥 표적 DNA와 함께 인큐베이션할 것이다. 반응의 분취물을 고정된 시점에서 얻고, 동일 부피의 50 mM EDTA 및 95% 포름아미드의 첨가에 의해 켄칭할 것이다. 시료를 변성 폴리아크릴아미드 겔 상에서 전개시켜, 절단된 DNA 기질 및 절단되지 않은 DNA 기질을 분리할 것이다. 결과를 시각화할 것이며, 변이체에 의한 2개 가닥 모두의 절단율을 결정할 것이다. 비-표적 가닥 절단이 아니라 표적 가닥 절단의 속도의 변화는 절단을 위한 활성 부위에서 표적 가닥의 로딩의 향상을 나타낼 것이다. 예비-절단된 기질을 모방하는, 비-표적 가닥 상에 갭을 가진 dsDNA 기질을 이용하여 검정을 반복함으로써 이러한 활성을 더 단리할 수 있었다. 이러한 맥락에서 비-표적 가닥의 향상된 절단은, 표적 가닥의 로딩 및 절단의 추가의 증거를 제공할 것이다.
실시예 14: CasX:gNA 시험관내 절단 검정
1. 야생형 기준 CasX와 비교하여 단백질 변이체에 대한 절단-적격 분획의 결정
기준 CasX와 비교하여 활성 RNP를 형성하는 CasX 변이체의 능력을, 시험관내 절단 검정을 사용하여 결정하였다. 절단 검정을 위한 베타-2 마이크로글로불린(B2M) 7.37을 하기와 같이 생성하였다. 서열 TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(비-표적 가닥, NTS(SEQ ID NO: 596)) 및 TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(표적 가닥, TS(SEQ ID NO: 597))를 갖는 DNA 올리고를 5' 형광 표지(각각 LI-COR IRDye 700 및 800)와 함께 구매하였다. 올리고를 1x 절단 완충제(20 mM Tris HCl pH 7.5, 150 mM NaCl, 1 mM TCEP, 5% 글리세롤, 10 mM MgCl2)에서 1:1 비로 혼합하고, 95℃까지 10분 동안 가열하고, 용액을 실온까지 냉각시킴으로써 dsDNA 표적을 형성하였다.
CasX RNP를 다르게 명시되지 않는 한 1× 절단 완충제(20 mM Tris HCl pH 7.5, 150 mM NaCl, 1 mM TCEP, 5% 글리세롤, 10 mM MgCl2) 중 1.5배 과량의 지시된 가이드와 함께 1 μM의 최종 농도에서 37℃에서 10분 동안 지시된 CasX 및 가이드(그래프 참조)로 재구성한 후, 사용 준비가 될 때까지 얼음으로 옮겼다. 7.37 표적을, 상기 7.37 표적에 상보적인 스페이서를 갖는 sgRNA와 더불어 사용하였다.
절단 반응을 100 nM의 최종 RNP 농도 및 100 nM의 최종 표적 농도로 제조하였다. 반응을 37℃에서 수행하고, 7.37 표적 DNA의 첨가에 의해 개시하였다. 분취물을 5, 10, 30, 60, 및 120분에서 얻고, 95% 포름아미드, 20 mM EDTA에 첨가함으로써 켄칭하였다. 시료를 95℃에서 10분 동안 가열함으로써 변성시키고, 10% 우레아-PAGE 겔 상에서 전개하였다. 겔을, LI-COR Odyssey CLx를 이용하여 이미지화하고 LI-COR Image Studio 소프트웨어를 사용하여 정량화하거나, Cytiva Typhoon을 이용하여 이미지화하고 Cytiva IQTL 소프트웨어를 사용하여 정량화하였다. 생성된 데이터를 플롯화하고, 프리즘(Prism)을 사용하여 분석하였다. 본 발명자들은, 하위-화학양론 양의 효소가 심지어 연장된 시간-규모 하에 화학양론보다 더 큰 양의 표적을 절단하는 데 실패하고 대신에 존재하는 효소의 양에 따라 규모화(scale)하는 안정기(plateau)에 접근한다는 관찰에 의해 나타낸 바와 같이, CasX가 검정된 조건 하에 본질적으로 단일-전환 효소로서 작용한다고 가정하였다. 그러므로, 등몰량의 RNP에 의해 장기간 시간 규모에 걸쳐 절단된 표적의 분획은, RNP 중 어떤 분획이 적절하게 형성되고 절단에 활성인지 나타낸다. 절단 반응이 이러한 농도 계획 하에 단상(monophasic)으로부터 분명하게 벗어나기 때문에 절단 추적(trace)을 이상(biphasic) 속도 모델로 적합화시켰고, 안정기를 3개의 독립적인 복제물 각각에 대해 결정하였다. 평균 및 표준 편차를 계산하여, 활성 분획을 결정하였다(표 14). 그래프를 도 12에 도시한다.
CasX2 + 가이드 174 + 7.37 스페이서, CasX119 + 가이드 174 + 7.37 스페이서, CasX457 + 가이드 174 +7.37 스페이서, CasX488 + 가이드 174 + 7.37 스페이서, 및 CasX491 + 가이드 174 + 7.37 스페이서에 대해 형성된 RNP에 대해 겉보기 활성(적격) 분획을 결정하였다. 결정된 활성 분획을 표 14에 나타낸다. 모든 CasX 변이체는 야생형 CasX2보다 더 높은 활성 분획을 가졌으며, 이는 조작된 CasX 변이체가 야생형 CasX와 비교하여 시험된 조건 하에 동일한 가이드와 함께 유의하게 더 활성이고 안정한 RNP를 형성함을 나타낸다. 이는, sgRNA에 대한 증가된 친화도, sgRNA의 존재 하에 증가된 안정성 또는 용해도, 또는 조작된 CasX:sgRNA 복합체의 절단-적격 입체배좌의 더 큰 안정성으로 인한 것일 수 있다. RNP의 용해도의 증가는, CasX457, CasX488, 또는 CasX491을 sgRNA에 첨가하였을 때 CasX2와 비교하여, 형성된 관찰된 침전물에서 주목할 만한 저하에 의해 나타났다.
2. 시험관내 절단 검정 - 야생형 기준 CasX와 비교하여 CasX 변이체에 대한 k절단의 결정
도 13 및 표 14에 도시된 바와 같이, CasX2.2.7.37, CasX2.32.7.37, CasX2.64.7.37, 및 CasX2.174.7.37에 대해 동일한 프로토콜을 사용하여 16 ± 3%, 13 ± 3%, 5 ± 2%, 및 22 ± 5%인 절단-적격 분획을 결정하였다.
가이드의 제2 세트를, RNP 형성에 대한 가이드의 기여를 더 양호하게 단리하기 위해 상이한 조건 하에 시험하였다. 7.37 스페이서와 함께 174, 175, 185, 186, 196, 214, 및 215 가이드를, 이전과 같이 과량의 가이드를 이용하기 보다는, 가이드에 대해 1 μM 및 단백질에 대해 1.5 μM의 최종 농도에서 CasX491과 혼합하였다. 결과를 도 14 및 표 14에 도시한다. 많은 이들 가이드는 174를 능가하는 추가 향상을 나타내었으며, 이때 185 및 196은 이들 가이드-제한 조건 하에 174에 대해 17%와 비교하여, 각각 44% 및 46% 적격 분획을 달성하였다.
데이터는, CasX 변이체와 sgRNA 변이체가 둘 다 야생형 CasX 및 야생형 sgRNA와 비교하여 가이드 RNA와 함께 더 높은 정도의 활성 RNP를 형성할 수 있음을 나타낸다.
표적 7.37의 절단에 대해 시험관내 형광 검정을 사용하여 야생형 기준 CasX와 비교하여 CasX 변이체 119, 457, 488, 및 491의 겉보기 절단율을 결정하였다.
CasX RNP를 1× 절단 완충제(20 mM Tris HCl pH 7.5, 150 mM NaCl, 1 mM TCEP, 5% 글리세롤, 10 mM MgCl2) 중 1.5배 과량의 지시된 가이드와 함께 1 μM의 최종 농도에서 37℃에서 10분 동안 지시된 CasX(도 15 참조)로 재구성한 후, 사용 준비가 될 때까지 얼음으로 옮겼다. 절단 반응을 200 nM의 최종 RNP 농도 및 10 nM의 최종 표적 농도로 설정하였다. 다르게 주지되는 경우를 제외하고는 반응을 37℃에서 수행하고, 표적 DNA의 첨가에 의해 개시하였다. 분취물을 0.25, 0.5, 1, 2, 5, 및 10분에서 얻고, 95% 포름아미드, 20 mM EDTA에 첨가함으로써 켄칭하였다. 시료를 95℃에서 10분 동안 가열함으로써 변성시키고, 10% 우레아-PAGE 겔 상에서 전개하였다. 겔을, LI-COR Odyssey CLx를 이용하여 이미지화하고 LI-COR Image Studio 소프트웨어를 사용하여 정량화하거나, Cytiva Typhoon을 이용하여 이미지화하고 Cytiva IQTL 소프트웨어를 사용하여 정량화하였다. 생성된 데이터를 플롯화하고, 프리즘을 사용하여 분석하였고, 비-표적 가닥 절단의 겉보기 1차 속도 상수(k절단)를 각각의 CasX:sgRNA 조합 복합물에 대해 개별적으로 결정하였다. 독립적인 적합도를 갖는 3개 복제물의 평균 및 표준 편차를 표 14에 제시하고, 절단 추적을 도 15에 도시한다.
겉보기 절단율 상수를, 각각의 검정에 활용된 야생형 CasX2, 및 가이드 174 및 스페이서 7.37을 갖는 CasX 변이체 119, 457, 488, 및 491에 대해 결정하였다(표 14 및 도 15 참조). 모든 CasX 변이체는 야생형 CasX2에 비해 향상된 절단율을 가졌다. CasX457은 상기 결정된 바와 같이 더 높은 적격 분획을 가짐에도 불구하고 119보다 더 느리게 절단하였다. CasX488 및 CasX491은 최고 절단율을 큰 차이로 가졌으며; 표적이 제1 시점에서 대체로 전적으로 절단되었으므로, 진절단율(true cleavage rate)은 이 검정의 분해(resolution)를 초과하고, 보고된 k절단은 더 낮은 분계선(bound)로서 간주되어야 한다.
데이터는, CasX 변이체가 더 높은 수준의 활성을 가지며, K절단율이 야생형 CasX2와 비교하여 적어도 30배 더 높게 도달함을 나타낸다.
3. 시험관내 절단 검정: 가이드 변이체와 야생형 가이드의 비교
절단 검정을 또한, 가이드 변이체 32, 64, 및 174와 비교하여 야생형 기준 CasX2 및 기준 가이드 2로 수행하여, 변이체가 절단을 향상시켰는지의 여부를 결정하였다. 실험을 상기 기재된 바와 같이 수행하였다. 많은 생성된 RNP가 시험된 시간에서 표적의 완전 절단에 접근하지 않았으므로, 본 발명자들은 1차 속도 상수보다는 초기 반응 속도(V0)를 결정하였다. 2개의 제1 시점(15초 및 30초)을 각각의 CasX:sgRNA 조합 및 복제물에 대한 선(line)으로 적합화시켰다. 3개의 복제물에 대한 기울기의 평균 및 표준 편차를 결정하였다.
검정된 조건 하에, 가이드 2, 32, 64, 및 174를 갖는 CasX2에 대한 V0은 20.4 ± 1.4 nM/분, 18.4 ± 2.4 nM/분, 7.8 ± 1.8 nM/분, 및 49.3 ± 1.4 nM/분이었다(표 14 및 도 16 및 도 17 참조). 가이드 174는 생성된 RNP의 절단율에서 실질적인 향상(2에 비해 약 2.5배, 도 17 참조)을 나타낸 한편, 가이드 32 및 64는 가이드 2와 유사하거나 이보다 불량하게 수행하였다. 주목할 만하게는, 가이드 64는 가이드 2의 절단율보다 더 낮은 절단율을 뒷받침하지만, 생체내에서는 훨씬 더 양호하게 수행한다(데이터는 도시되지 않음). 가이드 64를 생성하기 위한 서열 변경 중 일부는 트리플렉스 형성에 관여하는 클레오타이드를 희생하여 생체내 전사를 향상시키는 경향이 있다. 가이드 64의 향상된 발현은 생체내에서 이의 향상된 활성을 설명하는 경향이 있는 한편, 이의 감소된 안정성은 시험관내에서 부적절한 접힘을 유발할 수 있다.
스페이서 7.37 및 CasX491과 함께 가이드 174, 175, 185, 186, 196, 214, 및 215를 이용하여 추가 실험을 수행하여, 상대 절단율을 결정하였다. 절단 동역학(cleavage kinetics)을 본 발명자들의 검정으로 측정 가능한 범위까지 감소시키기 위해, 절단 반응물을 10℃에서 인큐베이션하였다. 결과는 도 18 및 표 14에 있다. 이들 조건 하에, 215는 174보다 더 신속한 절단율을 뒷받침한 유일한 가이드였다. 가이드-제한 조건 하에 RNP의 최고 활성 분획을 나타낸 196은 174와 본질적으로 동일한 동역학을 가졌고, 이는 다시 상이한 변이체가 별도의 특징의 향상을 이끈다는 것을 강조하였다.
데이터는, 검정 조건 하에, CasX와 함께 대부분의 가이드 변이체의 사용은 야생형 가이드를 갖는 것보다 더 높은 수준의 활성을 갖는 RNP를 이끌며, 초기 절단 속도의 향상은 약 2배 내지 >6배 범위임을 뒷받침한다. 표 14의 숫자는, 좌측으로부터 우측까지, RNP 작제물의 CasX 변이체, sgRNA 스캐폴드, 및 스페이서 서열을 나타낸다.
Figure pct00101
실시예 15: 틈새 형성 변이체의 식별
정제된 변형된 CasX 변이체를, 고정된 표적화 서열을 보유하는 단일 가닥 RNA와 복합체화할 것이다. RNP 복합체를, 100 nM의 최종 농도에서 MgCl2를 함유하는 완충제에 첨가하고, 10 nM의 농도에서 표적 가닥 상에서 5' 형광 표지 또는 비-표적 가닥 상에서 5' Cy5 표지를 갖는 이중 가닥 표적 DNA와 함께 인큐베이션할 것이다. 반응의 분취물을 고정된 시점에서 얻고, 동일 부피의 50 mM EDTA 및 95% 포름아미드의 첨가에 의해 켄칭할 것이다. 시료를 변성 폴리아크릴아미드 겔 상에서 전개시켜, 절단된 DNA 기질 및 절단되지 않은 DNA 기질을 분리할 것이다. 다른 가닥이 아니라 하나의 가닥의 효율적인 절단은, 변이체가 단일-가닥 닉카제 활성을 소유하였음을 나타낼 것이다.
실시예 16: RNP 생성을 위한 CasX 변이체의 향상된 발현 및 용해도 특징의 평가
야생형 및 변형된 CasX 변이체는 동일한 조건 하에 BL21(DE3) 이. 콜라이에서 발현될 것이다. 모든 단백질은 IPTG-유도성 T7 프로모터의 제어 하에 있을 것이다. 세포를 TB 배지에서 37℃에서 0.6의 OD까지 성장시킬 것이며, 이때 성장 온도를 16℃까지 감소시킬 것이고 0.5 mM IPTG의 첨가에 의해 발현을 유도할 것이다. 18시간의 발현 후 세포를 수합할 것이다. 가용성 단백질 분획을 추출하고, SDS-PAGE 겔 상에서 분석할 것이다. 가용성 CasX 발현의 상대 수준을 쿠마시 염색에 의해 식별할 것이다. 단백질을 상기 프로토콜에 따라 병행하여 정제할 것이고, 순수한 단백질의 최종 수율을 비교할 것이다. 정제된 단백질의 용해도를 결정하기 위해, 단백질이 침전되기 시작할 때까지 작제물을 저장에서 농축시킬 것이다. 침전된 단백질을 원심분리에 의해 제거할 것이고, 가용성 단백질의 최종 농도를 측정하여 각각의 변이체에 대한 최대 용해도를 결정할 것이다. 마지막으로, CasX 변이체를 단일 가이드 RNA와 복합체화하고, 침전이 시작할 때까지 농축시킬 것이다. 침전된 RNP를 원심분리에 의해 제거할 것이고, 가용성 RNP의 최종 농도를 측정하여 가이드 RNA에 결합되었을 때 각각의 변이체의 최대 용해도를 결정할 것이다.
실시예 17: sgNA 및 CasX 단백질 활성을 측정하는 데 사용되는 검정
몇몇 검정을 사용하여, CasX 단백질 및 sgNA 심층 돌연변이 발생(DME; Deep Mutation) 라이브러리 및 변형된 돌연변이체의 초기 스크린을 수행하고, CasX 기준 sgNA 및 단백질에 비해 선택된 단백질 및 sgNA 변이체의 활성을 측정하였다.
이. 콜라이 CRISPRi 스크린:
간략하게는, 카르브베니실린(Carb: carbenicillin) 내성 플라스미드 상에서 GFP gNA와 함께 클로람페니콜(CM: chloramphenicol) 내성 플라스미드 상에서 사멸 CasX DME 라이브러리의 생물학적 3벌(triplicate)을, 유전적으로 통합된 그리고 구성적으로 발현된 GFP 및 RFP와 함께 MG1655 내로 형질전환하였다(> 5x 라이브러리 크기에서). 세포를 EZ-RDM + Carb, CM 및 안하이드로테트라사이클린(aTc) 유도제에서 밤새 성장시켰다. 이. 콜라이를, RFP 억제가 아닌 상위 1%의 GFP에 대한 게이트(gate)에 기초하여 FACS 분류하고, 수집하고, 즉시 재분류하여, 고도로 기능성인 CasX 분자에 대해 추가로 농화시켰다. 그 후에, 이중 분류된 라이브러리를 성장시키고, DNA를 highseq 상에서의 심층 시퀀싱을 위해 수집하였다. 이 DNA를 또한, 플레이트 상으로 재형질전환시키고, 개별 클론을 추가 분석을 위해 집어내었다.
이.콜라이 독소 선택:
간략하게는, 아라비노스 유도성 독소를 함유하는 카르브베니실린 내성 플라스미드를 이.콜라이 세포 내로 형질전환시키고, 일렉트로적격으로 만들었다. 클로람페니콜 내성 플라스미드 상에서 독소 표적화된 gNA와 함께 CasX DME 라이브러리의 생물학적 3벌을 상기 세포 내로 형질전환하고(> 5x 라이브러리 크기에서), LB + CM 및 아라비노스 유도제에서 성장시켰다. 독소 플라스미드를 절단한 이. 콜라이는 유도 배지에서 생존하였고, 중간 로그(mid log)까지 성장하였고, 기능적 CasX 절단제를 갖는 플라스미드를 회수하였다. 이 선택을 필요하다면 반복하였다. 그 후에, 선택된 라이브러리를 성장시키고, DNA를 highseq 상에서의 심층 시퀀싱을 위해 수집하였다. 이 DNA를 또한, 플레이트 상으로 재형질전환시키고, 개별 클론을 추가 분석 및 시험을 위해 집어내었다.
렌티바이러스 기초 스크린 EGFP 스크린:
형질주입 시 70%-90%의 합류도에서 HEK293 세포에서 렌티바이러스 입자를 생성하였다. CasX DME 라이브러리를 함유하는 플라스미드의 폴리에틸렌이민 기초 형질주입을 사용하여 세포를 형질주입하였다. 입자 생성을 위해 렌티바이러스 벡터를 렌티바이러스 패키징 플라스미드 및 VSV-G 외피 플라스미드로 공동-형질주입하였다. 배지를 형질주입-후 12시간째에 교환하고, 형질주입-후 36-48시간째에 바이러스를 수합하였다. 0.45 mm 막 필터를 사용하여 바이러스 상층액을 여과하고, 세포 배양 배지에서 희석시키고, 적절하다면, 통합된 GFP 리포터와 함께 표적 세포 HEK 세포에 첨가하였다. 폴리브렌을 보충하여, 필요하다면 형질도입 효율을 증강시켰다. 형질도입된 세포를 형질도입-후 24-48시간 동안 퓨로마이신을 사용하여 선택하고, 7-10일 동안 성장시켰다. 그 후에, 세포를 GFP 방해에 대해 분류하고, 고도로 기능성인 CasX sgNA 또는 단백질 변이체에 대해 수집하였다(도 19 참조). 그 후에, 라이브러리를 PCR을 통해 게놈으로부터 직접 증폭시키고, highseq 상에서의 심층 시퀀싱을 위해 수집하였다. 이 DNA를 또한, 재클로닝하고 플레이트 상으로 재형질전환시킬 수 있었고, 개별 클론을 추가 분석을 위해 골라 내었다.
실시예 18: HEK EGFP 리포터의 편집 효율의 검정
CasX 기준 sgNA 및 단백질 및 이의 변이체의 편집 효율을 검정하기 위해, EGFP HEK293T 리포터 세포를 96-웰 플레이트 내로 시딩하고, 제조업체의 프로토콜에 따라 리포펙타민 3000(Life Technologies) 및 100-200 ng의 기준 또는 CasX 변이체 단백질, P2A-퓨로마이신 융합 및 기준 또는 변이체 sgNA를 인코딩하는 플라스미드 DNA로 형질주입하였다. 이튿날 세포를 1.5 μg/ml 퓨로마이신을 이용하여 2일 동안 선택하고, 선택 후 7일째에 형광-활성화된 세포 분류(FACS)에 의해 분석하여, 세포로부터 EGFP 단백질의 제거를 가능하게 하였다. Attune NxT 유세포분석기 및 고-처리량 자동시료장치를 사용하여, 편집을 통한 EGFP 방해를 추적하였다.
실시예 19: CasX 기준 sgRNA의 절단 효율
SEQ ID NO: 4(아래)의 기준 CasX sgRNA는 국제공개 WO 2018064371호 및 미국 특허 US10570415B2호에 기재되어 있으며, 이의 내용은 참조로서 본원에 포함된다:
ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGAGAAACCGAUAAGUAAAACGCAUCAAAG (SEQ ID NO: 4).
SEQ ID NO: 5(아래)를 생성하는 SEQ ID NO: 4의 sgRNA 기준 서열에 대한 변경은 CasX 절단 효율을 향상시킬 수 있는 것으로 밝혀졌다. 서열은 UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGAGAAAUCCGAUAAAUAAGAAGCAUCAAAG(SEQ ID NO: 5)이다.
CasX 기준 sgRNA 및 이의 변이체의 편집 효율을 검정하기 위해, EGFP HEK293T 리포터 세포를 96-웰 플레이트 내로 시딩하고, 제조업체의 프로토콜에 따라 리포펙타민 3000(Life Technologies) 및 100-200 ng의 기준 CasX 단백질, P2A-퓨로마이신 융합 및 기준 sgRNA를 인코딩하는 플라스미드 DNA로 형질주입하였다. 이튿날 세포를 1.5 μg/ml 퓨로마이신을 이용하여 2일 동안 선택하고, 선택 후 7일째에 형광-활성화된 세포 분류(FACS)에 의해 분석하여, 세포로부터 EGFP 단백질의 제거를 가능하게 하였다. Attune NxT 유세포분석기 및 고-처리량 자동시료장치를 사용하여, 편집을 통한 EGFP 방해를 추적하였다.
CasX 기준 및 sgNA 변이체에 의한 EGFP 리포터의 절단을 시험할 때, 하기 스페이서 표적 서열을 사용하였다:
E6 (TGTGGTCGGGGTAGCGGCTG(SEQ ID NO: 17)) 및 E7 (TCAAGTCCGCCATGCCCGAA(SEQ ID NO: 18)).
SEQ ID NO: 4의 sgRNA와 비교하여 SEQ ID NO: 5의 sgRNA의 증가된 절단 효율의 일례를 도 20에 도시한다. SEQ ID NO: 5의 편집 효율은 SEQ ID NO: 4와 비교하여 176% 향상되었다. 이에, SEQ ID NO: 5를 아래 기재된 DME 및 추가 sgNA 변이체 설계를 위한 기준 sgRNA로서 선택하였다.
실시예 20: 향상된 표적 절단을 갖는 gNA 변이체의 설계, 생성 및 평가
기준 gNA와 비교하여 절단 활성의 향상을 평가하기 위해 핵산(gNA) 변이체를 설계하고 시험하였다. 이들 가이드를, 본원에 기재된 바와 같이 DME 또는 합리적인 설계 및 말단에서 연장된 스템과 같은 가이드 파트의 대체나 첨가 또는 리보자임의 첨가를 통해 발견하였다.
실험적 설계: 모든 가이드를 하기와 같이 HEK293T 또는 HEK293T 리포터 주(line)에서 시험하였다. 포유류 세포를 37℃ 인큐베이터, 5% CO2에서 유지시켰다. HEK293T 인간 신장 세포 및 이의 유도체는 10% 우태 혈청(FBS; Seradigm, #1500-500), 및 100 단위/ml 페니실린 및 100 mg/ml 스트렙토마이신(100x-Pen-Strep; GIBCO #15140-122)이 보충된 Dulbecco's Modified Eagle 배지(DMEM; Corning Cellgro, #10-013-CV)에서 성장되었고, 소듐 피루베이트(100x, Thermofisher #11360070), 비-필수 아미노산(100x Thermofisher #11140050), HEPES 완충제(100x Thermofisher #15630080), 및 2-머캅토에탄올(1000x Thermofisher #21985023)을 추가로 포함할 수 있다. 세포를 96-웰 플레이트 내로 웰당 2만개 내지 3만개 세포로 시딩(seed)하고, 제조업체의 프로토콜에 따라 0.25-1 uL의 리포펙타민 3000(Thermo Fisher Scientific # L3000008), 50-500 ng의, 리포터 또는 표적 유전자를 표적화하는 CasX 및 기준 또는 변이체 CasX 가이드를 함유하는 플라스미드를 사용하여 형질주입하였다. 24-72시간 후, 배지를 교환하고, 형질전환을 선택하기 위해 0.3-3.0 ug/ml 퓨로마이신(Sigma #P8833)을 첨가하였다. 선택 후 24-96시간째에, 세포를 유세포분석에 의해 분석하고, 적절한 포워드 및 사이드 스캐터에 대해 게이팅하고, 단일 세포를 선택한 다음, 녹색 형광 단백질(GFP) 또는 항체 리포터 발현에 대해 게이팅하여(Attune Nxt Flow Cytometer, Thermo Fisher Scientific), 형광단의 발현 수준을 정량화하였다. 적어도 10,000개 사건을 각각의 시료에 대해 수집하였다. HEK293T-GFP 게놈 편집 리포터 세포주에 대해, 유세포분석을 사용하여 GFP-음성(편집된) 세포의 백분율을 정량화하였고, 각각의 변이체에 대한 GFP 방해를 갖는 세포의 수를 기준 가이드와 비교하여 배수 변화 측정을 수행하였다.
결과: DME를 통해 생산된 sgNA 변이체로부터의 결과를 측정하고, SEQ ID NO: 4의 기준 gNA와 비교하였으며, 이를 도 22에 제시하며, 대부분의 변이체는 기준 gNA와 비교하여 0.1배 내지 거의 1.5배의 향상을 보여주었다. 가이드 파트(예컨대 말단에서 연장된 스템 또는 리보자임의 첨가)의 합리적인 설계 및 대체 또는 첨가를 통해 생산된 변이체의 결과를 각각 도 21 및 도 23에 도시하고; 이는 다시 많은 작제물에서의 향상을 보여준다. 도 23에서 숫자에 의해 표시된 변이체의 인코딩 서열과 더불어 이러한 변이체의 첨가를 아래 표 15에 나열한다. 본 발명자들은, C18G와 같은 단일 돌연변이가 기준과 비교할 때 가이드 활성을 향상시킴을 관찰하였다. 추가로, 연장된 스템 루프, 예컨대 MS2, QB, PP7, UvsX 등에 대한 상이한 스템 루프에서의 합리적인 스와핑(swapping)은 기준 가이드와 비교할 때 원래의 연장된 스템 루프를 절두함에 따라 활성을 향상시켰다. 마지막으로, 본 발명자들은, 대부분의 리보자임이 활성을 방해하는 한편, 기준 가이드 RNA에의 3' HDV의 첨가가 활성을 20-50%까지 향상시킬 수 있음을 실증한다.
Figure pct00102
Figure pct00103
결론: 결과는, DME 및 합리적인 설계를 사용하여 gNA의 성능을 향상시킬 수 있으며, 많은 이들 변이체 RNA는 현재 본원에 기재된 CasX:gNA 시스템의 구성요소로서 표적화 서열과 함께 사용되어 표적 핵산 서열을 편집할 수 있다는 결론을 뒷받침한다.
실시예 21: B2M 좌위의 CasX 편집
목표: B2M 좌위를 편집하기 위해 최적의 CasX 및 gNA 분자를 식별하기 위해 실험을 수행하였다.
재료 및 방법:
1. B2M 표적화 작제물의 생산:
B2M 표적화 작제물을 생산하기 위해, 코돈-최적화된 CasX 2(작제물 2.2) 및 작제물 119.64 분자(표 16에서 CasX 서열; 가이드 서열은 표 1 및 2에 나열됨) 및 융합된 NLS(본원에서 "StX"로 지칭됨), 가이드 스캐폴드, 및 비-표적화 표적화 서열을, 인코딩 DNA 서열을 사용하고 표준 클로닝 방법을 사용하여 포유류 발현 플라스미드(pStX) 내로 클로닝하였다. pStX는 퓨로마이신과 카르베니실린 둘 다에 대한 선택 마커를 포함한다. 관심 유전자를 표적화하는 표적화 서열을 인코딩하는 서열을 StX PAM 장소에 기초하여 설계하였다(RNA 표적화 서열을 나열하는 표 17; 플라스미드를 상응하는 DNA 인코딩 서열과 함께 생성하였음). 표적화 서열 DNA를, 표적화 서열 및 이 서열의 역 보체로 구성된 단일 가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로서 정돈하였다. 이들 2개의 올리고를 함께 어닐링하고, T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 조립체에 의해 개별적으로 또는 대량으로 pStx 내로 클로닝하였다. 골든 게이트 생성물을 화학적으로 또는 일렉트로-적격 세포, 예컨대 NEB Turbo 적격 이. 콜라이(NEB Cat #C2984I) 내로 형질전환시키고, 카르베니실린을 함유하는 Lb-한천 플레이트(LB: Teknova Cat# L9315, 한천: Quartzy Cat# 214510) 상으로 평판배양하였다. 개별 콜로니를 골라 내고, Qiagen Qiaprep 스핀 미니프렙 키트(Qiagen Cat# 27104)를 제조업체의 프로토콜에 따라 사용하여 미니프렙하였다. 생성된 플라스미드를 생어 시퀀싱에 의해 시퀀싱하여, 올바른 리게이션을 보장하였다. SaCas9 및 SpyCas9 대조군 플라스미드를 상기 기재된 pStx 플라스미드와 유사하게 제조하였고, 이때 pStx의 단백질 및 가이드 영역을 각각의 단백질 및 가이드에 대해 교환하였다. SaCas9 및 SpyCas9에 대한 표적화 서열을 문헌으로부터 수득하거나, 확립된 방법에 따라 합리적으로 설계하였다.
2. 포유류 세포주에서 B2M 편집 활성의 평가:
2개의 StX 변이체의 활성을 인간 배아 신장(HEK293T) 세포 및 인간 T 림프구 세포(Jurkats)를 포함한 포유류 세포에서 평가하였다. 포유류 세포에서 37℃ 인큐베이터에서 5% CO2에서 유지시켰다. HEK293T 세포 및 이의 유도체는 10% 우태 혈청(FBS; Seradigm, #1500-500), 및 100 단위/ml 페니실린 및 100 mg/ml 스트렙토마이신(100x-Pen-Strep; GIBCO #15140-122)에서 성장되었고, 소듐 피루베이트(100x, Thermofisher #11360070), 비-필수 아미노산(100x Thermofisher #11140050), HEPES 완충제(100x Thermofisher #15630080), 및 2-머캅토에탄올(1000x Thermofisher #21985023)이 보충된 Dulbecco's Modified Eagle 배지(DMEM; Corning Cellgro, #10-013-CV)를 추가로 포함할 수 있다. Jurkats 및 K562는 10% 우태 혈청(FBS; Seradigm, #1500-500), 및 100 단위/ml 페니실린 및 100 mg/ml 스트렙토마이신(100x-Pen-Strep; GIBCO #15140-122)이 보충된 RPMI 배지에서 배양되었고, 소듐 피루베이트(100x, Thermofisher #11360070), 비-필수 아미노산(100x Thermofisher #11140050), HEPES 완충제(100x Thermofisher #15630080), 및 2-머캅토에탄올(1000x Thermofisher #21985023)을 추가로 포함할 수 있다. 접착성 세포, 예컨대 HEK293T를 96-웰 플레이트 내로 웰당 2만개 내지 3만개 세포로 시딩하고, 제조업체의 프로토콜에 따라 0.25-1 uL의 리포펙타민 3000(Thermo Fisher Scientific # L3000008), 50-500 ng의, 리포터 또는 표적 유전자를 표적화하는 CasX 및 기준 또는 변이체 CasX 가이드를 함유하는 플라스미드를 사용하여 형질주입하였다. 대안적으로, 현탁 세포, 예컨대 Jurkats를, Lonza 4D-핵주입기를 제조업체의 프로토콜에 따라 사용하여 0.5-4.0 ug 플라스미드 DNA/200k 세포로 핵주입하였다. 핵주입 후, 현탁 세포, 예컨대 Jurkats를 96웰 플레이트에서 배양하였다. 24-72시간 후, 배지를 교환하고, 형질전환을 선택하기 위해 0.3-3.0 ug/ml 퓨로마이신(Sigma #P8833)을 첨가하였다. 하기 대조군 또는 이의 조합을 각각의 형질주입 또는 핵주입 실험에 사용하였다: 비-표적화 표적화 서열과 함께 StX 분자, Sa.Cas9 및/또는 SpyCas9 표적화 B2M, 및 비-표적화 표적화 서열과 함께 Sa.Cas9 및 Spy.Cas9. 선택 후 24-96시간째에 또는 이후에, 세포를 유세포분석에 의해 분석하고, 적절한 포워드 및 사이드 스캐터에 대해 게이팅하고, 단일 세포를 선택한 다음, 항체 리포터 발현에 대해 게이팅하여(Attune Nxt Flow Cytometer, Thermo Fisher Scientific), 형광단의 발현 수준을 정량화하였다. 적어도 10,000개 사건을 각각의 시료에 대해 수집하였다. 그 후에, 데이터를 사용하여, 항체-표지 음성(편집된) 세포의 백분율을 계산하였다.
추가로, T7E1 및 NGS를 사용하여 각각의 실험 시료로부터의 세포에서의 편집을 검정하였다. 이를 위해, 각각의 실험 시료로부터의 세포의 하위세트를 용해시키고, Quikextract 용액(Lucigen Cat#QE09050)을 제조업체의 프로토콜에 따라 사용하여 게놈 DNA를 추출하였다. T7E1에 대해, 우선 관심 표적 게놈 위치에서 프라이머를 이용하여 게놈 DNA를 PCR을 통해 증폭시켰다. 그 후에, 이러한 증폭된 DNA를 New England Biolabs T7E1 프로토콜에 따라 가공하고, 겔 전기영동에 의해 분석하였다.
3. NGS 분석
NGS 분석을 위해, 관심 표적 게놈 위치에 특이적인 프라이머를 이용하여 게놈 DNA를 PCR을 통해 증폭시켜, 표적 앰플리콘을 형성하였다. 이들 프라이머는 Illumina 판독물1 및 2개의 서열을 도입하기 위해 5' 단부에 추가 서열을 함유한다. 추가로, 이들은 독특한 분자 식별자(UMI)로서 작용하는 16 nt 랜더머(randomer) 서열을 함유한다. 단편 분석기 DNA 분석기 키트(Agilent, dsDNA 35-1500bp)를 사용하여 앰플리콘의 품질 및 정량화를 평가하였다. 앰플리콘을 Illumina Miseq 상에서 제조업체의 설명에 따라 시퀀싱하였다.
시퀀싱으로부터의 Raw fastq 파일을 하기와 같이 가공하였다: (1) 프로그램 cutadapt(v. 2.1)를 사용하여 서열을 품질 및 어댑터 서열에 대해 트리밍(trimming)하였다; (2) 프로그램 flash2(v2.2.00)를 사용하여 판독물 1 및 판독물 2로부터의 서열을 단일 삽입물 서열 내로 병합하였다; (3) 동일한 UMI 서열을 갖는 삽입물을 단일 서열 내로 병합하였다. 제1 단계에서, 퍼-베이스 보팅(per-base voting) 전략을 사용하여 동일한 UMI를 갖는 모든 개별 삽입물로부터 단일 컨센서스(consensus) 서열을 생산하였다. 제2 단계에서, 개별 삽입물을 컨센서스 서열과 비교하였다. 67% 초과의 삽입물이 컨센서스 서열과 정확하게 매칭한다면, 컨센서스 서열은 해당 UMI에 대해 얻어졌다. 그렇지 않다면, 최고 시퀀싱 품질을 갖는 개별 삽입물이 해당 UMI에 대해 얻어지고; (4) 컨센서스 삽입물 서열을 예상된 앰플리콘 서열 및 표적화 서열과 더불어 프로그램 CRISPResso2(v 2.0.29)를 통해 전개시켰다. 이러한 프로그램은, 표적화 서열의 3' 단부 주변의 윈도우(window)(표적화 서열의 3' 단부로부터 -3 bp에서 집중된 20 bp 윈도우)에서 변형되는 판독물의 백분율을 정량화한다. 이 윈도우에서 삽입 및/또는 결실을 함유하는 판독물의 총 백분율에 의해 StX 분자의 변형된 백분율을 정량화하였다.
Figure pct00104
Figure pct00105
Figure pct00106
Figure pct00107
Figure pct00108
Figure pct00109
Figure pct00110
결과:
HLA1 발현의 수준을 우선 다수의 인간 세포주에서 평가하였다(도 24). 이러한 검정의 근본은, HLA1의 필수적인 구조 단백질인 B2M의 넉아웃으로 인한 HLA1 발현의 수준 감소이다. T7E1 검정은 HEK 세포에서 B2M 좌위의 편집을 입증하였다(도 25). 본 발명자들은 HLA 1에 특이적인 형광 항체를 사용하여 이에 대해 스크리닝하였다. 다양한 PAM 특이성을 갖는 68개의 B2M 표적화 서열(표 17 참조)의 HEK293T 세포에서의 초기 스크린을, 대조군으로서 SpyCas9를 사용하여 본 발명자들의 초기 Stx 분자 2.2로 시험하였고, a) 그 후에 SaCas9와 융화성인 26개의 B2M 표적화 서열(표 17 참조)로 유사한 스크린을 수행하여 SaCas9 분자와 함께 이러한 표적에 대한 대조군을 확립하였다. 편집 검정의 결과를 표 17에서, HLA1 발현의 변화 백분율로서 표현하여 제시한다.
Stx 119.64 변이체는 Stx 2.2를 능가하는 실질적인 향상, HEK293T 세포에서 유세포분석을 통해 측정된 바와 같이 20배까지 더 높은 효율로 HEK 세포 내 내인성 B2M 좌위에서의 편집을 보여준다(도 26). HEK 293T 세포에서 내인성 B2M을 표적화하는 5개의 최상의 SaCas9 스페이서와 Stx 119.64의 비교는 대등한 편집 수준을 보여준다(도 27 및 도 28). HEK 293tTB2M 좌위의 NGS 분석은 Stx 119.64로 80%까지의 변형을 보여준다(도 29). 이들 변형은, 주로 삽입인 SpyCas9와는 대조적으로, 주로 결실이다.
결론: 결과는, Stx CasX의 편집 성능이 Stx 2.2의 서열 내로 도입된 선택적 돌연변이에 의해 향상될 수 있음을 뒷받침한다.
실시예 22: 키메라 항원 수용체(CAR) 및 TCR을 발현하도록 유전적으로 조작된 세포에서 B2M의 유전적 방해
1차 인간 CD4+ 및 CD8+ T 세포를, 건강한 공여자로부터 수득된 인간 PBMC 시료로부터 면역친화도-기초 선택에 의해 단리할 것이다. 생성된 세포를, 인간 혈청, IL-2(100 U/mL), IL-7(10 ng/mL) 및 IL-15(5 ng/mL)를 함유하는 배지에서 항-CD3/항-CD28 시약과 함께 37℃에서 배양한 후, 24-48시간 동안 렌티바이러스 형질도입에 의해 키메라 항원 수용체(CAR)로 조작함으로써 자극시킬 것이다. 세포를, T2A 리보솜 스위치를 인코딩하는 서열에 의해 분리된, 형질도입에 대한 대리(surrogate) 마커로서 사용하기 위한, 예시적인 항-CD19 CAR을 인코딩하는 핵산 분자 및 절두된 EGFR(EGFRt)을 인코딩하는 핵산을 함유하는 렌티바이러스 벡터를 사용하여 형질도입할 것이다. CAR은 항-CD19 scFv(예컨대 표 5의 항-CD19 서열로서, 여기서 VH 및 VL은 짧은 링커에 의해 결합됨), Ig-유래 스페이서, 인간 CD28-유래 막관통 도메인, 인간 4-1BB-유래 세포내 신호전달 도메인 및 인간 CD3 제타-유래 신호전달 도메인을 포함할 것이다. 조작된 T 세포 수용체(TCR)의 도입을 위해, 세포는 링커 서열에 의해 표 5의 항-CD19 서열에 연결된 인간 전장 T-세포 수용체 α 사슬을 인코딩하는 핵산 분자를 함유하고(CAR 항-CD19 서열과 비교하여 동일하거나 상이할 수 있음), CD3 입실론 또는 CD3 감마의 세포내 신호전달 도메인을 추가로 함유하는 렌티바이러스 벡터를 사용하여 형질도입될 것이다.
형질도입 후, 세포를 인간 혈청 및 IL-2(50 U/mL), IL-7(5 ng/mL) 및 IL-15(0.5 ng/mL)를 함유하는 배지에서 36-48시간 동안 배양할 것이다. 그 후에, 세포는, 표적화 서열 GUGUAGUACAAGAGAUAGAA(표 17의 TTC 9(SEQ ID NO: 616))와 함께 B2M-표적화된 gNA 및 가이드 174와 함께 CasX 119를 사용하여 제조된 RNP로 전기천공될 것이다. 그 후에, 세포를, IL-2, IL-7 및 IL-15를 동일한 농도에서 함유하는 동일한 배지에서 30℃에서 밤새, 그리고 그 후에 37℃에서 전기천공-후 제12일 내지 제15일을 통해 배양할 것이다.
CAR 및 B2M 발현
B2M, TCR 및 CAR 발현(대리 마커를 통해 지시된 바와 같음)의 세포 표면 발현을, 항-CD3/항-CD28 항체와 접합된 비드로 24시간 재자극한 다음 전기천공 후 제12일에 평가할 것이다. 세포를 표면 상에서 유세포분석에 의해, 항-EGFR 항체로 염색하여 CAR 발현(대리 마커, EGFRt의 표면 발현에 의해 지시된 바와 같음)을 입증하고, 항-TCR 알파로 염색하여 TCR 발현을 입증하고, 항-B2M 항체로 염색하여 B2M의 발현을 입증하고 넉다운시킬 것이다. 유세포분석에 의해, 대부분의 세포는 B2M, i의 감소된 발현 및 CAR-발현 집단(EGFRt 마커에 의해 지시된 바와 같음)의 발현, 및 TCR-발현 집단에서 TCR의 발현을 보여주는 것으로 예상될 것이다.
변형된 조작된 CD4+ 및 CD8+ T 세포의 표현형 특징을 또한 유세포분석에 의해 평가하여, 표현형, 분화 상태 및/또는 활성화 상태를 나타내는 마커를 포함하여 다양한 마커의 표면 발현을 평가할 것이다. 상기 기재된 바와 같은 B2M 및 EGFRt 마커(CAR 발현에 대한 대리)를 인식하기 위한 것에 더하여 -C 모티프 케모카인 수용체 7(CCR7), 4-1BB, TIM-3, CD27, CD45RA, CD45RO, Lag-3, CD62L, CD25 및 CD69에 특이적인 항체로 세포를 염색할 것이다.
실시예 23: 세포독성 검정
실시예 22의 JVM-2 세포(CD19를 발현하는 인간 만성 B-세포 백혈병 세포주) 및 CAR-T 세포주를 10% FCS(Bio Whittaker, Walkersville, MD), 100 IU/mL 페니실린, 및 100 μg/mL 스트렙토마이신(Life Technologies)이 보충된 RPMI 1640(Life Technologies, Rockville, MD)에서 배양할 것이다. 세포독성을 표준 51Cr-방출 검정에서 측정할 것이다. CAR-T 세포를 96-웰 U-바닥 마이크로타이터 플레이트(시료당 3벌 웰)에서 다양한 이펙터/표적 세포 비에서 크롬 51(51Cr)-표지된 표적 세포(웰당 5 × 103 세포)와 함께 시딩할 것이다. 플레이트를 37℃, 5% CO2에서 6시간 동안 인큐베이션할 것이다. 51Cr-방출을 100 μL 상층액에서 액체 섬광 카운터를 사용하여 측정할 것이다. 최대 방출은 세제-방출된 표적 세포 카운트에서 수득될 것이고, 자발적 방출은 이펙터 세포의 부재 하에 표적 세포 카운트로부터 수득될 것이다. 세포의 세포독성을 하기와 같이 계산할 것이다: 특이적인 용해 % = [(실험 방출 - 자발적 방출) / (최대 방출 - 자발적 방출)]. 데이터는 CD19+ 표적 세포 상에서 용해를 수행하는 CAR-T 세포의 능력을 확인할 것으로 예상된다.
실시예 24: B2M 좌위에서의 편집
재료 및 방법
CasX 변이체 119, 488, 및 491를 상기 실시예에서 기재된 바와 같이 발현시키고 정제하였다. 스캐폴드 174와 스페이서 7.9(서열 GUGUAGUACAAGAGAUAGAA(SEQ ID NO: 616)를 가짐) 및 7.37(서열 GGCCGAGAUGUCUCGCUCCG(SEQ ID NO: 592)를 가짐)을 갖는 단일 가이드 RNA를 상기 실시예에 기재된 바와 같이 전사시키고 정제하였다. 25 mM 소듐 포스페이트 완충액(pH 7.25), 150 mM NaCl, 1 mM MgCl2, 및 200 mM 트레할로스를 함유하는 완충액(완충액 1)에서 1.2배 몰 과량의 가이드와 단백질을 혼합함으로써 개별 RNP를 조립하였다. RNP를 37℃에서 10분 동안 인큐베이션한 다음, 크기 배제 크로마토그래피를 통해 정제하였다. 정제 후 Pierce 660 nm 단백질 검정을 사용하여 RNP의 농도를 결정하였다.
정제된 RNP를 Jurkat 세포에서 B2M 좌위에서의 편집에 대해 시험하였다. Lonza 4-D 핵주입기 시스템을 사용한 전기천공에 의해 RNP를 전달하였다. 다르게 명시되지 않는 한, 700,000개의 세포를 20 uL의 Lonza 완충액 P3에 재현탁시키고, 완충액 1에서 적절한 농도 및 5 uL의 최종 부피까지 희석된 RNP에 첨가하였다. Lonza 96-웰 셔틀 시스템을 사용하여 프로토콜 EH-115를 사용하여 세포를 전기천공시켰다. 세포를 예비-평형화된 RPMI에서 회수한 다음, 각각의 전기천공 조건을 96-웰 플레이트의 3개 웰 내로 분할하였다. 배지를 핵주입 후 제1일 및 제4일에 교환하였다. 핵주입-후 제7일에, 세포를 형광 항-HLA 1 항체로 염색하고, Attune Nxt 유세포분석기를 사용하여 표면 HLA의 제거에 대해 평가하였다. 차세대 시퀀싱을 수행한다면, 각각의 조건으로부터의 세포 중 절반을 수합 전 추가 3일 동안 계대배양하였다. 게놈 DNA를 단리하고, B2M 유전자의 관련 영역(7.37에 대해 엑손 1, 7.9에 대해 엑손 2)을 PCR 증폭시키고 Illumina MiSeq를 사용하여 시퀀싱하였다. 생성된 서열 판독물을 Crispresso를 사용하여 편집 프로파일에 대해 분석하였다.
결과
CasX 변이체 119, 488, 또는 491 및 B2M-표적화 가이드 174.7.9 또는 174.7.37로 이루어진 CasX RNP를 25 uL 핵주입 조건당 1.25, 5, 20, 및 80 pmol의 용량에서 Jurkat 세포 내로 핵주입하였다. RNP 119.174.7.37에 대한 1.25 pmol 용량은 공간 제약으로 인해 생략되었다. 7.9를 표적화하는 RNP는 20 및 80 pmol 용량에서 모든 단백질 변이체에 대해 >90%의 세포에서 표면 HLA를 제거하였다(도 30). 더 낮은 용량에서 CasX 488 및 491 RNP는 CasX 119 RNP를 능가하였다. 7.37-표적화 RNP는 약 80%의 편집 천장(editing ceiling)을 갖는 것으로 보였으며, 편집에서의 실질적인 저하는 5 pmol에서 119에 대한 것이지만 488 및 491에 대해 심지어 최저 용량에서도 편집에서 상대적으로 약간의 감소가 존재하였다(도 30). 모든 용량에 걸쳐, 488 및 491-기초 RNP의 성능은 거의 동일하였다. RNP 대 완충액-단독 대조군의 처리 후 생존 가능한 세포의 수에 의해 측정된 바와 같이, RNP 중 어느 것도 뚜렷한 RNP-의존적 독성을 나타내지 않았다(도 31). 491은 잠재적으로 488보다 더 양호한 생존력을 가졌지만, 그 차이는 측정의 표준 편차에 비해 작았고, 이는 또한 더 양호한 생성 특징을 가져서(데이터는 도시되지 않음), 향후 RNP 편집 실험을 위한 바람직한 후보가 되게 한다.
HLA의 표현형 넉다운을 입증하기 위해, B2M의 표적화된 영역의 심층 시퀀싱을 1.25, 5, 및 20 pmol 용량의 각각의 RNP에 대해 수행하였다. 488.174.7.9(CasX 488, gNA 174 및 스페이서 7.9) RNP 및 491.174.7.9(CasX 491, gNA 174 및 스페이서 7.9) RNP는 20 pmol 용량에서 >99%의 B2M 좌위에서 그리고 5 pmol 용량에서 각각 95% 및 97%의 B2M 좌위에서 인델을 생성하였다(도 32). 상응하는 7.37 RNP는 20 pmol 용량과 5 pmol 용량 둘 다에서 >99% 인델을 이끌었으며, 이는 이 장소에서의 많은 편집물이 여전히 기능적 B2M 생성을 이끌고 표현형 넉아웃에서 분명한 천장(ceiling)을 야기함을 나타낸다. NGS 데이터는, 119-기초 RNP에 비해 488 및 491을 이용하여 일관적으로 더 높은 편집을 보여주고, 뿐만 아니라 피코몰(picomolar) 범위에서 매우 낮은 용량의 RNP를 이용하여 효율적인 편집을 실증하는 표현형 분석과 일관된다.
실시예 25. TRAC 좌위에서의 NHEJ 및 HDR
방법 및 재료
CasX 변이체 491 및 gRNA 174.15.3 또는 174.15.5로 이루어진 RNP를 상기 기재된 바와 같이 조립하고, 정제하였다. 절단 부위의 어느 한 측면 상에서 대략 500 bp에 상응하는 인간 게놈 DNA로부터의 상동성 아암 및 플랭킹 P2A 및 T2A 자기-절단 펩타이드 서열과 함께 eGFP 서열을 PCR-증폭시킴으로써 상동성-안내 수선을 위한 주형을 생산하였다(사용된 프라이머는 표 18에 있음). 중첩 연장 PCR을 사용하여 단편을 조합하였고, 따라서 생성된 주형은 TRAC와 프레임-내에서(in-frame) P2A-eGFP-T2A 작제물을 포함하였다. 그 후에, 조립된 주형 서열을, PstI 및 HindIII 제한 부위를 사용하여 플라스미드 백본 내로 클로닝하였다. 이중-가닥 DNA 주형을 생성하기 위해, 지시된 프라이머를 사용하여 적절한 플라스미드를 PCR-증폭시켰고, 생성물을 페놀-클로로포름 추출 및 에탄올 침전에 의해 정제하였다. 단일-가닥 DNA 주형을 생성하기 위해, 동일한 프라이머를 사용하지만 2개 중 하나는 5' 포스페이트를 함유하는 프라이머를 사용하여 플라스미드를 PCR-증폭시켰다. 생성된 생성물을 정제하고, 5' 포스페이트를 갖는 가닥을 분해하는 람다 엑소뉴클레아제를 사용하여 절단시켜, 요망되는 가닥의 ssDNA를 주로 산출하였다. ssDNA 생성물을 페놀-클로로포름 추출 및 에탄올 침전에 의해 정제하였다.
2 uL의 최종 부피를 위해 수(water) 중에서 요망되는 농도까지 희석된 주형 DNA를 적절하다면 반응물에 첨가하는 점을 제외하고는, 전기천공을 대체로 상기 기재된 바와 같이 수행하였다. 50 pmol의 RNP를 사용하였고, 주형 DNA 양을 dsDNA에 대해 2 내지 8 ug 및 ssDNA에 대해 1 내지 4 ug으로 다양화시켰다. 핵주입-후 7일째에, 세포를 형광 항-TCR α/β 항체로 염색하고, Attune Nxt 유세포분석기를 사용하여 TCR 넉아웃 및 GFP 발현에 대해 평가하였다. Jurkat 세포는 좌위에서 편집의 부재 하에 유의한 TCR 음성 집단을 갖는다. 이를 교정하기 위해, 본 발명자들은, TCR을 발현하지 않는 세포가 규칙적인 TCR 발현과 제시를 갖는 세포와 대등한 비율(rate)로 TRAC 좌위에서 편집되었음을 가정하였고, 식 Ec = (TCRNeg관찰 - TCRNeg대조군)/(1 - TCRNeg대조군)를 적용하였으며, 여기서 Ec는 교정된 편집이며, TCRNeg관찰은 관찰된 TCR 음성 세포의 분획이고, TCRNeg대조군은 완충액-단독 대조군에서 관찰된 TCR 음성 세포의 평균 분획이다. GFP + 세포에는 어떠한 교정도 적용되지 않았지만, TCRα 좌위에서의 침묵화(silencing)는 본 발명자들의 HDR 효율의 과소평가를 초래하는 것이 가능하다.
Figure pct00111
결과
공여자의 부재 하에서의 TRAC-표적화 RNP는 각각 50 pmol 용량의 스페이서 15.3 및 15.5로 75% 및 83%의 세포에서 표면 TCR α/β를 제거하였다(도 33). dsDNA는 10%에 걸쳐 도달하는 최고 HDR 비율을 생성하는 것으로 보였고, 뿐만 아니라 거의 모든 세포의 사멸을 유발하였다. ssDNA는 생존력에 있어서 훨씬 더 낮은 효과를 가졌으며, 일부 경우 공여자 무함유 대조군 및 완충액-단독 대조군에 비해 생존력을 증가시키는 것으로 보였다. ssDNA를 이용할 때 HDR 비율은 RNP와 공여자 둘 다의 용량에 따라 1% 내지 6%로 다양하였고, 이때 최고 비율은 스페이서 15.5 및 공여자 DNA의 상부 가닥에서 달성되었다. 스페이서 둘 다에 대해, 주형의 상부 가닥으로부터 유래된 공여자 DNA는 더 높은 수준의 HDR을 이끌었지만, 이것이 이 시스템에서 ssDNA 주형의 일관된 특징인지의 여부는 아직 명확하지 않다.
실시예 26. B2M 및 TRAC 좌위에서의 동시적인 편집
방법 및 재료
RNP를 상기 기재된 바와 같이 CasX 491 및 가이드 174.7.9, 174.7.37, 및 174.15.3과 함께 조립하였다. RNP를 크기-배제 크로마토그래피보다는 음이온 교환을 사용하여 정제하였다.
전기천공을 대체로 상기 기재된 바와 같이 수행하였다. 5 uL의 최종 부피에서 동일한 몰량의 각각의 RNP를 혼합함으로써 B2M 및 TRAC를 표적화하는 RNP의 공동-전기천공을 수행하였다. RNP 용량을, 각각의 RNP 단독에 대해 20 pmol로부터 0.3725 pmol까지, 그리고 공동-전기천공 조건에 대해 20 pmol로부터 0.625 pmol까지 2배 희석에서 만들었다. 몰량은 조건에서 RNP 둘 다의 조합된 양보다는 개별 RNP를 지칭한다. TRAC 넉아웃을 단독으로 측정할 때, 배경 교정을 상기 기재된 바와 같이 적용하였다. 이중-넉아웃의 분획을 결정할 때, 본 발명자들은, TRAC 및 B2M에서의 편집이 서로 그리고 세포의 TCR 상태와 독립적이었고, 식 DblNegc = (DblNeg관찰 - TCRNeg대조군*HLANeg관찰)/(1 - TCRNeg대조군)을 적용하였음을 가정하였고, 여기서 DblNegc는 교정된 이중 음성 분획이며, DblNeg관찰은 주어진 시료에 대한 관찰된 TCR-/HLA- 분획이고, TCRNeg대조군은 완충액 단독 대조군에서 총 TCR- 분획이며, HLANeg관찰은 주어진 시료에 대해 관찰된 총 HLA- 분획이다.
결과
B2M 및 TRAC에서의 편집은 다양한 RNP 수준에 걸쳐 양호한 용량 반응을 보여주었다. TRAC 좌위에서의 편집은 일반적으로 B2M 좌위에서보다 더 낮았고, 최대 편집율은 57%였다(도 34). 이중-넉아웃 비율은 최고 RNP 용량에서 45%에 도달하였다. 각각의 용량에서의 이중-넉아웃 비율은, 2개의 좌위가 독립적으로 편집된다는 예상과 일관된다. 공동-편집의 비율은, 해당 부위에서의 편집의 감소된 효율을 보상하기 위해 TRAC-표적화 RNP의 용량을 증가시킴으로써 계속 향상될 수 있을 것이다.

Claims (217)

  1. CasX 단백질 및 제1 가이드 핵산(gNA)을 포함하는 CasX:gNA 시스템으로서, 상기 gNA는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 제1 단백질을 인코딩하는 유전자의 표적 핵산 서열에 상보적인 표적화 서열을 포함하는, CasX:gNA 시스템.
  2. 제1항에 있어서, 상기 제1 단백질은 면역 세포 표면 마커 또는 면역 체크포인트 단백질인, CasX:gNA 시스템.
  3. 제1항에 있어서, 상기 제1 단백질은 세포내 단백질인, CasX:gNA 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA: class II major histocompatibility complex transactivator), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβ 수용체 2(TGFβRII), 프로그래밍된 세포 사멸 1(PD-1), 사이토카인 유도성 SH2(CISH), 림프구 활성화 3(LAG-3), Ig 및 ITIM 도메인을 갖는 T 세포 면역수용체(TIGIT), 아데노신 A2a 수용체(ADORA2A), 살해 세포 렉틴 유사 수용체 C1(NKG2A), 세포독성 T-림프구-관련 단백질 4(CTLA-4), T-세포 면역글로불린 및 뮤신 도메인 3(TIM-3), 및 2B4(CD244)로 이루어진 군으로부터 선택되는, CasX:gNA 시스템.
  5. 제4항에 있어서, 상기 제1 단백질은 B2M인, CasX:gNA 시스템.
  6. 제5항에 있어서, 상기 제1 gNA의 표적화 서열은 SEQ ID NO: 725-2100, 2281-7085, 547-551, 591-595 및 614-681로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, CasX:gNA 시스템.
  7. 제5항에 있어서, 상기 제1 gNA의 표적화 서열은 SEQ ID NO: 725-2100, 2281-7085, 547-551, 591-595 및 614-681로 이루어진 군으로부터 선택되는 서열을 포함하는, CasX:gNA 시스템.
  8. 제4항에 있어서, 상기 제1 단백질은 TRAC인, CasX:gNA 시스템.
  9. 제8항에 있어서, 상기 제1 gNA의 표적화 서열은 SEQ ID NO: 7086-27454, 522-529 및 566-573으로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, CasX:gNA 시스템.
  10. 제8항에 있어서, 상기 제1 gNA의 표적화 서열은 SEQ ID NO: 7086-27454, 522-529 및 566-573으로 이루어진 군으로부터 선택되는 서열을 포함하는, CasX:gNA 시스템.
  11. 제4항에 있어서, 상기 제1 단백질은 CIITA인, CasX:gNA 시스템.
  12. 제11항에 있어서, 상기 제1 gNA의 표적화 서열은 SEQ ID NO: 27455-55572로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, CasX:gNA 시스템.
  13. 제11항에 있어서, 상기 제1 gNA의 표적화 서열은 SEQ ID NO: 27455-55572로 이루어진 군으로부터 선택되는 서열을 포함하는, CasX:gNA 시스템.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβRII, PD-1, CISH, LAG-3, TIGIT, ADORA2A, NKG2A, CTLA-4, TIM-3, 및 CD244로 이루어진 군으로부터 선택되는 제2 단백질을 인코딩하는 면역 세포 유전자의 표적 핵산 서열에 상보적인 표적화 서열을 포함하는 제2 gNA를 추가로 포함하고, 상기 제2 단백질은 상기 제1 단백질과 상이한 것인, CasX:gNA 시스템.
  15. 제14항에 있어서, 상기 제1 gNA 표적화 서열은 B2M 유전자 표적 핵산 서열에 상보적이고, 제2 gNA 표적화 서열은 TRAC 유전자 표적 핵산 서열에 상보적인, CasX:gNA 시스템.
  16. 제14항에 있어서, 상기 제1 gNA 표적화 서열은 B2M 유전자 표적 핵산 서열에 상보적이고, 제2 gNA 표적화 서열은 CIITA 유전자 표적 핵산 서열에 상보적인, CasX:gNA 시스템.
  17. 제14항에 있어서, 상기 제1 gNA 표적화 서열은 TRAC 유전자 표적 핵산 서열에 상보적이고, 제2 gNA 표적화 서열은 CIITA 유전자 표적 핵산 서열에 상보적인, CasX:gNA 시스템.
  18. 제14항 내지 제17항 중 어느 한 항에 있어서, 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβRII, PD-1, CISH, LAG-3, TIGIT, ADORA2A, NKG2A, CTLA-4, TIM-3, 및 CD244로 이루어진 군으로부터 선택되는 제3 단백질을 인코딩하는 면역 세포 유전자의 표적 핵산 서열에 상보적인 표적화 서열을 포함하는 제3 gNA를 추가로 포함하고, 상기 제3 단백질은 상기 제1 단백질 및 제2 단백질과 상이한 것인, CasX:gNA 시스템.
  19. 제18항에 있어서, 상기 제1 gNA 표적화 서열은 B2M을 인코딩하는 유전자의 표적 핵산 서열에 상보적이며, 제2 gNA 표적화 서열은 TRAC를 인코딩하는 유전자의 표적 핵산 서열에 상보적이고, 제3 gNA 표적화 서열은 CIITA를 인코딩하는 유전자의 표적 핵산 서열에 상보적인, CasX:gNA 시스템.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 분화 클러스터 247(CD247), CD3d 분자(CD3D), CD3e 분자(CD3E), CD3g 분자(CD3G), CD52 분자(CD52), 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP 프롤릴 이소머라제 1A(FKBP1A: FKBP prolyl isomerase 1A)로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 면역 세포 유전자의 표적 핵산 서열에 상보적인 표적화 서열을 갖는 추가 gNA를 추가로 포함하는, CasX:gNA 시스템.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 제1 gNA, 제2 gNA, 제3 gNA, 및/또는 추가 gNA는 가이드 RNA(gRNA)인, CasX:gNA 시스템.
  22. 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 gNA는 가이드 DNA(gDNA)인, CasX:gNA 시스템.
  23. 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 gNA는 DNA 및 RNA를 포함하는 키메라(chimera)인, CasX:gNA 시스템.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 gNA는 단일-분자 gNA(sgNA)인, CasX:gNA 시스템.
  25. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 gNA는 이중-분자 gNA(dgNA)인, CasX:gNA 시스템.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 상기 gNA의 표적화 서열은 15, 16, 17, 18, 19, 또는 20개의 뉴클레오타이드를 포함하는, CasX:gNA 시스템.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 gNA는 SEQ ID NO: 4-16의 기준 gNA 서열 또는 SEQ ID NO: 2101-2280의 gNA 변이체 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택되는 서열을 포함하는 스캐폴드(scaffold)를 갖는, CasX:gNA 시스템.
  28. 제27항에 있어서, gNA 변이체 스캐폴드는 SEQ ID NO: 4-16으로 이루어진 군으로부터 선택되는 기준 gNA 서열에 비해 적어도 하나의 변형을 갖는 서열을 포함하는, CasX:gNA 시스템.
  29. 제28항에 있어서, 상기 기준 gNA의 적어도 하나의 변형은 gNA 서열의 뉴클레오타이드의 적어도 하나의 치환, 결실, 또는 치환을 포함하는, CasX:gNA 시스템.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 gNA는 화학적으로 변형되는, CasX:gNA 시스템.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, 상기 CasX 단백질은 SEQ ID NO: 1-3 중 임의의 하나의 서열을 갖는 기준 CasX 단백질, SEQ ID NO: 49-143, 438, 440, 442, 444, 446, 448-460, 472, 474, 478, 480, 482, 484, 486, 488, 490, 612 또는 613의 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열을 갖는 CasX 변이체 단백질을 포함하는, CasX:gNA 시스템.
  32. 제31항에 있어서, 상기 CasX 변이체 단백질은 SEQ ID NO: 1-3으로부터 선택되는 서열을 갖는 기준 CasX 단백질에 비해 적어도 하나의 변형을 포함하는, CasX:gNA 시스템.
  33. 제32항에 있어서, 상기 적어도 하나의 변형은 기준 CasX 단백질에 비해 CasX 변이체 단백질의 도메인에 적어도 하나의 아미노산 치환, 결실, 또는 치환을 포함하는, CasX:gNA 시스템.
  34. 제33항에 있어서, 상기 도메인은 비-표적 가닥 결합(NTSB) 도메인, 표적 가닥 로딩(TSL) 도메인, 나선형 I 도메인, 나선형 II 도메인, 올리고뉴클레오타이드 결합 도메인(OBD), 및 RuvC DNA 절단 도메인으로 이루어진 군으로부터 선택되는, CasX:gNA 시스템.
  35. 제31항 내지 제34항 중 어느 한 항에 있어서, 상기 CasX 단백질은 하나 이상의 핵 위치 신호(NLS: nuclear localization signal)를 추가로 포함하는, CasX:gNA 시스템.
  36. 제35항에 있어서, 상기 하나 이상의 NLS는 PKKKRKV(SEQ ID NO: 158), KRPAATKKAGQAKKKK(SEQ ID NO: 159), PAAKRVKLD(SEQ ID NO: 160), RQRRNELKRSP(SEQ ID NO: 161), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 162), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 163), VSRKRPRP(SEQ ID NO: 164), PPKKARED(SEQ ID NO: 165), PQPKKKPL(SEQ ID NO: 166), SALIKKKKKMAP(SEQ ID NO: 167), DRLRR(SEQ ID NO: 168), PKQKKRK(SEQ ID NO: 169), RKLKKKIKKL(SEQ ID NO: 170), REKKKFLKRR(SEQ ID NO: 171), KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 172), RKCLQAGMNLEARKTKK(SEQ ID NO: 173), PRPRKIPR(SEQ ID NO: 174), PPRKKRTVV(SEQ ID NO: 175), NLSKKKKRKREK(SEQ ID NO: 176), RRPSRPFRKP(SEQ ID NO: 177), KRPRSPSS(SEQ ID NO: 178), KRGINDRNFWRGENERKTR(SEQ ID NO: 179), PRPPKMARYDN(SEQ ID NO: 180), KRSFSKAF(SEQ ID NO: 181), KLKIKRPVK(SEQ ID NO: 182), PKTRRRPRRSQRKRPPT(SEQ ID NO:184), RRKKRRPRRKKRR(SEQ ID NO: 187), PKKKSRKPKKKSRK(SEQ ID NO: 188), HKKKHPDASVNFSEFSK(SEQ ID NO: 189), QRPGPYDRPQRPGPYDRP(SEQ ID NO: 190), LSPSLSPLLSPSLSPL(SEQ ID NO: 191), RGKGGKGLGKGGAKRHRK(SEQ ID NO: 192), PKRGRGRPKRGRGR(SEQ ID NO: 193), MSRRRKANPTKLSENAKKLAKEVEN(SEQ ID NO: 185), PKKKRKVPPPPAAKRVKLD(SEQ ID NO: 183), 및 PKKKRKVPPPPKKKRKV(SEQ ID NO: 194)로 이루어진 서열의 군으로부터 선택되는, CasX:gNA 시스템.
  37. 제35항 또는 제36항에 있어서, 상기 하나 이상의 NLS는 CasX 단백질의 C-말단에 또는 그 부근에 발현되는, CasX:gNA 시스템.
  38. 제35항 또는 제36항에 있어서, 상기 하나 이상의 NLS는 CasX 단백질의 N-말단에 또는 그 부근에 발현되는, CasX:gNA 시스템.
  39. 제35항 또는 제36항에 있어서, 상기 CasX 단백질의 N-말단에 또는 그 부근에 그리고 C-말단에 또는 그 부근에 위치하는 하나 이상의 NLS를 포함하는, CasX:gNA 시스템.
  40. 제31항 내지 제39항 중 어느 한 항에 있어서, 상기 CasX 변이체는 변이체 gNA와 리보핵 단백질 복합체(RNP: ribonuclear protein complex)를 형성할 수 있는, CasX:gNA 시스템.
  41. 제40항에 있어서, 상기 CasX 변이체 단백질과 gNA 변이체의 RNP는 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX 단백질과 SEQ ID NO: 4-16 중 임의의 하나의 서열을 포함하는 gNA의 RNP와 비교하여 적어도 하나 이상의 향상된 특징을 나타내는, CasX:gNA 시스템.
  42. 제41항에 있어서, 상기 향상된 특징은, CasX 변이체의 향상된 접힘(folding); 가이드 핵산(gNA)에의 향상된 결합 친화도; 표적 DNA에의 향상된 결합 친화도; 표적 DNA의 편집 시, ATC, CTC, GTC, 또는 TTC를 포함한 하나 이상의 PAM 서열의 더 큰 스펙트럼을 활용하는 향상된 능력; 표적 DNA의 향상된 풀림(unwinding); 증가된 편집 활성; 향상된 편집 효율; 향상된 편집 특이성; 증가된 뉴클레아제 활성; 이중 가닥 절단에 대한 증가된 표적 가닥 로딩(loading); 단일 가닥 틈새 형성(nicking)에 대한 저하된 표적 가닥 로딩; 저하된 표적-외(off-target) 절단; 비-표적 DNA 가닥의 향상된 결합; 향상된 단백질 안정성; 향상된 단백질 용해도; 향상된 단백질:gNA 복합체(RNP) 안정성; 향상된 단백질:gNA 복합체 용해도; 향상된 단백질 수율; 향상된 단백질 발현; 및 향상된 융합 특징으로 이루어진 군 중 하나 이상으로부터 선택되는, CasX:gNA 시스템.
  43. 제41항 또는 제42항에 있어서, 상기 CasX 변이체 단백질과 gNA 변이체의 RNP의 향상된 특징은 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX 단백질과 SEQ ID NO: 4-16 중 임의의 하나의 gNA의 RNP에 비해 적어도 약 1.1배 내지 약 100배 이상 향상되는, CasX:gNA 시스템.
  44. 제41항 또는 제42항에 있어서, 상기 CasX 변이체 단백질의 향상된 특징은 SEQ ID NO: 1, SEQ ID NO: 2, 또는 SEQ ID NO: 3의 기준 CasX 단백질과 SEQ ID NO: 4-16 중 임의의 하나의 서열을 포함하는 gNA에 비해 적어도 약 1.1배, 적어도 약 2배, 적어도 약 10배, 적어도 약 100배 이상 향상되는, CasX:gNA 시스템.
  45. 제41항 내지 제43항 중 어느 한 항에 있어서, 상기 향상된 특징은 편집 효율을 포함하고, CasX 변이체 단백질과 gNA 변이체의 RNP는 SEQ ID NO: 2의 기준 CasX 단백질과 SEQ ID NO: 4-16 중 임의의 하나의 서열을 포함하는 gNA의 RNP와 비교한 편집 효율에서 1.1배 내지 100배의 향상을 포함하는, CasX:gNA 시스템.
  46. 제40항 내지 제45항 중 어느 한 항에 있어서, 상기 CasX 변이체와 gNA 변이체를 포함하는 RNP는, PAM 서열 TTC, ATC, GTC, 또는 CTC 중 임의의 하나가 세포 검정 시스템에서의 gNA의 표적화 서열과 동일성을 갖는 프로토스페이서의 비-표적 가닥에 대해 1개 뉴클레오타이드 5'에 위치할 때 표적 DNA 내 표적 서열의 편집 효율 및/또는 결합을, 대등한(comparable) 검정 시스템에서의 SEQ ID NO: 4-16 중 임의의 하나의 서열을 포함하는 gNA 및 SEQ ID NO: 2의 기준 CasX 단백질을 포함하는 RNP의 편집 효율 및/또는 결합과 비교하여 더 크게 나타내는, CasX:gNA 시스템.
  47. 제46항에 있어서, 상기 PAM 서열은 TTC인, CasX:gNA 시스템.
  48. 제46항에 있어서, 상기 PAM 서열은 ATC인, CasX:gNA 시스템.
  49. 제46항에 있어서, 상기 PAM 서열은 CTC인, CasX:gNA 시스템.
  50. 제46항에 있어서, 상기 PAM 서열은 GTC인, CasX:gNA 시스템.
  51. 제46항 내지 제50항 중 어느 한 항에 있어서, 하나 이상의 PAM 서열에 대한 증가된 결합 친화도는 PAM 서열에 대한 SEQ ID NO: 1-3의 기준 CasX 단백질 중 임의의 하나의 결합 친화도와 비교하여 적어도 1.5배 내지 적어도 10배 더 큰, CasX:gNA 시스템.
  52. 제40항 내지 제51항 중 어느 한 항에 있어서, 상기 RNP는 SEQ ID NO: 1-3의 기준 CasX와 SEQ ID NO: 4-16 중 임의의 하나의 서열을 포함하는 gNA의 RNP와 비교하여 적어도 5%, 적어도 10%, 적어도 15%, 또는 적어도 20% 더 높은 백분율의 절단-적격(cleavage-competent) RNP를 갖는, CasX:gNA 시스템.
  53. 제31항 내지 제52항 중 어느 한 항에 있어서, 상기 CasX 변이체 단백질은 닉카제(nickase) 활성을 갖는 RuvC DNA 절단 도메인을 포함하는, CasX:gNA 시스템.
  54. 제31항 내지 제52항 중 어느 한 항에 있어서, 상기 CasX 변이체 단백질은 이중-가닥 절단 활성을 갖는 RuvC DNA 절단 도메인을 포함하는, CasX:gNA 시스템.
  55. 제1항 내지 제40항 중 어느 한 항에 있어서, 상기 CasX 단백질은 촉매 활성이 없는(catalytically inactive) CasX(dCasX) 단백질이고, dCasX 및 gNA는 SOD1 표적 핵산에 결합하는 능력을 유지하는, CasX:gNA 시스템.
  56. 제55항에 있어서, 상기 dCasX는,
    a. SEQ ID NO: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935 잔기; 또는
    b. SEQ ID NO: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922 잔기에 돌연변이를 포함하는, CasX:gNA 시스템.
  57. 제56항에 있어서, 상기 돌연변이는 잔기에 대한 알라닌의 치환인, CasX:gNA 시스템.
  58. 제1항 내지 제54항 중 어느 한 항에 있어서, 공여자 주형 핵산을 추가로 포함하는, CasX:gNA 시스템.
  59. 제58항에 있어서, 상기 공여자 주형은 B2M, TRAC, CIITA, TRBC1, TRBC2, HLA-A, HLA-B, TGFβRII, PD-1, CISH, LAG-3, TIGIT, ADORA2A, NKG2A, CTLA-4, TIM-3, 및 CD244로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 유전자의 모두 또는 일부를 포함하는 폴리뉴클레오타이드를 포함하고, 상기 폴리뉴클레오타이드는 단백질을 인코딩하는 게놈 폴리뉴클레오타이드 서열과 비교하여 하나 이상의 뉴클레오타이드의 결실, 삽입, 또는 돌연변이를 포함하는, CasX:gNA 시스템.
  60. 제31항 내지 제57항 중 어느 한 항의 CasX를 인코딩하는 서열을 포함하는 폴리뉴클레오타이드.
  61. 제1항 내지 제30항 중 어느 한 항의 gNA를 인코딩하는 서열을 포함하는 폴리뉴클레오타이드.
  62. 제58항 또는 제59항의 공여자 주형을 포함하는 폴리뉴클레오타이드.
  63. 제60항 내지 제62항 중 어느 한 항의 폴리뉴클레오타이드 중 하나 이상을 포함하는 벡터.
  64. 제60항 내지 제62항 중 어느 한 항의 폴리뉴클레오타이드를 포함하는 벡터.
  65. 제63항 또는 제64항에 있어서, 상기 벡터는 프로모터를 추가로 포함하는, 벡터.
  66. 제63항 내지 제65항 중 어느 한 항에 있어서, 상기 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 바이러스-유사 입자(VLP), 단순 포진 바이러스(HSV) 벡터, 플라스미드, 미니서클(minicircle), 나노플라스미드, DNA 벡터, 및 RNA 벡터로 이루어진 군으로부터 선택되는, 벡터.
  67. 제66항에 있어서, 상기 벡터는 AAV 벡터인, 벡터.
  68. 제67항에 있어서, 상기 AAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV-Rh74, 또는 AAVRh10으로부터 선택되는, 벡터.
  69. 제66항에 있어서, 상기 벡터는 레트로바이러스 벡터인, 벡터.
  70. 매트릭스 단백질(MA), 뉴클레오캡시드 단백질(NC), 캡시드 단백질(CA), p1-p6 단백질, 및 프로테아제 절단 부위로 이루어진 군으로부터 선택되는 gag 폴리단백질(polyprotein)의 하나 이상의 성분을 포함하고, 표적 세포로의 VLP의 결합 및 융합을 제공하는 표적화 당단백질을 추가로 포함하는, 바이러스-유사 입자(VLP).
  71. 제70항에 있어서, 제31항 내지 제57항 중 어느 한 항의 CasX 단백질, 및 제1항 내지 제30항 중 어느 한 항의 gNA를 포함하고, 선택적으로 제62항의 폴리뉴클레오타이드를 포함하는, VLP.
  72. 제71항에 있어서, 상기 CasX 단백질 및 상기 gNA는 RNP에서 함께 회합되는, VLP.
  73. 세포 집단에서 유전자의 표적 핵산 서열을 변형시키는 방법으로서, 상기 유전자는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하며, 상기 방법은 상기 세포 집단의 각각의 세포 내로,
    a. 제1항 내지 제59항 중 어느 한 항의 CasX:gNA 시스템;
    b. 제60항 내지 제62항 중 어느 한 항의 폴리뉴클레오타이드;
    c. 제63항의 벡터;
    d. 제70항 내지 제72항 중 어느 한 항의 VLP; 또는
    e. 상기 a 내지 상기 d 중 2개 이상의 조합을 도입하는 단계를 포함하고,
    CasX 단백질로 상기 세포들의 표적 핵산 서열을 변형시키는, 방법.
  74. 제73항에 있어서, 상기 CasX:gNA 시스템은 RNP로서 세포 내로 도입되는, 방법.
  75. 제73항 또는 제74항에 있어서, 상기 세포는 질환 항원, 선택적으로 종양 세포 항원에 대해 결합 친화도를 갖는 키메라 항원 수용체(CAR: chimeric antigen receptor)를 인코딩하는 폴리뉴클레오타이드의 도입에 의해 변형되는, 방법.
  76. 제73항 또는 제74항에 있어서, 상기 세포는 질환 항원, 선택적으로 종양 세포 항원에 대해 결합 친화도를 갖는 결합 도메인을 포함하는 조작된 T 세포 수용체(TCR)를 인코딩하는 폴리뉴클레오타이드의 도입에 의해 변형되는, 방법.
  77. 제74항 또는 제75항에 있어서, 상기 종양 세포 항원은 분화 클러스터 19(CD19), 분화 클러스터 3(CD3), CD3d 분자(CD3D), CD3g 분자(CD3G), CD3e 분자(CD3E), CD247 분자(CD247, 또는 CD3Z), CD8a 분자(CD8), CD7 분자(CD7), 막 메탈로엔도펩티다제(CD10), 막 경유 4-도메인 A1(CD20), CD22 분자(CD22), TNF 수용체 슈퍼계열 구성원 8(CD30), C-유형 렉틴 도메인 계열 12 구성원 A(CLL1), CD33 분자(CD33), CD34 분자(CD34), CD38 분자(CD38), 인테그린 하위단위 알파 2b(CD41), CD44 분자(인도인 혈액 군)(CD44), CD47 분자(CD47), 인테그린 알파 6(CD49f), 신경 세포 접착 분자 1(CD56), CD70 분자(CD70), CD74 분자(CD74), CD99 분자(Xg 혈액 군)(CD99), 인터루킨 3 수용체 하위단위 알파(CD123), 프로미닌 1(prominin 1)(CD133), 신데칸 1(syndecan 1)(CD138), 카르보닉스 안하이드라제 IX(CAIX: carbonix anhydrase IX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 접착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEA 세포 접착 분자 5(CEACAM5), 클라우딘 6(CLDN6: Claudin 6), 클라우딘 18(CLDN18), C-유형 렉틴 도메인 계열 12 구성원 A(CLEC12A), 상피-간엽 전이 인자(cMET), 세포독성 T-림프구-관련 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), 표피 성장 인자 수용체 변이체 III(EGFRvIII), 상피 당단백질 2(EGP-2), 상피 세포 접착 분자(EGP-40 또는 EpCAM), EPH 수용체 A2(EphA2), 엑토뉴클레오타이드 피로포스파타제/포스포디에스테라제 3(ENPP3: ectonucleotide pyrophosphatase/phosphodiesterase 3), erb-b2 수용체 티로신 키나제 2(ERBB2), erb-b2 수용체 티로신 키나제 3(ERBB3), erb-b2 수용체 티로신 키나제 4(ERBB4), 폴레이트 결합 단백질(FBP), 태아 니코틴성 아세틸콜린 수용체(AChR), 폴레이트 수용체 알파(FR알파 또는 FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사지향성 수용체 8(GRM8), 글리피칸-3(GPC3: glypican-3), 강글리오사이드 GD2, 강글리오사이드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), 인간 표피 성장 인자 수용체 3(HER3), 인테그린 B7, 세포내 세포-접착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY: Lewis-Y), 콘드로모듈린-1(LECT1: chondromodulin-1), L1 세포 접착 분자(L1CAM), 리소포스파티드산 수용체 3(LPAR3: Lysophosphatidic acid receptor 3), 흑색종-관련 항원 1(MAGE-A1), 메소텔린(MSLN: mesothelin), 뮤신 1(MUC1), 뮤신 16, 세포 표면 관련(MUC16), 흑색종-관련 항원 3(MAGE-A3), 종양 단백질 p53(p53), T 세포에 의해 인식되는 흑색종 항원 1(MART1: Melanoma Antigen Recognized by T cells 1), 당단백질 100(GP100), 프로테이나제3(Proteinase3)(PR1), 에프린-A 수용체 2(EphA2: ephrin-A receptor 2), 자연 살해기 2D 리간드(NKG2D 리간드: Natural killer group 2D ligand), 뉴욕 식도 편평 세포 암종 1(NY-ESO-1), 종양태아성 항원(oncofetal antigen)(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 고아 수용체 1(ROR1: receptor tyrosine kinase-like orphan receptor 1), 영양아층 당단백질(TPBG: trophoblast glycoprotein), 종양-관련 당단백질 72(TAG-72), 종양-관련 칼슘 신호 전달자 2(TROP-2: tumor-associated calcium signal transducer 2), 티로시나제(TYR: tyrosinase), 서바이빈(survivin), 혈관 내피 성장 인자 수용체 2(VEGF- R2), 윌름 종양-1(WT-1: Wilms tumor-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현되는 항원(PRAME: Preferentially Expressed Antigen In Melanoma), T 세포 수용체 베타 불변 1(TRBC1), TRBC2, 및 (T-세포 면역글로불린 뮤신-3) TIM-3으로 이루어진 군으로부터 선택되는, 방법.
  78. 제75항 내지 제77항 중 어느 한 항에 있어서, 상기 CAR 및/또는 TCR은 선형 항체(linear antibody), 단일 도메인 항체(sdAb: single domain antibody), 및 단일-사슬 가변 단편(scFv: single-chain variable fragment)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함하는, 방법.
  79. 제78항에 있어서, 상기 항원 결합 도메인은 종양 세포 항원에 대해 결합 친화도를 갖는 scFv인, 방법.
  80. 제79항에 있어서, 상기 항원 결합 도메인은 표 5에 제시된 서열로 이루어진 군으로부터 선택되는 가변 중쇄(VH)와 가변 경쇄(VL) 및/또는 중쇄 CDR과 경쇄 CDR을 포함하는 scFv인, 방법.
  81. 제80항에 있어서, 상기 scFv의 VH, VL, 및/또는 CDR은 하나 이상의 아미노산 변형을 가지며, scFv는 종양 항원에 대해 결합 친화도를 유지하고, 변형은 치환, 결실, 및 삽입으로 이루어진 군으로부터 선택되는, 방법.
  82. 제75항 내지 제81항 중 어느 한 항에 있어서, 상기 CAR은 적어도 하나의 세포내 신호전달 도메인을 추가로 포함하는, 방법.
  83. 제82항에 있어서, 상기 적어도 하나의 세포내 신호전달 도메인은 CD247 분자(CD3-제타), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB), 유도적 T 세포 공동자극자(ICOS), 또는 TNF 수용체 슈퍼계열 구성원 4(OX40)로부터 단리되거나 유래되는 적어도 하나의 세포내 신호전달 도메인을 포함하는, 방법.
  84. 제83항에 있어서, 상기 적어도 하나의 세포내 신호전달 도메인은
    a. CD3-제타 세포내 신호전달 도메인;
    b. CD3-제타 세포내 신호전달 도메인 및 4-1BB 또는 CD28 세포내 신호전달 도메인;
    c. CD-제타 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD28 세포내 신호전달 도메인; 또는
    d. CD-제타 세포내 신호전달 도메인, CD28 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD27 또는 OX40 세포내 신호전달 도메인을 포함하는, 방법.
  85. 제75항 내지 제84항 중 어느 한 항에 있어서, 상기 CAR은 세포외 힌지(hinge) 도메인을 추가로 포함하는, 방법.
  86. 제85항에 있어서, 상기 힌지 도메인은 면역글로불린 유사 도메인인, 방법.
  87. 제86항에 있어서, 상기 힌지 도메인은 IgG1, IgG2, 또는 IgG4로부터 단리되거나 유래되는, 방법.
  88. 제86항에 있어서, 상기 힌지 도메인은 CD8a 분자(CD8) 또는 CD28로부터 단리되거나 유래되는, 방법.
  89. 제75항 내지 제88항 중 어느 한 항에 있어서, 상기 CAR은 막관통 도메인을 추가로 포함하는, 방법.
  90. 제89항에 있어서, 상기 막관통 도메인은 CD3-제타, CD4, CD8, 및 CD28로 이루어진 군으로부터 단리되거나 유래되는, 방법.
  91. 제76항 내지 제81항 중 어느 한 항에 있어서, 상기 TCR은 TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타로 이루어진 군으로부터 선택되는 하나 이상의 하위단위를 포함하는, 방법.
  92. 제91항에 있어서, 상기 TCR은 CD247 분자(CD3-제타), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB), 유도적 T 세포 공동자극자(ICOS), 또는 TNF 수용체 슈퍼계열 구성원 4(OX40)로 이루어진 군으로부터 선택되는 하나 이상의 세포내 신호전달 도메인을 추가로 포함하는, 방법.
  93. 제90항 또는 제91항에 있어서, 상기 TCR의 항원 결합 도메인은 TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타로 이루어진 군으로부터 선택되는 하나 이상의 TCR 하위단위에 작동 가능하게 연결되는, 방법.
  94. 제93항에 있어서, 상기 TCR의 항원 결합 도메인은 표 5에 제시된 서열로 이루어진 군으로부터 선택되는 가변 중쇄(VH)와 가변 경쇄(VL) 및/또는 중쇄 CDR과 경쇄 CDR을 포함하는 scFv인, 방법.
  95. 제94항에 있어서, 상기 scFv의 VH, VL, 및/또는 CDR은 하나 이상의 아미노산 변형을 가지며, scFv는 종양 항원에의 결합 친화도를 유지하고, 변형은 치환, 결실, 및 삽입으로 이루어진 군으로부터 선택되는, 방법.
  96. 제73항 내지 제95항 중 어느 한 항에 있어서, 상기 세포는 설치류 세포, 마우스 세포, 래트 세포, 및 비인간 영장류 세포로 이루어진 군으로부터 선택되는, 방법.
  97. 제73항 내지 제95항 중 어느 한 항에 있어서, 상기 세포는 인간 세포인, 방법.
  98. 제73항 내지 제97항 중 어느 한 항에 있어서, 상기 세포는 전구 세포(progenitor cell), 조혈 줄기세포(hematopoietic stem cell), 및 만능성 줄기세포(pluripotent stem cell)로 이루어진 군으로부터 선택되는, 방법.
  99. 제98항에 있어서, 상기 세포는 유도 만능성 줄기세포(induced pluripotent stem cell)인, 방법.
  100. 제73항 내지 제97항 중 어느 한 항에 있어서, 상기 세포는 면역 세포인, 방법.
  101. 제100항에 있어서, 상기 면역 세포는 T 세포, 종양 침윤성 림프구, NK 세포, B 세포, 단핵구, 대식세포, 또는 수지상 세포로 이루어진 군으로부터 선택되는, 방법.
  102. 제101항에 있어서, 상기 T 세포는 CD4+ T 세포, CD8+ T 세포, 세포독성 T 세포, 말단 이펙터 T 세포(terminal effector T cell), 기억 T 세포, 미접촉(naive) T 세포, 조절 T 세포, 자연 살해 T 세포, 감마-델타 T 세포, 사이토카인-유도 살해(CIK: cytokine-induced killer) T 세포, 및 종양 침윤성 림프구, 또는 이들의 조합으로 이루어진 군으로부터 선택되는, 방법.
  103. 제73항 내지 제102항 중 어느 한 항에 있어서, 상기 변형시키기에는, 상기 세포 집단의 세포의 표적 핵산 서열에 하나 이상의 단일-가닥 절단부(break)를 도입하는 것이 포함되는, 방법.
  104. 제73항 내지 제102항 중 어느 한 항에 있어서, 상기 변형시키기에는, 상기 세포 집단의 세포의 표적 핵산 서열에 하나 이상의 이중-가닥 절단부를 도입하는 것이 포함되는, 방법.
  105. 제73항 내지 제104항 중 어느 한 항에 있어서, 상기 변형시키기는, B2M, TRAC, CIITA, TRBC1, TRBC2, HLA-A, HLA-B, TGFβRII, PD-1, CISH, LAG3, TIGIT, ADORA2A, NKG2A, CTLA-4, TIM-3, 및 CD244로 이루어진 군으로부터 선택되는 하나 이상의 단백질을 인코딩하는 상기 세포 집단의 세포 내 유전자가 넉다운(knock-down) 또는 넉아웃(knock-out)되는 결과를 일으키는, 상기 세포 집단의 세포의 표적 핵산 서열에 하나 이상의 뉴클레오타이드의 삽입, 결실, 치환, 중복(duplication), 또는 역위(inversion)를 도입하는 것을 포함하는, 방법.
  106. 제73항 내지 제104항 중 어느 한 항에 있어서, 제58항 또는 제59항의 공여자 주형을 상기 세포 집단의 세포의 표적 핵산 서열의 절단부 부위(들) 내로 삽입하는 단계를 포함하는, 방법.
  107. 제106항에 있어서, 상기 공여자 주형의 삽입은 상동성-안내 수선(HDR: homology-directed repair) 또는 상동성-독립적 표적화된 통합(HITI: homology-independent targeted integration)에 의해 매개되는, 방법.
  108. 제106항 또는 제107항에 있어서, 상기 공여자 주형의 삽입이, B2M, TRAC, CIITA, TRBC1, TRBC2, HLA-A, HLA-B, TGFβRII, PD-1, CISH, LAG-3, TIGIT, ADORA2A, NKG2A, CTLA-4, TIM-3, 및 CD244로 이루어진 군으로부터 선택되는 하나 이상의 단백질을 인코딩하는 상기 세포 집단의 세포 내 유전자를 넉다운 또는 넉아웃시키는, 방법.
  109. 제105항 내지 제108항 중 어느 한 항에 있어서, 상기 세포 집단의 세포는, 하나 이상의 단백질의 발현이 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록, 변형된, 방법.
  110. 제105항 내지 제109항 중 어느 한 항에 있어서, 상기 세포 집단의 세포는, 세포 중 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%가 변형되지 않은 세포와 비교하여 하나 이상의 단백질을 검출 가능한 수준으로 발현하지 않도록, 변형된, 방법.
  111. 제105항 내지 제110항 중 어느 한 항에 있어서, 상기 하나 이상의 단백질은 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택되는, 방법.
  112. 제111항에 있어서, 상기 세포 집단의 세포는, 세포 중 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%가, B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택되는 단백질 중 적어도 2개를 검출 가능한 수준으로 발현하지 않도록, 변형된, 방법.
  113. 제105항 내지 제112항 중 어느 한 항에 있어서, 상기 세포는, 상기 세포 집단의 세포 중 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%가 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않도록, 변형된, 방법.
  114. 제105항 내지 제113항 중 어느 한 항에 있어서, 상기 세포는, 상기 세포 집단의 세포 중 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%가 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않도록, 변형된, 방법.
  115. 제105항 내지 제114항 중 어느 한 항에 있어서, 상기 세포 집단은 검출 가능한 수준의 CAR을 발현하는, 방법.
  116. 제105항 내지 제115항 중 어느 한 항에 있어서, 상기 세포 집단은 검출 가능한 수준의 TCR을 발현하는, 방법.
  117. 제73항 내지 제115항 중 어느 한 항에 있어서, 상기 방법은 생체외에서 상기 세포 집단에서 실시되는, 방법.
  118. 제73항 내지 제115항 중 어느 한 항에 있어서, 상기 방법은 생체내에서 대상체에서 실시되는, 방법.
  119. 제118항에 있어서, 상기 대상체는 설치류, 마우스, 래트, 돼지, 및 비인간 영장류로 이루어진 군으로부터 선택되는, 방법.
  120. 제118항에 있어서, 상기 대상체는 인간인, 방법.
  121. 제73항 내지 제117항 중 어느 한 항의 방법에 의해 생체외에서 변형된 세포들의 집단.
  122. 제121항에 있어서, 상기 세포 집단의 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않도록 세포가 변형된, 세포들의 집단.
  123. 제121항 또는 제122항에 있어서, 상기 세포 집단의 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않도록 세포가 변형된, 세포들의 집단.
  124. 제121항 내지 제123항 중 어느 한 항에 있어서, 상기 세포 집단의 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 검출 가능한 수준의 키메라 항원 수용체(CAR)를 발현하도록 세포가 변형된, 세포들의 집단.
  125. 제121항 내지 제124항 중 어느 한 항에 있어서, 상기세포 집단의 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 인터루킨 7(IL-7), IL-12, IL-15, 및 IL-18로 이루어진 군으로부터 선택되는 면역 자극성 사이토카인을 검출 가능한 수준으로 발현하도록 세포가 변형된, 세포들의 집단.
  126. 제121항 내지 제125항 중 어느 한 항에 있어서, 상기 세포 집단의 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 검출 가능한 수준의 TCR을 발현하도록 세포가 변형된, 세포들의 집단.
  127. 제124항 내지 제126항 중 어느 한 항에 있어서, 종양 항원을 보유하는 세포의 상기 종양 항원에 CAR이 결합 시, 상기 세포 집단은 i) 활성화되는 반응; ii) 세포 집단의 증식을 유도하는 반응; iii) 세포 집단에 의한 사이토카인 분비 반응; iv) 상기 종양 항원을 보유하는 세포의 세포독성을 유도하는 반응; 또는 v) (i) 내지 (iv) 중 임의의 것의 조합으로부터 선택되는 반응을 할 수 있는, 세포의 집단.
  128. 대상체에서 항종양 면역력을 제공하는 방법으로서, 치료적 유효량의 제121항 내지 제127항 중 어느 한 항의 세포 집단을 대상체에게 투여하는 단계를 포함하는 방법.
  129. 치료를 필요로 하는 대상체를 치료하는 방법으로서, 치료적 유효량의 제121항 내지 제127항 중 어느 한 항의 세포 집단을 대상체에게 투여하는 단계를 포함하는 방법.
  130. 제129항에 있어서, 상기 대상체는 암 또는 자가면역 질환을 갖고 있는, 방법.
  131. 제130항에 있어서, 상기 암은 결장암(colon cancer), 직장암(rectal cancer), 신세포 암종(renal-cell carcinoma), 간암, 폐의 비-소세포 암종(non-small cell carcinoma of the lung), 소장암(cancer of the small intestine), 식도암, 흑색종, 골암(bone cancer), 전립선암, 피부암, 두경부암, 피부 또는 안구내 악성 흑색종(cutaneous or intraocular malignant melanoma), 자궁암, 난소암, 직장암, 항문 영역의 암, 위암, 고환암, 나팔관 암종, 자궁내막 암종, 자궁경부 암종, 질 암종, 외음(vulva) 암종, 호지킨 질환(Hodgkin's Disease), 비-호지킨 림프종(non-Hodgkin's lymphoma), 내분비계암, 갑상선암, 부갑상선암, 부신암(cancer of adrenal gland), 연조직 육종, 요도암, 음경암, 소아의 고형 종양, 방광암, 신장 또는 수뇨관의 암, 신우(renal pelvis) 암종, 중추신경계(CNS)의 신생물, 원발성 CNS 림프종, 종양 혈관신생, 척추 종양(spinal axis tumor), 뇌간 신경교종(brain stem glioma), 뇌하수체 선종(pituitary adenoma), 카포시 육종(Kaposi's sarcoma), 유표피암(epidermoid cancer), 편평 세포암, T-세포 림프종, 환경적으로 유도된 암(environmentally induced cancer), 만성 림프구성 백혈병(CLL: chronic lymphocytic leukemia), 급성 백혈병, 급성 림프성 백혈병(ALL: acute lymphoid leukemia), B-세포 급성 림프성 백혈병(B-ALL), T-세포 급성 림프성 백혈병(T-ALL), 만성 골수구성 백혈병(CML: chronic myelogenous leukemia), 급성 골수성 백혈병(AML: acute myeloid leukemia), B 세포 전림프구성 백혈병(B cell prolymphocytic leukemia), 모구 형질세포양 수지상 세포 신생물(blastic plasmacytoid dendritic cell neoplasm), 버킷 림프종(Burkitt's lymphoma), 미만성 거대 B 세포 림프종(diffuse large B cell lymphoma), 소포성 림프종(follicular lymphoma), 털세포 백혈병(hairy cell leukemia), 소세포(small cell)- 또는 거대 세포-소포성 림프종, 악성 림프증식성 병태(malignant lymphoproliferative condition), MALT 림프종, 맨틀 세포 림프종(mantle cell lymphoma), 변연부 림프종(marginal zone lymphoma), 다발성 골수종(multiple myeloma), 골수이형성증(myelodysplasia) 및 골수이형성 증후군(myelodysplastic syndrome), 호지킨 림프종(Hodgkin's lymphoma), 형질모세포성 림프종(plasmablastic lymphoma), 형질세포양 수지상 세포 신생물, 발덴스트롬 거대글로불린혈증(Waldenstrom macroglobulinemia), 전백혈병(pre-leukemia), 상기 암들의 조합, 및 상기 암들의 전이성 병변으로 이루어진 군으로부터 선택되는, 방법.
  132. 제130항 또는 제131항에 있어서, 상기 암은 종양 세포 항원을 발현하는, 방법.
  133. 제132항에 있어서, 상기 CAR은 종양 세포 항원에 대해 특이적인 결합 친화도를 갖는, 방법.
  134. 제133항에 있어서, CAR이 종양 항원에 결합 시, 상기 세포 집단은 i) 활성화되는 반응; ii) 세포 집단의 증식을 유도하는 반응; iii) 세포 집단에 의한 사이토카인 분비 반응; iv) 상기 종양 항원을 보유하는 세포의 세포독성을 유도하는 반응; 또는 v) (i) 내지 (iv) 중 임의의 하나의 조합을 할 수 있는, 방법.
  135. 제128항 내지 제134항 중 어느 한 항에 있어서, 상기 세포 집단은 뇌실질내(intraparenchymal), 정맥내, 동맥내, 뇌실내(intracerebroventricular), 수조내(intracisternal), 수막공간내(intrathecal), 두개내(intracranial), 요추(lumbar), 복강내(intraperitoneal), 피하(subcutaneous), 안구내(intraocular), 안구주위(periocular), 망막하(subretinal), 유리체내(intravitreal), 폐내(intrapulmonary), 및 비강내(intranasal), 및 이들의 조합으로부터 선택되는 투여 경로에 의해 대상체에게 투여되는, 방법.
  136. 제128항 내지 제135항 중 어느 한 항에 있어서, 치료적 유효량의 상기 세포 집단의 투여는, 완전, 부분, 또는 불완전 반응으로서의 종양 위축(shrinkage); 진행 시간(time-to-progression), 치료 실패까지의 시간(time to treatment failure), 바이오마커 반응; 무진행 생존율(progression-free survival); 무질환 생존율(disease free-survival); 재발까지의 시간(time to recurrence); 전이까지의 시간(time to metastasis); 전체 생존율의 시간(time of overall survival); 삶의 질의 향상; 및 증상의 향상 중 하나 이상으로부터 선택되는, 대상체의 질환과 관련된 임상적 매개변수 또는 종점의 향상을 이끄는, 방법.
  137. 제128항 내지 제136항 중 어느 한 항에 있어서, 화학치료제를 투여하는 단계를 추가로 포함하는 방법.
  138. 대상체에서의 면역치료법을 위한 세포를 제조하는 방법으로서, 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질의 발현을 감소시키거나 제거함으로써 면역 세포를 변형시키는 단계를 포함하는 방법.
  139. 제138항에 있어서, 상기 면역 세포의 표적 핵산 서열을 CasX 단백질 및 하나 이상의 gNA를 포함하는 CasX:gNA 시스템과 접촉시키는 단계를 포함하고, 각각의 gNA는 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 하나 이상의 단백질을 인코딩하는 하나 이상의 유전자의 표적 핵산 서열에 상보적인 표적화 서열을 포함하는, 방법.
  140. 제138항 또는 제139항에 있어서, 상기 하나 이상의 단백질은 B2M, TTRAC, CIITA, TRBC1, TRBC2, HLA-A, HLA-B, TGFβRII, PD-1, CISH, LAG-3, TIGIT, ADORA2A, NKG2A, CTLA-4, TIM-3, 및 CD244로 이루어진 군으로부터 선택되는, 방법.
  141. 제140항에 있어서, 상기 하나 이상의 단백질은 B2M, TRAC, 및 CIITA로 이루어진 군으로부터 선택되는, 방법.
  142. 제140항 또는 제141항에 있어서, CD247, CD3D, CD3E, CD3G, CD52, 인간 백혈구 항원 C(HLA-C), 데옥시시티딘 키나제(dCK), 및 FKBP1A로 이루어진 군으로부터 선택되는 단백질을 인코딩하는 유전자의 표적 핵산 서열에 상보적인 표적화 서열을 포함하는 gNA를 추가로 포함하는, 방법.
  143. 제138항 내지 제142항 중 어느 한 항에 있어서, 상기 세포는, 하나 이상의 단백질의 발현이 변형되지 않은 세포와 비교하여 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%만큼 감소되도록, 변형된, 방법.
  144. 제138항 내지 제143항 중 어느 한 항에 있어서, 상기 세포는, 하나 이상의 단백질을 검출 가능한 수준으로 발현하지 않도록, 변형된, 방법.
  145. 제138항 내지 제144항 중 어느 한 항에 있어서, 상기 세포는, 변형된 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 MHC 클래스 I 분자를 검출 가능한 수준으로 발현하지 않도록, 변형된, 방법.
  146. 제138항 내지 제145항 중 어느 한 항에 있어서, 상기 세포는, 변형된 세포 중 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 약 95%가 야생형 T 세포 수용체를 검출 가능한 수준으로 발현하지 않도록, 변형된, 방법.
  147. 제138항 내지 제146항 중 어느 한 항에 있어서, 종양 세포 항원에 대해 특이적인 결합 친화도를 갖는 키메라 항원 수용체(CAR)를 인코딩하는 폴리핵산(polynucleic acid)을 면역 세포 내로 도입하는 단계를 추가로 포함하는, 방법.
  148. 제138항 내지 제147항 중 어느 한 항에 있어서, 질환 항원, 선택적으로 종양 세포 항원에 대해 결합 친화도를 갖는 결합 도메인을 포함하는 조작된 T 세포 수용체(TCR)를 인코딩하는 폴리핵산을 면역 세포 내로 도입하는 단계를 추가로 포함하는, 방법.
  149. 제147항에 있어서, 상기 종양 세포 항원은 CD19, CD3, CD3D, CD3G, CD3E, CD247, CD8, CD7, CD10, CD20, CD22, CD30, CLL1, CD33, CD34, CD38, CD41, CD44, CD47, CD49f, CD56, CD70, CD74, CD99, CD123, CD133, CD138, CAIX, CCR4, ADAM12, ADGRE2, ALPPL2, ANG2, BCMA, CD44V6, CEA, CEAC, CEACAM5, CLDN6, CLDN18, CLEC12A, cMET, CTLA-4, EGF1R, EGFR-vIII, EGP-2, EGP-40, EphA2, ENPP3, EpCAM, ERBB2, ERBB3, ERBB4, FBP, AChR, FR알파, GPR143, GRM8, gGPC3, 강글리오사이드 GD2, 강글리오사이드 GD3, HER1, HER2, HER3, 인테그린 B7, ICAM-l, hTERT, IL-l3R-a2, K-경쇄, KDR, 루이스-Y, LECT1, L1CAM, LPAR3, MAGE-A1, MSLN, MUC1, MUC16, MAGE-A3, p53, MART1, GPl00, PR1, EphA2, NKG2D 리간드, NY-ESO-1, h5T4, PSMA, PDL-1, ROR1, TPBG, TAG-72, TROP-2, TYR, 서바이빈, VEGF-R2, WT-1, LILRB2, PRAME, TRBC1, TRBC2, 및 TIM-3으로 이루어진 군으로부터 선택되는, 방법.
  150. 제147항 또는 제148항에 있어서, 상기 CAR은 선형 항체, 단일 도메인 항체(sdAb), 및 단일-사슬 가변 단편(scFv)으로 이루어진 군으로부터 선택되는 항원 결합 도메인을 포함하는, 방법.
  151. 제150항에 있어서, 상기 항원 결합 도메인은 표 5에 제시된 서열로 이루어진 군으로부터 선택되는 가변 중쇄(VH)와 가변 경쇄(VL) 및/또는 중쇄 CDR과 경쇄 CDR을 포함하는 scFv인, 방법.
  152. 제151항에 있어서, 상기 scFv의 VH, VL, 및/또는 CDR은 하나 이상의 아미노산 변형을 가지며, scFv는 종양 항원에 대해 결합 친화도를 유지하고, 변형은 치환, 결실, 및 삽입으로 이루어진 군으로부터 선택되는, 방법.
  153. 제147항 내지 제152항 중 어느 한 항에 있어서, 상기 CAR은 적어도 하나의 세포내 신호전달 도메인을 추가로 포함하는, 방법.
  154. 제153항에 있어서, 상기 적어도 하나의 세포내 신호전달 도메인은 CD247 분자(CD3-제타), CD27 분자(CD27), CD28 분자(CD28), TNF 수용체 슈퍼계열 구성원 9(4-1BB), 유도적 T 세포 공동자극자(ICOS), 또는 TNF 수용체 슈퍼계열 구성원 4(OX40)로부터 단리되거나 유래되는 적어도 하나의 세포내 신호전달 도메인을 포함하는, 방법.
  155. 제154항에 있어서, 상기 적어도 하나의 세포내 신호전달 도메인은
    a. CD3-제타 세포내 신호전달 도메인;
    b. CD3-제타 세포내 신호전달 도메인 및 4-1BB 또는 CD28 세포내 신호전달 도메인;
    c. CD-제타 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD28 세포내 신호전달 도메인;
    d. CD-제타 세포내 신호전달 도메인, CD28 세포내 신호전달 도메인, 4-1BB 세포내 신호전달 도메인, 및 CD27 또는 OX40 세포내 신호전달 도메인을 포함하는, 방법.
  156. 제147항 내지 제155항 중 어느 한 항에 있어서, 상기 CAR은 세포외 힌지 도메인을 추가로 포함하는, 방법.
  157. 제156항에 있어서, 상기 힌지 도메인은 면역글로불린 유사 도메인인, 방법.
  158. 제157항에 있어서, 상기 힌지 도메인은 IgG1, IgG2, 또는 IgG4로부터 단리되거나 유래되는, 방법.
  159. 제157항에 있어서, 상기 힌지 도메인은 CD8a 분자(CD8) 또는 CD28로부터 단리되거나 유래되는, 방법.
  160. 제147항 내지 제159항 중 어느 한 항에 있어서, 상기 CAR은 막관통 도메인을 추가로 포함하는, 방법.
  161. 제160항에 있어서, 상기 막관통 도메인은 CD3-제타, CD4, CD8, 및 CD28로 이루어진 군으로부터 단리되거나 유래되는, 방법.
  162. 제148항 내지 제161항 중 어느 한 항에 있어서, 상기 TCR은 TCR 알파, TCR 베타, CD3-델타, CD3-입실론, CD-감마 또는 CD3-제타로 이루어진 군으로부터 선택되는 하나 이상의 하위단위를 포함하는, 방법.
  163. 제162항에 있어서, 상기 TCR은 세포내 신호전달 도메인으로부터 자극성 도메인을 포함하는 세포내 도메인을 추가로 포함하는, 방법.
  164. 제162항 또는 제163항에 있어서, 상기 TCR의 항원 결합 도메인은 TCR 알파 또는 TCR 베타 하위단위에 작동적으로 연결되는, 방법.
  165. 제164항에 있어서, 상기 TCR의 항원 결합 도메인은 표 5에 제시된 서열로 이루어진 군으로부터 선택되는 가변 중쇄(VH)와 가변 경쇄(VL) 및/또는 중쇄 CDR과 경쇄 CDR을 포함하는 scFv인, 방법.
  166. 제165항에 있어서, 상기 scFv의 VH, VL, 및/또는 CDR은 하나 이상의 아미노산 변형을 가지며, scFv는 종양 항원에 대해 결합 친화도를 유지하고, 변형은 치환, 결실, 및 삽입으로 이루어진 군으로부터 선택되는, 방법.
  167. 제147항 내지 제166항 중 어느 한 항에 있어서, IL-7, IL-12, IL-15, 및 IL-18로 이루어진 군으로부터 선택되는 면역 자극성 사이토카인을 인코딩하는 폴리뉴클레오타이드를 면역 세포 내로 도입하는 단계를 추가로 포함하는, 방법.
  168. 제138항 내지 제167항 중 어느 한 항에 있어서, 적절한 성장 조건 하에 적절한 배지에서의 시험관내 배양에 의해 상기 세포의 집단을 확장(expand)시키는 단계를 추가로 포함하는, 방법.
  169. 제138항 내지 제168항 중 어느 한 항에 있어서, 상기 세포는 세포를 수용하기 위한 대상체에 대해 자가유래(autologous)인, 방법.
  170. 제138항 내지 제168항 중 어느 한 항에 있어서, 상기 세포는 세포를 수용하기 위한 대상체에 대해 동종이계(allogeneic)인, 방법.
  171. 제138항 내지 제170항 중 어느 한 항에 있어서, 상기 대상체는 암 또는 자가면역 질환을 갖고 있는, 방법.
  172. 제171항에 있어서, 상기 암은 결장암, 직장암, 신세포 암종, 간암, 폐의 비-소세포 암종, 소장암, 식도암, 흑색종, 골암, 전립선암, 피부암, 두경부암, 피부 또는 안구내 악성 흑색종, 자궁암, 난소암, 직장암, 항문 영역의 암, 위암, 고환암, 나팔관 암종, 자궁내막 암종, 자궁경부 암종, 질 암종, 외음 암종, 호지킨 질환, 비-호지킨 림프종, 내분비계암, 갑상선암, 부갑상선암, 부신암, 연조직 육종, 요도암, 음경암, 소아의 고형 종양, 방광암, 신장 또는 수뇨관의 암, 신우 암종, 중추신경계(CNS)의 신생물, 원발성 CNS 림프종, 종양 혈관신생, 척추 종양, 뇌간 신경교종, 뇌하수체 선종, 카포시 육종, 유표피암, 편평 세포암, T-세포 림프종, 환경적으로 유도된 암, 만성 림프구성 백혈병(CLL), 급성 백혈병, 급성 림프성 백혈병(ALL), B-세포 급성 림프성 백혈병(B-ALL), T-세포 급성 림프성 백혈병(T-ALL), 만성 골수구성 백혈병(CML), 급성 골수성 백혈병(AML), B 세포 전림프구성 백혈병, 모구 형질세포양 수지상 세포 신생물, 버킷 림프종, 미만성 거대 B 세포 림프종, 소포성 림프종, 털세포 백혈병, 소세포- 또는 거대 세포-소포성 림프종, 악성 림프증식성 병태, MALT 림프종, 맨틀 세포 림프종, 변연부 림프종, 다발성 골수종, 골수이형성증 및 골수이형성 증후군, 호지킨 림프종, 형질모세포성 림프종, 형질세포양 수지상 세포 신생물, 발덴스트롬 거대글로불린혈증, 전백혈병, 상기 암들의 조합, 및 상기 암들의 전이성 병변으로 이루어진 군으로부터 선택되는, 방법.
  173. 제171항 또는 제172항에 있어서, 상기 암은 종양 세포 항원을 발현하는, 방법.
  174. 제173항에 있어서, 상기 CAR은 종양 세포 항원에 대해 특이적인 결합 친화도를 갖는, 방법.
  175. 제174항에 있어서, CAR이 종양 항원에 결합 시, 상기 세포는 i) 활성화되는 반응; ii) 세포의 증식을 유도하는 반응; iii) 세포에 의한 사이토카인 분비를 유도하는 반응; iv) 상기 종양 항원을 보유하는 세포의 세포독성을 유도하는 반응; 또는 v) (i) 내지 (iv) 중 임의의 하나의 조합을 할 수 있는, 방법.
  176. 제138항 내지 제175항 중 어느 한 항에 있어서, 상기 세포는 뇌실질내, 정맥내, 동맥내, 뇌실내, 수조내, 수막공간내, 두개내, 요추, 복강내, 피하, 안구내, 안구주위, 망막하, 유리체내, 폐내, 및 비강내, 및 이들의 조합으로부터 선택되는 투여 경로에 의해 대상체에게 투여되는, 방법.
  177. 제138항 내지 제176항 중 어느 한 항에 있어서, 치료적 유효량의 세포의 투여는 대상체에서 완전, 부분 또는 불완전 반응으로서 종양 위축; 진행 시간, 치료 실패까지의 시간, 바이오마커 반응; 무진행 생존율; 무질환 생존율; 재발까지의 시간; 전이까지의 시간; 전체 생존율의 시간; 삶의 질의 향상; 및 증상의 향상 중 하나 이상으로부터 선택되는, 질환과 관련된 임상적 매개변수 또는 종점에서의 향상을 초래하는, 방법.
  178. 제138항 내지 제177항 중 어느 한 항에 있어서, 상기 방법은 화학치료제를 투여하는 단계를 추가로 포함하는, 방법.
  179. 키트로서,
    a. 제1항 내지 제59항 중 어느 한 항의 CasX 시스템;
    b. 제63항 내지 제69항 중 어느 한 항의 벡터; 또는
    c. 제70항 내지 제72항 중 어느 한 항의 VLP
    를 포함하고, 부형제 및 용기를 추가로 포함하는, 키트.
  180. 제179항에 있어서, 완충제, 뉴클레아제 저해제, 프로테아제 저해제, 리포솜, 치료제, 표지, 표지 시각화 시약(label visualization reagent), 또는 이들 중 임의의 조합을 추가로 포함하는, 키트.
  181. 제1항 내지 제54항 중 어느 한 항, 제60항 내지 제62항 중 어느 한 항, 제63항 내지 제69항 중 어느 한 항, 제70항 내지 제72항 중 어느 한 항, 또는 제121항 내지 제127항 중 어느 한 항에 있어서, 질환 또는 장애의 치료용 약제로서 사용하기 위한, CasX:gNA 시스템, 폴리뉴클레오타이드, 벡터, VLP, 또는 세포의 집단.
  182. 제1항 내지 제54항 중 어느 한 항, 제60항 내지 제62항 중 어느 한 항, 제63항 내지 제69항 중 어느 한 항, 제70항 내지 제72항 중 어느 한 항, 또는 제121항 내지 제127항 중 어느 한 항에 있어서, 치료를 필요로 하는 대상체에서 질환 또는 장애의 치료 방법에 사용하기 위한, CasX:gNA 시스템, 폴리뉴클레오타이드, 벡터, VLP, 또는 세포의 집단.
  183. 제181항 또는 제182항에 있어서, 상기 질환 또는 장애는 암 또는 자가면역 질환인, CasX:gNA 시스템, 폴리뉴클레오타이드, 벡터, VLP 또는 세포의 집단.
  184. 항원 가공, 항원 제시, 항원 인식, 및/또는 항원 반응에 관여하는 단백질을 인코딩하는 유전자의 표적 가닥 내의 표적 핵산 서열에 상보적인 표적화 서열을 포함하는 가이드 핵산(gNA)으로서, 상기 gNA는 상보적인 비-표적 가닥에 TC 모티프를 포함하는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 서열에 특이적인 CRISPR 단백질과 복합체를 형성할 수 있고, 상기 PAM 서열은 표적 가닥의 표적 핵산 서열에 상보적인 비-표적 가닥 내 서열의 1개 뉴클레오타이드 5'에 위치하는, gNA.
  185. 제184항에 있어서, 상기 CRISPR 단백질은 TC PAM 서열에 특이적인, gNA.
  186. 제184항에 있어서, 상기 CRISPR 단백질은 TTC PAM 서열에 특이적인, gNA.
  187. 제184항에 있어서, 상기 CRISPR 단백질은 ATC PAM 서열에 특이적인, gNA.
  188. 제184항에 있어서, 상기 CRISPR 단백질은 CTC PAM 서열에 특이적인, gNA.
  189. 제184항에 있어서, 상기 CRISPR 단백질은 GTC PAM 서열에 특이적인, gNA.
  190. 제184항 내지 제189항 중 어느 한 항에 있어서, 상기 표적화 서열은 gNA의 3' 단부(end)에 위치하는, gNA.
  191. 제184항 내지 제190항 중 어느 한 항에 있어서, 상기 CRISPR 단백질은 유형 V CRISPR 단백질인, gNA.
  192. 제184항 내지 제191항 중 어느 한 항에 있어서, 상기 단백질은 면역 세포 표면 마커인, gNA 서열.
  193. 제184항 내지 제191항 중 어느 한 항에 있어서, 상기 단백질은 면역 체크포인트 단백질인, gNA 서열.
  194. 제184항 내지 제191항 중 어느 한 항에 있어서, 상기 단백질은 세포내 단백질인, gNA 서열.
  195. 제184항 내지 제191항 중 어느 한 항에 있어서, 상기 단백질은 베타-2-마이크로글로불린(B2M), T 세포 수용체 알파 사슬 불변 영역(TRAC), 클래스 II 주 조직적합성 복합체 트랜스활성자(CIITA), T 세포 수용체 베타 불변 1(TRBC1), T 세포 수용체 베타 불변 2(TRBC2), 인간 백혈구 항원 A(HLA-A), 인간 백혈구 항원 B(HLA-B), TGFβ 수용체 2(TGFβRII), 프로그래밍된 세포 사멸 1(PD-1), 사이토카인 유도적 SH2(CISH), 림프구 활성화 3(LAG-3), Ig 및 ITIM 도메인을 갖는 T 세포 면역수용체(TIGIT), 아데노신 A2a 수용체(ADORA2A), 살해 세포 렉틴 유사 수용체 C1(NKG2A), 세포독성 T-림프구-관련 단백질 4(CTLA-4), T-세포 면역글로불린 및 뮤신 도메인 3(TIM-3), 및 2B4(CD244)로 이루어진 군으로부터 선택되는, gNA 서열.
  196. 제195항에 있어서, 상기 단백질은 B2M인, gNA.
  197. 제196항에 있어서, 상기 gNA의 표적화 서열은 SEQ ID NO: 725-2100, 2281-7085, 547-551, 591-595 및 614-681로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, gNA.
  198. 제196항에 있어서, 상기 gNA의 표적화 서열은 SEQ ID NO: 725-2100, 2281-7085, 547-551, 591-595 및 614-681로 이루어진 군으로부터 선택되는 서열을 포함하는, gNA.
  199. 제195항에 있어서, 상기 단백질은 TRAC인, gNA.
  200. 제199항에 있어서, 상기 gNA의 표적화 서열은 SEQ ID NO: 7086-27454, 522-529 및 566-573으로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, gNA.
  201. 제199항에 있어서, 상기 gNA의 표적화 서열은 SEQ ID NO: 7086-27454, 522-529 및 566-573로 이루어진 군으로부터 선택되는 서열을 포함하는, gNA.
  202. 제195항에 있어서, 상기 단백질은 CIITA인, gNA.
  203. 제202항에 있어서, 상기 gNA의 표적화 서열은 SEQ ID NO: 27455-55572로 이루어진 군으로부터 선택되는 서열, 또는 이와 적어도 약 65%, 적어도 약 75%, 적어도 약 85%, 또는 적어도 약 95%의 동일성을 갖는 서열을 포함하는, gNA.
  204. 제202항에 있어서, 상기 gNA의 표적화 서열은 SEQ ID NO: 27455-55572로 이루어진 군으로부터 선택되는 서열을 포함하는, gNA.
  205. 제184항 내지 제204항 중 어느 한 항에 있어서, 상기 gNA는가이드 RNA(gRNA)인, gNA.
  206. 제184항 내지 제204항 중 어느 한 항에 있어서, 상기 gNA는가이드 DNA(gDNA)인, gNA.
  207. 제184항 내지 제204항 중 어느 한 항에 있어서, 상기 gNA는 DNA 및 RNA를 포함하는 키메라인, gNA.
  208. 제184항 내지 제204항 중 어느 한 항에 있어서, 상기 gNA는 단일-분자 gNA(sgNA)인, gNA.
  209. 제184항 내지 제208항 중 어느 한 항에 있어서, 상기 gNA는 이중-분자 gNA(dgNA)인, gNA.
  210. 제184항 내지 제209항 중 어느 한 항에 있어서, 상기 gNA의 표적화 서열은 15, 16, 17, 18, 19, 또는 20개의 뉴클레오타이드를 포함하는, gNA.
  211. 제184항 내지 제210항 중 어느 한 항에 있어서, 상기 gNA는 SEQ ID NO: 4-16의 기준 gNA 서열 또는 SEQ ID NO: 2101-2280의 gNA 변이체 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 또는 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택되는 서열을 포함하는 스캐폴드를 갖는, gNA.
  212. 제211항에 있어서, gNA 변이체 스캐폴드는 SEQ ID NO: 4-16으로 이루어진 군으로부터 선택되는 기준 gNA 서열에 비해 적어도 하나의 변형을 갖는 서열을 포함하는, gNA.
  213. 제212항에 있어서, 상기 기준 gNA의 적어도 하나의 변형은 gNA 서열의 뉴클레오타이드의 적어도 하나의 치환, 결실, 또는 치환을 포함하는, gNA.
  214. 제184항 내지 제213항 중 어느 한 항에 있어서, 상기 gNA는 화학적으로 변형되는, gNA.
  215. 제184항 내지 제214항 중 어느 한 항에 있어서, 상기 gNA는 클래스 II 유형 V CRISPR-Cas 단백질과 리보핵 단백질 복합체(RNP)를 형성할 수 있는, gNA.
  216. 제215항에 있어서, 상기 클래스 II 유형 V CRISPR-Cas 단백질은 SEQ ID NO: 1-3 중 임의의 하나를 포함하는 단백질, SEQ ID NO: 49-143, 438, 440, 442, 444, 446, 448-460, 472, 474, 478, 480, 482, 484, 486, 488, 490, 612 또는 613의 서열, 또는 이와 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 서열을 포함하는 단백질로부터 선택되는, gNA.
  217. 클래스 II 유형 V CRISPR 단백질로서, 20 pM 이하의 농도에서 CRISPR 단백질과 gNA를 포함하는 RNP는 이중 가닥 DNA 표적을 적어도 80%의 효율로 절단할 수 있는 것인, 클래스 II 유형 V CRISPR 단백질.
KR1020227011467A 2019-09-09 2020-09-09 면역치료법에 사용하기 위한 조성물 및 방법 KR20220070456A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962897947P 2019-09-09 2019-09-09
US62/897,947 2019-09-09
US202063075041P 2020-09-04 2020-09-04
US63/075,041 2020-09-04
PCT/US2020/050008 WO2021050601A1 (en) 2019-09-09 2020-09-09 Compositions and methods for use in immunotherapy

Publications (1)

Publication Number Publication Date
KR20220070456A true KR20220070456A (ko) 2022-05-31

Family

ID=72644925

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227011467A KR20220070456A (ko) 2019-09-09 2020-09-09 면역치료법에 사용하기 위한 조성물 및 방법

Country Status (9)

Country Link
US (1) US20230081117A1 (ko)
EP (1) EP4028523A1 (ko)
JP (1) JP2022547168A (ko)
KR (1) KR20220070456A (ko)
CN (1) CN114729368A (ko)
AU (1) AU2020344553A1 (ko)
CA (1) CA3153700A1 (ko)
IL (1) IL291176A (ko)
WO (1) WO2021050601A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3163714A1 (en) * 2020-01-10 2021-07-15 Benjamin OAKES Compositions and methods for the targeting of pcsk9
CN113151470A (zh) * 2021-04-26 2021-07-23 暨南大学 多基因联合在制备预测aml预后试剂盒中的应用
CN113209019B (zh) * 2021-05-11 2022-03-15 西北工业大学 Nk细胞协同刺激聚合物胶束的制备方法及应用
WO2022242701A1 (en) * 2021-05-20 2022-11-24 Wuxi Biologics (Shanghai) Co., Ltd. Genetically modified gamma-delta t cells and uses thereof
WO2022261150A2 (en) 2021-06-09 2022-12-15 Scribe Therapeutics Inc. Particle delivery systems
CN114164234A (zh) * 2021-11-30 2022-03-11 东莞市麦亘生物科技有限公司 利用CRISPR/Cas9技术构建可靶向MSLN新型CAR-T细胞的方法
WO2023167752A2 (en) * 2021-12-09 2023-09-07 The Broad Institute, Inc. Small novel crispr-cas systems and methods of use thereof
WO2023151620A1 (zh) * 2022-02-09 2023-08-17 恺兴生命科技(上海)有限公司 用于细胞免疫学的组合物和方法
WO2023235818A2 (en) * 2022-06-02 2023-12-07 Scribe Therapeutics Inc. Engineered class 2 type v crispr systems
WO2023235888A2 (en) 2022-06-03 2023-12-07 Scribe Therapeutics Inc. COMPOSITIONS AND METHODS FOR CpG DEPLETION
WO2023240027A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Particle delivery systems
WO2023240074A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
EP4314267A1 (en) 2022-06-07 2024-02-07 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
WO2023240162A1 (en) 2022-06-08 2023-12-14 Scribe Therapeutics Inc. Aav vectors for gene editing
CN117343153A (zh) * 2023-04-18 2024-01-05 上海本导基因技术有限公司 一种用于治疗亨廷顿疾病的慢病毒样颗粒
CN116732099B (zh) * 2023-08-07 2023-11-24 北赛泓升(北京)生物科技有限公司 一种干细胞多重CRISPR/Cas基因组编辑方法

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR901228A (fr) 1943-01-16 1945-07-20 Deutsche Edelstahlwerke Ag Système d'aimant à entrefer annulaire
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5199942A (en) 1991-06-07 1993-04-06 Immunex Corporation Method for improving autologous transplantation
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5641870A (en) 1995-04-20 1997-06-24 Genentech, Inc. Low pH hydrophobic interaction chromatography for antibody purification
US5695937A (en) 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US6451995B1 (en) 1996-03-20 2002-09-17 Sloan-Kettering Institute For Cancer Research Single chain FV polynucleotide or peptide constructs of anti-ganglioside GD2 antibodies, cells expressing same and related methods
WO2000023573A2 (en) 1998-10-20 2000-04-27 City Of Hope Cd20-specific redirected t cells and their use in cellular immunotherapy of cd20+ malignancies
US20020131960A1 (en) 2000-06-02 2002-09-19 Michel Sadelain Artificial antigen presenting cells and methods of use thereof
WO2002077029A2 (en) 2000-11-07 2002-10-03 City Of Hope Cd19-specific redirected immune cells
US7070995B2 (en) 2001-04-11 2006-07-04 City Of Hope CE7-specific redirected immune cells
US20090257994A1 (en) 2001-04-30 2009-10-15 City Of Hope Chimeric immunoreceptor useful in treating human cancers
US7446190B2 (en) 2002-05-28 2008-11-04 Sloan-Kettering Institute For Cancer Research Nucleic acids encoding chimeric T cell receptors
US20050129671A1 (en) 2003-03-11 2005-06-16 City Of Hope Mammalian antigen-presenting T cells and bi-specific T cells
US8479118B2 (en) 2007-12-10 2013-07-02 Microsoft Corporation Switching search providers within a browser search box
JP5173594B2 (ja) 2008-05-27 2013-04-03 キヤノン株式会社 管理装置、画像形成装置及びそれらの処理方法
WO2010075303A1 (en) 2008-12-23 2010-07-01 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Splicing factors with a puf protein rna-binding domain and a splicing effector domain and uses of same
US9580714B2 (en) 2010-11-24 2017-02-28 The University Of Western Australia Peptides for the specific binding of RNA targets
JP5947311B2 (ja) 2010-12-09 2016-07-06 ザ トラスティーズ オブ ザ ユニバーシティ オブ ペンシルバニア 癌を治療するためのキメラ抗原受容体改変t細胞の使用
MX359513B (es) 2011-03-23 2018-10-01 Hutchinson Fred Cancer Res Metodo y composiciones para inmunoterapia celular.
US8398282B2 (en) 2011-05-12 2013-03-19 Delphi Technologies, Inc. Vehicle front lighting assembly and systems having a variable tint electrowetting element
CN107011426B (zh) 2011-11-11 2021-05-14 弗雷德哈钦森癌症研究中心 针对癌症的靶向细胞周期蛋白a1的t细胞免疫疗法
EP2814846B1 (en) 2012-02-13 2020-01-08 Seattle Children's Hospital d/b/a Seattle Children's Research Institute Bispecific chimeric antigen receptors and therapeutic uses thereof
WO2013126726A1 (en) 2012-02-22 2013-08-29 The Trustees Of The University Of Pennsylvania Double transgenic t cells comprising a car and a tcr and their methods of use
NZ702108A (en) 2012-05-03 2016-09-30 Hutchinson Fred Cancer Res Enhanced affinity t cell receptors and methods for making the same
RU2700765C2 (ru) 2012-08-20 2019-09-19 Фред Хатчинсон Кансэр Рисёч Сентер Способ и композиции для клеточной иммунотерапии
PT2981607T (pt) 2013-04-03 2020-11-20 Memorial Sloan Kettering Cancer Center Geração eficaz de células t direcionadas a tumores, derivadas de células estaminais pluripotentes
US10968253B2 (en) * 2015-10-20 2021-04-06 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods and products for genetic engineering
EP3374494A4 (en) 2015-11-11 2019-05-01 Coda Biotherapeutics, Inc. CRISPR COMPOSITIONS AND METHODS OF USE FOR GENE THERAPY
JP2019506875A (ja) * 2016-02-23 2019-03-14 アーク バイオ, エルエルシー 標的検出のための方法および組成物
CN109843915B (zh) 2016-05-06 2023-03-03 朱诺治疗学股份有限公司 基因工程化细胞及其制备方法
LT3474669T (lt) * 2016-06-24 2022-06-10 The Regents Of The University Of Colorado, A Body Corporate Barkodu pažymėtų kombinatorinių bibliotekų generavimo būdai
US11873504B2 (en) * 2016-09-30 2024-01-16 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
CA3038839A1 (en) * 2016-10-12 2018-04-19 Feldan Bio Inc. Rationally-designed synthetic peptide shuttle agents for delivering polypeptide cargos from an extracellular space to the cytosol and/or nucleus of a target eukaryotic cell, uses thereof, methods and kits relating to same
US9982267B2 (en) * 2016-10-12 2018-05-29 Feldan Bio Inc. Rationally-designed synthetic peptide shuttle agents for delivering polypeptide cargos from an extracellular space to the cytosol and/or nucleus of a target eukaryotic cell, uses thereof, methods and kits relating to same
JP2020505025A (ja) * 2017-01-13 2020-02-20 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 免疫工学的な改変をした多能性細胞
WO2018195555A1 (en) 2017-04-21 2018-10-25 The Board Of Trustees Of The Leland Stanford Junior University Crispr/cas 9-mediated integration of polynucleotides by sequential homologous recombination of aav donor vectors
EP3441461A1 (en) * 2017-08-11 2019-02-13 Baylor College of Medicine Cd1d-restricted nkt cells as a platform for off-the-shelf cancer immunotherapy
US11718659B2 (en) * 2017-08-28 2023-08-08 The Trustees Of Columbia University In The City Of New York CD33 exon 2 deficient donor stem cells for use with CD33 targeting agents
CA3074872A1 (en) * 2017-09-07 2019-03-14 The Board Of Trustees Of The Leland Stanford Junior University Nuclease systems for genetic engineering
KR20200097760A (ko) * 2017-12-11 2020-08-19 에디타스 메디신, 인코포레이티드 유전자 편집을 위한 cpf1-관련 방법 및 조성물
US20210115475A1 (en) * 2018-01-30 2021-04-22 Editas Medicine, Inc. Systems and methods for modulating chromosomal rearrangements

Also Published As

Publication number Publication date
US20230081117A1 (en) 2023-03-16
AU2020344553A1 (en) 2022-04-07
JP2022547168A (ja) 2022-11-10
CA3153700A1 (en) 2021-03-18
CN114729368A (zh) 2022-07-08
EP4028523A1 (en) 2022-07-20
IL291176A (en) 2022-05-01
WO2021050601A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
US20230081117A1 (en) Compositions and methods for use in immunotherapy
US20240026385A1 (en) Engineered class 2 type v crispr systems
US11535835B1 (en) Compositions and methods for the targeting of rhodopsin
US20230032369A1 (en) Compositions and methods for the targeting of htt
KR20220032050A (ko) 조작된 casx 시스템
US11613742B2 (en) Compositions and methods for the targeting of SOD1
AU2021237633A1 (en) Compositions and methods for the targeting of C9orf72
US20230167424A1 (en) Compositions and methods for the targeting of pcsk9
US20240026386A1 (en) Compositions and methods for the targeting of bcl11a
EP4351660A2 (en) Particle delivery systems
US20240100185A1 (en) Compositions and methods for the targeting of ptbp1
CN117120607A (zh) 工程化2类v型crispr系统
IL303360A (en) CRISPR systems engineered class 2 V type
WO2023240027A1 (en) Particle delivery systems
JP2024503249A (ja) 部位特異的変異導入のための組成物及び方法