KR20230157387A - Cas 효소를 이용한 다중 편집 - Google Patents

Cas 효소를 이용한 다중 편집 Download PDF

Info

Publication number
KR20230157387A
KR20230157387A KR1020237034371A KR20237034371A KR20230157387A KR 20230157387 A KR20230157387 A KR 20230157387A KR 1020237034371 A KR1020237034371 A KR 1020237034371A KR 20237034371 A KR20237034371 A KR 20237034371A KR 20230157387 A KR20230157387 A KR 20230157387A
Authority
KR
South Korea
Prior art keywords
sequence
rna
target
endonuclease
locus
Prior art date
Application number
KR1020237034371A
Other languages
English (en)
Inventor
브라이언 토마스
크리스토퍼 브라운
아우드라 데보토
크리스티나 버터필드
리사 알렉산더
다니엘라 에스 에이 골츠만
그레그 코스트
레베카 라모스
디에고 에스피노사
Original Assignee
메타지노미, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메타지노미, 인크. filed Critical 메타지노미, 인크.
Publication of KR20230157387A publication Critical patent/KR20230157387A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/72Receptors; Cell surface antigens; Cell surface determinants for hormones
    • C07K14/721Steroid/thyroid hormone superfamily, e.g. GR, EcR, androgen receptor, oestrogen receptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Endocrinology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Graft Or Block Polymers (AREA)

Abstract

Cas 효소를 사용하는 다중 편집 또는 Cas 효소를 사용하는 T 세포 또는 관련 세포의 편집을 위한 방법, 조성물 및 시스템이 본원에 기술된다.

Description

CAS 효소를 이용한 다중 편집
상호 참조
본 출원은 2021년 3월 19일에 "MULTIPLEX EDITING WITH CAS ENZYMES"이란 발명의 명칭으로 출원된 미국 특허 가출원 제63/163,510호; 2021년 5월 10일에 "MULTIPLEX EDITING WITH CAS ENZYMES"이란 발명의 명칭으로 출원된 미국 특허 가출원 제63/186,506호; 및 2021년 9월 8일에 "MULTIPLEX EDITING WITH CAS ENZYMES"라는 발명의 명칭으로 출원된 미국 특허 가출원 제63/241,916호의 이익을 주장하며, 이들 각각은 그 전체가 참조로서 본원에 통합된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 동 서열 목록은 그 전체가 참조로서 본원에 통합된다. 2022년 3월 17일에 생성된 상기 ASCII 사본의 명칭은 55921-719-601-SL.txt이며, 크기는 70,612바이트이다.
Cas 효소는 이와 연관된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복서열(CRISPR) 가이드 리보 핵산(RNA)과 함께 원핵 면역 체계의 만연한(약 45%의 박테리아, 약 84%의 고세균) 구성요소인 것으로 보이는데, 이들은 CRISPR-RNA 가이드된 핵산 절단에 의해 비자기 핵산, 예컨대 감염성 바이러스 및 플라스미드에 대해 이러한 미생물을 보호하는 역할을 한다. CRISPR RNA 요소를 암호화하는 데옥시리보핵산(DNA) 요소는 구조 및 길이가 비교적 보존될 수 있지만, 이들의 CRISPR-연관(Cas) 단백질은 매우 다양하며, 매우 다양한 핵산-상호 작용 도메인을 함유한다. CRISPR DNA 요소는 1987년 초에 관찰되었지만, CRISPR/Cas 복합체의 프로그램 가능한 엔도뉴클레아제 절단 능력은 비교적 최근에 인식되었고, 이는 다양한 DNA 조작 및 유전자 편집 응용에서 재조합 CRISPR/Cas 시스템의 사용으로 이어지고 있다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체로서, (i) 클래스 2, II형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, 클래스 2, II형 Cas 엔도뉴클레아제 복합체; (b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서, (i) 클래스 2, V형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함한다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 방법은 전술한 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 전술한 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만의 빈도로 파괴된다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 10 내지 15 중 어느 하나, 이의 보체 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 알부민(ALB) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 17 내지 19 중 어느 하나, 이의 보체 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1(Nuclear Receptor Subfamily 3 Group C Member 1, NR3C1) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 이의 보체 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 방법은, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 편집은 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입을 포함한다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법을 제공하며, 방법은, T 세포 또는 이의 전구체에: (a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및 (ii) 전술한 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체, 및 (b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제2 RNA 가이드 엔도뉴클레아제; 및 (ii) 전술한 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 TCR 유전자좌의 전술한 적어도 일부는 전술한 T-세포 유전자좌 내에 있다. 일부 구현예에서, 방법은, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 이종 조작된 T-세포 수용체는 CAR 분자이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌이다. 일부 구현예에서, 전술한 상동 아암은 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부에 인접한 전술한 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함한다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAC의 제1 또는 제3 엑손이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 전술한 TCR 유전자좌 및 전술한 NR3C1 유전자좌의 게놈 서열을 파괴한다. 일부 구현예에서, 전술한 효율은 전술한 TCR 및 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정된다. 일부 구현예에서, 전술한 NR3C1 유전자좌의 전술한 적어도 일부는 엑손 2 또는 엑손 3이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산한다. 일부 구현예에서, 전술한 방법은 (a) 내지 (c)를 전술한 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는, 서열번호 3, 6, 또는 9 중 어느 하나, 이의 보체, 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재한다. 일부 구현예에서, 전술한 T-세포 또는 전술한 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다. 일부 구현예에서, 전술한 제2 스페이서 서열은, 서열번호 16, 20, 21, 또는 22 중 어느 하나, 이의 보체, 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함한다. 일부 구현예에서, 전술한 공여자 DNA 서열은 바이러스 벡터로 전달된다. 일부 구현예에서, 전술한 바이러스 벡터는 AAV 또는 AAV-6 벡터이다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 T 세포 또는 이의 전구체의 집단을 제공하며, 집단은: (a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열을 포함한다. 일부 구현예에서, T 세포 또는 이의 전구체는 (b) 인델을 포함하는 NR3C1 유전자좌를 추가로 포함한다. 일부 구현예에서, 전술한 이종 서열은 인델이다. 일부 구현예에서, 전술한 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함한다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 세포의 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 세포의 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 전술한 세포 집단에는 염색체 전위가 실질적으로 없다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 제1 Cas 엔도뉴클레아제 복합체로서, (i) 제1 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제1 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제1 Cas 엔도뉴클레아제 복합체; (b) 제2 Cas 엔도뉴클레아제 복합체로서, (i) 제2 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제2 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제2 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에 (c) 제1 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제1 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제1 공여자 DNA 서열; (d) 제2 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제2 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제2 공여자 DNA 서열을 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 이식유전자 및 전술한 제2 이식유전자는 상이하다. 일부 구현예에서, 전술한 제1 표적 서열 또는 전술한 제2 표적 서열은 T-세포 수용체 유전자좌, TRAC, TRBC, NR3C1, 또는 AAVS1 유전자좌, 또는 이들의 임의의 조합 내의 표적 서열이다. 일부 구현예에서, 전술한 제1 또는 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합이다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암은 서열번호 42 또는 23을 포함하거나, 이에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암은 서열번호 43 또는 24를 포함하거나, 이에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는, 서열번호 3, 6, 또는 9 중 어느 하나, 이의 보체, 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 제2 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 22, 또는 41 중 어느 하나, 또는 이의 보체, 이의 보체 또는 이의 역방향 보체 중 어느 하나에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제 또는 클래스 2, V형 Cas 엔도뉴클레아제, 또는 이들의 임의의 조합을 포함한다.
일부 양태에서, 본 개시는 서열번호 63 내지 65 중 어느 하나의 서열을 포함하거나, 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는 단리된 핵산을 제공한다.
일부 양태에서, 본 개시는 본원에 기술된 서열 중 어느 하나, 이의 보체, 또는 이의 역방향 보체를 포함하는 단리된 핵산을 제공한다. 일부 구현예에서, 단리된 핵산은 가이드 RNA이다.
일부 양태에서, 본 개시는 본원에 기술된 핵산 서열 중 어느 하나를 포함하는 세포를 제공한다. 일부 구현예에서, 전술한 세포는 T-세포 또는 이의 전구체이다. 일부 구현예에서, 전술한 T-세포 또는 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다.
일부 구현예에서, 본 개시는 본원에 기술된 핵산 중 어느 하나를 포함하는 벡터를 제공한다. 일부 구현예에서, 전술한 벡터는 아데노-연관 바이러스(AAV)벡터이다. 일부 구현예에서, 전술한 AAV 벡터는 AAV-6 혈청형 벡터이다.
일부 양태에서, 본 개시는 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는 벡터를 제공한다. 일부 구현예에서, 벡터는 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 전술한 서열의 측면에 위치하는 이식유전자를 추가로 포함한다. 일부 구현예에서, 전술한 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 벡터는 서열번호 63의 tEGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함한다. 일부 구현예에서, 벡터는 서열번호 64의 tLNGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 포함한다. 일부 구현예에서, 벡터는 서열번호 63의 MND 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함한다. 일부 구현예에서, 벡터는 서열번호 64의 MSCV 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함한다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체 또는 폴리뉴클레오티드로서: (i) 클래스 2, II형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, II형 Cas 엔도뉴클레아제 복합체 또는 이를 암호화하는 폴리뉴클레오티드를 접촉시키거나 도입하는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에: (b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서: (i) 클래스 2, V형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키거나 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제는 아니다. 일부 구현예에서, 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 방법은 전술한 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 전술한 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단에 의해 결정 시, 0.01% 미만의 빈도로 파괴된다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석은, HTGTS 검정(고처리량, 게놈-와이트 전좌 시퀀싱; 예를 들어, Chiarle 등의 문헌[Cell. 2011 Sep 30;147(1):107-19. doi: 10.1016/j.cell.2011.07.049] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), LAM-HTGTS 검정(선형 증폭 매개 고처리량 게놈-와이드 시퀀싱; 예를 들어, Hu 등의 문헌[Nat Protoc. 2016. 11(5):853-71. doi:10.1038/nprot.2016.043] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), 또는 Digenome-Seq 검정(시험관 내 Cas-소화 전체 게놈 시퀀싱; 예를 들어, Kim 등의 문헌[Nat Methods. 2015. 12(3):237-43. doi:10.1038/nmeth.3284] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨))을 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 10 내지 15 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 방법은, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 편집은 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입을 포함한다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법을 제공하며, 방법은, T 세포 또는 이의 전구체에: (a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체, 또는 폴리뉴클레오티드로서: (i) 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및 (ii) 전술한 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체, 또는 이를 암호화하는 폴리뉴클레오티드 및 (b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체 또는 폴리뉴클레오티드로서로서: (i) 제2 RNA 가이드 엔도뉴클레아제; 및 (ii) 전술한 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체, 또는 이를 암호화하는 폴리뉴클레오티드를 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 TCR 유전자좌의 전술한 적어도 일부는 전술한 T-세포 유전자좌 내에 있다. 일부 구현예에서, 방법은, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 이종 조작된 T-세포 수용체는 CAR 분자이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌이다. 일부 구현예에서, 전술한 상동 아암은 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부에 인접한 전술한 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함한다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAC의 제1 또는 제3 엑손이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 전술한 TCR 유전자좌 및 전술한 NR3C1 유전자좌의 게놈 서열을 파괴한다. 일부 구현예에서, 전술한 효율은 전술한 TCR 및 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정된다. 일부 구현예에서, 전술한 NR3C1 유전자좌의 전술한 적어도 일부는 엑손 2 또는 엑손 3이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산한다. 일부 구현예에서, 전술한 방법은 (a) 내지 (c)를 전술한 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재한다. 일부 구현예에서, 전술한 T-세포 또는 전술한 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다. 일부 구현예에서, 전술한 제2 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함한다. 일부 구현예에서, 전술한 공여자 DNA 서열은 바이러스 벡터로 전달된다. 일부 구현예에서, 전술한 바이러스 벡터는 AAV 또는 AAV-6 벡터이다.
일부 양태에서, 본 개시는 T 세포의 집단을 제공하며, 집단은: (a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열 또는 서열번호 42의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열을 포함한다. 일부 구현예에서, T-세포의 집단은 (b) 인델을 포함하는 NR3C1 유전자좌를 추가로 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌 내의 전술한 인델은 전술한 T-세포에 대해 글루코코르티코이드-내성을 부여한다. 전술한 이종 서열의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열은 인델이다. 일부 구현예에서, 전술한 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함한다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 전술한 세포 집단에는 염색체 전위가 실질적으로 없다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 제1 Cas 엔도뉴클레아제 복합체 또는 폴리뉴클레오티드로서, (i) 제1 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제1 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제1 Cas 엔도뉴클레아제 복합체, 또는 이를 암호화하는 폴리뉴클레오티드; (b) 제2 Cas 엔도뉴클레아제 복합체로서, (i) 제2 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제2 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제2 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에 (c) 제1 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제1 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제1 공여자 DNA 서열; (d) 제2 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제2 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제2 공여자 DNA 서열을 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제2 이식유전자는 상이하다. 일부 구현예에서, 전술한 제1 표적 서열 또는 전술한 제2 표적 서열은 T-세포 수용체 유전자좌, TRAC, TRBC, NR3C1, 또는 AAVS1 유전자좌, 또는 이들의 임의의 조합 내의 표적 서열이다. 일부 구현예에서, 전술한 제1 또는 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 또는 이들의 임의의 조합이다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암은 서열번호 42 또는 23을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암은 서열번호 43 또는 24를 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 제2 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 22, 또는 41 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제 또는 클래스 2, V형 Cas 엔도뉴클레아제, 또는 이들의 임의의 조합을 포함한다.
본 개시의 추가 양태 및 이점은, 본 개시의 예시적인 구현예만이 도시되고 설명되는, 다음의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 인지하게 되겠지만, 본 개시는 다른 구현예 및 상이한 구현예가 가능하고, 본 개시의 몇몇 세부 사항은 다양한 명백한 측면에서 본 개시를 벗어나지 않고도 변형될 수 있다. 따라서, 도면 및 본 발명을 실시하기 위한 구체적인 내용은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 마치 각각의 개별 간행물, 특허, 또는 특허 출원이 참조에 의해 구체적으로 및 개별적으로 통합된 것으로 표시된 것과 동일한 정도로 참조에 의해 본원에 통합된다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에 명시되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 구현예가 제시되는 하기 발명을 실시하기 위한 구체적인 내용 및 첨부 도면을 참조함으로써 보다 잘 이해될 것이다.
도 1은 CAR-T 공여자 서열을 전달하는 AAV 벡터와 조합하여 본원에 기술된 Cas 엔도뉴클레아제를 사용하여 동종 CAR-T 세포를 생산하기 위한 개념도를 도시한다.
도 2는 Cas9 대조군과 함께 TRAC를 표적화하는 가이드 RNA를 함유하는 MG3-6, MG3-8, 및 MG29-1 RNP에 의한 TRAC에서의 인델 형성을 시험하는 실시예 1에서의 실험 결과를 도시한다. 좌측 패널은 차세대 시퀀싱(NGS)에 의해 측정된 인델의 형성%를 나타내고, 우측 패널은 유세포 계측법에 의해 평가된 세포 표현형(TCR+ 또는 TCR-)을 나타낸다.
도 3은 CAR-T 서열을 함유하는 AAV 공여자 벡터와 조합하여 TRAC를 표적화하는 본원에 기술된 RNP 뉴클레아제 복합체를 사용하여 표적화된 CAR-T 통합을 시험하는 실시예 1에서의 실험의 결과를 도시한다. CAR 항원 결합 도메인의 발현(y-축)과 함께 TCR 발현 상태(TCR- 또는 TCR+, x-축)를 나타내는 유세포 계측 플롯이 도시되어 있다. MG3-6, MG3-8, 및 MG29-1 모두에 대해 유사한 결과를 얻었다.
도 4는 실시예 2에 기술된 바와 같은 MG3-6 및 MG29-1 RNP 복합체의 조합을 사용한 2개의 유전자좌(하나는 TRAC임)의 다중 편집을 도시한다.
도 5는 실시예 2에 기술된 바와 같은 MG3-6 및 MG29-1 RNP 복합체의 조합을 사용한 3개의 유전자좌(하나는 TRAC임)의 다중 편집을 도시한다.
도 6은 AAVS1 유전자좌(A) 내로의 GR 이식유전자의 통합을 시험하기 위한 실시예 3에서와 같은 PCR 실험의 설계를 도시하고, 여기에서 아가로스 겔 사진(B 및 C)은 AAVS1 및 TRAC 유전자좌가 실시예 3에서와 같이 각각의 부위를 표적화하는 별도의 공여자 DNA에 대한 노출과 함께 상이한 Cas 효소를 사용하여 동시에 표적화된 실험의 결과를 도시한다. (B)는 T-세포가 GR 이식유전자 보유 AAV 작제물(레인 2 내지 5), GR 이식유전자 AAV 작제물/SpCas9 표적화 AAVS1/MG3-6-표적화 TRAC/CAR 이식유전자 AAV(레인 6 내지 9) 작제물, 또는 25K 다중성 감염(MOI)에서 AAVS1을 단독으로 표적화하는 GR AAV 작제물/SpCas9(레인 10 내지 13)에 노출된 조건 중 하나로부터의 GR 이식유전자의 증폭을 도시한다. (C)는 T-세포가 분석 대조군(모의 형질감염 또는 이식유전자가 없는 Cas 복합체; 레인 2 내지 4), AAVS1을 단독으로 표적화하는 50K MOI/SpCas9에서의 GR AAV 작제물(레인 5 내지 8), 또는 50K 다중성 감염(MOI)에서 AAVS1을 단독으로 표적화하는 100K MOI/SpCas9에서의 GR AAV 작제물(레인 9 내지 12)에 노출된 조건 중 하나로부터의 GR 이식유전자의 증폭을 도시한다. 결과는 추가적인 TRAC 유전자좌가 표적화되었는지의 여부와 상관없이 유사한 효율로 AAVS1 유전자좌 내에 통합된 GR 이식유전자를 나타낸다.
도 7은 실시예 3에서와 같이 각각의 부위를 표적화화는 별도의 공여자 DNA에 대한 노출과 함께 상이한 Cas 효소를 사용하여 AAVS1 및 TRAC 유전자좌가 동시에 표적화되는, 실시예 3에서의 실험의 결과를 도시하는 유세포 계측 플롯을 도시한다. 각각의 GR 이식 유전자를 보유하는 AAV가 AAVS1-표적화 SpCas9 복합체, TRAC-표적화 MG3-6 복합체, 및 CAR-보유 AAV와 함께 T-세포에 도입된 개별 플롯(A 내지 D)이 도시되어 있다. 결과는 TCR 녹아웃 및 CAR 통합이 모든 GR 이식유전자에서 유사하게 효율적이며, AAVS1 유전자좌의 동시 표적화에도 불구하고 높다(51.31% 내지 61.1% 효율)는 것을 나타낸다.
도 8은 실시예 4에서와 같이 SpCas9("Cas9")와 함께 MG3-6, MG3-8, 및 MG29-1 엔도뉴클레아제의 오프-타겟 특이성을 평가하기 위해 수행된 게놈-와이드 오프-타겟 이중 가닥 절단 분석 검정의 결과를 도시한다.
도 9는 활성 전장 TCR을 만드는 델타, 감마 및 엡실론 사슬의 어셈블리를 도시한다.
도 10은 인델을 함유하는 표적화된 유전자좌에서의 서열의 백분율로 평가된 바와 같은, 실시예 5에 기술된 바와 같은 일차 T 세포에서의 다중 TRAC/TRBC 편집을 나타낸다. 결과는, 두 부위가 동시에 표적화될 때 두 부위에서의 높은 빈도의 파괴를 나타낸다.
도 11은 실시예 6에 기술된 단일 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한다. TCR 및 B2M(TCR- B2M- DKO, TCR- B2M+, TCR+ B2M-, 및 TCR+ B2M+)의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 막대 그래프가 도시되어 있다. 그래프는: (a) 가장 효율적인 TCR 녹아웃을 생성하는 MG3-6 TRAC6 및 MG3-6 TRBC E2 sgRNA을 사용하여, 모든 TCR 표적화 조건이 TCR 녹아웃을 효율적으로 생산하였고; (b) 가장 효율적인 B2M 녹아웃을 생성하는 B2M H1 및 B2M D2를 사용하여, 모든 B2M 표적화 조건이 B2M 녹아웃을 생성하였음을 도시한다.
도 12는 실시예 7에 기술된 이중 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M 및 TRAC 조건을 사용하되, 이들을 조합하여 사용한다. TCR 및 B2M(TCR- B2M- DKO, TCR- B2M+, TCR+ B2M-, 및 TCR+ B2M+)의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 막대 그래프가 도시되어 있다. 그래프는 가장 효율적인 이중 표적화 조건이 MG29-1 B2M H1, D2, 또는 A3 조건을 갖는 MG3-6 TRAC6 조건을 포함하는, A4, B4, 및 C4라는 것을 도시한다. 가장 효율적인 이중 표적화 조건은, MG3-6 TRAC6 sgRNA 및 MG29-1 B2M D2 sgRNA를 사용한 B4인 것으로 나타났다.
도 13은 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M, TRAC 및 TRBC 조건을 사용하되, 이들을 조합하여 사용한다.
도 14는 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 DNA 수준에서의 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M, TRAC 및 TRBC 조건을 사용하되, 이들을 조합하여 사용한다.
도 15는 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 차세대 시퀀싱(NGS)에 의해 결정된 유전자 편집 결과의 분석을 도시한다.
도 16은 실시예 9에 기술된 실험에 대한 T 세포 중 단백질 수준에서의 유전자 편집 결과를 도시한다. 실시예 9에 기술된 뉴클레아제, 가이드, 및 AAV의 조합을 사용하여, 형광-활성화 세포 분류(FACS)에 의해 결정했을 때의, GFP/tEGFR, tLNGFR, 이중 표적 통합(GFP/tLNGFR), 이중 표적 통합(tEGFR/tLNGFR), 또는 TCR에 대해 양성인 T-세포의 백분율(%)을 나타내는 막대 그래프가 도시되어 있다.
도 17은 실시예 10에 기술된 실험에 대한 AAVS1 부위 및 TRAC 유전자좌에 대한 T 세포 중 DNA 수준에서의 유전자 편집 결과를 도시한다. 실시예 10에 기술된 조건을 사용하여, AAVS1 유전자좌에서 검출된 적어도 하나의 인델(인델 %)을 사용하여 차세대 시퀀싱(Illumina MiSeq)에 의해 검출된 서열의 백분율의 막대 그래프가 도시되어 있다.
본 발명의 다양한 구현예가 본원에 도시되고 기술되었지만, 이러한 구현예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 수 있다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
달리 명시되지 않는 한, 본원에 개시된 일부 방법을 실시하는 데에는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈, 및 재조합 DNA의 기술이 사용된다. 예를 들어 Sambrook 및 Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel 등(편); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames 및 G.R. Taylor(편) (1995)), Harlow and Lane(편) (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney(편) (2010))을 참조한다(이들은 그 전체가 참조로서 본원에 통합됨).
본원에서 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 달리 명시되지 않는 한, 복수 형태도 포함하도록 의도된다. 또한, 용어 "포함하는(including, includes, having, has, with)" 또는 이의 변형된 표현이 발명을 실시하기 위한 구체적인 내용 및/또는 청구범위에 사용되는 정도까지, 이러한 용어는 용어 "포함하는(comprising)"과 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 당업자에 의해 결정되는 특정 값에 대한 허용 가능한 오차 범위 내의 것을 의미하며, 이는 값이 측정되거나 결정되는 방법, 즉, 측정 시스템의 한계에 부분적으로 좌우될 것이다. 예를 들어, "약"은 당 기술분야의 관행에 따라 하나 또는 둘 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다.
본원에서 사용되는 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본 구조, 기능, 및/또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 임의의 유기체로부터 유래될 수 있다. 일부 비제한적인 예는 다음을 포함한다: 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물의 세포, 원생동물 세포, 식물 유래의 세포(예를 들어, 식물 작물, 과일, 야채, 곡물, 대두, 옥수수(corn), 옥수수(maize), 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 개화 식물, 침엽수, 겉씨식물, 양치류, 석송, 뿔이끼류, 우산이끼, 이끼 유래의 세포), 해조류 세포(예를 들어, 보트리오코커스 브라우니(Botryococcus braunii), 녹조류(Chlamydomonas reinhardtii), 클라미도모나스 라인하르트티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 쌍발이모자반(Sargassum patens C. Agardh, 등), 해초(예를 들어, 켈프), 진균 세포(예를 들어, 효모 세포, 버섯 유래의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포류, 극피동물, 선충 등) 유래의 세포. 척추동물(예를 들어, 생선, 양서류, 파충류, 새, 포유동물) 유래의 세포, 포유동물(예를 들어, 돼지, 젖소, 염소, 양, 설치류, 랫트, 마우스, 비인간 영장류, 인간 등) 유래의 세포, 등. 때로는, 세포는 천연 유기체로부터 유래되지 않는다(예를 들어, 세포는 합성으로 만들어질 수 있고, 이는 가끔 인공 세포라 불린다).
본원에서 사용되는 용어 "뉴클레오티드"는 일반적으로 염기-당-인산염의 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 단위일 수 있다. 뉴클레오티드라는 용어는 리보뉴클레오시드 삼인산, 아데노신 삼인산(ATP), 우리딘 삼인산(UTP), 시토신 삼인산(CTP), 구아노신 삼인산(GTP), 및 데옥시리보뉴클레오시드 삼인산, 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는, 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이를 함유하는 핵산 분자에 뉴클레아제 저항성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 삼인산(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 삼인산의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP, 및 ddTTP를 포함할 수 있지만, 이에 한정되지는 않는다. 뉴클레오티드는 표지되지 않거나, 예컨대 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용하여 검출 가능하게 표지될 수 있다. 표지화는 양자점(quantum dots)으로 수행될 수도 있다. 검출 가능한 표지는, 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지, 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루(Cascade Blue), 오레곤 그린(Oregon Green), 텍사스 레드(Texas Red), 사아닌, 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)를 포함할 수 있지만 이에 한정되지는 않는다. 형광 표지된 뉴클레오티드의 특정 예는 다음을 포함할 수 있다: Perkin Elmer(Foster City, Calif)로부터 입수할 수 있는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; Amersham(Arlington Heights, Il.)으로부터 입수할 수 있는 FluoroLink 데옥시뉴클레오티드, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink 플루오르 X-dCTP, FluoroLink Cy3-dUTP, 및 FluoroLink Cy5-dUTP; Boehringer Mannheim(Indianapolis, Ind.)으로부터 입수할 수 있는 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 Molecular Probes(Eugene, Oreg.)로부터 입수할 수 있는 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP. 뉴클레오티드는 화학적 변형에 의해 표지되거나 표시될 수도 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비제한적인 예는 다음을 포함할 수 있다: 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP). 뉴클레오티드는 뉴클레오티드 유사체를 포함할 수 있다. 일부 구현예에서, 뉴클레오티드 유사체는 뉴클레오티드의 특정 화학적 특성을 변경시키지만 뉴클레오티드 유사체가 의도된 기능을 수행하는 능력(예를 들어, RNA 또는 DNA 내의 다른 뉴클레오티드에 혼성화)을 유지하도록 임의의 위치에서 변형되는 천연 뉴클레오티드의 구조를 포함할 수 있다. 유도체화될 수 있는 뉴클레오티드의 위치의 예는, 위치 5, 예를 들어, 5-(2-아미노)프로필 우리딘, 5-브로모 우리딘, 5-프로핀 우리딘, 5-프로페닐 우리딘 등; 위치 6, 예를 들어, 6-(2-아미노)프로필 우리딘; 아데노신 및/또는 구아노신의 경우 위치 8, 예를 들어, 8-브로모 구아노신, 8-클로로 구아노신, 8-플루오로구아노신 등을 포함한다. 뉴클레오티드 유사체는 또한 데아자 뉴클레오티드, 예를 들어, 7-데아자-아데노신: O- 및 N-변형된(예를 들어, 알킬화된, 예를 들어, N6-메틸 아데노신, 또는 달리 적합하게 변형된) 뉴클레오티드; 및 Herdewijn의 문헌[Antisense Nucleic Acid Drug Dev., 2000 Aug. 10(4):297-310]에 기술된 것과 같은 다른 헤테로시클릭적으로 변형된 뉴클레오티드 유사체를 포함한다. 뉴클레오티드 유사체는 또한 뉴클레오티드의 당 부분에 대한 변형을 포함할 수 있다. 예를 들어, 2' OH-기는 H, OR, R, F, Cl, Br, I, SH, SR, NH2, NHR, NR2, COOR, 또는 OR로부터 선택되는 기에 의해 치환될 수 있다(여기에서 R은 치환되거나 치환되지 않은 C1-C6 알킬, 알케닐, 알키닐, 아릴 등임). 다른 가능한 변형은 미국 특허 제5,858,988호 및 제6,291,438호에 기술되어 있다. 유도체화될 수 있는 뉴클레오티드의 위치의 예는, 위치 5, 예를 들어, 5-(2-아미노)프로필 우리딘, 5-브로모 우리딘, 5-프로핀 우리딘, 5-프로페닐 우리딘 등; 위치 6, 예를 들어, 6-(2-아미노)프로필 우리딘; 아데노신 및/또는 구아노신의 경우 위치 8, 예를 들어, 8-브로모 구아노신, 8-클로로 구아노신, 8-플루오로구아노신 등을 포함한다. 뉴클레오티드 유사체는 또한 데아자 뉴클레오티드, 예를 들어, 7-데아자-아데노신: O- 및 N-변형된(예를 들어, 알킬화된, 예를 들어, N6-메틸 아데노신, 또는 달리 적합하게 변형된) 뉴클레오티드; 및 Herdewijn의 문헌[Antisense Nucleic Acid Drug Dev., 2000 Aug. 10(4):297-310]에 기술된 것과 같은 다른 헤테로시클릭적으로 변형된 뉴클레오티드 유사체를 포함한다.
뉴클레오티드 유사체는 또한 뉴클레오티드의 당 부분에 대한 변형을 포함할 수 있다. 예를 들어, 2' OH-기는 H, OR, R, F, Cl, Br, I, SH, SR, NH2, NHR, NR2, COOR, 또는 OR로부터 선택되는 기에 의해 치환될 수 있다(여기에서 R은 치환되거나 치환되지 않은 C1-C6 알킬, 알케닐, 알키닐, 아릴 등임). 다른 가능한 변형은 미국 특허 제5,858,988호 및 제6,291,438호에 기술되어 있다.
용어 "폴리뉴클레오티드", "올리고뉴클레오티드", 및 "핵산"은 일반적으로 임의의 길이를 가진 뉴클로에티드의 중합체 형태를 지칭하도록 사용 교환적으로 사용되며, 상기 뉴클레오티드는 단일 가닥, 이중 가닥, 또는 다중 가닥의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드이거나, 이의 유사체일 수 있다. 폴리뉴클레오티드는 세포에 대해 외인성이거나 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에서 존재할 수 있다. 폴리뉴클레오티드는 유전자이거나 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있고 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 백본, 당, 또는 핵염기가 변경된 유사체)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적인 예는 다음을 포함한다: 5-브로모우라실, 펩티드 핵산, 제노 핵산(xeno nucleic acid), 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단 (예를 들어, 당류에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디하이드로우리딘, 큐오신, 및 와이오신. 폴리뉴클레오티드의 비제한적인 예는 다음을 포함한다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌/유전자좌들, 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA (tRNA), 리보솜 RNA (rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA (miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오티드, 핵산 프로브, 및 프라이머. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 중단될 수 있다. 폴리뉴클레오티드는 자연에서 발견되는 뉴클레오티드 및 뉴클레오티드 유사체(예를 들어, 합성 뉴클레오티드 유사체)의 혼합물을 포함할 수 있다.
용어 "형질감염(transfection 또는 transfected)"은 일반적으로 비-바이러스적인 방법 또는 바이러스-기반 방법에 의해 핵산을 세포 내로 도입하는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 암호화하는 유전자 서열일 수 있다. 예를 들어, Sambrook 등의 문헌[1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88 (이는 본원에 참조로서 전체적으로 통합됨).
용어 "펩티드", "폴리펩티드", 및 "단백질"은 일반적으로 펩티드 결합(들)에 의해 결합된 적어도 2개의 아미노산 잔기로 이루어진 중합체를 지칭하도록 본원에서 상호 교환적으로 사용된다. 이 용어는 중합체의 특정 길이를 의미하지 않으며, 펩티드가 재조합 기술, 화학적 또는 효소적 합성을 사용해 생산되는지 또는 자연적으로 발생하는지를 암시하거나 구별하도록 의도되지도 않는다. 상기 용어는 자연적으로 발생하는 아미노산 중합체뿐만 아니라 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 경우에, 중합체는 비-아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질을 포함하는 임의의 길이의 아미노산 사슬, 및 2차 및/또는 3차 구조(예를 들어, 도메인)가 있거나 없는 단백질을 포함한다. 상기 용어는 예를 들어, 이황화 결합 형성, 당질화, 지질화, 아세틸화, 인산화, 산화, 및 표지 성분과의 접합과 같은 임의의 다른 조작에 의해 변형된 아미노산 중합체도 포함한다. 본원에서 사용되는 용어 "아미노산(들)"은, 변형된 아미노산 및 아미노산 유사체를 포함하되 이에 한정되지 않는, 천연 및 비-천연 아미노산을 일반적으로 지칭한다. 변형된 아미노산은, 아미노산 상에는 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 천연 아미노산 및 비-천연 아미노산을 포함할 수 있다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산 및 L-아미노산 둘 모두를 포함한다.
본원에서 사용되는 바와 같이, "비-고유(non-native)"는 고유 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 일반적으로 지칭할 수 있다. 비-고유는 친화도 태그를 지칭할 수 있다. 비-고유는 융합을 지칭할 수 있다. 비-고유는 돌연변이, 삽입, 및/또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유 서열은 비-고유 서열이 융합되는 핵산 및/또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 금속전이효소 활성, 아세틸전이효소 활성, 키나아제 활성, 유비퀴틴화 활성 등)을 나타내고/나타내거나 이를 암호화할 수 있다. 비-고유 핵산 또는 폴리펩티드 서열은 유전자 조작에 의해 자연 발생 핵산 및/또는 폴리펩티드 서열(또는 이의 변이체)에 연결되어 키메라 핵산 또는 폴리펩티드를 암호화하는 키메라 핵산 및/또는 폴리펩티드 서열을 생성할 수 있다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는, 유전자의 전사 또는 발현을 조절하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하게 위치하거나 이와 중첩될 수 있는 조절 DNA 영역을 일반적으로 지칭한다. 프로모터는 종종 전사 인자로서 지칭되는 단백질 인자에 결합하는 특이적 DNA 서열을 함유할 수 있는데, 상기 인자는 RNA 중합효소가 DNA에 결합하는 것을 용이하게 하여 유전자 전사를 유도한다. '코어 프로모터'로도 지칭되는 '기저 프로모터(basal promoter)'는 작동 가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하는 모든 기본 요소를 함유하는 프로모터를 일반적으로 지칭할 수 있다. 진핵생물 기저 프로모터는, 반드시 그런 것은 아니지만, 통상적으로, TATA-박스 및/또는 CAAT 박스를 함유한다.
본원에서 사용되는 바와 같이, 용어 "발현"은 핵산 서열 또는 폴리뉴클레오티드가 DNA 템플릿으로부터 (예컨대 mRNA 또는 다른 RNA 전사체로) 전사되는 공정 및/또는 전사된 mRNA가 후속하여 펩티드, 폴리펩티드, 또는 단백질로 번역되는 공정을 일반적으로 지칭한다. 전사체 및 암호화된 폴리펩티드는 "유전자 산물"로서 통칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래되는 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용되는 바와 같이, "작동 가능하게 연결된(operably linked, operable linkage, operatively linked)" 또는 이와 문법적으로 동등한 표현은 유전자 요소, 예를 들어, 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 일반적으로 지칭하는데, 여기서 요소들은 이들이 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소가 코딩 서열의 전사 개시에 도움을 주는 경우, 조절 요소는 코딩 영역에 작동 가능하게 연결된다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.
본원에서 사용되는 바와 같이, "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 폴리뉴클레오티드와 결합하고 폴리뉴클레오티드를 세포로 전달하는 것을 매개하는데 사용될 수 있는 거대분자 또는 거대분자의 연관을 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포좀, 및 기타 유전자 전달 비히클을 포함한다. 벡터는 유전자에 작동 가능하게 연결되어 표적에서 유전자의 발현을 용이하게 하는 유전자 요소, 예를 들어 조절 요소를 일반적으로 포함한다.
본원에서 사용되는 바와 같이, "발현 카세트" 및 "핵산 카세트"는 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합을 지칭하기 위해 일반적으로 상호 교환적으로 사용된다. 일부 경우에, 발현 카세트는 조절 요소와 발현을 위해 조절 요소가 작동 가능하게 연결되는 유전자(들)의 조합을 지칭한다.
본원에서 사용되는 바와 같이, "조작된" 객체란 객체가 인간 개입에 의해 변형되었음을 일반적으로 나타낸다. 비제한적인 실시예에 따르면: 핵산은 이의 서열을 자연에서 발생하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 이 핵산을 자연에서 연관되지 않는 핵산과 결합시키되, 결합 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 결합시킴으로써 변형될 수 있고; 조작된 핵산은 자연에서 존재하지 않는 서열을 이용해 시험관 내에서 합성될 수 있고; 단백질은 이의 아미노산 서열을 자연에서 존재하지 않는 서열과 치환함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에서 사용되는 바와 같이, "합성" 및 "인공"은, 대체적으로 자연 발생 인간 단백질과 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭하도록 상호 교환적으로 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전사 활성화 도메인이다.
본원에서 사용되는 바와 같이, 용어 "Cas12a"는 대체적으로 클래스 2, V-A형 Cas 엔도뉴클레아제이고, (a) CRISPR 어레이로부터의 전사 후 뉴클레아제 자체에 의해 가공되는 비교적 작은 가이드 RNA(약 42 내지 44개 뉴클레오티드)를 사용하고, (b) 엇갈린 절단 부위를 남기도록 DNA를 절단하는 Cas 엔도뉴클레아제의 패밀리를 지칭한다. 이러한 효소 패밀리의 추가적인 특징은, 예를 들어, 본원에 참조로서 통합되는, Zetsche B, Heidenreich M, Mohanraju P, 등의 문헌[ Nat Biotechnol 2017;35:31-34], 및 Zetsche B, Gootenberg JS, Abudayyeh OO, 등의 문헌[Cell 2015;163:759-771]을 참조한다.
본원에서 사용되는 바와 같이, "가이드 핵산" 또는 이의 변이체는 대체적으로 다른 핵산에 혼성화될 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산의 서열에 부위 특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산 또는 표적 핵산은 뉴클레오티드를 포함할 수 있다. 가이드 핵산은 뉴클레오티드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보적일 수 있다. 가이드 핵산에 상보적이고 가이드 핵산과 혼성화되는 이중-가닥 표적 폴리뉴클레오티드의 가닥은 상보적 가닥으로 지칭될 수 있다. 상보적 가닥에 상보적이고, 따라서 가이드 핵산에 상보적이 아닐 수 있는 이중 가닥 표적 폴리뉴클레오티드의 가닥은 비상보적 가닥으로 지칭될 수 있다. 가이드 핵산은 하나의 폴리뉴클레오티드 사슬을 포함할 수 있고 "단일 가이드 핵산"으로 지칭될 수 있다. 가이드 핵산은 2개의 폴리뉴클레오티드 사슬을 포함할 수 있고 "이중 가이드 핵산"으로 지칭될 수 있다. 달리 명시되지 않는 경우, 용어 "가이드 핵산"은 단일 가이드 핵산 및 이중 가이드 핵산 둘 다를 포함할 수 있고, 둘 다를 지칭할 수 있다. 가이드 핵산은 "핵산-표적화 분절" 또는 "핵산-표적화 서열" 또는 "스페이서 서열"로서 지칭될 수 있는 분절을 포함할 수 있다. 핵산-표적화 분절은 "단백질 결합 분절" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 분절"로서 지칭될 수 있는 하위 분절을 포함할 수 있다. 가이드 핵산은 sgRNA를 포함할 수 있다. 가이드 핵산은 crRNA를 포함할 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서의 용어 "서열 동일성" 또는 "동일성 백분율"은, 서열 비교 알고리즘을 사용해 측정했을 때, 부분적 또는 전체 비교 윈도우에 걸쳐 비교하고 최대 상응에 정렬했을 때 동일한 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열; 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 백분율을 갖는 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열을 일반적으로 지칭한다. 폴리펩티드 서열에 대한 적절한 서열 비교 알고리즘은 예를 들어 다음을 포함한다: 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 30개 잔기를 초과하는 길이의 폴리펩티드 서열에 대해서는 조건부 조성 스코어 매트릭스 조정(conditional compositional score matrix)을 사용하는 BLASTP; 단어 길이(W) 2, 기대치(E) 1000000의 파라미터, 및 30개 잔기 미만의 서열에 대해서는 PAM30 스코어링 매트릭스(개방 갭 9, 연장 갭 1의 갭 비용 설정 - 이들은 https://blast.ncbi.nlm.nih.gov에서 이용할 수 있는 BLAST 세트 중 BLASTP에 대한 디폴트 파라미터임)를 사용하는 BLASTP; 일치 2, 불일치 -1, 및 갭 -1의 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW; 디폴트 파라미터를 사용하는 MUSCLE; retree 2 및 최대 반복 1000의 파라미터를 사용하는 MAFFT; 디폴트 파라미터를 사용하는 Novafold; 디폴트 파라미터를 사용하는 HMMER hmmalign.
본원에서 사용되는 바와 같이, 용어 "키메라 항원 수용체", "CAR", 또는 "CAR 분자"는 대체적으로 적어도 세포외 항원 결합 도메인, 막관통 도메인 및 본원에서 정의된 바와 같은 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인(본원에서 "세포내 신호전달 도메인"으로도 지칭됨)을 포함하는 재조합 폴리펩티드 작제물을 지칭한다. 일부 구현예에서, 자극 분자는 T 세포 수용체 복합체 또는 NKG2D의 신호전달 도메인과 연관된 제타 사슬이다. 일부 구현예에서, 세포내 신호전달 도메인은 아래에 정의된 바와 같은 적어도 하나의 공자극 분자로부터 유래된 하나 이상의 기능적 신호전달 도메인을 추가로 포함한다. 일부 구현예에서, 공자극 분자는 4-1BB(즉, CD137), CD27, 및/또는 CD28로부터 선택된다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 공자극 분자로부터 유래된 기능적 신호전달 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 하나 이상의 공자극 분자(들)로부터 유래된 2개의 기능적 신호전달 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 하나 이상의 공자극 분자(들)로부터 유래된 적어도 2개의 기능적 신호전달 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 CAR 융합 단백질의 아미노-말단(N-말단)에서의 선택적인 리더 서열을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인의 N-말단에서의 리더 서열을 추가로 포함하되, 리더 서열은 세포 처리 및 CAR의 세포막 위치화 동안 항원 인식 도메인(예를 들어, scFv)으로부터 선택적으로 절단된다.
용어 "신호전달 도메인"은 대체적으로 제2 메신저를 생성하거나 이러한 메신저에 대해 반응하여 효과기로 기능함으로써 정의된 신호전달 경로를 통해 세포 활성을 조절하기 위해 세포 내에서 정보를 전달함으로써 작용하는 단백질의 기능적 부분을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "항체"는 대체적으로, 예를 들어, 비공유적으로, 가역적으로, 그리고 특정 방식으로 항원과 특이적으로 결합하는 면역글로불린 분자로부터 유래된 단백질 또는 폴리펩티드 서열을 지칭한다. 항체는 다클론 또는 단클론, 다중 또는 단쇄, 또는 온전한 면역글로불린일 수 있고, 자연 공급원 또는 재조합 공급원으로부터 유래될 수 있다. 항체는 면역글로불린 분자의 사량체일 수 있다. 예를 들어, 자연적으로 발생하는 IgG 항체는 이황화 결합에 의해 상호 연결된 적어도 2개의 중쇄(H) 및 2개의 경쇄(L)를 포함하는 사량체이다. 각각의 중쇄는 중쇄 가변 영역(본원에서 VH로서 약칭됨) 및 중쇄 불변 영역으로 구성된다. 중쇄 불변 영역은 3개의 도메인 CH1, CH2 및 CH3으로 구성된다. 각각의 경쇄는 경쇄 가변 영역(본원에서 VL로서 약칭됨) 및 경쇄 불변 영역으로 구성된다. 경쇄 불변 영역은 하나의 도메인인 CL로 구성된다. VH 및 VL 영역은 상보성 결정 영역(CDR)으로 지칭되는 초가변성 영역, 프레임워크 영역(FR)으로 지칭되는 보다 보존된 산재된 영역으로 추가로 세분화될 수 있다. 각각의 VH 및 VL은 다음의 순서로 아미노 말단으로부터 카르복시 말단까지 배열된 3개의 CDR 및 4개의 FR로 구성된다: FR1, CDR1, FR2, CDR2, FR3, CDR3, 및 FR4. 중쇄 및 경쇄의 가변 영역은 항원과 상호작용하는 결합 도메인을 함유한다. 항체의 불변 영역은 면역 체계의 다양한 세포(예를 들어, 효과기 세포) 및 고전적 보체 시스템의 제1 성분(C1q)을 포함하는, 숙주 조직 또는 인자에 대한 면역글로불린의 결합을 매개할 수 있다. 용어 "항체"는 단클론 항체, 인간 항체, 인간화 항체, 카멜리드 항체, 및 키메라 항체를 포함하나, 이에 한정되지는 않는다. 항체는 임의의 이소형/클래스(예를 들어, IgG, IgE, IgM, IgD, IgA 및 IgY), 또는 서브클래스(예를 들어, IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2)일 수 있다.
용어 "항체 단편"은 온전한 항체 또는 이의 재조합 변이체의 적어도 일부를 지칭하며, 항원 결합 도메인, 예를 들어, 항원과 같은 표적에 대한 항체 단편의 인식 및 특이적 결합을 부여하기에 충분한 온전한 항체의 가변 영역을 결정하는 항원을 지칭한다. 항체 단편의 예는, Fab, Fab', F(ab')2, 및 Fv 단편, 단쇄 또는 "scFv" 항체 단편, 선형 항체, sdAb(VL 또는 VH)와 같은 단일 도메인 항체, 카멜리드 VH 도메인, 및 항체 단편으로부터 형성된 다중특이적 항체를 포함하나, 이에 한정되지는 않는다. 용어 "scFv"는 경쇄의 가변 영역을 포함하는 적어도 하나의 항체 단편 및 중쇄의 가변 영역을 포함하는 적어도 하나의 항체 단편을 포함하는 융합 단백질을 지칭하되, 경쇄 및 중쇄 가변 영역은 짧은 가요성 폴리펩티드 링커를 통해 인접하게 연결되고, 단쇄 폴리펩티드로서 발현될 수 있으며, 여기에서 상기 scFv는 scFv가 유래되는 온전한 항체의 특이성을 유지한다. 달리 명시되지 않는 한, 본원에서 사용되는 바와 같이, scFv는 VL 및 VH 가변 영역을, 예를 들어, 폴리펩티드의 N-말단 및 C-말단 종결에 대하여, 어느 순서로든 가질 수 있고, scFv는 VL-링커-VH를 포함할 수 있거나, VH-링커-VL을 포함할 수 있다.
항체 또는 이의 항체 단편을 포함하는 CAR 조성물의 부분은 항원 결합 도메인이 다음의 예를 포함하는 인접 폴리펩티드 사슬의 일부로서 발현되는 다양한 형태로 존재할 수 있다: 단일 도메인 항체 단편(sdAb), 단쇄 항체(scFv) 및 인간화 항체(Harlow 등의 문헌[1999, In: Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, NY]; Harlow 등의 문헌[1989, In: Antibodies: A Laboratory Manual, Cold Spring Harbor, N.Y.]; Houston 등의 문헌[1988, Proc. Natl. Acad. Sci. USA 85:5879-5883]; Bird 등의 문헌[1988, Science 242:423-426]). 일부 구현예에서, 본 발명의 CAR 조성물의 항원 결합 도메인은 항체 단편을 포함한다. 일부 구현예에서, CAR은 scFv를 포함하는 항체 단편을 포함한다.
하나 이상의 보존적 아미노산 치환을 갖는 본원에 기술된 효소 중 어느 하나의 변이체가 본 개시에 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 파괴하지 않고도 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 소수성, 극성, 및 R 사슬 길이가 서로 유사한 아미노산들을 치환함으로써 달성될 수 있다. 추가적으로 또는 대안적으로, 상이한 종의 상동성 단백질의 정렬된 서열을 비교함으로써, 종들 간에 돌연변이된 아미노산 잔기(예를 들어, 암호화된 단백질의 기본 기능을 변경시키지 않은 비보존적 잔기)를 위치시킴으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기술된 엔도뉴클레아제 단백질 서열 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 구현예에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 하나 이상의 중요한 활성 부위 잔기 또는 RNA 결합 잔기의 활성이 파괴되지 않도록 치환된 서열을 포함할 수 있다. 일부 구현예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체는 Cas 엔도뉴클레아제의 보존된 잔기 또는 기능적 잔기 특성 중 적어도 하나의 치환이 결여되어 있다. 일부 구현예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체는 Cas 엔도뉴클레아제의 보존된 잔기 또는 기능적 잔기 특성 모두의 치환이 결여되어 있다.
또한, 본 개시에는 효소의 활성을 감소시키거나 제거하기 위해 하나 이상의 촉매 잔기의 치환을 갖는, 본원에 기술된 효소 중 어느 하나의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 구현예에서, 본원에 기술된 단백질로서의 감소된 활성 변이체는 적어도 1개, 적어도 2개, 또는 3개의 RuvC 촉매 잔기 모두의 파괴 치환을 포함한다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참조 문헌을 통해 이용할 수 있다(예를 들어, Creighton의 문헌[Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (1993년 12월)] 참조). 다음의 8개의 기는 서로에 대해 보존적 치환인 아미노산을 각각 함유한다:
1) 알라닌 (A), 글리신 (G);
2) 아스파르트산 (D), 글루탐산 (E);
3) 아스파라긴 (N), 글루타민 (Q);
4) 아르기닌 (R), 리신 (K);
5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V);
6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W);
7) 세린 (S), 트레오닌 (T); 및
8) 시스테인 (C), 메티오닌 (M)
개요
독특한 기능 및 구조를 갖는 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA)을 추가로 파괴할 수 있는 편집 기술을 제공함으로써, 속도, 특이성, 기능, 및 사용 편이성을 개선할 수 있다. 미생물에서 CRISPR 시스템의 예측 유병률 및 미생물 종의 순수한 다양성과 관련하여, 기능적으로 특성화된 CRISPR/Cas 효소는 문헌에 상대적으로 거의 존재하지 않는다. 이는 부분적으로는 많은 수의 미생물 종이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 많은 수의 미생물 종을 포함하는 자연 환경 적소로부터의 메타게놈 시퀀싱은 신규 문서화된 CRISPR/Cas 시스템의 수를 극적으로 증가시키고 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 수 있는 가능성을 제공할 수 있다. 이러한 접근법의 결실에 대한 최근의 예는 2016년에 천연 미생물 군집의 메타게놈 분석에서 CasX/CasY CRISPR 시스템을 발견한 것에 의해 입증된다.
CRISPR/Cas 시스템은 미생물에서 적응성 면역 체계로서 기능하는 것으로 기술된 RNA-지향성 뉴클레아제 복합체이다. 이들의 자연적인 맥락에서, CRISPR/Cas 시스템은 CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복서열) 오페론 또는 유전자좌에서 발생하며, 이는 일반적으로 2개의 부분을 포함한다: (i) RNA-기반 표적화 요소를 암호화하는, 동일하게 짧은 스페이서 서열에 의해 분리된 짧은 반복 서열(30 내지 40 bp)의 어레이; 및 (ii) 부속 단백질/효소와 함께 RNA-기반 표적화 요소가 지향하는 뉴클레아제 폴리펩티드를 암호화하는 Cas를 암호화하는 ORF. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 다음 두 가지 모두를 필요로 한다: (i) 표적의 첫 6 내지 8개의 핵산(표적 시드)과 crRNA 가이드 사이의 상보적 혼성화; 및 (ii) 표적 시드의 정의된 근위 이내에 프로토스페이서-인접 모티프(PAM) 서열의 존재(PAM은 일반적으로 숙주 게놈 내에서 흔히 나타나지 않는 서열임). 시스템의 정확한 기능 및 구성에 따라, CRISPR-Cas 시스템은 공통의 기능적 특성 및 진화적 유사성을 기반으로 일반적으로 2개의 클래스, 5개의 유형, 및 16개의 하위 유형으로 구성된다(도 1 참조).
클래스 I CRISPR-Cas 시스템은 큰 다중 서브유닛 작동자 복합체를 가지며, I형, III형, 및 IV형을 포함한다. 클래스 II CRISPR-Cas 시스템은 단일-폴리펩티드 다중도메인 뉴클레아제 작동자를 일반적으로 가지며, II형, V형, 및 VI형을 포함한다.
II형 CRISPR-Cas 시스템은 구성요소 측면에서 가장 단순한 것으로 간주된다. II형 CRISPR-Cas 시스템에서, CRISPR 어레이를 성숙한 crRNA로 가공하는 데에는 특별한 엔도뉴클레아제 서브유닛의 존재가 필요하지 않고, 오히려 어레이 반복 서열에 상보적인 영역을 갖는 작은 트랜스-암호화된 crRNA(tracrRNA)가 필요하며; 여기서 tracrRNA는 이의 상응하는 작동자 뉴클레아제(예: Cas9) 및 반복 서열 둘 다와 상호작용하여 전구체 dsRNA 구조를 형성하는데, 이는 내인성 RNAse III에 의해 절단되어 tracrRNA 및 crRNA 둘 다와 함께 로딩되는 성숙한 작동자 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로서 식별된다. 2형 작동자는 대체적으로 RuvC-유사 뉴클레아제 도메인의 접힘부 내에 삽입된 무관한 HNH 뉴클레아제 도메인과 함께 RNase H 접힘부를 입양하는 RuvC-유사 엔도뉴클레아제 도메인을 포함하는 구조를 나타낸다. RuvC-유사 도메인은 표적 (예를 들어, crRNA 상보적인) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 변위된 DNA 가닥의 절단을 담당한다.
V형 CRISPR-Cas 시스템은 II형 작동자의 구조와 유사하고, RuvC-유사 도메인을 포함하는 뉴클레아제 작동자(예를 들어, Cas 12) 구조를 특징으로 한다. II형과 유사하게, (전부는 아니지만) 대부분의 V형 CRISPR 시스템은 tracrRNA를 사용해 pre-crRNA를 성숙한 crRNA로 처리하지만; pre-crRNA를 다수의 crRNA로 절단하기 위해 RNAse III을 필요로 하는 II형 시스템과 달리, V형 시스템은 작동자 뉴클레아제 자체를 사용해 pre-crRNA를 절단할 수 있다. II형 CRISPR-Cas 시스템과 마찬가지로, V형 CRISPR-Cas 시스템도 DNA 뉴클레아제로서 식별된다. II형 CRISPR-Cas 시스템과 달리, 일부 V형 효소(예를 들어, Cas12a)는 이중 가닥 표적 서열의 제1 crRNA 가이드 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 데옥시리보뉴클레아제 활성을 갖는 것으로 보인다.
CRISPR-Cas 시스템은 표적화 가능성과 사용 용이성으로 인해 최근 몇 년 동안 유전자 편집 기술의 선택지로서 각광받고 있다. 가장 흔히 사용되는 시스템은 클래스 2 II형 SpCas9 및 클래스 2 V-A형 Cas12a(종래 Cpf1)이다. 특히, V-A형 시스템은 세포에서 기록되는 특이성이 다른 뉴클레아제보다 높고, 오프-타겟 효과가 적거나 없기 때문에 점차적으로 널리 사용되고 있다. V-A 시스템은 또한 가이드 RNA가 작고(SpCas9 경우의 대략 100 nt와 비교하여 42 내지 44개의 뉴클레오티드) CRISPR 어레이로부터의 전사 후 뉴클레아제 자체에 의해 처리되기 때문에, 다중 유전자 편집으로 다중화된 응용을 단순화시킨다는 점에서 유리하다. 또한, V-A 시스템은 엇갈린 절단 부위를 가지며, 이는 미세상동성-의존성 표적 통합(MITI)과 같은 유도 복구 경로를 촉진시킬 수 있다.
가장 통상적으로 사용되는 V-A형 효소는 선택된 표적 부위 옆에 다음과 같은 5' 프로토스페이서 인접 모티프(PAM)를 필요로 한다: 라크노스피라세아에(Lachnospiraceae) 박테리아 ND2006 LbCas12a 및 아시다미노코쿠스 종(Acidaminococcus sp.) AsCas12a의 경우 5'-TTTV-3'; 및 프란치셀라 노비치다(Francisella novicida) FnCas12a의 경우 5'-TTV-3'. 최근의 병렬상동체(ortholog)에 대한 연구는, 포유류 세포 배양물, 예를 들어, YTV, YYN 또는 TTN에서도 활성인, 보다 덜 제한적인 PAM 서열을 갖는 단백질을 발견하였다. 그러나, 이들 효소는 V-A 생물다양성 및 표적화 능력을 완전히 포함하지 않으며, 모든 가능한 활성 및 PAM 서열 요건을 나타내지 않을 수 있다. 여기에서, 수천 개의 게놈 단편을 V-A형 뉴클레아제에 대한 다수의 메타게놈으로부터 채굴하였다. V-A 효소의 문서화된 다양성이 확장되었을 수 있고, 신규 시스템이 고도로 표적화되고, 콤팩트하고, 정확한 유전자 편집제로 개발되었을 수 있다.
예시적인 구현예
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체로서: (i) 클래스 2, II형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, II형 Cas 엔도뉴클레아제 복합체를 접촉시키거나 도입하는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에, (b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서: (i) 클래스 2, V형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키거나 도입하는 단계를 추가로 포함한다. 일부 구현예에서, Cas 엔도뉴클레아제는 리보뉴클레오단백질(RNP) 입자의 형태로 접촉된다(예를 들어, 지질 기반 또는 전기천공/뉴클레오펙션 기반 형질감염의 경우). 일부 구현예에서, Cas 엔도뉴클레아제는 전술한 엔도뉴클레아제 또는 연관된 가이드 RNA를 암호화하는 서열의 형태로 도입된다(예를 들어, 벡터 또는 시험관 내 전사된 mRNA의 경우). 일부 구현예에서, 편집은 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입을 포함한다.
Cas 엔도뉴클레아제는 특정 Cas 엔도뉴클레아제일 수 있고, 특정 파라미터 하에서 도입되거나, 특정 표적 메트릭을 달성하는 방식으로 도입될 수 있다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 방법은 전술한 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 전술한 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입된다. 일부 구현예에서, 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴된다. 일부 구현예에서, 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만의 빈도로 파괴된다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석은, HTGTS 검정(고처리량, 게놈-와이트 전좌 시퀀싱; 예를 들어, Chiarle 등의 문헌[Cell. 2011 Sep 30;147(1):107-19. doi: 10.1016/j.cell.2011.07.049] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), LAM-HTGTS 검정(선형 증폭 매개 고처리량 게놈-와이드 시퀀싱; 예를 들어, Hu 등의 문헌[Nat Protoc. 2016. 11(5):853-71. doi:10.1038/nprot.2016.043] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), 또는 Digenome-Seq 검정(시험관 내 Cas-소화 전체 게놈 시퀀싱; 예를 들어, Kim 등의 문헌[Nat Methods. 2015. 12(3):237-43. doi:10.1038/nmeth.3284] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨))을 포함한다.
표적화된 유전자좌는 임의의 유전자좌를 포함할 수 있다. 표적화된 유전자좌는, T 세포 수용체(TCR) 유전자좌(TRAC 및 TRBC와 같은 T-세포의 다수의 아형이 보존된 TCR 유전자좌의 불변 영역을 포함함), 글루코코르티코이드 수용체 유전자좌(GR 유전자좌로도 지칭됨), 다른 핵 호르몬 수용체를 암호화하는 유전자좌(예를 들어, 에스트로겐 수용체, 프로게스테론 수용체, 또는 안드로겐 수용체 유전자좌), 또는 특정 종양 또는 종양 억제제를 암호화하는 유전자좌와 같은 특정 치료적 관심 유전자좌일 수 있다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 10 내지 15 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다.
본원에 사용된 편집 방법 중 어느 하나는, 예를 들어, Cas 효소 또는 Cas 복합체에 의해 표적화된 부위 중 하나에서의 상동성 재조합에 의해 이식유전자를 도입하기 위해, 공여자 핵산 분자와 함께 사용될 수 있다. 일부 구현예에서, 방법은, 내인성 유전자의 이식유전자 버전을 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 내인성 유전자의 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 경우, 이식유전자는 CAR-T 분자일 수 있다. 일부 구현예에서, 방법은, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법을 제공하며, 방법은, T 세포 또는 이의 전구체에: (a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및 (ii) 전술한 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 T 세포 또는 전술한 이의 전구체에: (b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제2 RNA 가이드 엔도뉴클레아제; 및 (ii) 전술한 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 TCR 유전자좌의 전술한 적어도 일부는 전술한 T-세포 유전자좌 내에 있다. 일부 구현예에서, 방법은, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다.
II형 또는 V형 엔도뉴클레아제는 특정 Cas 엔도뉴클레아제를 포함할 수 있다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재한다.
본원에 사용된 편집 방법 중 어느 하나는, 예를 들어, Cas 효소 또는 Cas 복합체에 의해 표적화된 부위 중 하나에서의 상동성 재조합에 의해 이식유전자를 도입하기 위해, 공여자 핵산 분자와 함께 사용될 수 있다. 일부 구현예에서, 전술한 이종 조작된 T-세포 수용체는 CAR 분자이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAV 또는 TRAJ 유전자좌이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRBV 또는 TRBJ 유전자좌이다. 일부 구현예에서, 전술한 상동 아암은 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부에 인접한 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함한다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAC의 제1 또는 제3 엑손이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 전술한 TCR 유전자좌 및 전술한 NR3C1 유전자좌의 게놈 서열을 파괴한다. 일부 구현예에서, 전술한 효율은 전술한 TCR 또는 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정된다. 일부 구현예에서, 전술한 NR3C1 유전자좌의 전술한 적어도 일부는 엑손 2 또는 엑손 3이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산한다. 일부 구현예에서, 전술한 방법은 (a) 내지 (c)를 전술한 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 T-세포 또는 전술한 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다. 일부 구현예에서, 전술한 제2 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함한다.
본원에 기술된 방법과 함께 사용된 공여자 서열은 본 방법에서 다양한 형태로 제공될 수 있다. 일부 구현예에서, 공여자 서열은 핵산 분자(예를 들어, 단일- 또는 이중-가닥 DNA, 또는 RNA)의 형태로 제공된다. 일부 구현예에서, 공여자 서열은 벡터(예를 들어, 플라스미드, YAC미드, BAC미드, 파지미드, 또는 바이러스 벡터)에 제공된다. 바이러스 벡터의 경우, 바이러스 벡터는 특정 혈청형을 갖는 AAV 바이러스를 포함할 수 있다. 일부 구현예에서, 전술한 공여자 DNA 서열은 바이러스 벡터로 전달된다. 일부 구현예에서, 전술한 바이러스 벡터는 AAV 또는 AAV-6 벡터이다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 CAR-T 세포의 집단을 제공하며, 집단은: (a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열을 포함한다. 일부 구현예에서, 집단은 (b) 인델을 포함하는 NR3C1 유전자좌를 추가로 포함한다. 일부 구현예에서, 전술한 이종 서열은 인델이다. 일부 구현예에서, 전술한 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함한다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 집단 중 세포의 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 집단 중 세포의 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석은, HTGTS 검정(고처리량, 게놈-와이트 전좌 시퀀싱; 예를 들어, Chiarle 등의 문헌[Cell. 2011 Sep 30;147(1):107-19. doi: 10.1016/j.cell.2011.07.049] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), LAM-HTGTS 검정(선형 증폭 매개 고처리량 게놈-와이드 시퀀싱; 예를 들어, Hu 등의 문헌[Nat Protoc. 2016. 11(5):853-71. doi:10.1038/nprot.2016.043] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), 또는 Digenome-Seq 검정(시험관 내 Cas-소화 전체 게놈 시퀀싱; 예를 들어, Kim 등의 문헌[Nat Methods. 2015. 12(3):237-43. doi:10.1038/nmeth.3284] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨))을 포함한다. 일부 구현예에서, 전술한 세포 집단에는 염색체 전위가 실질적으로 없다.
일부 양태에서, 본 개시는 본원에 기술된 방법 중 어느 하나에 의해 생산된 세포를 제공한다.
일부 양태에서, 본 개시는 아래의 표 1에 제공된 단백질 서열 또는 뉴클레오티드 서열을 제공한다.
일부 경우, 본원에 기술된 엔도뉴클레아제 중 어느 하나는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 엔도뉴클레아제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 25 내지 40 중 어느 하나, 또는 서열번호 25 내지 40 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 경우, NLS는 서열 번호 25 내지 40 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우, 본원에 기술된 엔도뉴클레아제 방법 중 어느 하나는 단일 또는 이중 가닥 DNA 복구 템플릿을 세포에 도입하는 단계를 추가로 포함할 수 있다. 일부 경우, 조작된 뉴클레아제 시스템은 단일 가닥 DNA 복구 템플릿을 추가로 포함한다. 일부 경우, 조작된 뉴클레아제 시스템은 이중 가닥 DNA 복구 템플릿을 추가로 포함한다. 일부 경우에, 단일 또는 이중 가닥 DNA 복구 템플릿은 5'에서 3'까지 다음을 포함할 수 있다: 상기 표적 데옥시리보핵산 서열에 대해 5'에 있는 적어도 20개 뉴클레오티드의 서열을 포함하는 제1 상동 아암, 적어도 10개 뉴클레오티드의 합성 DNA 서열, 및 전술한 표적 서열에 대해 3'에 있는 적어도 20개 뉴클레오티드의 서열을 포함하는 제2 상동 아암.
일부 경우, 제1 상동 아암은 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 750개, 또는 적어도 1000개 뉴클레오티드의 서열을 포함한다. 일부 경우, 제2 상동 아암은 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 750개, 또는 적어도 1000개 뉴클레오티드의 서열을 포함한다.
일부 경우, 제1 및 제2 상동 아암은 원핵생물의 게놈 서열과 상동이다. 일부 경우, 제1 및 제2 상동 아암은 박테리아의 게놈 서열과 상동이다. 일부 경우, 제1 및 제2 상동 아암은 진균의 게놈 서열과 상동이다. 일부 경우, 제1 및 제2 상동 아암은 진핵생물의 게놈 서열과 상동이다.
일부 경우, 본원에 기술된 엔도뉴클레아제 방법 중 어느 하나는 DNA 복구 템플릿을 세포에 도입하는 단계를 추가로 포함할 수 있다. DNA 복구 템플릿은 이중 가닥 DNA 분절을 포함할 수 있다. 이중 가닥 DNA 분절에는 하나의 단일 가닥 DNA 분절이 측면에 위치할 수 있다. 이중 가닥 DNA 분절에는 2개의 단일 가닥 DNA 분절이 측면에 위치할 수 있다. 일부 경우, 단일 가닥 DNA 분절은 이중 가닥 DNA 분절의 5' 단부에 접합된다. 일부 경우, 단일 가닥 DNA 분절은 이중 가닥 DNA 분절의 3' 단부에 접합된다.
일부 경우, 단일 가닥 DNA 분절은 1 내지 15개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 4 내지 10개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 4개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 5개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 6개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 7개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 8개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 9개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 10개 뉴클레오티드 염기의 길이를 갖는다.
일부 경우, 단일 가닥 DNA 분절은 스페이서 서열 내의 서열에 상보적인 뉴클레오티드 서열을 갖는다. 일부 경우, 이중 가닥 DNA 서열은 바코드, 개방 해독 프레임, 인핸서, 프로모터, 단백질 코딩 서열, miRNA 코딩 서열, RNA 코딩 서열, 또는 이식유전자를 포함한다.
일부 경우, 본원에 기술된 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, 또는 MAFFT 알고리즘, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW 알고리즘에 의해 결정될 수 있다. 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 전술한 BLASTP 상동성 검색 알고리즘에 의해 결정될 수 있다.
본 개시의 시스템 또는 방법은, 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 응용에 사용될 수 있다. 이러한 시스템 또는 방법은, 예를 들어 대상체에서 질환을 유발할 수 있는 유전적으로 물려받은 돌연변이를 처리(예를 들어 제거 또는 치환)하는 데 사용될 수 있고, 세포에서 유전자의 기능을 확실하게 하기 위해 유전자를 불활성화시키는 데 사용될 수 있고, (예를 들어, 역-전사된 바이러스 RNA를 절단하거나 질환-유발 돌연변이를 암호화하는 증폭된 DNA 서열을 절단함으로써) 질환을 유발하는 유전적 요소를 검출하기 위한 진단 도구로서 사용될 수 있고, 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내 박테리아를 암호화하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 비활성화된 효소로서 사용될 수 있고, 바이러스 게놈을 표적화함으로써 바이러스를 불활성화시키거나 바이러스가 숙주 세포를 감염시킬 수 없게 하는 데 사용될 수 있고, 유전자를 추가하거나 대사 경로를 변경하여 유기체가 귀중한 소분자, 거대분자, 또는 이차 대사물을 생산하도록 이를 조작하는 데 사용될 수 있고, 진화적 선택을 위한 유전자 구동 요소를 확립하는 데 사용될 수 있고, 바이오센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 섭동을 검출하는 데 사용될 수 있다.
실시예
실시예 1 - TCAR 유전자좌에서의 편집
본원에 기술된 뉴클레아제를 사용하여 CAR-T 세포(및 이종 T-세포 수용체를 보유하는 다른 T-세포 유사 세포)를 생산하기 위한 워크플로우를 개발하였다(도 1). 이에 따라, T-세포 수용체 유전자좌(예를 들어, TRAC 유전자좌)를 표적화하기 위한 뉴클레아제 복합체를 개발하였다. 클래스 2 II형 엔도뉴클레아제 MG3-6(서열번호 1) 또는 SpCas9 또는 클래스 2, V형 엔도뉴클레아제 MG29-1(서열번호 7)과 조합하여 TRAC 유전자를 표적화하기 위해 스페이서 서열(서열번호 10 내지 15)을 개발하였고, 이를 각 효소에 대해 상응하는 sgRNA 내로 도입하였다(표 1 참조). 각각의 TRAC-표적화 sgRNA를 함유하는 RNP 복합체를 조립하고, CD2/3/28 비드(Miltenyi T 세포 활성화/확장 키트 #130-091-441)를사용한 음성 선택 및 활성화를 사용하여 PBMC로부터 정제한 후(Stemcell Technologies 인간 T 세포 단리 키드 #17951) 4일 동안 배양한 인간 T 세포(프로그램 EO-115 및 P3 완충액을 사용하는 Lonza 4-D Nucleofector를 사용한 200,000개의 T 세포)에 뉴클레오펙션시켰다. TRAC 유전자에서의 인델 형성에 대해 차세대 시퀀싱(NGS)(도 2 좌측), 및 TCR 발현에 대해 유세포 계측법(도 2 우측)을 사용하여, 모의 형질감염된 T 세포와 함께 세포를 분석하였다. NGS 및 유세포 계측법에 의한 분석은 형질감염된 T 세포에서의 인델 형성 또는 T 세포 수용체 발현의 파괴 유도에 있어서, MG3-6 및 MG29-1이 SpCas9와 유사하거나 보다 양호함을 나타냈다.
다음으로, TRAC 유전자좌 내로의 CAR-T 분자의 표적화된 통합을 촉진하기 위해 전술한 RNP 복합체를 사용하는 편집 능력을 시험하였다. 5' 및 3' 상동 아암(예를 들어, 서열번호 23-24)이 측면에 위치한 CAR-T 분자를 포함하는 뉴클레오티드 서열을 포함하는 AAV-6 벡터를 개발하여 TRAC 유전자를 표적화하였다. 전술한 바와 같이 MG29-1 RNP를 사용하는 TRAC 표적화를 수행하였지만, 이에 이어서 형질감염 후 AAV-6 벡터의 100,000 벡터 게놈(vg)을 T 세포에 첨가하였다. 유세포 계측법을 사용하여 TCR 수용체 및 CAR 항원 결합 도메인의 발현에 대해 세포를 분석하였다(도 3). 유세포 계측법은 AAV-엔도뉴클레아제 조합으로 치료한 T 세포의 약 60%가 CAR 항원 결합 도메인을 발현하였음을 나타냈다. TRAC를 표적화하는 MG3-6 및 MG3-8 RNP를 AAV-6/CAR-T 통합 작제물과 조합한 실험에서 이와 유사한 결과를 얻었다.
실시예 2 - TCR-유사 세포에서의 다중 편집
TRAC 유전자좌의 변형(예를 들어, CAR-T 통합)과 조합하여 다른 유전자를 변형시키는 것이 유리할 수 있다. 따라서, 본원에 기술된 뉴클레아제 복합체의 TRAC + 추가 유전자좌를 표적화하는 능력을 결정하였다. 이러한 유전자좌 중 하나는 NR3C1(즉, GR, 또는 글루코코르티코이드 수용체) 유전자좌이며, 이는 CAR-T 세포에 대한 글루코코르티코이드 제제에 대한 비반응성 부여를 파괴하는 데 유리할 수 있다(예를 들어, 글루코코르티코이드로 동시에 치료되고 있는 암 환자의 경우, 또는 글루코코르티코이드 유지를 필요로 하는 자가면역 질환을 가진 암 환자의 경우). 3개의 MG29-1-호환성 표적화 서열(표적 B-D; 서열 번호 20, 21, 22)을 NR3C1 유전자를 표적화하도록 설계하고 MG29-1 가이드 RNA에 통합하였다. 이러한 가이드 RNA를 갖는 MG29-1을 포함하는 RNP 복합체를 조립하였다. T 세포를 전술한 MG29-1/NR3C1 gRNA RNP 복합체 및 MG3-6/TRAC RNP의 다양한 조합의 뉴클레오펙션으로 치료하였다(도 4). 각 유전자좌에서의 인델 형성을 평가하기 위해 NGS를 사용한 뉴클레오펙션 후 세포를 분석하였다. 결과는 상이한 가이드 RNA가 NR3C1 표적화에서 상이한 효율을 갖는 반면("MG29-1 GR-13", "MG29-1 GR-28", "MG29-1 GR-29" 참조), TRAC를 표적화하는 MG3-6 복합체 및 NR3C1을 표적화하는 MG29-1 복합체의 조합은 두 유전자 모두에서 인델 형성을 효율적으로 유도할 수 있음을 나타냈다(도 4의 최우측 조건 참조).
본원에 기술된 뉴클레아제 복합체를 사용하여 2개의 상이한 유전자좌를 표적화하는 능력을 확립한 후, 3개의 유전자좌(예를 들어, TRAC, 유전자좌 B-29/서열번호 16, 유전자좌 C-87/서열번호 17, 유전자좌 C-74/서열번호 18, 또는 유전자좌 C-83/서열번호 19로부터 선택됨)를 표적화하는 능력을, 각각의 유전자좌에 해당하는 RNP 단독으로 그리고 전술한 3개의 조합으로 T 세포 내로 뉴클레오펙션시키고 NGS에 의한 인델 형성을 평가함으로써 평가하였다(도 5). 실험의 결과는 상이한 유전자좌를 표적화하는 3개의 상이한 RNP를 조합한 조건에서도, 3개의 유전자좌 모두에서 인델이 상당한 양으로 생성되었음을 나타냈다.
실시예 3 - 다중 유전자 치환을 이용한 다중 편집
다수의 유전자좌를 편집하고 이식유전자를 적어도 하나의 유전자좌에 통합하는 능력을 확립한 경우, 2개 이상의 유전자좌를 동시에 편집하고 두 유전자좌 모두에서 유전자를 동시에 통합하는 능력을, T 세포 내에서 2개의 상이한 유전자좌를 편집하고 해당 2개의 상이한 유전자좌를 표적화하는 2개의 상이한 공여자 DNA 템플릿을 제공함으로써 시험하였다. AAVS1(안전한 하버) 유전자좌 및 위의 TRAC 유전자좌를 표적 부위로서 선택하였다. 실시예 1 및 2에서와 같이 제조된 일차 T 세포(2 x 105)를 (a) SpCas9(12 pmol) 및 AAVS1 유전자좌를 표적화하는 호환성 sgRNA(60 pmol, 서열번호 41은 스페이서 서열을 나타냄) 및 (b) MG3-6(52 pmol) 및 호환성 TRAC3-6 6 sgRNA(60 pmol, 서열번호 10)의 조합으로 뉴클레오펙션시켰다. 뉴클레오펙션 후, 세포를 각각 50,000의 감염 다중도(MOI)에서의 다음과 같은 2개의 상이한 AAV-6 벡터와 함께 인큐베이션하였다: (a) AAVS1 유전자좌를 표적화하는 5' 및 3' 상동 아암(서열번호 42, 43)이 측면에 위치한 4개의 상이한 이소형의 GR(GR-알파, GR-베타, GR-알파 D3, 및 GR-베타 D3)을 각각 포함하는 이식유전자를 보유하는 벡터; 및 (b) TRAC 유전자좌를 표적화하는 5' 및 3' 상동 아암(서열번호 23-24)이 측면에 위치한 CAR을 보유하는 벡터. 4일 동안 인큐베이션한 후, (a) AAVS1 유전자좌에서의 GR 이식유전자의 존재에 대한 PCR(PCR 설계 및 결과는 도 6 참조), 또는 (b) TRAC 유전자좌에서의 CAR의 통합을 평가하기 위한 CAR 항원 결합 도메인 및 T 세포 수용체에 대한 유세포 계측법에 의해 T 세포를 분석하였다(도 7). PCR 및 유세포 계측법 실험으로부터의 데이터는 두 이식유전자(GR 및 CAR) 모두가 유의미한 성능 손실 없이 동시에 삽입될 수 있음을 나타냈다; 이중 AAVS1/TCR 표적화 조건 하의 GR 이식유전자(도 6b, 중간 4개 레인)에 대한 PCR은 AAVS1 단독 표적화(도 7b, 마지막 4개 레인, 또는 도 7c, 중간 4개 레인)와 유사한 통합 결과를 나타냈으며, TCR에 대한 유세포 분석(도 7a, 7b, 7c, 7d)은 AAVS1이 동시에 표적화되는 경우에서도 CAR의 높은 통합 및 TCR의 손실을 나타냈다.
실시예 4 - 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의한 특이성 분석
게놈-와이드 오프-타겟 이중 가닥 절단 분석을 통해 MG3-6, MG3-8, 및 MG29-1의 표적 특이성을 SpCas9("Cas9")와 함께 평가하였다. 도 8은 그 결과를 나타낸다. 결과는 MG3-6, MG3-8, 및 MG29-1이 Cas9보다 낮은 수준의 오프-타겟 편집을 가짐을 나타냈다.
실시예 5 - T 세포에서의 다중 편집
재조합-TCR-기반 T 세포 생성물의 제조는, a/b 사슬이 항원-특이적 인식을 제공하는 TCR의 서브유닛이기 때문에, T 세포의 풀 내에 TCR의 새롭고 바람직한 알파 및 베타 사슬을 도입하는 것을 필요로 할 수 있다. 이러한 새로운 a/b 사슬은, 이에 이어서 델타/감마/엡실론 사슬과 조립되어 활성인 전장 TCR을 만들 수 있다(도 9 참조). 불행하게도, 이러한 간단한 경우, 기존의 a/b 사슬은 수용자 세포에서 여전히 발현된다. 이는, 기존의 알파가 새로운 베타와 쌍을 이룰 수 있고 새로운 알파가 기존의 베타와 쌍을 이룰 수 있다는 바람직하지 않은 가능성을 제시한다: 예를 들어, 새롭고 바람직한 TCR a/b 사슬은 이들이 함께 쌍을 이루기 위해 "보충"된다는 것을 알지 못한다. 추가의 작용 없이, T 세포는 이제 조작된 특이성을 갖는 4개의 상이한 TCR(a/b, a'/b, a/b', a'/b')을 발현하게 된다. 이는 2가지 문제를 야기한다: i) 이는 새로운 바람직한 TCR의 발현을 4배까지 감소시킴; ii) 2개의 혼성 a/b 쌍(a'/b 및 a/b')은 예측할 수 없고, 잠재적으로 자가 반응하는 방식으로 항원을 인식하므로 자가 면역의 위험을 갖게 됨.
이 실험에서, CD2/3/28 비드로 증식된 일차 T 세포를 Lonza 4D 전기천공기 및 용액 P3을 사용하여, 조건 당 200K 세포로 뉴클레오펙션시키고, 104 pmol의 MG3-6 단백질 및 128 pmol의 가이드 RNA를 전달하거나, V형 효소 MG29-1 또는 MG3-6 및 MG29-1 둘 모두를 동일한 양을 전달하였다. 사용된 MG3-6 가이드는 MG3-6-TRAC-6(서열 번호 44) 및 MG3-6-TRBC(서열 번호 45)였으며; 길이는 22 nt이다. 이들 세포로부터 게놈 DNA를 3일 후에 수확하고 NGS로 분석하였다(도 10 참조). 인델을 갖는 표적화된 부위에서의 서열의 백분율을 나타내는 도 10의 결과는, 두 부위 모두를 표적화하는 RNP가 세포 내로 동시에 도입될 때 이들 세포에서 이중 TRAC/TRBC 녹아웃이 있음을 입증한다.
실시예 6 - 단일-유전자 녹아웃에 대한 유세포 분석에 의한 유전자-편집 결과
제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC(말초 혈액 단핵 세포)로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 RNP(100 pmol 단백질 및 150 pmol 가이드 RNA)의 뉴클레오펙션을 수행하였다. 유세포 계측법에 의한 분석을 위해, 뉴클레오펙션 후 3일차에, 항-CD3 항체 및 항-B2M 항체로 100,000개의 T 세포를 4℃에서 30분 동안 염색하고, Attune Nxt 유세포 계측기를 이용해 분석하였다(도 11). TCR 및 B2M의 녹아웃을 평가하는 4개 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 도 11은: (a) 가장 효율적인 TCR 녹아웃을 생성하는 MG3-6 TRAC6 및 MG3-6 TRBC E2 sgRNA을 사용하여, 모든 TCR 표적화 조건이 TCR 녹아웃을 효율적으로 생산하였고; (b) 가장 효율적인 B2M 녹아웃을 생성하는 B2M H1 및 B2M D2를 사용하여, 모든 B2M 표적화 조건이 B2M 녹아웃을 생성하였음을 도시한다.
실시예 7 - 이중-유전자 녹아웃에 대한 유세포 분석에 의한 유전자-편집 결과
실시예 6에서 TCR/B2M 표적화 조건의 단일 성능을 평가한 후, TRAC 및 B2M 표적화에 대해, 해당 조건의 조합을 사용하여 동시 이중 파괴를 또한 시험하였다(도 12 참조). 제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 RNP(100 pmol 단백질 및 150 pmol 가이드 RNA)의 뉴클레오펙션을 수행하였다. 유세포 계측법에 의한 분석을 위해, 뉴클레오펙션 후 3일차에, 항-CD3 항체 및 항-B2M 항체로 100,000개의 T 세포를 4℃에서 30분 동안 염색하고, Attune Nxt 유세포 계측기를 이용해 분석하였다(도 12). TCR 및 B2M의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 도 12는, 가장 효율적인 이중 표적화 조건이 MG29-1 B2M H1, D2, 또는 A3 조건을 갖는 MG3-6 TRAC6 조건을 포함하는 A4, B4, 및 C4임을 나타낸다. 가장 효율적인 이중 표적화 조건은, MG3-6 TRAC6 sgRNA 및 MG29-1 B2M D2 sgRNA를 사용한 B4인 것으로 나타났다.
실시예 8 - 삼중-유전자 녹아웃에 대한 유세포 분석에 의한 유전자-편집 결과
실시예 6에서 TCR/B2M 표적화 조건의 단일 성능, 실시예 7에서 이의 이중 성능을 평가한 후, TRAC, TRBC, 및 B2M 표적화에 대해, 해당 조건의 조합을 사용하여 동시 이중 파괴를 또한 시험하였다. 제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 RNP(100 pmol 단백질 및 150 pmol 가이드 RNA)의 뉴클레오펙션을 수행하였다. 유세포 계측법에 의한 분석을 위해, 뉴클레오펙션 후 3일차에, 항-CD3 항체로 100,000개의 T 세포를 4℃에서 30분 동안 염색하고, Attune Nxt 유세포 계측기를 이용해 분석하였다(도 13). 유세포 분석 결과는 조건 B2, E1 및 F1이 녹아웃에 대한 가장 효율적인 삼중-표적화 조건임을 나타낸다.
형질감염 후 5일차에 세포를 수확하고 게놈 DNA를 제조하였다. NGS-기반 DNA 시퀀싱에 사용하기에 적합한 PCR 프라이머를 생성하고, 최적화하고, 이를 사용해 각 가이드 RNA에 대한 개별 표적 서열을 증폭시켰다. Illumina MiSeq 기계를 이용해 앰플리콘을 시퀀싱하고, 독점적인 Python 스크립트로 분석하여 유전자 편집을 측정하였다(도 14). 여기에서의 시퀀싱 결과는 도 13의 결과와 충돌하는데, 이는 인델이 유전자의 기능적 파괴를 반드시 반영하지는 않을 수 있기 때문이다(예컨대, 유세포 계측법에 의해 측정될 것이다).
따라서, 추가 분석을 수행하여(도 15 참조) 시퀀싱에 의한 삼중 녹아웃 세포의 생성을 검증하였다. 도 15는 삼중 녹아웃 세포의 성공적인 생성을 입증하는 데이터를 도시한다. "편집된" 컬럼의 데이터는 도 14로부터 취해졌으며, 여기에서 "야생형" 컬럼의 데이터는 100%에서 편집 백분율을 뺀 것이다. 이중 및 삼중 녹아웃의 최소(Min.) 빈도는 개별 세포에서의 편집 이벤트 사이의 가능한 최소 중첩을 가정하여 계산된다. 따라서, TRBC와 B2M 사이의 최소 이중 녹아웃 빈도는 100%에서 TRBC에 대한 세포 야생형 백분율을 빼고, B2M에 대한 세포 야생형 백분율을 뺀 값이 된다. 따라서, 최소 삼중 녹아웃 빈도는 100%에서 이중 녹아웃을 함유하지 않을 수 있는 세포의 백분율을 빼고, TRAC에 대한 세포 야생형 백분율을 뺀 값이 된다. 관찰된 높은 편집 빈도는 모든 편집 이벤트가 별도의 세포에서 발생했을 가능성을 배제한다. 따라서, 도 15의 데이터는 삼중 녹아웃 TRAC/TRBC/B2M 세포가 성공적으로 생성되었음을 입증한다.
실시예 9 - 편집된 T 세포에서의 GFP 및 표면 마커의 발현
제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 인간 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 MG3-6 mRNA(500 ng/150 pmol 가이드), MG29-1 RNP(100 pmol/150 pmol 가이드), 및/또는 SpCas9 RNP(12 pmol/60 pmol 가이드)의 뉴클레오펙션을 수행하였다. 뉴클레오펙션 후, AAV-6(50,000 MOI)을 함유하는 배지에서 세포를 즉시 회수하였다. 사용된 AAV 벡터는 다음을 포함한다: (a) MG3-6-TRAC-6(서열번호 64) 또는 MG29-1-TRAC-35(서열번호 65)의 절단 부위에 상응하는 상동 아암이 측면에 위치한 MSCV 프로모터-유도 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 코딩 서열을 전달하는 AAV 벡터; 및 (b) Mali 등의 AAVS1 T2의 절단 부위에 상응하는 상동 아암(서열번호 63)이 측면에 위치한 절단된 버전의 상피 성장 인자 수용체(tEGFR)와 함께 GFP를 암호화하는 MND 프로모터-유도 폴리시스트론 작제물을 전달하는 AAV 벡터. 형질감염 후 4일차에, 생존력(Live/Dead Fixable Aqua Cell Stain Kit; ThermoFisher Scientific) 및 tLNGFR(CD271)(VioBlue REAfinity??, 클론 REA844; Miltenyi Biotech), tEGFR(Cetuximab Biosimilar, AlexaFluor ® 647, 클론 Hu1; R&D Systems) 및 TCR a/b(Brilliant Violet 785, 클론 IP26; BioLegend)의 발현에 대해 100,000개의 세포를 염색하였다. 세포를 4°C에서 30분 동안 염색하고, Attune NxT 유세포 분석기 상에서 데이터를 수득하였다. tLNGFR, GFP, tEGFR, 및/또는 TCR a/b를 발현하는 세포를 단일 세포, 생존 세포에 대해 게이팅하였다(도 16).
실시예 10 - 편집된 T 세포에서 AAVS1 부위에서의 인델 분석
제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 MG3-6 mRNA(500 ng/150 pmol 가이드), MG29-1 RNP(100 pmol/150 pmol 가이드), 및/또는 SpCas9 RNP(12 pmol/60 pmol 가이드)의 뉴클레오펙션을 수행하였다. 뉴클레오펙션 후, AAV-6(50,000 MOI)을 함유하는 배지에서 세포를 즉시 회수하였다. 사용된 AAV 벡터는, MG3-6-TRAC-6 또는 MG29-1-TRAC-35의 절단 부위에 상응하는 상동 아암이 측면에 위치한 MSCV 프로모터-유도 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 코딩 서열, GFP를 암호화하는 MND 프로모터-유도 폴리시스트론 작제물, 및 Mali 등의 AAVS1 T2의 절단 부위에 상응하는 상동 아암이 측면에 위치한 절단된 버전의 상피 성장 인자 수용체(tEGFR)를 포함한다. 형질감염 후 4일차에 세포를 수확하고 게놈 DNA를 제조하였다. NGS-기반 DNA 시퀀싱에 사용하기에 적합한 PCR 프라이머를 생성하고, 최적화하고, 이들 실험에 사용된 상이한 AAVS1 부위 특이적 RNA 가이드의 표적 부위를 포함하는 영역을 증폭시키는 데 사용하였다. Illumina MiSeq 기계를 이용해 앰플리콘을 시퀀싱하고, 독점적인 Python 스크립트로 분석하여 유전자 편집을 측정하였다(도 17 참조). 결과는 TRAC 및 AAVS1에 대한 가장 효율적인 이중 표적화 조건이 sgRNA F3을 갖는 MG29-1 및 sgRNA TRAC3-6 #6을 갖는 MG3-6과 관련된 조건임을 나타냈다.
본 발명의 바람직한 구현예가 본원에 도시되고 기술되었지만, 이러한 구현예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공된 특정 실시예에 의해 한정되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 기술되었지만, 본원의 구현예의 설명 및 예시는 한정적인 의미로 해석되는 것을 의미하지는 않는다. 이제 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 것이다. 또한, 본 발명의 모든 양태는 다양한 조건 및 변수에 따라 달라지는 본원에 제시된 특정 도시, 구성, 또는 상대 비율로 한정되지 않음을 이해할 것이다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변이, 또는 균등물도 포괄하는 것으로 고려된다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이들 청구범위의 범위에 속하는 방법 및 구조와 이들의 등가물이 이에 의해 포괄되는 것으로 의도된다.
SEQUENCE LISTING <110> METAGENOMI, INC. <120> MULTIPLEX EDITING WITH CAS ENZYMES <130> 55921-719.601 <140> <141> <150> 63/241,916 <151> 2021-09-08 <150> 63/186,506 <151> 2021-05-10 <150> 63/163,510 <151> 2021-03-19 <160> 65 <170> PatentIn version 3.5 <210> 1 <211> 1132 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG3-6 protein sequence (Class 2, type II) <400> 1 Met Ser Ala Asp Ser Leu Asn Tyr Arg Ile Gly Val Asp Val Gly Asp 1 5 10 15 Arg Ser Val Gly Leu Ala Ala Ile Glu Leu Asp Asp Asp Gly Phe Pro 20 25 30 Leu Lys Lys Leu Ala Met Val Thr Phe Arg His Asp Gly Gly Lys Asp 35 40 45 Pro Ala Thr Gly Lys Thr Pro Lys Ser Arg Lys Glu Thr Ala Gly Val 50 55 60 Ala Arg Arg Thr Met Arg Met Arg Arg Arg Lys Lys Lys Arg Leu Lys 65 70 75 80 Asp Leu Asp Lys Lys Leu Arg Asp Leu Gly Tyr Phe Val Pro Arg Asp 85 90 95 Glu Glu Pro Gln Thr Tyr Glu Ala Trp Ser Ser Arg Ala Arg Leu Ala 100 105 110 Glu Ser Arg Phe Glu Asp Pro His Glu Arg Gly Glu His Leu Val Arg 115 120 125 Ala Val Arg His Met Ala Arg His Arg Gly Trp Arg Asn Pro Trp Trp 130 135 140 Ser Phe Ser Gln Leu Glu Glu Ala Ser Gln Glu Pro Ser Glu Thr Phe 145 150 155 160 Gly Arg Ile Leu Glu Arg Ala Gln His Glu Trp Gly Glu Arg Val Ser 165 170 175 Asp Asn Ala Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Asn 180 185 190 Ile Leu Leu Arg Pro Arg Arg Tyr Glu His Asn Pro Lys Thr Gly Lys 195 200 205 Asn Ala Glu Lys Leu Asn Val Arg Gly Gln Glu Pro Ile Leu Leu Asp 210 215 220 Lys Val Arg Gln Glu Asp Val Leu Ala Glu Leu Arg Arg Ile Cys Lys 225 230 235 240 Val Gln Gly Ile Glu Asp Gln Tyr Pro Glu Leu Ala His Ala Val Phe 245 250 255 Thr Gln Val Arg Pro Tyr Val Pro Thr Glu Arg Val Gly Lys Asp Pro 260 265 270 Leu Gln Pro Met Lys Ile Arg Ala Ser Arg Ala Ser Leu Glu Phe Gln 275 280 285 Glu Phe Arg Ile Arg Asp Ala Val Ala Asn Leu Arg Ile Arg Val Gly 290 295 300 Gly Ser Glu Arg Arg Pro Leu Thr Glu Glu Glu Tyr Asp Arg Ala Val 305 310 315 320 Asp Tyr Leu Met Glu Tyr Ser Asp Thr Thr Pro Pro Thr Trp Gly Glu 325 330 335 Val Ala Asp Glu Leu Glu Ile Ala Glu Asn Thr Leu Ile Ala Pro Val 340 345 350 Ile Asp Asp Val Arg Leu Asn Val Ala Pro Tyr Asp Arg Ser Ser Ala 355 360 365 Ile Val Glu Ala Lys Leu Lys Arg Lys Thr Gln Ala Arg Gln Trp Trp 370 375 380 Asp Asp Asp Ala Asn Leu Asp Leu Arg Ser Gln Leu Ile Leu Leu Val 385 390 395 400 Ser Asp Ala Thr Asp Asp Thr Ala Arg Val Ala Glu Asn Ser Gly Leu 405 410 415 Leu Glu Val Phe Glu Ser Trp Ser Asp Glu Glu Lys Gln Thr Leu Gln 420 425 430 Asp Leu Lys Phe Asp Ser Gly Arg Ala Ala Tyr Ser Ile Asp Thr Leu 435 440 445 Asn Lys Leu Asn Ala Tyr Met His Glu His Arg Val Gly Leu His Glu 450 455 460 Ala Arg Gln Asn Val Phe Gly Val Ser Asp Thr Trp Arg Pro Pro Arg 465 470 475 480 Asp Arg Leu Asp Glu Pro Thr Gly Gln Pro Thr Val Asp Arg Val Leu 485 490 495 Thr Ile Val Arg Arg Phe Ile Leu Asp Cys Glu Arg Ala Trp Gly Arg 500 505 510 Pro Gln Lys Ile Val Val Glu His Ala Arg Thr Gly Leu Met Gly Pro 515 520 525 Ser Gln Arg Ala Asp Val Leu Lys Glu Ile Ala Arg Asn Arg Asn Ala 530 535 540 Asn Glu Arg Ile Arg Gln Glu Leu Arg Glu Gly Gly Ile Glu Ala Pro 545 550 555 560 Asn Arg Ala Asp Ile Arg Arg Asn Ser Ile Ile Gln Asp Gln Glu Ser 565 570 575 Gln Cys Leu Tyr Cys Gly Lys Glu Ile Gly Val Leu Thr Ala Glu Leu 580 585 590 Asp His Ile Val Pro Arg Ala Gly Gly Gly Ser Ser Lys Arg Glu Asn 595 600 605 Leu Ala Ala Val Cys Arg Ala Cys Asn Ala Ser Lys Gly Ser Arg Pro 610 615 620 Phe Ala Val Trp Ala Gly Pro Ala Arg Leu Glu Arg Thr Ile Gln Arg 625 630 635 640 Leu Arg Glu Leu Gln Ala Phe Lys Thr Lys Ser Lys Lys Arg Thr Leu 645 650 655 Asn Ala Ile Ile Arg Arg Leu Lys Gln Arg Glu Glu Asp Glu Pro Ile 660 665 670 Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr Ala Ala Thr Ser Ile Arg 675 680 685 Glu Arg Leu Glu Gln His Phe Asn Asp Asp Leu Pro Asp Gly Phe Ala 690 695 700 Pro Val Ala Val Asp Val Tyr Gly Gly Ser Leu Thr Arg Glu Ser Arg 705 710 715 720 Arg Ala Gly Gly Ile Asp Lys Ser Ile Met Leu Arg Gly Gln Ser Asp 725 730 735 Lys Asn Arg Phe Asp Val Arg His His Ala Ile Asp Ala Ala Val Met 740 745 750 Thr Leu Leu Asn Pro Ser Val Ala Val Thr Leu Glu Gln Arg Arg Met 755 760 765 Leu Lys Gln Glu Asn Asp Tyr Ser Ser Pro Arg Gly Gln His Asp Asn 770 775 780 Gly Trp Arg Asp Phe Ile Gly Arg Gly Glu Ala Ser Gln Ser Lys Phe 785 790 795 800 Leu His Trp Lys Lys Thr Ala Val Val Leu Ala Asp Leu Ile Ser Glu 805 810 815 Ala Ile Glu Gln Asp Thr Ile Pro Val Val Asn Pro Leu Arg Leu Arg 820 825 830 Pro Gln Asn Gly Ser Val His Lys Asp Thr Val Glu Ala Val Leu Glu 835 840 845 Arg Thr Val Gly Asp Ser Trp Thr Asp Lys Gln Val Ser Arg Ile Val 850 855 860 Asp Pro Asn Thr Tyr Ile Ala Phe Leu Ser Leu Leu Gly Arg Lys Lys 865 870 875 880 Glu Leu Asp Ala Asp His Gln Arg Leu Val Ser Val Ser Ala Gly Val 885 890 895 Lys Leu Leu Ala Asp Glu Arg Val Gln Ile Phe Pro Glu Glu Ala Ala 900 905 910 Ser Ile Leu Thr Pro Arg Gly Val Val Lys Ile Gly Asp Ser Ile His 915 920 925 His Ala Arg Leu Tyr Gly Trp Lys Asn Gln Arg Gly Asp Ile Gln Val 930 935 940 Gly Met Leu Arg Val Phe Gly Ala Glu Phe Pro Trp Phe Met Arg Glu 945 950 955 960 Ser Gly Val Lys Asp Ile Leu Arg Val Pro Ile Pro Gln Gly Ser Gln 965 970 975 Ser Tyr Arg Asp Leu Ala Ala Thr Thr Arg Lys Phe Ile Glu Asn Gly 980 985 990 Gln Ala Thr Glu Phe Gly Trp Ile Thr Gln Asn Asp Glu Ile Glu Ile 995 1000 1005 Ser Ala Glu Glu Tyr Leu Ala Thr Asp Lys Gly Asp Ile Leu Ser 1010 1015 1020 Asp Phe Leu Gly Ile Leu Pro Glu Ile Arg Trp Lys Val Thr Gly 1025 1030 1035 Ile Glu Asp Asn Arg Arg Ile Arg Leu Arg Pro Leu Leu Leu Ser 1040 1045 1050 Ser Glu Ala Ile Pro Asn Met Leu Asn Gly Arg Leu Leu Thr Gln 1055 1060 1065 Glu Glu His Asp Leu Ile Ala Leu Val Ile Asn Lys Gly Val Arg 1070 1075 1080 Val Val Val Ser Thr Phe Leu Ala Leu Pro Ser Thr Lys Ile Ile 1085 1090 1095 Arg Arg Asn Asn Leu Gly Ile Pro Arg Trp Arg Gly Asn Gly His 1100 1105 1110 Leu Pro Thr Ser Leu Asp Ile Gln Arg Ala Ala Thr Gln Ala Leu 1115 1120 1125 Glu Gly Arg Asp 1130 <210> 2 <211> 7 <212> RNA <213> Unknown <220> <223> Description of Unknown: MG3-6 consensus 3' PAM with sgRNA <220> <221> modified_base <222> (1)..(2) <223> a, c, u, g, unknown or other <400> 2 nnrgryy 7 <210> 3 <211> 110 <212> RNA <213> Unknown <220> <223> Description of Unknown: MG3-6 sgRNA <220> <221> modified_base <222> (1)..(22) <223> a, c, u, g, unknown or other <400> 3 nnnnnnnnnn nnnnnnnnnn nnguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60 augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110 <210> 4 <211> 1132 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG3-8 protein sequence (Class 2, type II) <400> 4 Met Ser Thr Asp Met Lys Asn Tyr Arg Ile Gly Val Asp Val Gly Asp 1 5 10 15 Arg Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Ala Gly Phe Pro 20 25 30 Ile Gln Lys Leu Ala Leu Val Thr Phe Arg His Asp Gly Gly Leu Asp 35 40 45 Pro Thr Asp Asn Pro Lys Ser Arg Lys Glu Thr Arg Gly Glu Ala Arg 50 55 60 Arg Arg Met Arg Met Thr Arg Arg Arg Lys Gln Arg Leu Arg Asp Leu 65 70 75 80 Asp Lys Val Leu Glu Asn Leu Gly Tyr Thr Val Pro Glu Gly Pro Glu 85 90 95 Pro Glu Thr Tyr Glu Ala Trp Thr Ser Arg Ala Leu Leu Ala Ser Ile 100 105 110 Lys Leu Ala Ser Ala Asp Glu Leu Asn Glu His Leu Val Arg Ala Val 115 120 125 Arg His Ile Ala Arg His Arg Gly Trp Val Asn Pro Trp Trp Ser Leu 130 135 140 Asp Gln Leu Glu Arg Ala Ser Gln Glu Pro Ser Glu Thr Phe Glu Ile 145 150 155 160 Ile Leu Ala Arg Ala Arg Glu Leu Phe Gly Glu Arg Val Pro Ala Asn 165 170 175 Pro Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Glu Val Leu 180 185 190 Leu Arg Pro Arg Ala Glu Lys Lys Lys Lys Thr Gly Tyr Val Arg Gly 195 200 205 Thr Pro Leu Leu Ala Ala Gln Val Arg Gln Ile Asp Gln Val Ala Glu 210 215 220 Leu Arg Arg Ile Cys Glu Val Gln Gly Ile Glu Glu Gln Tyr Glu Thr 225 230 235 240 Leu Arg Asn Ala Ile Phe Ala His Lys Val Ala Tyr Val Pro Thr Glu 245 250 255 Arg Val Gly Lys Asp Pro Leu Ala Pro Ser Lys Asn Arg Thr Ile Arg 260 265 270 Ala Ser Leu Glu Phe Gln Glu Phe Arg Ile Leu Asp Ser Val Ala Asn 275 280 285 Leu Arg Val Arg Thr Asp Ser Arg Ala Lys Arg Glu Leu Thr Glu Gly 290 295 300 Glu Tyr Asp Ala Ala Val Glu Phe Leu Met Gly Tyr Thr Ala Lys Glu 305 310 315 320 Gln Pro Ser Trp Ala Asp Val Ala Glu Glu Ile Gly Val Pro Gly Asn 325 330 335 Arg Leu Ile Ala Pro Val Leu Glu Asp Val Gln Gln Lys Thr Ala Pro 340 345 350 Phe Asp Arg Ser Ser Ala Ala Phe Glu Lys Ala Met Ser Lys Arg Thr 355 360 365 Glu Ala Arg Gln Trp Trp Glu Ala Asn Asp Asp Asp Gln Leu Arg Ser 370 375 380 Leu Phe Ile Met Phe Leu Ala Asp Ala Thr Asn Asp Thr Glu Glu Ala 385 390 395 400 Ala Ala Val Ala Gly Leu Pro Glu Leu Tyr Met Ser Trp Pro Ala Glu 405 410 415 Glu Arg Glu Ala Leu Ser Asn Ile Asp Phe Glu Lys Gly Arg Val Ala 420 425 430 Tyr Ser His Glu Thr Leu Ser Lys Leu Ser Glu Tyr Met His Glu His 435 440 445 Arg Val Gly Leu His Glu Ala Arg Lys Ala Val Phe Gly Val Asp Asp 450 455 460 Thr Trp Arg Pro Pro Leu Ala Lys Leu Glu Glu Pro Thr Gly Gln Pro 465 470 475 480 Thr Val Asp Arg Val Leu Thr Ile Leu Arg Arg Phe Val Leu Asp Cys 485 490 495 Glu Arg Gln Trp Gly Arg Pro Arg Ala Ile Thr Val Glu His Ala Arg 500 505 510 Ile Gly Leu Val Gly Pro Ala Gln Arg Gln Asn Ile Leu Lys Glu Gln 515 520 525 Glu Asp Asn Arg Lys Asn Asn Glu Cys Ile Arg Asp Glu Leu Arg Lys 530 535 540 Ser Gly Val Glu Asn Pro Ser Arg Thr Glu Val Arg Arg His Leu Val 545 550 555 560 Val Gln Asp Gln Glu Ser Gln Cys Leu Tyr Cys Gly Ala Val Ile Arg 565 570 575 Thr Asp Thr Ser Glu Leu Asp His Ile Val Pro Arg Ala Gly Gly Gly 580 585 590 Ser Ser Arg Arg Glu Asn Leu Ala Ala Val Cys Arg Tyr Cys Asn Ser 595 600 605 Lys Lys Asp Arg Thr Leu Phe Tyr Asp Trp Ala Gly Ser Val Arg Leu 610 615 620 Gln Glu Thr Ile Asp Arg Val Arg Gln Leu Lys Ala Phe Lys Asp Ser 625 630 635 640 Lys Lys Ala Lys Met Phe Lys Asn Gln Ile Arg Arg Leu Arg Gln Thr 645 650 655 Glu Ala Asp Glu Pro Ile Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr 660 665 670 Ala Ala Val Ala Val Arg Glu Arg Leu Glu Gln His Phe Asn Glu Gly 675 680 685 Leu Ala Pro Asp Asp Lys Asn Arg Val Val Leu Asp Val Tyr Ala Gly 690 695 700 Ser Val Thr Arg Glu Ser Arg Arg Ala Gly Gly Ile Asp Glu Arg Ile 705 710 715 720 Leu Leu Arg Gly Glu Arg Asp Lys Asn Arg Phe Asp Val Arg His His 725 730 735 Ala Ile Asp Ala Ala Val Met Thr Leu Leu Asn Arg Ser Val Ala Leu 740 745 750 Thr Leu Glu Gln Arg Ser Gln Leu Arg Arg Ala Phe Tyr Glu Gln Gly 755 760 765 Leu Asp Lys Leu Asp Arg Asp Gln Leu Lys Pro Glu Glu Asp Trp Arg 770 775 780 Asn Phe Ile Gly Leu Ser Leu Ala Ser Gln Glu Lys Phe Leu Glu Trp 785 790 795 800 Lys Lys Val Thr Thr Val Leu Gly Asp Leu Leu Ala Glu Ala Ile Glu 805 810 815 Asp Asp Ser Ile Ala Val Val Ser Pro Leu Arg Leu Arg Pro Gln Asn 820 825 830 Gly Arg Val His Lys Asp Thr Ile Ala Ala Val Lys Lys Gln Thr Leu 835 840 845 Gly Ser Ala Trp Ser Ala Asp Ala Val Lys Arg Ile Val Asp Pro Glu 850 855 860 Ile Tyr Leu Ala Met Lys Asp Ala Leu Gly Lys Ser Lys Val Leu Pro 865 870 875 880 Glu Asp Ser Ala Arg Thr Leu Glu Leu Ser Asp Gly Arg Tyr Leu Glu 885 890 895 Ala Asp Asp Glu Val Leu Phe Phe Pro Lys Asn Ala Ala Ser Ile Leu 900 905 910 Thr Pro Arg Gly Val Ala Glu Ile Gly Gly Ser Ile His His Ala Arg 915 920 925 Leu Tyr Ser Trp Leu Thr Lys Lys Gly Glu Leu Lys Ile Gly Met Leu 930 935 940 Arg Val Tyr Gly Ala Glu Phe Pro Trp Leu Met Arg Glu Ser Gly Ser 945 950 955 960 His Asp Val Leu Arg Met Pro Ile His Pro Gly Ser Gln Ser Phe Arg 965 970 975 Asp Met Gln Asp Thr Thr Arg Lys Ala Val Glu Ser Ser Glu Ala Val 980 985 990 Glu Phe Ala Trp Ile Thr Gln Asn Asp Glu Leu Glu Phe Glu Pro Glu 995 1000 1005 Asp Tyr Ile Ala His Gly Gly Lys Asp Glu Leu Arg Gln Phe Leu 1010 1015 1020 Glu Phe Met Pro Glu Cys Arg Trp Arg Val Asp Gly Phe Lys Lys 1025 1030 1035 Asn Tyr Gln Ile Arg Ile Arg Pro Ala Met Leu Ser Arg Glu Gln 1040 1045 1050 Leu Pro Ser Asp Ile Gln Arg Arg Leu Glu Ser Lys Thr Leu Thr 1055 1060 1065 Glu Asn Glu Ser Leu Leu Leu Lys Ala Leu Asp Thr Gly Leu Val 1070 1075 1080 Val Ala Ile Gly Gly Leu Leu Pro Leu Gly Thr Leu Lys Val Ile 1085 1090 1095 Arg Arg Asn Asn Leu Gly Phe Pro Arg Trp Arg Gly Asn Gly Asn 1100 1105 1110 Leu Pro Thr Ser Phe Glu Val Arg Ser Ser Ala Leu Arg Ala Leu 1115 1120 1125 Gly Val Glu Gly 1130 <210> 5 <211> 7 <212> DNA <213> Unknown <220> <223> Description of Unknown: MG3-8 consensus 3'PAM <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <400> 5 nnrgrty 7 <210> 6 <211> 110 <212> RNA <213> Unknown <220> <223> Description of Unknown: MG3-8 sgRNA <220> <221> modified_base <222> (1)..(22) <223> a, c, u, g, unknown or other <400> 6 nnnnnnnnnn nnnnnnnnnn nnguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60 augcugacuu cucaccgucc ggcuccucuu aggaacgggc gguauguuuu 110 <210> 7 <211> 1280 <212> PRT <213> Unknown <220> <223> Description of Unknown: MG29-1 (Class 2, type V-A Cas effector, Cas12a class) protein sequence <400> 7 Met Phe Asn Asn Phe Ile Lys Lys Tyr Ser Leu Gln Lys Thr Leu Arg 1 5 10 15 Phe Glu Leu Lys Pro Val Gly Glu Thr Ala Asp Tyr Ile Glu Asp Phe 20 25 30 Lys Ser Glu Tyr Leu Lys Asp Thr Val Leu Lys Asp Glu Gln Arg Ala 35 40 45 Lys Asp Tyr Gln Glu Ile Lys Thr Leu Ile Asp Asp Tyr His Arg Glu 50 55 60 Tyr Ile Glu Glu Cys Leu Arg Glu Pro Val Asp Lys Lys Thr Gly Glu 65 70 75 80 Ile Leu Asp Phe Thr Gln Asp Leu Glu Asp Ala Phe Ser Tyr Tyr Gln 85 90 95 Lys Leu Lys Glu Asn Pro Thr Glu Asn Arg Val Gly Trp Glu Lys Glu 100 105 110 Gln Glu Ser Leu Arg Lys Lys Leu Val Thr Ser Phe Val Gly Asn Asp 115 120 125 Gly Leu Phe Lys Lys Glu Phe Ile Thr Arg Asp Leu Pro Glu Trp Leu 130 135 140 Gln Lys Lys Gly Leu Trp Gly Glu Tyr Lys Asp Thr Val Glu Asn Phe 145 150 155 160 Lys Lys Phe Thr Thr Tyr Phe Ser Gly Phe His Glu Asn Arg Lys Asn 165 170 175 Met Tyr Thr Ala Glu Ala Gln Ser Thr Ala Ile Ala Asn Arg Leu Met 180 185 190 Asn Asp Asn Leu Pro Lys Phe Phe Asn Asn Tyr Leu Ala Tyr Gln Thr 195 200 205 Ile Lys Glu Lys His Pro Asp Leu Val Phe Arg Leu Asp Asp Ala Leu 210 215 220 Leu Gln Ala Ala Gly Val Glu His Leu Asp Glu Ala Phe Gln Pro Arg 225 230 235 240 Tyr Phe Ser Arg Leu Phe Ala Gln Ser Gly Ile Thr Ala Phe Asn Glu 245 250 255 Leu Ile Gly Gly Arg Thr Thr Glu Asn Gly Glu Lys Ile Gln Gly Leu 260 265 270 Asn Glu Gln Ile Asn Leu Tyr Arg Gln Gln Asn Pro Glu Lys Ala Lys 275 280 285 Gly Phe Pro Arg Phe Met Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg 290 295 300 Glu Thr His Ser Phe Leu Pro Asp Ala Phe Glu Asn Asp Lys Glu Leu 305 310 315 320 Leu Gln Ala Leu Arg Asp Tyr Val Asp Ala Ala Thr Ser Glu Glu Gly 325 330 335 Met Ile Ser Gln Leu Asn Lys Ala Met Asn Gln Phe Val Thr Ala Asp 340 345 350 Leu Lys Arg Val Tyr Ile Lys Ser Ala Ala Leu Thr Ser Leu Ser Gln 355 360 365 Glu Leu Phe His Phe Phe Gly Val Ile Ser Asp Ala Ile Ala Trp Tyr 370 375 380 Ala Glu Lys Arg Leu Ser Pro Lys Lys Ala Gln Glu Ser Phe Leu Lys 385 390 395 400 Gln Glu Val Tyr Ala Ile Glu Glu Leu Asn Gln Ala Val Val Gly Tyr 405 410 415 Ile Asp Gln Leu Glu Asp Gln Ser Glu Leu Gln Gln Leu Leu Val Asp 420 425 430 Leu Pro Asp Pro Gln Lys Pro Val Ser Ser Phe Ile Leu Thr His Trp 435 440 445 Gln Lys Ser Gln Glu Pro Leu Gln Ala Val Ile Ala Lys Val Glu Pro 450 455 460 Leu Phe Glu Leu Glu Glu Leu Ser Lys Asn Lys Arg Ala Pro Lys His 465 470 475 480 Asp Lys Asp Gln Gly Gly Glu Gly Phe Gln Gln Val Asp Ala Ile Lys 485 490 495 Asn Met Leu Asp Ala Phe Met Glu Val Ser His Ala Ile Lys Pro Leu 500 505 510 Tyr Leu Val Lys Gly Arg Lys Ala Ile Asp Met Pro Asp Val Asp Thr 515 520 525 Gly Phe Tyr Ala Asp Phe Ala Glu Ala Tyr Ser Ala Tyr Glu Gln Val 530 535 540 Thr Val Ser Leu Tyr Asn Lys Thr Arg Asn His Leu Ser Lys Lys Pro 545 550 555 560 Phe Ser Lys Asp Lys Ile Lys Ile Asn Phe Asp Ala Pro Thr Leu Leu 565 570 575 Asn Gly Trp Asp Leu Asn Lys Glu Ser Asp Asn Lys Ser Ile Ile Leu 580 585 590 Arg Lys Asp Gly Asn Phe Tyr Leu Ala Ile Met His Pro Lys His Thr 595 600 605 Lys Val Phe Asp Cys Tyr Ser Ala Ser Glu Ala Ala Gly Lys Cys Tyr 610 615 620 Glu Lys Met Asn Tyr Lys Leu Leu Ser Gly Ala Asn Lys Met Leu Pro 625 630 635 640 Lys Val Phe Phe Ser Lys Lys Gly Ile Glu Thr Phe Ser Pro Pro Gln 645 650 655 Glu Ile Leu Asp Leu Tyr Lys Asn Asn Glu His Lys Lys Gly Ala Thr 660 665 670 Phe Lys Leu Glu Ser Cys His Lys Leu Ile Asp Phe Phe Lys Arg Asn 675 680 685 Ile Pro Lys Tyr Lys Val His Pro Thr Asp Asn Phe Gly Trp Asp Val 690 695 700 Phe Gly Phe His Phe Ser Pro Thr Ser Ser Tyr Gly Asp Leu Ser Gly 705 710 715 720 Phe Tyr Arg Glu Val Glu Ala Gln Gly Tyr Lys Leu Trp Phe Ser Asp 725 730 735 Val Ser Glu Ala Tyr Ile Asn Lys Cys Val Glu Glu Gly Lys Leu Phe 740 745 750 Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Asn Ser Thr Gly Lys 755 760 765 Pro Asn Leu His Thr Leu Tyr Trp Lys Gly Leu Phe Glu Pro Glu Asn 770 775 780 Leu Lys Asp Val Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Tyr 785 790 795 800 Arg Lys His Ser Ile Lys His Glu Asp Lys Thr Ile His Arg Ala Lys 805 810 815 Asp Pro Ile Ala Asn Lys Asn Ala Asp Asn Pro Lys Lys Gln Ser Val 820 825 830 Phe Asp Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe 835 840 845 Phe Phe His Val Pro Ile Ser Leu Asn Phe Lys Ser Gln Gly Val Val 850 855 860 Arg Phe Asn Asp Lys Ile Asn Gly Leu Leu Ala Ala Gln Asp Asp Val 865 870 875 880 His Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Tyr Thr 885 890 895 Val Val Asn Gly Lys Gly Glu Val Val Glu Gln Gly Ser Leu Asn Gln 900 905 910 Val Ala Thr Asp Gln Gly Tyr Val Val Asp Tyr Gln Gln Lys Leu His 915 920 925 Ala Lys Glu Lys Glu Arg Asp Gln Ala Arg Lys Asn Trp Ser Thr Ile 930 935 940 Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Leu Ser Gln Val Val His 945 950 955 960 Lys Leu Ala Gln Leu Ile Val Lys His Asn Ala Ile Val Cys Leu Glu 965 970 975 Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln 980 985 990 Val Tyr Gln Lys Phe Glu Lys Ala Leu Ile Asp Lys Leu Asn Tyr Leu 995 1000 1005 Val Phe Lys Glu Arg Gly Ala Thr Gln Ala Gly Gly Tyr Leu Asn 1010 1015 1020 Ala Tyr Gln Leu Ala Ala Pro Phe Glu Ser Phe Glu Lys Leu Gly 1025 1030 1035 Lys Gln Thr Gly Ile Leu Tyr Tyr Val Arg Ser Asp Tyr Thr Ser 1040 1045 1050 Lys Ile Asp Pro Ala Thr Gly Phe Val Asp Phe Leu Lys Pro Lys 1055 1060 1065 Tyr Glu Ser Met Ala Lys Ser Lys Val Phe Phe Glu Ser Phe Glu 1070 1075 1080 Arg Ile Gln Trp Asn Gln Ala Lys Gly Tyr Phe Glu Phe Glu Phe 1085 1090 1095 Asp Tyr Lys Lys Met Cys Pro Ser Arg Lys Phe Gly Asp Tyr Arg 1100 1105 1110 Thr Arg Trp Val Val Cys Thr Phe Gly Asp Thr Arg Tyr Gln Asn 1115 1120 1125 Arg Arg Asn Lys Ser Ser Gly Gln Trp Glu Thr Glu Thr Ile Asp 1130 1135 1140 Val Thr Ala Gln Leu Lys Ala Leu Phe Ala Ala Tyr Gly Ile Thr 1145 1150 1155 Tyr Asn Gln Glu Asp Asn Ile Lys Asp Ala Ile Ala Ala Val Lys 1160 1165 1170 Tyr Thr Lys Phe Tyr Lys Gln Leu Tyr Trp Leu Leu Arg Leu Thr 1175 1180 1185 Leu Ser Leu Arg His Ser Val Thr Gly Thr Asp Glu Asp Phe Ile 1190 1195 1200 Leu Ser Pro Val Ala Asp Glu Asn Gly Val Phe Phe Asp Ser Arg 1205 1210 1215 Lys Ala Thr Asp Lys Gln Pro Lys Asp Ala Asp Ala Asn Gly Ala 1220 1225 1230 Tyr His Ile Ala Leu Lys Gly Leu Trp Asn Leu Gln Gln Ile Arg 1235 1240 1245 Gln His Asp Trp Asn Val Glu Lys Pro Lys Lys Leu Asn Leu Ala 1250 1255 1260 Met Lys Asn Glu Glu Trp Phe Gly Phe Ala Gln Lys Lys Lys Phe 1265 1270 1275 Arg Ala 1280 <210> 8 <211> 4 <212> DNA <213> Unknown <220> <223> Description of Unknown: MG29-1 consensus 5' PAM <220> <221> modified_base <222> (4)..(4) <223> a, c, t, g, unknown or other <400> 8 tttn 4 <210> 9 <211> 44 <212> RNA <213> Unknown <220> <223> Description of Unknown: MG29-1 crRNA <220> <221> modified_base <222> (21)..(44) <223> a, c, u, g, unknown or other <400> 9 uaauuucuac uguuguagau nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 10 <211> 22 <212> DNA <213> Homo sapiens <220> <223> MG3-6-TRAC-6-22 <400> 10 cgaatcctcc tcctgaaagt gg 22 <210> 11 <211> 20 <212> DNA <213> Homo sapiens <220> <223> SpyCas9 TRAC-1-20 <400> 11 acaaaactgt gctagacatg 20 <210> 12 <211> 20 <212> DNA <213> Homo sapiens <220> <223> SpyCas9 TRAC-2-20 <400> 12 agagcaacag tgctgtggcc 20 <210> 13 <211> 20 <212> DNA <213> Homo sapiens <220> <223> SpyCas9 TRAC-3-20 <400> 13 tctctcagct ggtacacggc 20 <210> 14 <211> 22 <212> DNA <213> Homo sapiens <220> <223> MG29-1-TRAC-19-22 <400> 14 ttgctccagg ccacagcact gt 22 <210> 15 <211> 22 <212> DNA <213> Homo sapiens <220> <223> MG29-1-TRAC-35-22 <400> 15 gagtctctca gctggtacac gg 22 <210> 16 <211> 20 <212> DNA <213> Homo sapiens <220> <223> MG29-1-GR-29-20 (NR3C1 targeting) <400> 16 cagcttccac aagttaagac 20 <210> 17 <211> 22 <212> DNA <213> Homo sapiens <220> <223> MG29-1-ALB-87 (albumin targeting) <400> 17 cgcactaagg aaagtgcaaa gt 22 <210> 18 <211> 22 <212> DNA <213> Homo sapiens <220> <223> MG29-1-ALB-74 (albumin targeting) <400> 18 aataaagcat agtgcaatgg at 22 <210> 19 <211> 22 <212> DNA <213> Homo sapiens <220> <223> MG29-1-ALB-83 (albumin targeting) <400> 19 tgagatcaac agcacaggtt tt 22 <210> 20 <211> 20 <212> DNA <213> Homo sapiens <220> <223> NR3C1 spacer target sequence MG29-1-GR-13-20 ("target B") <400> 20 gtctgtggta tacaatttca 20 <210> 21 <211> 20 <212> DNA <213> Homo sapiens <220> <223> NR3C1 spacer target sequence MG29-1-GR-28-20 ("target C") <400> 21 ggaggtggtc ctgttgttgc 20 <210> 22 <211> 20 <212> DNA <213> Homo sapiens <220> <223> NR3C1 spacer target sequence MG29-1-GR-29-20 ("target D") <400> 22 cagcttccac aagttaagac 20 <210> 23 <211> 500 <212> DNA <213> Homo sapiens <220> <223> CAR 5' homology arm targeting TRAC <400> 23 ttaatgccaa cataccataa acctcccatt ctgctaatgc ccagcctaag ttggggagac 60 cactccagat tccaagatgt acagtttgct ttgctgggcc tttttcccat gcctgccttt 120 actctgccag agttatattg ctggggtttt gaagaagatc ctattaaata aaagaataag 180 cagtattatt aagtagccct gcatttcagg tttccttgag tggcaggcca ggcctggccg 240 tgaacgttca ctgaaatcat ggcctcttgg ccaagattga tagcttgtgc ctgtccctga 300 gtcccagtcc atcacgagca gctggtttct aagatgctat ttcccgtata aagcatgaga 360 ccgtgacttg ccagccccac agagccccgc ccttgtccat cactggcatc tggactccag 420 cctgggttgg ggcaaagagg gaaatgagat catgtcctaa ccctgatcct cttgtcccac 480 agatatccag aaccctgacc 500 <210> 24 <211> 500 <212> DNA <213> Homo sapiens <220> <223> CAR 3' homology arm targeting TRAC <400> 24 ctgccgtgta ccagctgaga gactctaaat ccagtgacaa gtctgtctgc ctattcaccg 60 attttgattc tcaaacaaat gtgtcacaaa gtaaggattc tgatgtgtat atcacagaca 120 aaactgtgct agacatgagg tctatggact tcaagagcaa cagtgctgtg gcctggagca 180 acaaatctga ctttgcatgt gcaaacgcct tcaacaacag cattattcca gaagacacct 240 tcttccccag cccaggtaag ggcagctttg gtgccttcgc aggctgtttc cttgcttcag 300 gaatggccag gttctgccca gagctctggt caatgatgtc taaaactcct ctgattggtg 360 gtctcggcct tatccattgc caccaaaacc ctctttttac taagaaacag tgagccttgt 420 tctggcagtc cagagaatga cacgggaaaa aagcagatga agagaaggtg gcaggagagg 480 gcacgtggcc cagcctcagt 500 <210> 25 <211> 7 <212> PRT <213> Simian virus 40 <220> <223> SV40 <400> 25 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 26 <211> 16 <212> PRT <213> Unknown <220> <223> Description of Unknown: Nucleoplasmin bipartite NLS sequence <400> 26 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 27 <211> 9 <212> PRT <213> Unknown <220> <223> Description of Unknown: C-myc NLS sequence <400> 27 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 28 <211> 11 <212> PRT <213> Unknown <220> <223> Description of Unknown: C-myc NLS sequence <400> 28 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 29 <211> 38 <212> PRT <213> Homo sapiens <220> <223> hRNPA1 M9 NLS <400> 29 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 30 <211> 42 <212> PRT <213> Unknown <220> <223> Description of Unknown: Importin-alpha IBB domain sequence <400> 30 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 31 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: Myoma T protein sequence <400> 31 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 32 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: Myoma T protein sequence <400> 32 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 33 <211> 8 <212> PRT <213> Homo sapiens <220> <223> p53 <400> 33 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 34 <211> 12 <212> PRT <213> Mus musculus <220> <223> mouse c-abl IV <400> 34 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 35 <211> 5 <212> PRT <213> Influenza A virus <220> <223> influenza virus NS1 <400> 35 Asp Arg Leu Arg Arg 1 5 <210> 36 <211> 7 <212> PRT <213> Influenza A virus <220> <223> influenza virus NS1 <400> 36 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 37 <211> 10 <212> PRT <213> Hepacivirus D <220> <223> Hepatitis virus delta antigen <400> 37 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 38 <211> 10 <212> PRT <213> Mus musculus <220> <223> mouse Mx1 protein <400> 38 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 39 <211> 20 <212> PRT <213> Homo sapiens <220> <223> human poly(ADP-ribose) polymerase <400> 39 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 40 <211> 17 <212> PRT <213> Homo sapiens <220> <223> steroid hormone receptors (human) glucocorticoid <400> 40 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 41 <211> 20 <212> DNA <213> Homo sapiens <220> <223> AAVS1 spacer target sequence <400> 41 ggggccacta gggacaggat 20 <210> 42 <211> 500 <212> DNA <213> Homo sapiens <220> <223> GR isoform 5' homology arm targeting AAVS1 <400> 42 ctccttctgg ggcctgtgcc atctctcgtt tcttaggatg gccttctccg acggatgtct 60 cccttgcgtc ccgcctcccc ttcttgtagg cctgcatcat caccgttttt ctggacaacc 120 ccaaagtacc ccgtctccct ggctttagcc acctctccat cctcttgctt tctttgcctg 180 gacaccccgt tctcctgtgg attcgggtca cctctcactc ctttcatttg ggcagctccc 240 ctacccccct tacctctcta gtctgtgcta gctcttccag ccccctgtca tggcatcttc 300 caggggtccg agagctcagc tagtcttctt cctccaaccc gggcccctat gtccacttca 360 ggacagcatg tttgctgcct ccagggatcc tgtgtccccg agctgggacc accttatatt 420 cccagggccg gttaatgtgg ctctggttct gggtactttt atctgtcccc tccaccccac 480 agtggggcca ctagggacag 500 <210> 43 <211> 500 <212> DNA <213> Homo sapiens <220> <223> GR isoform 3' homology arm targeting AAVS1 <400> 43 gattggtgac agaaaagccc catccttagg cctcctcctt cctagtctcc tgatattggg 60 tctaaccccc acctcctgtt aggcagattc cttatctggt gacacacccc catttcctgg 120 agccatctct ctccttgcca gaacctctaa ggtttgctta cgatggagcc agagaggatc 180 ctgggaggga gagcttggca gggggtggga gggaaggggg ggatgcgtga cctgcccggt 240 tctcagtggc caccctgcgc taccctctcc cagaacctga gctgctctga cgcggccgtc 300 tggtgcgttt cactgatcct ggtgctgcag cttccttaca cttcccaaga ggagaagcag 360 tttggaaaaa caaaatcaga ataagttggt cctgagttct aactttggct cttcaccttt 420 ctagtcccca atttatattg ttcctccgtg cgtcagtttt acctgtgaga taaggccagt 480 agccagcccc gtcctggcag 500 <210> 44 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG3-6 sgRNA targeting TRAC <400> 44 cgaauccucc uccugaaagu ggguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60 augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110 <210> 45 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG3-6 sgRNA targeting TRBC1/2 <400> 45 cggcgcugac gaucugggug guugagaauc gaaagauucu uaauaaggca uccuuccgau 60 gcugacuucu caccguccgu uuuccaauag gagcgggcgg uauguuuu 108 <210> 46 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting TRAC <400> 46 uaauuucuac uguuguagau gagucucuca gcugguacac gg 42 <210> 47 <211> 40 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting TRBC1/2 <400> 47 uaauuucuac uguuguagau agccaucaga agcagagauc 40 <210> 48 <211> 40 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting TRBC1/2 <400> 48 uaauuucuac uguuguagau gcccuauccu ggguccacuc 40 <210> 49 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting B2M <400> 49 uaauuucuac uguuguagau uaucucuugu acuacacuga au 42 <210> 50 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting B2M <400> 50 uaauuucuac uguuguagau agugggggug aauucagugu ag 42 <210> 51 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting B2M <400> 51 uaauuucuac uguuguagau cauucucugc uggaugacgu ga 42 <210> 52 <211> 22 <212> DNA <213> Homo sapiens <220> <223> TRAC spacer target sequence (MG3-6-TRAC-6) <400> 52 cgaatcctcc tcctgaaagt gg 22 <210> 53 <211> 22 <212> DNA <213> Homo sapiens <220> <223> AAVS1 spacer target sequence (MG3-6-AAVS1-D2) <400> 53 taggaaggag gaggcctaag ga 22 <210> 54 <211> 22 <212> DNA <213> Homo sapiens <220> <223> TRAC spacer target sequence (MG29-1-TRAC-35) <400> 54 gagtctctca gctggtacac gg 22 <210> 55 <211> 22 <212> DNA <213> Homo sapiens <220> <223> AAVS1 spacer target sequence (MG29-1-AAVS1-F3) <400> 55 tctgtcccct ccaccccaca gt 22 <210> 56 <211> 23 <212> DNA <213> Homo sapiens <220> <223> AAVS1 spacer target sequence (SpCas9, Mali et al. AAVS1 T2) <400> 56 ggggccacta gggacaggat tgg 23 <210> 57 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG3-6 sgRNA targeting TRAC (MG3-6-TRAC-6) <400> 57 cgaauccucc uccugaaagu ggguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60 augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110 <210> 58 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG3-6 sgRNA targeting AAVS1 (MG3-6-AAVS1-D2) <400> 58 uaggaaggag gaggccuaag gaguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60 augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110 <210> 59 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting TRAC (MG29-1-TRAC-35) <400> 59 uaauuucuac uguuguagau gagucucuca gcugguacac gg 42 <210> 60 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <223> MG29-1 sgRNA targeting AAVS1 (MG29-1-AAVS1-F3) <400> 60 uaauuucuac uguuguagau ucuguccccu ccaccccaca gu 42 <210> 61 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> SpCas9 sgRNA targeting AAVS1 (SpCas9, Mali et al. AAVS1 T2) <400> 61 ggggccacua gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 62 <211> 3705 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> MG3-6 nuclease (mRNA sequence) <400> 62 atgcatgcgc ggccgcaagc tttaatacga ctcactataa ggaaaagcca gctccagcag 60 gcgctgctca ctcctcccca tcctctccct ctgtccctct gtccctctga ccctgcactg 120 tcccagcacc atggccccca agaagaagcg gaaagttggc ggcggaggca gcagcaccga 180 catgaagaac taccggatcg gcgtggacgt gggcgataga tctgttggac tggccgccat 240 cgagttcgac gatgatggac tgcccatcca gaagctggcc ctggtcacct ttagacacga 300 tggcggactg gaccccacca agaacaagac ccctatgagc cggaaagaga cacggggaat 360 cgccagacgg accatgcgga tgaacagaga gcggaagcgg cggctgagaa acctggacaa 420 cgtgctggaa aacctgggct actctgtgcc tgagggccct gagcctgaga catatgaggc 480 ctggacaagc agagccctgc tggcctctat caaactggcc tctgccgacg agctgaacga 540 acaccttgtc agagccgtgc ggcacatggc cagacataga ggatgggcca atccttggtg 600 gtccctggac cagctggaaa aggccagcca agagcctagc gagacattcg agatcatcct 660 ggccagagcc agagagctgt tcggcgagaa ggtgcccgct aatcctacac tgggaatgct 720 gggagccctg gccgctaaca atgaggtgct gctgaggccc agggacgaga agaagagaaa 780 gaccggatac gtgcggggca cccctctgat gtttgctcaa gttcgacagg gcgatcagct 840 ggccgagctg cggagaattt gtgaagtgca gggcatcgag gaccagtacg aggctctgag 900 actgggcgtg ttcgaccaca agcaccccta cgtgcccaaa gaaagagtgg gcaaagaccc 960 tctgaacccc agcaccaaca gaaccatcag agccagcctg gaatttcaag agttccgcat 1020 cctggacagc gtggccaatc tgagagtgcg gatcggcagc agagccaaga gggaactgac 1080 agaggccgag tatgatgccg ccgtggaatt cctgatggac tacgccgaca aagagcagcc 1140 tagctgggcc gatgtggccg agaaaattgg cgtgcccggc aacagactgg tggcccctgt 1200 tctggaagat gtgcagcaga aaacagcccc ttacgacaga agcagcgccg cctttgagaa 1260 ggccatgggc aagaaaaccg aggccagaca gtggtgggag tccaccgatg atgaccagct 1320 gagaagcctg ctgattgcct tcctggtgga cgccaccaac gacacagaag aagccgctgc 1380 tgaagccggc ctgagcgagc tgtataagtc ttggcctgcc gaggaaagag aggccctgtc 1440 caacatcgac ttcgagaagg gcagagtggc ctacagccaa gaaaccctga gcaagctgag 1500 cgagtacatg cacgagtaca gagtgggact gcacgaggct agaaaggccg tgttcggagt 1560 ggatgatacc tggcggcctc ctctggataa gctggaagaa cctacaggac agcctgccgt 1620 ggacagagtg ctgaccatcc tgagaagatt cgtgctggac tgcgagcggc aatggggcag 1680 acctagagcc atcaccgtgg aacacacacg gacaggcctg atgggcccaa cacagagaca 1740 gaagatcctg aacgagcaga agaagaaccg ggccgacaac gagagaatcc gggatgagct 1800 gagagaatct ggcgtggaca acccctccag agccgaagtt cggagacacc tgatcgtgca 1860 agagcaagag tgccagtgcc tgtactgcgg caccatgatc accaccacca caagcgagct 1920 ggaccacatc gttcctagag ccggtggcgg cagcagcaga agggaaaatc tggccgctgt 1980 gtgcagagcc tgcaacgcca agaagaaacg cgagctgttc tacgcctggg ctggcccagt 2040 gaagtcccaa gagacaatcg agagagtcag acagctgaag gcctttaagg acagcaagaa 2100 agccaagatg ttcaagaacc agatccgccg gctgaaccag accgaggccg atgagcctat 2160 cgacgaaaga agcctggcca gcacatctta cgccgctgtg gccgttagag agcggctgga 2220 acagcacttc aacgaaggcc tggcactgga cgacaagtcc agagtggtgc tggatgtgta 2280 tgccggcgct gtgaccagag agtctcgtag agctggcggc atcgacgagc ggattctgct 2340 gagaggcgag cgggacaaga acagattcga tgtgcggcat cacgccgtgg acgctgctgt 2400 tatgaccctg ctgaacagat ccgtggctct gaccctggaa cagagatcac agctgcggcg 2460 gaccttctac gagcaaggac tggacaaact ggaccggaac cagctgaagc ccgaggaaga 2520 ttggagagac ttcaccggac tggcccctgc ctctcaagag aagtttctgg aatggcggaa 2580 ggccgccacc atcctgggag atttgctggc cgaagccatc gaggatgact ctatcgccgt 2640 ggtgtcccca ctgagactga ggccacagaa tggcagcgtg cacctggaaa caatcagcgc 2700 cgtgaagaag cagaccctgg gctctgattg gccagccgac gccgtgaaaa gaatcgtgga 2760 ccccgagatc tacctggcta tgaaggatgc cctgggaaag ctgaaagagc tgcccgagga 2820 tagcgccaga tctctggaac tgcccgacgg cagattcgtg gaagccgatg acgaggtgct 2880 gttcttccca gagaacgccg ccagcattct gacccctaga ggcgtggcag agatcggcgg 2940 ctctattcac catgccagac tgtacggctg gctgaccaaa aagggcgagc tgaaagtggg 3000 catgctgaga gtgtacggcg ccgagtttcc ctggctgatg agagagtccg gctccagaaa 3060 cgtgctgagc atgcctatcc acagaggcag ccagagcttc cgggacatgc aggacacaac 3120 ccggaaagcc gtggaaagcg gagaggctgt ggaattcgcc tggatcaccc agaacgatga 3180 gctggaattc gaccccgacg actacattgc ccacggcgga aaggacgaac tgagacagtt 3240 cctgggcttt atgcccgagt gccgttggag agtggacggc ttcaagaaga attaccagat 3300 cagaatcagg cccgccatgc tgagcagaga gcagctgcct agcgacatcc agcggagact 3360 ggaaagcaag accctgacca agaacgagtc cctgctgctg aaagccctgg atacaggact 3420 ggtggtggcc atcggaggac tgctgcctct cgagacactg aaagtgatcc ggcgcaacaa 3480 tctgggcttc cccaggtggc gcggaaacgg aaatctgccc accagctttg aagtgcggag 3540 cagcgctctg agagccctgg gagttgaagg atctggcgga aaaagacctg ccgccacaaa 3600 gaaagccgga caggccaaga aaaagaagtg accacacccc cattccccca ctccagatag 3660 aacttcagtt atatctcacg tgtctggagt tggatccatg catgc 3705 <210> 63 <211> 4036 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Transgene inserted at AAVS1 locus (MND promoter-driven GFP and tEGFR coding sequences flanked by homology arms corresponding to the cut site of Mali et al. AAVS1 T2 guide) <400> 63 ggccgcttaa ttaataataa ggaagtgcca ttccgcctga cctctccttc tggggcctgt 60 gccatctctc gtttcttagg atggccttct ccgacggatg tctcccttgc gtcccgcctc 120 cccttcttgt aggcctgcat catcaccgtt tttctggaca accccaaagt accccgtctc 180 cctggcttta gccacctctc catcctcttg ctttctttgc ctggacaccc cgttctcctg 240 tggattcggg tcacctctca ctcctttcat ttgggcagct cccctacccc ccttacctct 300 ctagtctgtg ctagctcttc cagccccctg tcatggcatc ttccaggggt ccgagagctc 360 agctagtctt cttcctccaa cccgggcccc tatgtccact tcaggacagc atgtttgctg 420 cctccaggga tcctgtgtcc ccgagctggg accaccttat attcccaggg ccggttaatg 480 tggctctggt tctgggtact tttatctgtc ccctccaccc cacagtgggg ccactaggga 540 cagatttgtg tgaacagaga aacaggagaa tatgggccaa acaggatatc tgtggtaagc 600 agttcctgcc ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg 660 atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg 720 cggtcccgcc ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac 780 ctgaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg 840 cgcgcttctg ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcaa 900 atgcctggag acgccatcca cgctgttttg acctccatag aagacaccga ctctagagga 960 tccaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat 1020 cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga 1080 gggcgatgcc acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc 1140 cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta 1200 ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca 1260 ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt 1320 cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg 1380 caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc 1440 cgacaagcag aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg 1500 cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct 1560 gctgcccgac aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa 1620 gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga 1680 cgagctgtac aagggcagcg gcgaaggaag gggttctctg ttgacttgcg gggatgttga 1740 agaaaacccg ggaccaatgc ttctcctggt gacaagcctt ctgctctgtg agttaccaca 1800 cccagcattc ctcctgatca ggaaggtgtg caacggcatc ggcatcggcg agttcaagga 1860 cagcctgagc atcaacgcca ccaacatcaa gcacttcaag aactgcacca gcatcagcgg 1920 cgacctgcac atcctgcccg tggccttcag gggcgacagc ttcacccaca ccccccccct 1980 ggacccccag gagctggaca tcctgaagac cgtgaaggag atcaccggct tcctgctgat 2040 ccaggcctgg cccgagaaca ggaccgacct gcacgccttc gagaacctgg agatcatcag 2100 gggcaggacc aagcagcacg gccagttcag cctggccgtg gtgagcctga acatcaccag 2160 cctgggcctg aggagcctga aggagatcag cgacggcgac gtgatcatca gcggcaacaa 2220 gaacctgtgc tacgccaaca ccatcaactg gaagaagctg ttcggcacca gcggccagaa 2280 gaccaagatc atcagcaaca ggggcgagaa cagctgcaag gccaccggcc aggtgtgcca 2340 cgccctgtgc agccccgagg gctgctgggg ccccgagccc agggactgcg tgagctgcag 2400 gaacgtgagc aggggcaggg agtgcgtgga caagtgcaac ctgctggagg gcgagcccag 2460 ggagttcgtg gagaacagcg agtgcatcca gtgccacccc gagtgcctgc cccaggccat 2520 gaacatcacc tgcaccggca ggggccccga caactgcatc cagtgcgccc actacatcga 2580 cggcccccac tgcgtgaaga cctgccccgc cggcgtgatg ggcgagaaca acaccctggt 2640 gtggaagtac gccgacgccg gccacgtgtg ccacctgtgc caccccaact gcacctacgg 2700 ctgcaccggc cccggcctgg agggctgccc caccaacggc cccaagatcc ccagcatcgc 2760 caccggcatg gtgggcgccc tgctgctgct gctggtggtg gccctgggca tcggcctgtt 2820 catgggcagc ggcgaaggaa ggggttctct gttgacttgc ggggatgttg aagaaaaccc 2880 gggaccaatg gggaatgaag caagttatcc attggaaatg tgtagccatt ttgatgctga 2940 tgaaataaag agactcggaa aacgatttaa gaaactcgat cttgataata gtggatctct 3000 ctctgtcgaa gaattcatgt cccttcctga actccaacaa aatccactcg tccaaagagt 3060 cattgatata tttgatacgg atgggaatgg tgaagtcgat tttaaagaat ttattgaagg 3120 ggttagtcaa ttttccgtca aaggggataa agaacagaaa ctccgctttg cgtttcgaat 3180 ttatgacatg gacaaggacg gatacatctc caacggggaa ctctttcaag ttctcaaaat 3240 gatggtagga aataacacca aacttgcgga cactcaactc caacaaattg ttgataaaac 3300 aattattaac gctgataaag atggagatgg tcgtattagc tttgaagaat tttgcgcagt 3360 tgtcggcggt ttggacatcc acaagaagat ggtagtcgat gtttgaaact tgtttattgc 3420 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 3480 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttacg ccgattggtg 3540 acagaaaagc cccatcctta ggcctcctcc ttcctagtct cctgatattg ggtctaaccc 3600 ccacctcctg ttaggcagat tccttatctg gtgacacacc cccatttcct ggagccatct 3660 ctctccttgc cagaacctct aaggtttgct tacgatggag ccagagagga tcctgggagg 3720 gagagcttgg cagggggtgg gagggaaggg ggggatgcgt gacctgcccg gttctcagtg 3780 gccaccctgc gctaccctct cccagaacct gagctgctct gacgcggccg tctggtgcgt 3840 ttcactgatc ctggtgctgc agcttcctta cacttcccaa gaggagaagc agtttggaaa 3900 aacaaaatca gaataagttg gtcctgagtt ctaactttgg ctcttcacct ttctagtccc 3960 caatttatat tgttcctccg tgcgtcagtt ttacctgtga gataaggcca gtagccagcc 4020 ccgtcctggc agggcc 4036 <210> 64 <211> 4263 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Transgene inserted at TRAC locus (MSCV promoter-driven tLNGFR coding sequence flanked by homology arms corresponding to the cut site of MG3-6-TRAC-6.) <400> 64 caatggtcct gtctctcaag aatcccctgc cactcctcac acccaccctg ggcccatatt 60 catttccatt tgagttgttc ttattgagtc atccttcctg tggtagcgga actcactaag 120 gggcccatct ggacccgagg tattgtgatg ataaattctg agcacctacc ccatccccag 180 aagggctcag aaataaaata agagccaagt ctagtcggtg tttcctgtct tgaaacacaa 240 tactgttggc cctggaagaa tgcacagaat ctgtttgtaa ggggatatgc acagaagctg 300 caagggacag gaggtgcagg agctgcaggc ctcccccacc cagcctgctc tgccttgggg 360 aaaaccgtgg gtgtgtcctg caggccatgc aggcctggga catgcaagcc cataaccgct 420 gtggcctctt ggttttacag atacgaacct aaactttcaa aacctgtcag tgattgggtt 480 ccgaatcctc ctcctgaaag ttaattaatg aatgaatgaa ataaaagatc tttattttca 540 ttagatctgt gtgttggttt tttgtgtgat cctcgaggga atgaaagacc ccacctgtag 600 gtttggcaag ctagcttaag taacgccatt ttgcaaggca tggaaaatac ataactgaga 660 atagagaagt tcagatcaag gttaggaaca gagagacagc agaatatggg ccaaacagga 720 tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 780 ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 840 tgaaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg 900 cgcgcttctg ctccccgagc tcaataaaag agcccacaac ccctcactcg gcgcgcgcca 960 gtccggtacc agtcgccacc atggccctgc ctgtgacagc tctgctcctc cctctggccc 1020 tgctgctcca tgccgccaga cccgacatcg tgctgaccca gagccccccc agcctggcca 1080 tgtctctggg caagagagcc accatcagct gccgggccag cgagagcgtg accatcctgg 1140 gcagccacct gatccactgg tatcagcaga agcccggcca gccccccacc ctgctgatcc 1200 agctcgccag caatgtgcag accggcgtgc ccgccagatt cagcggcagc ggcagcagaa 1260 ccgacttcac cctgaccatc gaccccgtgg aagaggacga cgtggccgtg tactactgcc 1320 tgcagagccg gaccatcccc cggacctttg gcggaggcac caaactggaa atcaagggca 1380 gcaccagcgg ctccggcaag cctggctctg gcgagggcag cacaaaggga cagattcagc 1440 tggtgcagag cggccctgag ctgaagaaac ccggcgagac agtgaagatc agctgcaagg 1500 cctccggcta caccttcacc gactacagca tcaactgggt gaaaagagcc cctggcaagg 1560 gcctgaagtg gatgggctgg atcaacaccg agacaagaga gcccgcctac gcctacgact 1620 tccggggcag attcgccttc agcctggaaa ccagcgccag caccgcctac ctgcagatca 1680 acaacctgaa gtacgaggac accgccacct acttttgcgc cctggactac agctacgcca 1740 tggactactg gggccagggc accagcgtga ccgtgtccag cttcgtgccc gtgttcctgc 1800 ccgccaaacc taccaccacc cctgccccta gacctcccac cccagcccca acaatcgcca 1860 gccagcctct gtctctgcgg cccgaagcct gtagacctgc tgccggcgga gccgtgcaca 1920 ccagaggcct ggacttcgcc tgcgacatct acatctgggc ccctctggcc ggcacctgtg 1980 gcgtgctgct gctgagcctg gtgatcaccc tgtactgcaa ccaccggaac agaagcaagc 2040 ggagccggct gctgcacagc gactacatga acatgacccc aagacggcct ggccccaccc 2100 ggaagcacta ccagccttac gcccctccca gagacttcgc cgcctaccgg tccagagtga 2160 agttcagcag atccgccgac gcccctgcct accagcaggg acagaaccag ctgtacaacg 2220 agctgaacct gggcagacgg gaagagtacg acgtgctgga caagcggaga ggccgggacc 2280 ccgagatggg cggaaagccc agacggaaga acccccagga aggcctgtat aacgaactgc 2340 agaaagacaa gatggccgag gcctacagcg agatcggcat gaagggcgag cggaggcgcg 2400 gcaagggcca cgatggcctg taccagggcc tgagcaccgc caccaaggac acctacgacg 2460 ccctgcacat gcaggccctg ccccccagag gatccggcgc tacaaatttt tcactgctga 2520 aacaggcggg tgatgtggag gagaaccctg gacccatggg tgctggcgca actggacgcg 2580 ctatggatgg acctcgcttg ctgcttcttc tgcttctcgg ggtctcattg ggtggtgcta 2640 aggaagcatg cccaacggga ctttatacgc atagcggaga gtgttgcaaa gcttgtaacc 2700 tgggcgaagg cgtcgcgcaa ccttgtggtg caaatcaaac cgtctgcgag ccatgtttgg 2760 actctgttac gtttagtgac gtagtatctg cgacagagcc atgcaagcct tgtacggaat 2820 gtgtaggatt gcagagcatg tctgcccctt gtgtagaagc cgacgatgca gtttgcaggt 2880 gcgcgtatgg ctattaccaa gacgaaacaa ccggacgatg tgaagcttgc cgagtttgtg 2940 aagcgggttc cgggcttgta ttctcatgtc aggataagca gaacaccgtc tgcgaagagt 3000 gccccgatgg cacctacagc gatgaagcga accatgtaga cccctgcctg ccttgcaccg 3060 tttgtgaaga cacggaacga cagttgcggg agtgtacccg gtgggcagac gccgagtgcg 3120 aagagattcc aggccgctgg atcacgcgaa gtaccccgcc agaaggttcc gacagtactg 3180 caccaagcac ccaagaacca gaggcgcccc ccgagcagga cctgattgcc tccaccgtgg 3240 cgggtgttgt tactacggtt atgggctcat cccagcccgt tgttacccga ggaactacag 3300 acaacctgat tccggtatat tgttctatct tggcggctgt agtagttggc ttggtcgcgt 3360 acatcgcttt caaaagatga aagcttgata atcaacctct ggattacaaa atttgtgaaa 3420 gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 3480 tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 3540 cctggttagt tcttgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag 3600 gggctcggct gttgggcact gacaattccg tggaacttgt ttattgcagc ttataatggt 3660 tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 3720 agttgtggtt tgtccaaact catcaatgta tcttagttta aactggccgg gtttaatctg 3780 ctcatgacgc tgcggctgtg gtccagctga ggtgaggggc cttgaagctg ggagtggggt 3840 ttagggacgc gggtctctgg gtgcatccta agctctgaga gcaaacctcc ctgcagggtc 3900 ttgcttttaa gtccaaagcc tgagcccacc aaactctcct acttcttcct gttacaaatt 3960 cctcttgtgc aataataatg gcctgaaacg ctgtaaaata tcctcatttc agccgcctca 4020 gttgcacttc tcccctatga ggtaggaaga acagttgttt agaaacgaag aaactgaggc 4080 cccacagcta atgagtggag gaagagagac acttgtgtac accacatgcc ttgtgttgta 4140 cttctctcac cgtgtaacct cctcatgtcc tctctcccca gtacggctct cttagctcag 4200 tagaaagaag acattacact catattacac cccaatcctg gctagagtct ccgcaccctc 4260 ctc 4263 <210> 65 <211> 4295 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <223> Transgene inserted at TRAC locus (MSCV promoter-driven tLNGFR coding sequence flanked by homology arms corresponding to the cut site of MG29-1-TRAC-35.) <400> 65 gcggccgctt aattaattaa tgccaacata ccataaacct cccattctgc taatgcccag 60 cctaagttgg ggagaccact ccagattcca agatgtacag tttgctttgc tgggcctttt 120 tcccatgcct gcctttactc tgccagagtt atattgctgg ggttttgaag aagatcctat 180 taaataaaag aataagcagt attattaagt agccctgcat ttcaggtttc cttgagtggc 240 aggccaggcc tggccgtgaa cgttcactga aatcatggcc tcttggccaa gattgatagc 300 ttgtgcctgt ccctgagtcc cagtccatca cgagcagctg gtttctaaga tgctatttcc 360 cgtataaagc atgagaccgt gacttgccag ccccacagag ccccgccctt gtccatcact 420 ggcatctgga ctccagcctg ggttggggca aagagggaaa tgagatcatg tcctaaccct 480 gatcctcttg tcccacagat atccagaacc ctgaccttaa ttaatgaatg aatgaaataa 540 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtgatcctc gagggaatga 600 aagaccccac ctgtaggttt ggcaagctag cttaagtaac gccattttgc aaggcatgga 660 aaatacataa ctgagaatag agaagttcag atcaaggtta ggaacagaga gacagcagaa 720 tatgggccaa acaggatatc tgtggtaagc agttcctgcc ccggctcagg gccaagaaca 780 gatggtcccc agatgcggtc ccgccctcag cagtttctag agaaccatca gatgtttcca 840 gggtgcccca aggacctgaa aatgaccctg tgccttattt gaactaacca atcagttcgc 900 ttctcgcttc tgttcgcgcg cttctgctcc ccgagctcaa taaaagagcc cacaacccct 960 cactcggcgc gcgccagtcc ggtaccagtc gccaccatgg ccctgcctgt gacagctctg 1020 ctcctccctc tggccctgct gctccatgcc gccagacccg acatcgtgct gacccagagc 1080 ccccccagcc tggccatgtc tctgggcaag agagccacca tcagctgccg ggccagcgag 1140 agcgtgacca tcctgggcag ccacctgatc cactggtatc agcagaagcc cggccagccc 1200 cccaccctgc tgatccagct cgccagcaat gtgcagaccg gcgtgcccgc cagattcagc 1260 ggcagcggca gcagaaccga cttcaccctg accatcgacc ccgtggaaga ggacgacgtg 1320 gccgtgtact actgcctgca gagccggacc atcccccgga cctttggcgg aggcaccaaa 1380 ctggaaatca agggcagcac cagcggctcc ggcaagcctg gctctggcga gggcagcaca 1440 aagggacaga ttcagctggt gcagagcggc cctgagctga agaaacccgg cgagacagtg 1500 aagatcagct gcaaggcctc cggctacacc ttcaccgact acagcatcaa ctgggtgaaa 1560 agagcccctg gcaagggcct gaagtggatg ggctggatca acaccgagac aagagagccc 1620 gcctacgcct acgacttccg gggcagattc gccttcagcc tggaaaccag cgccagcacc 1680 gcctacctgc agatcaacaa cctgaagtac gaggacaccg ccacctactt ttgcgccctg 1740 gactacagct acgccatgga ctactggggc cagggcacca gcgtgaccgt gtccagcttc 1800 gtgcccgtgt tcctgcccgc caaacctacc accacccctg cccctagacc tcccacccca 1860 gccccaacaa tcgccagcca gcctctgtct ctgcggcccg aagcctgtag acctgctgcc 1920 ggcggagccg tgcacaccag aggcctggac ttcgcctgcg acatctacat ctgggcccct 1980 ctggccggca cctgtggcgt gctgctgctg agcctggtga tcaccctgta ctgcaaccac 2040 cggaacagaa gcaagcggag ccggctgctg cacagcgact acatgaacat gaccccaaga 2100 cggcctggcc ccacccggaa gcactaccag ccttacgccc ctcccagaga cttcgccgcc 2160 taccggtcca gagtgaagtt cagcagatcc gccgacgccc ctgcctacca gcagggacag 2220 aaccagctgt acaacgagct gaacctgggc agacgggaag agtacgacgt gctggacaag 2280 cggagaggcc gggaccccga gatgggcgga aagcccagac ggaagaaccc ccaggaaggc 2340 ctgtataacg aactgcagaa agacaagatg gccgaggcct acagcgagat cggcatgaag 2400 ggcgagcgga ggcgcggcaa gggccacgat ggcctgtacc agggcctgag caccgccacc 2460 aaggacacct acgacgccct gcacatgcag gccctgcccc ccagaggatc cggcgctaca 2520 aatttttcac tgctgaaaca ggcgggtgat gtggaggaga accctggacc catgggtgct 2580 ggcgcaactg gacgcgctat ggatggacct cgcttgctgc ttcttctgct tctcggggtc 2640 tcattgggtg gtgctaagga agcatgccca acgggacttt atacgcatag cggagagtgt 2700 tgcaaagctt gtaacctggg cgaaggcgtc gcgcaacctt gtggtgcaaa tcaaaccgtc 2760 tgcgagccat gtttggactc tgttacgttt agtgacgtag tatctgcgac agagccatgc 2820 aagccttgta cggaatgtgt aggattgcag agcatgtctg ccccttgtgt agaagccgac 2880 gatgcagttt gcaggtgcgc gtatggctat taccaagacg aaacaaccgg acgatgtgaa 2940 gcttgccgag tttgtgaagc gggttccggg cttgtattct catgtcagga taagcagaac 3000 accgtctgcg aagagtgccc cgatggcacc tacagcgatg aagcgaacca tgtagacccc 3060 tgcctgcctt gcaccgtttg tgaagacacg gaacgacagt tgcgggagtg tacccggtgg 3120 gcagacgccg agtgcgaaga gattccaggc cgctggatca cgcgaagtac cccgccagaa 3180 ggttccgaca gtactgcacc aagcacccaa gaaccagagg cgccccccga gcaggacctg 3240 attgcctcca ccgtggcggg tgttgttact acggttatgg gctcatccca gcccgttgtt 3300 acccgaggaa ctacagacaa cctgattccg gtatattgtt ctatcttggc ggctgtagta 3360 gttggcttgg tcgcgtacat cgctttcaaa agatgaaagc ttgataatca acctctggat 3420 tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 3480 ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 3540 tcctccttgt ataaatcctg gttagttctt gccacggcgg aactcatcgc cgcctgcctt 3600 gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtgga acttgtttat 3660 tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 3720 tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt agtttaaacc 3780 tgccgtgtac cagctgagag actctaaatc cagtgacaag tctgtctgcc tattcaccga 3840 ttttgattct caaacaaatg tgtcacaaag taaggattct gatgtgtata tcacagacaa 3900 aactgtgcta gacatgaggt ctatggactt caagagcaac agtgctgtgg cctggagcaa 3960 caaatctgac tttgcatgtg caaacgcctt caacaacagc attattccag aagacacctt 4020 cttccccagc ccaggtaagg gcagctttgg tgccttcgca ggctgtttcc ttgcttcagg 4080 aatggccagg ttctgcccag agctctggtc aatgatgtct aaaactcctc tgattggtgg 4140 tctcggcctt atccattgcc accaaaaccc tctttttact aagaaacagt gagccttgtt 4200 ctggcagtcc agagaatgac acgggaaaaa agcagatgaa gagaaggtgg caggagaggg 4260 cacgtggccc agcctcagtg tttaaacgcg gccgc 4295

Claims (73)

  1. 세포 내에서 2개 이상의 유전자좌를 편집하는 방법으로서, 상기 방법은, 상기 세포에:
    (a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체로서:
    (i) 클래스 2, II형 Cas 엔도뉴클레아제; 및
    (ii) 제1 조작된 가이드 RNA이되:
    상기 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
    상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는, 제1 조작된 가이드 RNA를 포함하는, 클래스 2, II형 Cas 엔도뉴클레아제 복합체;
    (b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서:
    (i) 클래스 2, V형 Cas 엔도뉴클레아제; 및
    (ii) 제2 조작된 가이드 RNA이되:
    상기 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
    상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는, 제2 조작된 가이드 RNA를 포함하는, 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제가 아닌, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제인, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  5. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 제1 조작된 가이드 RNA 또는 상기 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 방법은 상기 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 상기 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 제1 RNA-가이드 엔도뉴클레아제 또는 상기 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입되는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴되는, 방법.
  10. 제9항에 있어서, 상기 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만의 빈도로 파괴되는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트 또는 상기 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함하는, 방법.
  12. 제11항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 10 내지 15 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트 또는 상기 하나 이상의 표적 유전자좌의 제2 세트는 알부민(ALB) 유전자좌를 포함하는, 방법.
  14. 제13항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 17 내지 19 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트 또는 상기 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1 유전자좌를 포함하는, 방법.
  16. 제15항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 상기 하나 이상의 표적 유전자좌의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 상기 하나 이상의 표적 유전자좌의 제1 세트의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 상기 세포에 도입하는 단계를 추가로 포함하는, 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 편집 단계는 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입 단계를 포함하는, 방법.
  19. 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법으로서, 상기 방법은 T 세포 또는 이의 전구체에:
    (a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서:
    (i) 제1 RNA 가이드 엔도뉴클레아제 또는 상기 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및
    (ii) 제1 조작된 가이드 RNA이되:
    상기 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및
    상기 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는, 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체; 및
    (b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서:
    (i) 제2 RNA 가이드 엔도뉴클레아제; 및
    (ii) 제2 조작된 가이드 RNA이되:
    상기 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및
    상기 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는, 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 포함하는, 방법.
  20. 제19항에 있어서, 상기 TCR 유전자좌의 상기 적어도 일부는 상기 T 세포 유전자좌 내에 있는, 방법.
  21. 제19항 또는 제20항 중 어느 한 항에 있어서, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 상기 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 상기 TCR 유전자좌 내의 상기 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 상기 세포에 도입하는 단계를 추가로 포함하는, 방법.
  22. 제19항 내지 제21항 중 어느 한 항에 있어서, 상기 제1 RNA 가이드 엔도뉴클레아제 또는 상기 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함하는, 방법.
  23. 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 제1 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 상기 제2 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, V형 Cas 엔도뉴클레아제를 포함하는, 방법.
  24. 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 제2 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 상기 제1 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, V형 Cas 엔도뉴클레아제를 포함하는, 방법.
  25. 제19항 내지 제24항 중 어느 한 항에 있어서, 상기 이종 조작된 T-세포 수용체는 CAR 분자인, 방법.
  26. 제19항 내지 제25항 중 어느 한 항에 있어서, 상기 T 세포 수용체 유전자좌의 상기 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌인, 방법.
  27. 제19항 내지 제26항 중 어느 한 항에 있어서, 상기 상동 아암은 상기 T 세포 수용체 유전자좌의 상기 적어도 일부에 인접한 상기 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함하는, 방법.
  28. 제19항 내지 제26항 중 어느 한 항에 있어서, 상기 T 세포 수용체 유전자좌의 상기 적어도 일부는 TRAC의 제1 또는 제3 엑손인, 방법.
  29. 제19항 내지 제28항 중 어느 한 항에 있어서, 상기 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 상기 TCR 유전자좌 및 상기 NR3C1 유전자좌의 게놈 서열을 파괴하는, 방법.
  30. 제28항에 있어서, 상기 효율은 상기 TCR 및 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정되는, 방법.
  31. 제19항 내지 제30항 중 어느 한 항에 있어서, 상기 NR3C1 유전자좌의 상기 적어도 일부는 엑손 2 또는 엑손 3인, 방법.
  32. 제19항 내지 제31항 중 어느 한 항에 있어서, 상기 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산하는, 방법.
  33. 제19항 내지 제32항 중 어느 한 항에 있어서, (a) 내지 (c)를 상기 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 포함하는, 방법.
  34. 제19항 내지 제33항 중 어느 한 항에 있어서, 상기 제1 RNA-가이드 엔도뉴클레아제 또는 상기 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  35. 제19항 내지 제34항 중 어느 한 항에 있어서, 상기 제1 조작된 가이드 RNA 또는 상기 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  36. 제19항 내지 제35항 중 어느 한 항에 있어서, 상기 제1 RNA-가이드 엔도뉴클레아제 또는 상기 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재하는, 방법.
  37. 제19항 내지 제36항 중 어느 한 항에 있어서, 상기 T-세포 또는 상기 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함하는, 방법.
  38. 제19항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  39. 제19항 내지 제38항 중 어느 한 항에 있어서, 상기 제1 또는 상기 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함하는, 방법.
  40. 제19항 내지 제38항 중 어느 한 항에 있어서, 상기 공여자 DNA 서열은 바이러스 벡터로 전달되는, 방법.
  41. 제40항에 있어서, 상기 바이러스 벡터는 AAV 또는 AAV-6 벡터인, 방법.
  42. 글루코코르티코이드-내성 CAR-T 세포의 집단으로서:
    (a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열;
    (b) 인델을 포함하는 NR3C1 유전자좌를 포함하는, 글루코코르티코이드-내성 CAR-T 세포의 집단.
  43. 제42항에 있어서, 상기 이종 서열은 인델인, 글루코코르티코이드-내성 T 세포의 집단.
  44. 제42항 또는 제43항에 있어서, 상기 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함하는, 글루코코르티코이드-내성 T 세포의 집단.
  45. 제42항 내지 제44항 중 어느 한 항에 있어서, 상기 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함하는, 글루코코르티코이드-내성 T 세포의 집단.
  46. 제42항 내지 제45항 중 어느 한 항에 있어서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는, 글루코코르티코이드-내성 T 세포의 집단.
  47. 제43항에 있어서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는, 글루코코르티코이드-내성 T 세포의 집단.
  48. 제42항 내지 제47항 중 어느 한 항에 있어서, 상기 세포 집단에는 염색체 전위가 실질적으로 없는, 글루코코르티코이드-내성 T 세포의 집단.
  49. 세포 내에서 2개 이상의 유전자좌를 편집하는 방법으로서, 상기 방법은, 상기 세포에:
    (a) 제1 Cas 엔도뉴클레아제 복합체로서:
    (i) 제1 Cas 엔도뉴클레아제; 및
    (ii) 하나 이상의 조작된 가이드 RNA이되:
    상기 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
    제1 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 하나 이상의 조작된 가이드 RNA를 포함하는, 제1 Cas 엔도뉴클레아제 복합체;
    (b) 제2 Cas 엔도뉴클레아제 복합체로서:
    (i) 제2 Cas 엔도뉴클레아제; 및
    (ii) 하나 이상의 조작된 가이드 RNA이되:
    상기 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
    제2 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 하나 이상의 조작된 가이드 RNA를 포함하는, 제2 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함하는, 방법.
  50. 제49항에 있어서, 상기 세포에:
    (c) 제1 이식유전자를 암호화하는 개방 해독 프레임, 상기 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 상기 제1 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제1 공여자 DNA 서열; 및
    (d) 제2 이식유전자를 암호화하는 개방 해독 프레임, 상기 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 상기 제2 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제2 공여자 DNA 서열을 도입하는 단계를 추가로 포함하는, 방법.
  51. 제50항에 있어서, 상기 제1 이식유전자 및 상기 제2 이식유전자는 상이한, 방법.
  52. 제50항 또는 제51항 중 어느 한 항에 있어서, 상기 제1 표적 서열 또는 상기 제2 표적 서열은 T-세포 수용체 유전자좌, TRAC, TRBC, NR3C1, 또는 AAVS1 유전자좌, 또는 이들의 임의의 조합 내의 표적 서열인, 방법.
  53. 제50항 내지 제52항 중 어느 한 항에 있어서, 상기 제1 또는 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합인, 방법.
  54. 제50항 내지 제53항 중 어느 한 항에 있어서, 상기 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 5' 상동 아암 또는 상기 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 5' 상동 아암은 서열번호 42 또는 23을 포함하는, 방법.
  55. 제50항 내지 제54항 중 어느 한 항에 있어서, 상기 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 3' 상동 아암 또는 상기 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 3' 상동 아암은 서열번호 43 또는 24를 포함하는, 방법.
  56. 제49항 내지 제55항 중 어느 한 항에 있어서, 상기 제1 또는 상기 제2 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  57. 제49항 내지 제56항 중 어느 한 항에 있어서, 상기 제1 조작된 가이드 RNA 또는 상기 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
  58. 제49항 내지 제57항 중 어느 한 항에 있어서, 상기 제1 표적 서열에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 제2 표적 서열에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 16, 20, 21, 22, 또는 41 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
  59. 제49항 내지 제58항 중 어느 한 항에 있어서, 상기 제1 또는 상기 제2 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제 또는 클래스 2, V형 Cas 엔도뉴클레아제, 또는 이들의 임의의 조합을 포함하는, 방법.
  60. 서열번호 63 내지 65 중 어느 하나의 서열, 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는, 단리된 핵산.
  61. 제60항의 단리된 핵산을 포함하는, 세포.
  62. 제61항에 있어서, 상기 세포는 T-세포 또는 이의 전구체인, 세포.
  63. 제62항에 있어서, 상기 T-세포 또는 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함하는, 세포.
  64. 제60항의 단리된 핵산 서열을 포함하는, 벡터.
  65. 제64항에 있어서, 상기 벡터는 아데노-연관 바이러스(AAV) 벡터인, 벡터.
  66. 제65항에 있어서, 상기 AAV 벡터는 AAV-6 혈청형 벡터인, 벡터.
  67. 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는, 벡터.
  68. 제67항에 있어서, 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 상기 서열의 측면에 위치하는 이식유전자를 추가로 포함하는, 벡터.
  69. 제68항에 있어서, 상기 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합을 포함하는, 벡터.
  70. 제67항 또는 제68항에 있어서, 서열번호 63의 tEGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
  71. 제67항 또는 제68항에 있어서, 서열번호 64의 tLNGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
  72. 제67항 또는 제68항에 있어서, 서열번호 63의 MND 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
  73. 제67항 또는 제68항에 있어서, 서열번호 64의 MSCV 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
KR1020237034371A 2021-03-19 2022-03-18 Cas 효소를 이용한 다중 편집 KR20230157387A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202163163510P 2021-03-19 2021-03-19
US63/163,510 2021-03-19
US202163186506P 2021-05-10 2021-05-10
US63/186,506 2021-05-10
US202163241916P 2021-09-08 2021-09-08
US63/241,916 2021-09-08
PCT/US2022/021004 WO2022198080A1 (en) 2021-03-19 2022-03-18 Multiplex editing with cas enzymes

Publications (1)

Publication Number Publication Date
KR20230157387A true KR20230157387A (ko) 2023-11-16

Family

ID=83321225

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237034371A KR20230157387A (ko) 2021-03-19 2022-03-18 Cas 효소를 이용한 다중 편집

Country Status (8)

Country Link
EP (1) EP4308699A1 (ko)
JP (1) JP2024515936A (ko)
KR (1) KR20230157387A (ko)
AU (1) AU2022237663A1 (ko)
BR (1) BR112023018948A2 (ko)
CA (1) CA3210361A1 (ko)
MX (1) MX2023010969A (ko)
WO (1) WO2022198080A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021178933A2 (en) 2020-03-06 2021-09-10 Metagenomi Ip Technologies, Llc Class ii, type v crispr systems
WO2022159758A1 (en) * 2021-01-22 2022-07-28 Metagenomi, Inc Novel engineered and chimeric nucleases
WO2024127370A1 (en) * 2022-12-16 2024-06-20 LifeEDIT Therapeutics, Inc. Guide rnas that target trac gene and methods of use

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10982200B2 (en) * 2019-02-14 2021-04-20 Metagenomi Ip Technologies, Llc Enzymes with RuvC domains
GB201907733D0 (en) * 2019-05-31 2019-07-17 Governing Council Of The Univ Of Toronto Methods and compositions for multiplex gene editing

Also Published As

Publication number Publication date
BR112023018948A2 (pt) 2023-10-17
AU2022237663A1 (en) 2023-10-12
JP2024515936A (ja) 2024-04-11
CA3210361A1 (en) 2022-09-22
AU2022237663A9 (en) 2023-10-26
WO2022198080A1 (en) 2022-09-22
EP4308699A1 (en) 2024-01-24
MX2023010969A (es) 2023-09-27

Similar Documents

Publication Publication Date Title
JP7012645B2 (ja) キメラタンパク質および免疫治療の方法
EP3359184B1 (en) Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene
KR20230157387A (ko) Cas 효소를 이용한 다중 편집
KR20230057487A (ko) 게놈 조정을 위한 방법 및 조성물
JP6965466B2 (ja) 操作されたカスケード構成要素およびカスケード複合体
US20210102183A1 (en) Engineered cascade components and cascade complexes
KR102547738B1 (ko) 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법
CA3072777A1 (en) Compositions and methods for chimeric ligand receptor (clr)-mediated conditional gene expression
KR20210138603A (ko) 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기를 갖는 변형된 면역 세포
JP7471289B2 (ja) 抗liv1免疫細胞癌療法
KR20240019791A (ko) 원형 rna 조성물 및 방법
KR102151065B1 (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
US20240287453A1 (en) Persistent allogeneic modified immune cells and methods of use thereof
CN109071633A (zh) 基于使用表达增强性基因座来制备抗体的组合物和方法
KR20210149734A (ko) Rna-가이드된 엔도뉴클레아제를 사용한 dna 작제물의 통합을 위한 개선된 방법
KR20230068401A (ko) 치료 단백질 생산을 위한 고 생산 재조합 차이니즈 햄스터 난소 세포주의 생성
CN117043327A (zh) 用cas酶进行多重编辑
TW202102669A (zh) 含有新穎選擇標記的細胞株及其用於蛋白製造的用途
CA3130645A1 (en) Use of an improved sleeping beauty transposase with increased solubility to facilitate and control transfection of a target cell with a transgene
KR20240103154A (ko) 비-푸코실화 단백질 생산 세포주 제조방법 및 이 방법에 따라 제조된 세포주
WO2023187779A1 (en) Site-specific in vivo t cell engineering, systems, compositions and methods thereof
KR20200085781A (ko) 선택된 항체를 발현하도록 유전자 변형된 b 세포를 생산하기 위한 시스템 및 방법
KR20240156649A (ko) 선택된 항체를 발현하도록 유전자 변형된 b 세포를 생산하기 위한 시스템 및 방법