KR20240036632A - 표적 유전자 조절을 위한 시스템 및 방법 - Google Patents

표적 유전자 조절을 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20240036632A
KR20240036632A KR1020247005598A KR20247005598A KR20240036632A KR 20240036632 A KR20240036632 A KR 20240036632A KR 1020247005598 A KR1020247005598 A KR 1020247005598A KR 20247005598 A KR20247005598 A KR 20247005598A KR 20240036632 A KR20240036632 A KR 20240036632A
Authority
KR
South Korea
Prior art keywords
gene
effector
heterologous gene
heterologous
complex
Prior art date
Application number
KR1020247005598A
Other languages
English (en)
Inventor
다니엘 오 할트
레이 에스 치
티모시 데일리
토마스 블레어 게이너스
지오반니 카로쏘
텡유 코
로빈 더블유 여
2세 크리스토퍼 대릴 스틸
Original Assignee
에피크리스피알 바이오테크놀로지스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에피크리스피알 바이오테크놀로지스, 인크. filed Critical 에피크리스피알 바이오테크놀로지스, 인크.
Publication of KR20240036632A publication Critical patent/KR20240036632A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/06Methods of screening libraries by measuring effects on living organisms, tissues or cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/12Applications; Uses in screening processes in functional genomics, i.e. for the determination of gene function
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • C12N2330/31Libraries, arrays

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 개시내용은 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하기 위한 조성물, 방법 및 시스템을 제공한다. 본 개시내용의 복합체는 하나 이상의 이종성 유전자 이펙터를 표적 유전자 또는 표적 유전자 조절 서열과 가깝게 근접하게 하여, 표적 유전자의 발현 또는 활성 수준의 조절을 촉진하는데 유용할 수 있다. 본 개시내용은 예를 들어 특정 표적 유전자(들)의 발현을 조절하기 위해 이종성 유전자 이펙터 도메인 및 가이드 모이어티와 이펙터 도메인의 복합체를 확인하기 위한 고처리량 스크린을 위한 조성물, 시스템 및 방법을 제공한다. 본 개시내용은 또한 연구 또는 치료제와 같은 다른 목적을 위해 사용될 수 있는, 본원에 개시된 시스템에 의해 확인된 복합체를 제공한다.

Description

표적 유전자 조절을 위한 시스템 및 방법
본원은 2021년 7월 20일에 출원된 미국 가출원 번호 제63/223,842호에 대한 우선권 및 이익을 주장하며, 이 출원은 이의 전체 내용이 참조로 본원에 포함된다.
서열 목록
본원에는 ASCII 형식으로 전자적으로 제출된 서열 목록이 포함되어 있으며 이의 전체 내용이 참조로 포함된다. 2022년 7월 17일에 생성된 해당 ASCII 카피의 명칭은 55176-715_601_SL.txt이고 크기는 41,277,379바이트이다.
복잡한 네트워크는 유전자 발현을 조절하여, 세포의 생존, 성장, 분화, 및 다양한 생리학적 기능을 뒷받침한다. 어떤 경우에는, 하나 이상의 특정 유전자를 켜거나 꺼서 세포에서 이러한 조절을 수행할 수 있다. 어떤 경우에는, 특정 유전자의 비정상적인 발현이 많은 질병과 병태의 원인이 된다. 관심 유전자의 비정상적인 발현은 유전자의 발현 수준이 비정상적으로 증가하거나, 유전자의 발현 수준이 비정상적으로 감소하거나, 유전자의 발현 기간이 비정상적으로 연장되거나, 유전자 발현 기간이 비정상적으로 단축되는 것일 수 있다.
특정 유전자의 발현을 바람직한 방식으로 조절할 수 있는 약제는 치료상의 이점을 가질 수 있지만, 현재 사용되는 많은 전략은 강력하며/하거나, 지속적이며/이거나, 가역적인 효과를 이끌어내지 못한다. 또한, 다양한 표적 유전자를 조절하기 위해 선택된 소수의 유전자 이펙터만이 탐색되고 활용되었다. 따라서, 본 개시내용의 다양한 양태는 특정 표적 유전자를 조절하기 위해(예를 들어, 발현의 상향조절, 발현의 하향조절, 발현 기간의 연장 또는 단축 등) 맞춤 제작될 수 있는 하나 이상의 유전자 이펙터를 포함하는 시스템, 방법, 및 조성물을 제공한다.
일부 양태에서, (a) 세포 집단을 복합체 라이브러리와 접촉시키는 단계로, 여기서 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 복합체에 있는 이종성 유전자 이펙터와 상이한 이종성 유전자 이펙터; 및 (ii) 라이브러리의 다른 복합체에서 핵산 서열을 가이드하기 위해 100% 서열 동일성을 나타내는 가이드 핵산 서열을 포함하며, 여기서 이종성 유전자 이펙터 및 가이드 핵산 분자는 세포 집단의 표적 내인성 유전자에 대한 특이적 결합을 나타내는 개별 복합체를 형성하며, 여기서 라이브러리는 적어도 25개의 서로 다른 복합체를 포함하는 것인 단계; (b) 접촉 시, 세포 집단 내 표적 내인성 유전자의 발현 또는 활성 수준의 변화에 기초하여 세포 집단을 분류하는 단계; 및 (c) 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터를 확인하는 단계를 포함하는 방법이 본원에 개시되어 있다.
일부 양태에서, (a) 세포 집단을 복합체 라이브러리와 접촉시키는 단계로, 여기서 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 복합체에 있는 이종성 유전자 이펙터와 상이한 이종성 유전자 이펙터; 및 (ii) 라이브러리의 다른 복합체에서 핵산 서열을 가이드하기 위해 100% 서열 동일성을 나타내는 가이드 핵산 서열을 포함하며, 여기서 이종성 유전자 이펙터 및 가이드 핵산 서열은 세포 집단의 표적 내인성 유전자에 대한 특이적 결합을 나타내는 개별 복합체를 형성하며, 여기서 이종성 유전자 이펙터는 바이러스성 유전자 이펙터를 포함하는 것인 단계; (b) 접촉 시, 세포 집단 내 표적 내인성 유전자의 발현 또는 활성 수준의 변화에 기초하여 세포 집단을 분류하는 단계; 및 (c) 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터를 확인하는 단계를 포함하는 방법이 본원에 개시되어 있다.
일부 실시양태에서, 상기 바이러스성 유전자 이펙터는 아데노바이러스과(Adenoviridae), 아레나바이러스과(Arenaviridae), 보르나바이러스과(Bornaviridae), 코로나바이러스과(Coronaviridae), 필로바이러스과(Filoviridae), 플라비바이러스과(Flaviviridae), 헤파바이러스과(Hepadnaviridae), 헤르페스바이러스과(Herpesviridae), 오르토믹소바이러스과(Orthomyxoviridae), 파필로마바이러스과(Papillomaviridae), 파라믹소바이러스과(Paramyxoviridae), 파르보바이러스과(Parvoviridae), 페리분야바이러스과(Peribunyaviridae), 페누이바이러스과(Phenuiviridae), 뉴모바이러스과(Pneumoviridae), 폴리오마바이러스과(Polyomaviridae), 폭스바이러스과(Poxviridae), 레트로바이러스과(Retroviridae), 및 랍도바이러스과(Rhabdoviridae)로 이루어진 군으로부터 선택되는 인간 바이러스로부터 유래한다. 일부 실시양태에서, 상기 바이러스성 유전자 이펙터는 플라비바이러스과(Flaviviridae), 라이사바이러스과(Lyssaviridae), 필로바이러스과(Filoviridae), 파라믹소바이러스과(Paramyxoviridae), 오르토믹소바이러스과(Orthomyxoviridae), 코로나바이러스과(Coronaviridae), 레오바이러스과(Reoviridae), 토가바이러스과(Togaviridae), 페뉴바이러스과(Phenuviridae), 및 한타바이러스과(Hantaviridae)로 이루어진 군으로부터 선택되는 인간-박쥐 공유 바이러스로부터 유래한다. 일부 실시양태에서, 상기 바이러스성 유전자 이펙터는 고세균-향성 바이러스(Archaea-tropic virus), 시포바이러스과(Siphoviridae), 포도바이러스과(podoviridae), 미미바이러스과(Mimiviridae), 니마바이러스과(Nimaviridae), 리가멘바이러스목(Ligamenvirales), 글로불로바이러스과(Globuloviridae), 푸셀로바이러스과(Fuselloviridae), 비카우다바이러스과(Bicaudaviridae), 위성 바이러스(Satellite virus), 이리도바이러스과(Iridoviridae), 투리바이러스과(Turriviridae), 카우도바이러스목(Caudovirales), 피코드나바이러스과(Phycodnaviridae) 및 미오바이러스과(Myoviridae)로 이루어진 군으로부터 선택되는 바이러스로부터 유래한다. 일부 실시양태에서, 상기 라이브러리는 적어도 30, 50, 100, 200, 500, 1,000, 2,000, 5,000, 또는 10,000개의 서로 다른 복합체를 포함한다. 일부 실시양태에서, 상기 가이드 핵산 서열은 약 10개 내지 약 30개의 뉴클레오티드, 약 15개 내지 약 25개의 뉴클레오티드, 또는 약 15개의 뉴클레오티드를 포함한다. 일부 실시양태에서, 개별 복합체는 이종성 엔도뉴클레아제를 추가로 포함한다. 일부 실시양태에서, 개별 복합체의 이종성 엔도뉴클레아제는 다른 복합체의 이종성 엔도뉴클레아제와 100% 서열 동일성을 나타낸다. 일부 실시양태에서, 이종성 유전자 이펙터 및 이종성 엔도뉴클레아제는 서로 융합된다. 일부 실시양태에서, 이종성 유전자 이펙터 및 이종성 엔도뉴클레아제는 비공유적으로 서로 결합된다. 일부 실시양태에서 이종성 엔도뉴클레아제는 Cas 단백질이다. 일부 실시양태에서 Cas 단백질에는 핵산 절단 활성이 결여되어 있다. 일부 실시양태에서, 가이드 핵산 서열은 가이드 RNA 분자의 일부이다. 일부 실시양태에서, 이종성 유전자 이펙터는 이종성 전사 조절인자를 포함한다. 일부 실시양태에서, 이종성 유전자 이펙터는 이종성 염색질 조절인자를 포함한다. 일부 실시양태에서, 변화는 표적 내인성 유전자의 향상된 발현 또는 활성 수준이다. 일부 실시양태에서, 변화는 표적 내인성 유전자의 감소된 발현 또는 활성 수준이다. 일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나 또는 서열번호: 16-13605 중 어느 하나와 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 100% 서열 동일성을 나타낸다. 일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16155-47350 중 어느 하나 또는 서열번호: 16155-43953 중 어느 하나와 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 100% 서열 동일성을 나타낸다. 일부 실시양태에서, 이종성 유전자 이펙터는 복수의 상이한 이종성 유전자 이펙터를 포함하며, 여기서 개별 복합체의 복수의 상이한 이종성 유전자 이펙터의 조합은 라이브러리의 다른 복합체 내의 이종성 유전자 이펙터의 조합과 다르다. 일부 실시양태에서, 복수의 상이한 이종성 유전자 이펙터는 P300, TET1, TET2, TET3, 및/또는 HSF1이 아니다. 일부 실시양태에서, 복수의 상이한 이종성 유전자 이펙터 중 적어도 하나는 VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR(Vp64+p65+Rta)이 아니다. 일부 실시양태에서, 복수의 상이한 이종성 유전자 이펙터 중 적어도 하나는 KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노산, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A이 아니다. 일부 실시양태에서, 이종성 유전자 이펙터는 P300, TET1, TET2, TET3, 및/또는 HSF1이 아니다. 일부 실시양태에서, 이종성 유전자 이펙터는 VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR(Vp64+p65+Rta)가 아니다. 일부 실시양태에서, 이종성 유전자 이펙터는 KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노산, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A가 아니다. 일부 실시양태에서, 하나 이상의 선도 이종성 유전자 이펙터는 최대 1개의 이종성 유전자 이펙터, 최대 2개의 이종성 유전자 이펙터, 최대 5개의 이종성 유전자 이펙터, 최대 10개의 이종성 유전자 이펙터, 최대 15개의 이종성 유전자 이펙터, 최대 15개의 이종성 유전자 이펙터, 최대 20개의 이종성 유전자 이펙터, 또는 최대 50개의 이종성 유전자 이펙터이다. 일부 실시양태에서, 하나 이상의 선도 이종성 유전자 이펙터에 의해 발생되는 표적 내인성 유전자의 발현 또는 활성 수준의 변화 정도는 대조군에 의한 변화보다 적어도 2배 더 크다. 일부 실시양태에서, 상기 정도는 대조군에 의한 것보다 적어도 5배, 10배, 20배, 50배, 또는 100배 더 크다. 일부 실시양태에서, 대조군은 복합체 라이브러리가 없는 세포 집단이다. 일부 실시양태에서, 대조군은 대조군 이종성 유전자 이펙터에 의해 접촉된 세포 집단이다. 일부 실시양태에서, 대조군 이종성 유전자 이펙터는 P300, TET1, TET2, TET3, 및/또는 HSF1이다. 일부 실시양태에서, 대조군 이종성 유전자 이펙터는 VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR (Vp64+p65+Rta)이다. 일부 실시양태에서, 대조군 이종성 유전자 이펙터는 KRAB, SID, ERD, cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노산, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A이다. 일부 실시양태에서, 상기 방법은 추가의 세포 집단에서 추가의 표적 내인성 유전자에 대해 (a) 내지(c) 단계를 수행하는 것을 추가로 포함하며, 여기서 (1) 표적 내인성 유전자의 발현 또는 활성 수준에서 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터는 (2) 추가의 표적 내인성 유전자의 발현 또는 활성 수준의 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터와 다르다. 일부 실시양태에서, 세포 집단과 추가의 세포 집단은 동일한 세포 유형이다. 일부 실시양태에서, 세포 집단과 추가의 세포 집단은 다른 세포 유형이다. 일부 실시양태에서, 세포 집단은 포유동물 세포를 포함한다. 일부 실시양태에서, 세포 집단은 인간 세포를 포함한다. 일부 실시양태에서, 세포 집단은 줄기 세포를 포함한다. 일부 실시양태에서, 세포 집단은 분화된 세포를 포함한다. 일부 실시양태에서, 표적 내인성 유전자는 질병 관련 유전자이다. 일부 실시양태에서, 표적 내인성 유전자는 분화 관련 유전자이다. 일부 실시양태에서, 표적 내인성 유전자는 나이 관련 유전자이다.
일부 양태에서, 선행 실시양태 중 어느 하나의 방법의 복합체 라이브러리를 포함하는 시스템이 본원에 개시된다.
일부 양태에서, 선행 실시양태 중 어느 하나의 방법의 복합체 라이브러리를 포함하는 키트가 본원에 개시된다.
일부 양태에서, 선행 실시양태 중 어느 하나의 방법의 복합체 라이브러리의 이종성 유전자 이펙터를 코딩하는 핵산 라이브러리가 본원에 개시된다.
일부 양태에서, 선행 실시양태 중 어느 하나의 방법의 복합체 라이브러리를 코딩하는 핵산 라이브러리가 본원에 개시된다.
일부 양태에서, 선행 실시양태 중 어느 하나의 방법의 복합체 라이브러리의 이종성 유전자 이펙터를 집합적으로 발현하는 세포 집단이 본원에 개시된다.
일부 양태에서, 선행 실시양태 중 어느 하나의 방법의 복합체 라이브러리를 집합적으로 발현하는 세포 집단이 본원에 개시된다.
일부 양태에서, 가이드 모이어티 및 이종성 유전자 이펙터를 포함하는 복합체가 본원에 개시되며, 여기서 이종성 유전자 이펙터는 서열번호: 23631, 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나와 적어도 약 70% 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 상기 아미노산 서열은 서열번호: 23631, 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나와 적어도 약 90% 서열 동일성을 갖는다. 일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 23631, 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 상기 아미노산 서열은 서열번호: 23631과 적어도 90%의 서열 동일성을 갖는다. 일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 23631의 아미노산 서열을 포함한다. 일부 실시양태에서, 상기 아미노산 서열은 서열번호: 33890과 적어도 90% 서열 동일성을 갖는다. 일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 33890의 아미노산 서열을 포함한다. 일부 실시양태에서, 상기 아미노산 서열은 서열번호: 40985과 적어도 90% 서열 동일성을 갖는다. 일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 40985의 아미노산 서열을 포함한다. 일부 실시양태에서, 이종성 유전자 이펙터는 500개 미만의 아미노산을 포함한다. 일부 실시양태에서, 이종성 유전자 이펙터는 100개 미만의 아미노산을 포함한다. 일부 실시양태에서, 가이드 모이어티는 표적 유전자 또는 표적 유전자 조절 서열에 특이적으로 결합한다. 일부 실시양태에서, 가이드 모이어티는 가이드 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 핵산 서열은 약 10 내지 약 30개의 뉴클레오티드를 포함하거나 구성된다. 일부 실시양태에서, 가이드 핵산 서열은 가이드 RNA이다. 일부 실시양태에서, 가이드 핵산 서열은 단일 가이드 RNA(sgRNA)이다. 일부 실시양태에서, 가이드 모이어티는 뉴클레아제 또는 이의 일부를 포함한다. 일부 실시양태에서, 뉴클레아제 또는 이의 일부는 뉴클레아제의 야생형 버전에 비해 뉴클레아제 활성이 감소된 변형된 뉴클레아제이다. 일부 실시양태에서, 뉴클레아제 또는 이의 일부에는 핵산 절단 활성이 실질적으로 결여되어 있다. 일부 실시양태에서 뉴클레아제 또는 이의 일부는 Cas 단백질 또는 이의 일부이다. 일부 실시양태에서, 뉴클레아제 또는 이의 일부는 뉴클레아제 불활성화된 Cas(dCas) 단백질 또는 이의 일부이다. 일부 실시양태에서, 가이드 모이어티와 이종성 유전자 이펙터는 선택적으로 링커를 통해 서로 융합된다. 일부 실시양태에서, 가이드 모이어티와 이종성 유전자 이펙터는 비공유적으로 서로 결합된다.
일부 양태에서, 선행 실시양태 중 어느 하나의 이종성 유전자 이펙터를 포함하는 벡터가 본원에 개시된다. 일부 실시양태에서, 상기 벡터는 가이드 모이어티를 추가로 포함한다.
일부 양태에서, 선행 실시양태 중 어느 하나의 복합체를 포함하는 벡터가 본원에 개시된다.
일부 양태에서, 선행 실시양태 중 어느 하나의 이종성 유전자 이펙터를 코딩하는 핵산을 포함하는 벡터가 본원에 개시된다.
일부 실시양태에서, 상기 벡터는 가이드 모이어티 또는 이의 성분을 코딩하는 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 벡터는 바이러스성 벡터이다. 일부 실시양태에서, 상기 벡터는 비-바이러스성 벡터이다.
일부 양태에서, 선행 실시양태 중 어느 하나의 복합체를 포함하는 세포 집단이 본원에 개시된다.
일부 양태에서, 표적 유전자의 발현 또는 활성을 조절하는 방법이 본원에 개시되며, 이 방법은 표적 유전자를 포함하는 세포 집단을 선행 실시양태 중 어느 하나의 복합체 또는 벡터와 접촉시키는 것을 포함한다.
일부 실시양태에서, 세포 집단은 포유동물 세포를 포함한다. 일부 실시양태에서, 세포 집단은 인간 세포를 포함한다. 일부 실시양태에서, 세포 집단은 줄기 세포를 포함한다. 일부 실시양태에서, 세포 집단은 분화된 세포를 포함한다. 일부 실시양태에서, 접촉은 시험관내 또는 생체외에서 이루어진다. 일부 실시양태에서, 접촉은 생체내에서 이루어진다.
일부 양태에서, 치료가 필요한 대상체를 치료하는 방법이 본원에 개시되며, 이 방법은 대상체에게 선행 실시양태 중 어느 하나의 복합체 또는 벡터를 투여하는 단계, 및 이에 의해 대상체의 세포 집단에서 표적 유전자의 발현 또는 활성을 조절하는 단계를 포함한다.
일부 실시양태에서, 표적 유전자는 표적 내인성 유전자이다. 일부 실시양태에서, 표적 유전자는 질병 관련 유전자이다. 일부 실시양태에서, 표적 유전자는 분화 관련 유전자이다. 일부 실시양태에서, 발현 또는 활성을 조절하는 것은 표적 유전자의 발현 또는 활성 수준을 증가시키는 것을 포함한다. 일부 실시양태에서, 발현 또는 활성을 조절하는 것은 표적 유전자의 발현 또는 활성 수준을 감소시키는 것을 포함한다. 일부 실시양태에서, 표적 유전자의 발현 또는 활성은 대조군과 비교하여 적어도 2배 증가된다. 일부 실시양태에서, 표적 유전자의 발현 또는 활성은 대조군과 비교하여 적어도 2배 감소된다. 일부 실시양태에서, 표적 유전자의 발현 또는 활성은 대조군보다 적어도 10% 더 긴 기간 동안 조절된다. 일부 실시양태에서, 표적 유전자의 발현 또는 활성은 적어도 12시간 동안 조절된다. 일부 실시양태에서, 표적 유전자의 발현 또는 활성은 적어도 28일 동안 조절된다. 일부 실시양태에서, 대조군은 접촉 전의 세포 집단이다. 일부 실시양태에서, 대조군은 복합체와 접촉되지 않은 세포 집단이다. 일부 실시양태에서, 대조군은 대조군 복합체와 접촉된 세포 집단이다.
일부 양태에서, 복수의 이종성 폴리뉴클레오티드 서열을 포함하는 발현 벡터가 본원에 개시되며, 여기서 복수의 이종성 폴리뉴클레오티드 서열 중 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49334-49341 또는 49344-49352 중 어느 하나 이상의 폴리뉴클레오티드 서열과 적어도 약 80%의 서열 동일성을 나타낸다.
본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49334과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49335와 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49336과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49337과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49338과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49339와 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49340과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49341과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49344와 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49345와 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49346과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49347과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49348과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49349와 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49350과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49351과 적어도 약 80% 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49352와 적어도 약 80% 서열 동일성을 나타낸다.
본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49334-49341 또는 49344-49352 중 어느 하나의 폴리뉴클레오티드 서열과 적어도 약 90%의 서열 동일성을 나타낸다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49334-49341 또는 49344-49352 중 어느 하나의 폴리뉴클레오티드 서열과 적어도 약 95%의 서열 동일성을 나타낸다.
본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 (i) CRISPR 표적 서열 및 (ii) 하나 이상의 CRISPR 프로토스페이서 인접 모티프(PAM) 서열을 포함한다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, CRISPR 표적 서열은 2개의 상이한 CRISPR PAM 서열 측면에 위치한다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 하나 이상의 CRISPR PAM 서열은 Cas12 PAM 서열을 포함한다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 하나 이상의 CRISPR PAM 서열은 Cas9 PAM 서열을 포함한다.
본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 복수는 4개 이상의 이종성 폴리뉴클레오티드 서열을 포함한다. 본원에 개시된 발현 벡터 중 어느 하나의 일부 실시양태에서, 복수는 6개 이상의 이종성 폴리뉴클레오티드 서열을 포함한다.
또 다른 양태에서, 본 개시내용은 (i) CRISPR 표적 서열 및 (ii) CRISPR 프로토스페이서 인접 모티프(PAM) 서열을 포함하는 키메라 서열인 이종성 폴리뉴클레오티드 서열 및 추가의 상이한 CRISPR PAM 서열을 포함하는 핵산 분자를 제공하며, 여기서 CRISPR 표적 서열은 CRISPR PAM 서열과 추가의 CRISPR PAM 서열의 측면에 위치한다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 이종성 폴리뉴클레오티드 서열은 단일 가닥이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, CRISPR PAM 서열과 추가의 CRISPR PAM 서열 사이의 거리는 최대 약 50개 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 거리는 최대 약 40개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 거리는 최대 약 35개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 거리는 최대 약 25개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 거리는 최대 약 20개의 핵염기이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, CRISPR 표적 서열의 크기는 적어도 약 10개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 크기는 적어도 약 15개의 핵염기이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, CRISPR PAM 서열 및 추가의 CRISPR PAM 서열은 상이한 CRISPR 유형에 의해 인식된다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, CRISPR PAM 서열 및 추가의 CRISPR PAM 서열 중 하나는 Cas12 또는 이의 변이체에 의해 인식된다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, CRISPR PAM 서열 및 추가의 CRISPR PAM 서열 중 하나는 Cas9 또는 이의 변이체에 의해 인식된다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 이종성 폴리뉴클레오티드 서열은 비-코딩 서열이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, CRISPR 표적 서열은 서열번호: 49334.c와 적어도 약 80%의 서열 동일성을 나타낸다.
또 다른 양태에서, 본 개시내용은 복수의 이종성 폴리뉴클레오티드 서열을 포함하는 핵산 분자를 제공하며, 여기서: (i) 복수의 이종성 폴리뉴클레오티드 서열의 각각의 이종성 폴리뉴클레오티드 서열은 폴리뉴클레오티드 서열 및 다른 인간 염색체로부터 유래하는 추가의 폴리뉴클레오티드 서열을 포함하며; (ii) 각각의 이종성 폴리뉴클레오티드 서열의 크기는 최대 약 50개의 핵염기이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 크기는 최대 약 40개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 크기는 최대 약 30개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 크기는 최대 약 25개의 핵염기이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 폴리뉴클레오티드 서열의 크기는 적어도 약 5개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 추가의 폴리뉴클레오티드 서열의 크기는 적어도 약 5개의 핵염기이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 이종성 폴리뉴클레오티드 서열과 복수개의 이종성 폴리뉴클레오티드 서열 사이의 거리는 최대 약 100개의 핵염기이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 거리는 최대 약 80개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 거리는 최대 약 60개의 핵염기이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 거리는 최대 약 50개의 핵염기이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 각각의 이종성 폴리뉴클레오티드 서열은 비-코딩 서열이다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 폴리뉴클레오티드 서열 및 추가의 폴리뉴클레오티드 서열 중 적어도 하나는 분화 클러스터(CD) 단백질로부터 유래된다.
본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 복수는 4개 이상의 이종성 폴리뉴클레오티드 서열을 포함한다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 복수는 6개 이상의 이종성 폴리뉴클레오티드 서열을 포함한다.
또 다른 측면에서, 본 개시내용은 본원에 개시된 핵산 서열 중 어느 하나를 포함하는 발현 벡터를 제공한다.
본원에 개시된 발현 벡터 또는 핵산 분자 중 어느 하나의 일부 실시양태에서, 발현 벡터 또는 핵산 분자는 이종성 폴리뉴클레오티드 서열의 하류에 있는 상류 활성화 서열(UAS) 또는 이종성 폴리뉴클레오티드 서열을 추가로 포함한다. 본원에 개시된 발현 벡터 또는 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 UAS는 비-인간 UAS이다. 본원에 개시된 발현 벡터 또는 핵산 분자 중 어느 하나의 일부 실시양태에서, 상기 UAS는 효모 GAL4 프로모터로부터 유래된다
본원에 개시된 발현 벡터 또는 핵산 분자 중 어느 하나의 일부 실시양태에서, 발현 벡터 또는 핵산 분자는 프로모터를 추가로 포함한다.
본원에 개시된 발현 벡터 또는 핵산 분자 중 어느 하나의 일부 실시양태에서, 복수의 이종성 폴리뉴클레오티드 서열 중 적어도 하나는 프로모터의 상류에 있다. 본원에 개시된 발현 벡터 또는 핵산 분자 중 어느 하나의 일부 실시양태에서, 프로모터는 강력한 구성적 인간 프로모터이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 프로모터는 약한 최소의 바이러스 프로모터이다. 본원에 개시된 핵산 분자 중 어느 하나의 일부 실시양태에서, 발현 벡터 또는 핵산 분자는 프로모터의 제어 하에 있는 표적 유전자를 추가로 포함한다.
또 다른 양태에서, 본 개시내용은 본원에 개시된 바와 같은 발현 벡터 또는 핵산 서열 중 어느 하나를 포함하는 세포를 제공한다. 일부 실시양태에서, 상기 세포는 포유동물 세포일 수 있다.
또 다른 양태에서, 본 개시내용은 세포에서 표적 유전자의 발현을 조절하는 방법으로서, (a) (i) 본원에 개시된 바와 같은 핵산 서열 중 어느 하나, (ii) 프로모터, 및 (iii) 표적 유전자를 포함하는 벡터를 제공하는 단계; 및 핵산 서열을 프로모터와 상호작용할 수 있는 작동인자 모이어티와 접촉시켜 표적 유전자의 발현 수준을 조절하는 단계를 포함하는 방법을 제공한다.
본원에 개시된 방법 중 어느 하나의 일부 실시양태에서, 작동인자 모이어티는 CRISPR 엔도뉴클레아제 및 유전자 이펙터를 포함하는 복합체이다. 본원에 개시된 방법 중 어느 하나의 일부 실시양태에서, 유전자 이펙터는 유전자 활성화제이다. 본원에 개시된 방법 중 어느 하나의 일부 실시양태에서, 유전자 이펙터는 유전자 억제인자이다. 본원에 개시된 방법 중 어느 하나의 일부 실시양태에서, 복합체는 이종성 폴리뉴클레오티드 서열에 대한 특이적 결합을 나타내는 가이드 핵산 분자 또는 이종성 폴리뉴클레오티드 서열을 추가로 포함한다.
본원에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되도록 구체적이고 개별적으로 표시된 것과 동일한 정도로 참조로 여기에 포함된다.
본 개시내용의 신규 특징은 첨부된 청구범위에서 구체적으로 설명된다. 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 다음의 상세한 설명과 첨부 도면을 참조함으로써 본 개시내용의 특징 및 장점을 더 잘 이해할 수 있을 것이다:
도 1은 CD45의 발현을 활성화하거나 CD71의 발현을 감소시키는 인간 핵 단백질을 확인하기 위한 예시적인 이펙터 스크린 설계의 개요를 제공한다.
도 2는 본 개시내용의 벡터를 생성하는데 사용될 수 있는 시작 벡터 백본을 예시한다.
도 3은 하류 리포터 유전자의 발현을 구동하는 IRES와 함께, 이종성 이펙터에 융합된 dCas9를 코딩하는 본 개시내용의 벡터를 예시한다.
도 4는 예시적인 세포주에서의 CD45의 상대적 기준선 발현을 보여준다.
도 5는 예시적인 세포주에서의 CD71의 상대적 기준선 발현을 보여준다.
도 6은 본 개시내용의 복합체에 의한 CD45 및 CD71의 조절, 및 생성된 CD45 및 CD71의 발현 프로파일에 기초한 세포 분류를 보여준다. 활성화제 스크린(오른쪽 상단 패널)의 실험 조건에서 CD45의 발현 증가가 관찰될 수 있으며, 억제인자 스크린(오른쪽 하단 패널)의 실험 조건에서 CD71의 발현 감소가 관찰될 수 있다.
도 7은 본 개시내용의 조합 스크린을 위한 발현 작제물의 예시적인 개략도를 제공한다.
도 8은 GAI-dCas9-ABI를 안정적으로 발현하는 세포주의 생성을 위한 발현 작제물의 예시적인 개략도를 제공한다. 이 시약은 본 개시내용의 조합 스크린에 사용될 수 있다.
도 9는 dCas9와 관련된 전사 조절인자와 염색질 조절인자의 조합을 포함하는 본 개시내용의 복합체에 의한 CD45 및 CD71 발현의 조절을 예시한다. 상단 이미지는 CD45에 대한 예시적인 활성화제 스크린을 보여주고, 하단 이미지는 CD71에 대한 예시적인 억제인자 스크린을 보여준다. 오른쪽 그래프는 본 개시내용의 복합체에 의한 CD45 발현의 증가 및 본 개시내용의 복합체에 의한 CD71 발현의 억제를 예시한다.
도 10은 조작된 합성 리포터(ESR)에 대한 발현 벡터의 예시적인 구조를 개략적으로 보여준다. 도 10은 서열번호: 49340(전체 서열 표시)을 개시하며, 이는 서열번호: 49334("합성 가이드 표적") 서열번호: 49341("UAS"), 서열번호: 49335(Cas12a/MINI PAM + 합성 가이드 표적), 서열번호: 49336(합성 가이드 표적 + SpCas9 PAM), 서열번호: 49337(합성 가이드 표적 + SpCas9 PAM 및 SaCas9 PAM), 서열번호: 49338(Cas12a/미니 PAM + 합성 가이드 표적 + SpCas9 PAM 및 SaCas9 PAM), 및 서열번호: 49339(Cas12a/미니 PAM + 합성 가이드 표적 + SpCas9 PAM)을 포함한다.
도 11은 ESR의 서열의 일례를 개략적으로 도시한다. 도 11은 서열번호: 49344(Cas12a/미니 PAM(TTTA), 이종성 가이드 표적(서열번호: 49334), Cas9 PAM(CGG), 및 UAS(서열번호: 49341)을 포함하는 단일 ESR 반복부); 서열번호: 49345(ESR 반복부의 7개의 카피); 서열번호: 49346(미니CMV 프로모터); 및 서열번호: 49347(EF1a 프로모터)를 개시한다.
도 12는 대조군 리포터 벡터의 서열의 일례를 개략적으로 보여준다. 도 12는 서열번호: 49348(Cas12a/미니 PAM(TTTA), Cas9 PAM(CCC), Cas9 스페이서(서열번호: 49349), 및 CasMINI/Cas12a 스페이서(서열번호: 49350)를 포함하는 단일 TRE3G_반복부); 및 전체 TRE3GS_프로모터(서열번호: 49351, 이는 TRE3G 반복부의 7개의 카피 및 변형된 미니CMV 프로모터(서열번호: 49352)를 포함함)를 개시한다.
도 13은 미니CMV-GFP를 코딩하는 ESR(ESR121)로 조작된 리포터 293T 세포주의 유세포분석 데이터 분석을 보여준다.
도 14는 EF1a-GFP를 코딩하는 ESR(ESR221)로 조작된 리포터 293T 세포주의 유세포분석 데이터 분석을 보여준다.
도 15는 미니CMV-GFP를 코딩하는 ESR(ESR111)로 조작된 리포터 K562 세포주의 유세포분석 데이터 분석을 보여준다.
도 16은 EF1a-GFP를 코딩하는 ESR(ESR211)로 조작된 리포터 K562 세포주의 유세포분석 데이터 분석을 보여준다.
도 17은 미니CMV-GFP(ESR121)를 코딩하는 ESR로 조작된 리포터 293T 세포주의 다른 유세포분석 데이터 분석을 보여준다.
도 18은 EF1a-GFP를 코딩하는 ESR(ESR221)로 조작된 리포터 293T 세포주의 다른 유세포분석 데이터 분석을 보여준다.
도 19는 녹색 형광 단백질(GFP)을 코딩하는 ESR로 조작된 리포터 293T 세포주(클론 1), GFP을 코딩하는 ESR로 조작된 추가의 리포터 293T 세포주(클론 2), GFP를 코딩하는 대조군 발현 벡터를 발현하는 대조군 리포터 293T 세포주(TRE3G-GFP), 및 GFP를 코딩하는 대조군 발현 벡터를 발현하는 추가의 대조군 리포터 293T 세포주(SV40-GFP)의 유세포분석 데이터 분석을 보여주며, 여기서 ESR-EF1a 293T 클론 세포주는 기존 리포터 세포보다 GFP 발현의 더 좁은 분포를 나타낸다.
도 20은 표적 유전자(예를 들어, CD45, CD71), 또는 GFP 리포터 유전자의 발현을 활성화하거나 감소시키는 이종성 유전자 이펙터를 확인하기 위한 예시적인 스크린 설계의 개요를 제공한다.
도 21a는 각각 양성 대조군 작제물 VPR 또는 KRAB으로부터의 ESR-GFP 전사 활성화 또는 억제의 높은 동적 범위를 보여주는 대표적인 유세포분석 히스토그램을 제공한다.
도 21b는 2개의 내인성 인간 유전자 표적: 활성화의 경우 저발현 CD45 또는 억제의 경우 고발현 CD71의 전사 활성화 또는 억제를 보여주는 대표적인 히스토그램을 제공한다.
도 22a는 강화된 합성 리포터 시스템을 사용하여 후보 활성화제 이종성 유전자 이펙터에 대한 스크린에서의 히트를 보여주는 화산 플롯이다.
도 22b는 강화된 합성 리포터 시스템을 사용하여 후보 억제인자 이종성 유전자 이펙터에 대한 스크린에서의 히트를 보여주는 화산 플롯이다.
도 23a는 야생형 K562 세포에서 내인성 유전자(CD45)를 사용하는 후보 활성화제 이종성 유전자 이펙터에 대한 스크린에서의 히트를 보여주는 화산 플롯이다.
도 23b는 야생형 K562 세포에서 내인성 유전자(CD71)를 사용하는 후보 억제인자 이종성 유전자 이펙터에 대한 스크린에서의 히트를 보여주는 화산 플롯이다.
도 24a는 sgRNA에 의해 CXCR4에 표적화된 본원에 개시된 이종성 유전자 이펙터를 포함하는 복합체를 코딩하는 플라스미드로 형질감염시킨 후 3일 및 7일의 CXCR4 발현의 기하평균을 보여준다.
도 24b는 3 d.p.t.에서 CXCR4-APC 형광의 대표적인 유세포분석 히스토그램을 제공하며, 이는 하나의 신규 활성화제(EPICXV.1) 대 표준 활성화제(VPR), 및 하나의 신규 억제인자(EPICXV.71) 대 표준 억제인자(KRAB)의 상대적 성능을 보여준다. 표시된 조절인자는 dCasMini에 융합되어 있다.
도 24c는 본원에 개시된 신규 후보 이펙터(EPICXV)와 비교하여, dCas9, dCasMini, 표준 활성화제 VPR, 및 이들의 융합체를 코딩하는 서열의 상대적 크기(bp)를 예시한다.
도 25a는 야생형 HEK293T 세포를 dCasMini-이펙터 융합체 및 인간 IFNG를 표적으로 하는 sgRNA로 처리한지 3일 후에 ELISA에 의해 결정된 IFNg 분비를 보여준다.
도 25b는 야생형 HEK293T 세포를 dCasMini-이펙터 융합체 및 CD45를 표적으로 하는 sgRNA로 처리한지 2일 후 유세포분석법에 의해 결정된 CD45 표면 발현을 보여준다.
도 25c는 야생형 HEK293T 세포를 dCasMini-이펙터 융합체 및 CD2를 표적으로 하는 sgRNA로 처리한 지 3일 후 유세포분석법에 의해 결정된 CD2 표면 발현을 보여준다.
도 25d는 야생형 HEK293T 세포를 dCasMini-이펙터 융합체 및 CD2를 표적으로 하는 sgRNA로 처리한지 5일 후 유세포분석법에 의해 결정된 CD2 표면 발현을 보여준다.
도 26a는 유세포 분석법으로 결정된 바와 같이, dCasMini-이펙터 융합체 및 리포터를 표적으로 하는 sgRNA로 처리한지 2일 후 안정적으로 통합된 TRE3G 프로모터-구동된 GFP를 보유하는 HEK293T 세포의 GFP 리포터 발현을 보여준다.
도 26b는 유세포 분석법으로 결정된 바와 같이, dCasMini-이펙터 융합체 및 리포터를 표적으로 하는 sgRNA로 처리한지 2일 후 저발현 미니CMV 프로모터에 의해 구동되는 안정적으로 통합된 GFP 합성 리포터를 보유하는 HEK293T 세포의 GFP 리포터 발현을 보여준다.
도 27a는 유세포 분석법으로 결정된 바와 같이, dCasMini-이펙터 융합체 및 리포터를 표적으로 하는 sgRNA로 처리한 지 5일 후 고발현 EF1α 프로모터에 의해 구동되는 안정적으로 통합된 GFP 합성 리포터를 보유하는 HEK293T 세포의 GFP 리포터 발현을 보여준다.
도 27b는 유세포 분석법으로 결정된 바와 같이, dCas9-이펙터 융합체 및 리포터를 표적으로 하는 sgRNA로 처리한 지 5일 후 고발현 EF1α 프로모터에 의해 구동되는 안정적으로 통합된 GFP 합성 리포터를 보유하는 HEK293T 세포의 GFP 리포터 발현을 보여준다.
도 28a는 유세포 분석법으로 결정된 바와 같이, dCasMini-이펙터 융합체 및 CXCR4를 표적으로 하는 sgRNA를 사용한 형질감염 후 3, 7, 15 및 28일에 내인성 유전자 CXCR4의 발현에 대한 이종성 유전자 이펙터의 효과를 요약한 것이다.
도 28b는 본원에 개시된 이종성 유전자 이펙터 또는 sgRNA에 의해 CXCR4를 표적으로 하는 대조군을 포함하는 복합체를 코딩하는 플라스미드로 HEK293T 세포를 형질감염시킨 후 3, 7, 15, 및 28일째의 정규화된 CXCR4 발현 값을 보여준다. 이펙터는 각 시점에서 효과 크기에 따라 순위가 매겨진다.
도 29a는 시간 경과에 따른 유전자의 발현에 대한 대조군 이펙터(점선)와 비교하여 본원에 개시된 후보 이종성 유전자 이펙터의 효과를 보여준다. 표시된 이펙터는 dCasMini에 융합되어 있다.
도 29b는 dCas9에 융합된 KRAB, DNMT3A, 및 DNMT3L 도메인을 포함하는 지속적인 억제를 위한 작제물인 양성 대조군 dCas9-KAL에 대한 대표적인 유세포분석 히스토그램을 제공하며, 이는 점진적인 시점에 걸쳐 표적 유전자 발현의 증가된 억제를 보여준다.
도 29c는 dCasMini에 융합된 이펙터를 비교하는 대표적인 유세포분석 히스토그램을 제공한다. 음성 대조군(조절인자가 없는 dCasMini) 및 양성 대조군 억제인자는 새로운 억제인자(EPICXV.67)와 비교하여 표시된다.
도 29d는 ESR-GFP HEK293T 세포에서 플라스미드 형질감염 후 시간 경과에 따른 dCasMini-이펙터의 발현(mCherry 리포터에 의해 반영됨)을 입증하는 측정치를 보여준다.
도 29e는 현재 스크리닝된 신규 소형 조절인자(접두사 EPICXV)와 비교하여, 양성 대조군 융합체(KAL) 및 이의 구성성분의 상대적인 크기(bp)를 비교하는 막대 차트를 제공한다.
도 29f는 본원에서 테스트된 본 dCasMini-EPICXV 작제물에 비해, 유전자 발현의 지속적인 억제에 대한 dCas9-KAL 대조군의 상대적인 크기(bp)를 비교하는 막대 차트를 제공한다.
도 29g는 ESR-GFP 세포의 경우 77 d.p.t.에서 양성 대조군 및 선택된 후보 이종성 유전자 이펙터(EPICXV)의 각 실험 복제물에 대한 정규화된 리포터 GFP 형광 값을 보여준다.
도 30은 ESR-GFP 합성 리포터 세포에서의 정규화된 GFP 형광(3 내지 77 d.p.t.의 모든 시점에 걸쳐 평균; y축) 및 정규화된 CXCR4-APC 형광(3 내지 28 d.p.t.의 모든 시점에 걸쳐 평균; x축)의 상관관계를 보여준다.
유전자 발현은 세포와 조직에서 다양한 생리학적, 병리학적 효과를 뒷받침하고 많은 질병과 병태에 기여하므로, 특정 유전자의 발현을 바람직한 방식으로 조절하는 제제는 치료상의 이점을 가질 수 있다.
유전자 발현에서 강력하고/하거나, 지속적이며/이거나 가역적인 변화를 이끌어내는 제제를 개발하는 것은 많은 후보 치료제가 중간 정도 또는 단기간 효과만 달성하거나, 반대로 표적을 벗어난 효과를 초래하기 때문에, 어려운 것으로 입증되었다. 또한, 유전자 편집 및 게놈 조작에 대한 현재의 많은 접근 방식은 바람직하지 않은 독성 프로파일과 연관될 수 있는 표적을 벗어난 효과를 초래할 수 있으며, 어떤 경우에는 바람직하지 않은 효과가 영구적일 수 있다. 따라서, 표적 유전자 발현 및 활성, 예를 들어 인간 질병에 영향을 미치는 유전자 발현의 강력하고/하거나, 지속적이며/이거나 가역적인 조절을 가능하게 하는 유전자 발현을 조절하기 위한 새로운 전략이 필요하다.
후성적 방식으로 작용하는 분자 도구는 유전자 발현의 효율적이고 내구성이 있으며 위험도가 낮은 치료 조절을 유도할 수 있는 잠재력을 가지고 있다. 일부 실시양태에서, 본 개시내용은 표적 유전자 발현의 효율적이고 효과적이며 지속적인 후성적 변형이 가능한 신규 이펙터 도메인을 확인하기 위한 조성물 및 방법을 제공한다. 예를 들어, 특정 표적 유전자(들)(예를 들어, 표적 내인성 유전자(들))의 발현 또는 활성을 조절(예를 들어, 상향조절 또는 하향조절)하기 위한 가이드 모이어티와 이종성 유전자 이펙터 도메인 및 이펙터 도메인의 복합체가 제공된다.
이종성 유전자 이펙터의 조합은 또한 예를 들어 시너지 효과를 통해 유전자 발현 조절에 유리한 결과를 달성할 수 있는 잠재력을 가지고 있다. 일부 실시양태에서, 본 개시내용은 이종성 유전자 이펙터의 신규 조합, 예를 들어 인간 핵 프로테옴, 바이러스 공급원으로부터의 염색질 조절인자 및/또는 전사 조절인자인 이펙터 도메인, 및/또는 본원에 개시된 다른 유형의 이종성 유전자 이펙터의 조합을 포함하는 조성물 및 방법을 제공한다.
상황-의존적(context-dependent) 효과는 유전자 발현 및 활성의 치료적 조절에 대한 추가적인 챌린지를 제시한다. 예를 들어, 특정 표적 유전자(예: 특정 표적 내인성 유전자)의 발현, 세포 유형, 대상체 등에 대한 바람직한 효과를 달성하는 전략 또는 전사 조절인자는 다른 표적 유전자(예: 다른 표적 내인성 유전자), 세포 유형 또는 대상체에 대해 원하는 효과를 달성하지 못할 수도 있다. 일부 경우에, 본 개시내용의 시스템 및 방법은 특정 표적 유전자(예를 들어, 특정 표적 내인성 유전자), 특정 세포 유형, 특정 표적 질병, 특정 대상체 등에 맞춤화되거나 적용 가능하거나 특히 적합하다.
일부 실시양태에서, 본 개시내용은 이종성 유전자 이펙터 도메인 및 이펙터 도메인과 특정 표적 유전자(들)(예를 들어, 특정 표적 내인성 유전자)의 발현을 조절하기 위한 가이드 모이어티의 복합체를 확인하기 위한 고처리량 스크린을 위한 조성물 및 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 연구 또는 치료제와 같은 다른 목적을 위해 사용될 수 있는 본원에 개시된 시스템에 의해 확인된 복합체를 제공한다.
이종성 유전자 이펙터
본 개시내용은 이종성 유전자 이펙터(예를 들어, 본 개시내용의 유전자 이펙터 및/또는 복합체 내의 또 다른 성분을 포함하는 세포에 이종성인 유전자 이펙터)를 활용하는 조성물, 시스템, 방법 및 방법(예를 들어 복합체 및 라이브러리)을 제공한다. 이종성 유전자 이펙터는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하기 위한, 예를 들어, 상기 유전자의 발현 수준 또는 활성 수준을 활성화, 억제, 상향조절, 하향조절, 또는 안정화할 수 있거나 하기 위한 후보인 도메인을 포함한다. 이종성 유전자 이펙터는 복합체에 존재하는 또 다른 성분, 예를 들어 가이드 모이어티(예, 본원에 개시된 뉴클레아제 및/또는 가이드 핵산)에 대해 이종성일 수 있다. 일부 경우에, 이종성 유전자 이펙터는 이들이 도입되는 숙주 세포에 대해 이종성일 수 있다.
이종성 유전자 이펙터는 임의의 적합한 공급원으로부터의 서열, 예를 들어 인간 단백질, 바이러스 단백질, 또는 본원에 개시된 다른 단백질로부터의 아미노산 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 주로 핵에 국소화된 단백질, 예를 들어 인간 핵 프로테옴의 구성원일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 하나 이상의 천연 아미노산 잔기일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 하나 이상의 합성 아미노산 잔기일 수 있거나 이를 포함할 수 있다.
이종성 유전자 이펙터는 포유동물 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 인간 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 바이러스 단백질의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 비-인간 영장류 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 비-인간 포유동물 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 비-설치류 포유동물 단백질로부터의 서열이거나 서열을 포함할 수 있다. 이종성 유전자 이펙터는 식물 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 돼지 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 토끼목 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 개 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 조류 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 파충류 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 박테리아 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다. 이종성 유전자 이펙터는 고세균 단백질로부터의 서열일 수 있거나 이를 포함할 수 있다.
이종성 유전자 이펙터는 염색질 조절인자(CR)로부터의 서열일 수 있거나 이를 포함할 수 있다. 염색질 조절인자에는 다양한 부류의 히스톤 및 DNA 변형 효소(예: DNMT, HAT, HMT 등)의 기능성 도메인이 포함된다.
이종성 유전자 이펙터는 예를 들어 C-말단, N-말단에 위치하거나, 폴리펩티드 서열 내에 위치하는 염색질 조절인자로부터의 2개 이상의 도메인을 나란히 또는 별도로 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 이종성염색질 형성을 촉진하는 것이다. 이종성염색질 형성을 촉진할 수 있는 단백질의 비제한적인 예에는 HP1α, HP1β, KAP1, KRAB, SUV39H1, 및 G9a가 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 메틸화를 통해 히스톤을 조절한다. 일부 실시양태에서, 이종성 유전자 이펙터는 아세틸화를 통해 히스톤을 조절한다. 일부 실시양태에서, 이종성 유전자 이펙터는 인산화를 통해 히스톤을 조절한다. 일부 실시양태에서, 이종성 유전자 이펙터는 ADP-리보실화를 통해 히스톤을 조절한다. 일부 실시양태에서, 이종성 유전자 이펙터는 글리코실화를 통해 히스톤을 조절한다. 일부 실시양태에서, 이종성 유전자 이펙터는 SUMO화를 통해 히스톤을 조절한다. 일부 실시양태에서, 이종성 유전자 이펙터는 유비퀴틴화를 통해 히스톤을 조절한다. 일부 실시양태에서, 이종성 유전자 이펙터는 예를 들어 ATP 가수분해 의존 과정을 통해 히스톤 구조를 리모델링함으로써 히스톤을 조절한다.
일부 실시양태에서, 이종성 유전자 이펙터는 표적 폴리뉴클레오타이드 상에 또는 근처에 있는 단백질, 예를 들어 전사 억제인자, 전사 인자, 히스톤 등의 공간적 위치설정을 촉진한다. 일부 실시양태에서, 이종성 유전자 이펙터는 예를 들어 다양한 세포 기능을 조절하기 위해 핵 및/또는 세포질에 있는 게놈 DNA 및 RNA 성분의 시공간 조직을 조작하는 데 유용하다.
일부 실시양태에서, 이종성 유전자 이펙터는 관련 히스톤 아세틸트랜스퍼라제 계열로부터 유래된다. 히스톤 아세틸트랜스퍼라제의 비제한적 예에는 GNAT 하위계열, MYST 하위계열, p300/CBP 하위계열, HAT1 하위계열, GCN5, PCAF, Tip60, MOZ, MORF, MOF, HBO1, p300, CBP, HAT1, ATF-2, SRC1, 및 TAFII250이 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 히스톤 라이신 메틸트랜스퍼라제로부터 유래된다. 히스톤 라이신 메틸트랜스퍼라제의 비제한적 예에는 EZH 하위계열, 비-SET 하위계열, 기타 SET 하위계열, PRDM 하위계열, SET1 하위계열, SET2 하위계열, SUV39 하위계열, SYMD 하위계열, ASH1L, EHMT1, EHMT2, EZH1, EZH2, MLL, MLL2, MLL3, MLL4, MLL5, NSD1, NSD2, NSD3, PRDM1, PRDM10, PRDM11, PRDM12, PRDM13, PRDM14, PRDM15, PRDM16, PRDM2, PRDM4, PRDM5, PRDM6, PRDM7, PRDM8, PRDM9, SET1, SET1L, SET2L, SETD2, SETD3, SETD4, SETD5, SETD6, SETD7, SETD8, SETDB1, SETDB2, SETMAR, SUV39H1, SUV39H2, SUV420H1, SUV420H2, SYMD1, SYMD2, SYMD3, SYMD4, 및 SYMD5가 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 염색질 리모델링 복합체의 성분으로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 BAF의 성분, 예를 들어 액틴, ARIDA/B, BAF155, BAF170, BAF45 A/B/C/D, BAF53 A/B, BAF57, BAF60 A/B/C, BRG1/BRM, INI1, 또는 SS18이다.
일부 실시양태에서, 이종성 유전자 이펙터는 PBAF의 성분, 예를 들어 액틴, ARID2, BAF155, BAF170, BAF180, BAF45 A/B/C/D, BAF53 A/B, BAF57, BAF60 A/B/C, BRD7, BRG1, 또는 INI1로부터 유래된다.
일부 실시양태에서, 이종성 유전자 이펙터는 ISWI 계열 염색질 리모델링 복합체의 성분, 예를 들어 ACF 하위계열, RSF 하위계열, CERF 하위계열, CHRAC 하위계열, NURF 하위계열, NoRC 하위계열, WICH 하위계열, b-WICH 하위계열, ACF1, ATPase, BPTF, CECR2, CHRAC15, CHRAC17, CSB, DEK, MYBBP1A, NM1, RBAP46/48, RHII/Gua, RSF1, SAP155, SNF2H, SNF2H/L, SNF2L, TIP5, 또는 WSTF로부터 유래된다.
일부 실시양태에서, 이종성 유전자 이펙터는 CHD 계열 복합체의 성분, 예를 들어 NuRD 복합체, NuRD-유사 복합체, 또는 CHD 복합체로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 CHD1/2/6/7/8/9, CHD3/4, CHD5, GATAD2 A/B, GATAD2 B, HDAC1, HDAC2, HDAC2, MBD2/3, MTA1/2/3, MTA3, 또는 RBAP46, RBAP46/48로부터 유래된다.
일부 실시양태에서, 이종성 유전자 이펙터는 INO80 계열 복합체의 성분, 예를 들어 INO80 복합체, Tip60/p400 복합체, SRCAP 복합체, AMIDA, ARP6, BAF53, BAF53, BAF53A, BRD8, DMAP1, DMAP1, EPC1/2, FLJ11730, GAS41, GAS41, IES2, IES6, ING3, INO80, INO80E, MCRS1, MRG15, MRGBP, MRGX, NFRKB, p400, RUVBL1/2, RUVBL1/2, RUVBL1/2, SRCAP, Tip60, TRRAP, UCH37, YL-1, YL-1, YY1, 또는 ZnF-HIT1로부터 유래된다.
이종성 유전자 이펙터는 전사 조절인자(TR)로부터의 서열일 수 있거나 이를 포함할 수 있다. TR 유전자 이펙터에는 다양한 전사 인자 계열(예: KRAB, p65, MED, GTF 등)의 전사 조절 도메인이 포함된다.
이종성 유전자 이펙터는 전사 활성화제 도메인을 포함할 수 있다. 이종성 유전자 이펙터는 예를 들어 C-말단, N-말단에 위치하거나 폴리펩티드 서열 내에 위치하는 2개 이상의 나란한 전사 활성화 도메인을 포함할 수 있다.
전사 활성화 도메인의 비제한적 예에는 GAL4, 단순 포진 활성화 도메인 VP16, VP64(단순 포진 활성화 도메인 VP16의 사량체), NF-KB p65 하위유닛, 엡스타인-바 바이러스 R 트랜스활성인자(Rta)가 포함된다. 전사 활성화 도메인의 예는 문헌: Chavez et al., Nat Methods, 2015, 12(4):326-328 및 미국 특허 공개 공보 제20140068797호에 기재되어 있다. 일부 실시양태에서, 이러한 전사 활성화 도메인은 본 개시내용의 방법에서 대조군으로서 사용된다. 일부 실시양태에서, 이러한 전사 활성화 도메인은 적어도 하나의 추가적인 이종성 유전자 이펙터(예를 들어, 다른 이펙터)를 포함하는 복합체에서 하나의 이종성 유전자 이펙터로서 사용된다.
이종성 유전자 이펙터는 전사 억제인자 도메인을 포함할 수 있다. 이종성 유전자 이펙터는 예를 들어 C-말단, N-말단에 위치하거나 폴리펩티드 서열 내에 위치하는 2개 이상의 전사 억제인자 도메인을 나란히 또는 별도로 포함할 수 있다.
전사 억제인자 도메인의 비제한적 예에는 Koxl의 KRAB(Kruppel-associated box) 도메인, Mad mSIN3 상호작용 도메인(SID), 및 ERF 억제인자 도메인(ERD)이 포함된다. 전사 억제인자 도메인의 예는 문헌: Chavez et al., Nat Methods, 2015, 12(4):326-328 및 미국 특허 공개 공보 제20140068797호에 기재되어 있다. 일부 실시양태에서, 이러한 전사 억제인자 도메인은 본 개시내용의 방법에서 대조군으로서 사용된다. 일부 실시양태에서, 이러한 전사 억제인자 도메인은 적어도 하나의 추가적인 이종성 유전자 이펙터(예를 들어, 다른 이펙터)를 포함하는 복합체에서 하나의 이종성 유전자 이펙터로서 사용된다.
일부 실시양태에서, 이종성 유전자 이펙터는 전사 인자인 유전자 생성물로부터 유래된다.
일부 실시양태에서, 이종성 유전자 이펙터는 조혈 줄기 세포 전사 인자인 유전자 생성물로부터 유래된다. 조혈 줄기 세포 전사 인자의 비제한적인 예에는 AHR, Aiolos/IKZF3, CDX4, CREB, DNMT3A, DNMT3B, EGR1, FoxO3, GATA-1, GATA-2, GATA-3, Helios, HES-1, HHEX, HIF-1 알파/HIF1A, HMGB1/HMG-1, HMGB3, Ikaros, c-Jun, LMO2, LMO4, c-Maf, MafB, MEF2C, MYB, c-Myc, NFATC2, NFIL3/E4BP4, Nrf2, p53, PITX2, PRDM16/MEL1, Prox1, PU.1/Spi-1, RUNX1/CBFA2, SALL4, SCL/Tal1, Smad2, Smad2/3, Smad4, Smad7, Spi-B, STAT 활성화제, STAT 억제제, STAT3, STAT4, STAT5a, STAT6, 및 TSC22가 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 중간엽 줄기 세포 전사 인자인 유전자 생성물로부터 유래된다. 중간엽 줄기세포 전사 인자의 비제한적인 예에는 DUX4, DUX4/DUX4c, DUX4c, EBF-1, EBF-2, EBF-3, ETV5, FoxC2, FoxF1, GATA-4, GATA-6, HMGA2, c-Jun, MYF-5, 미오카르딘(Myocardin), MyoD, 미오게닌(Myogenin), NFATC2, p53, Pax3, PDX-1/IPF1, PLZF, PRDM16/MEL1, RUNX2/CBFA1, Smad1, Smad3, Smad4, Smad5, Smad8, Smad9, Snail, SOX2, SOX9, SOX11, STAT 활성화제, STAT 억제제, STAT1, STAT3, TBX18, Twist-1, 및 Twist-2가 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 배아 줄기 세포 전사 인자인 유전자 생성물로부터 유래된다. 배아 줄기 세포 전사 인자의 비제한적인 예에는 브라키우리(Brachyury), EOMES, FoxC2, FoxD3, FoxF1, FoxH1, FoxO1/FKHR, GATA-2, GATA-3, GBX2, 구스코이드(Goosecoid), HES-1, HNF-3 알파/FoxA1, c-Jun, KLF2, KLF4, KLF5, c-Maf, Max, MEF2C, MIXL1, MTF2, c-Myc, 나녹(Nanog), NFkB/IkB 활성화제, NFkB/IkB 억제제, NFkB1, NFkB2, Oct-3/4, Otx2, p53, Pax2, Pax6, PRDM14, Rex-1/ZFP42, SALL1, SALL4, Smad1, Smad2, Smad2/3, Smad3, Smad4, Smad5, Smad8, Snail, SOX2, SOX7, SOX15, SOX17, STAT 활성화제, STAT 억제제, STAT3, SUZ12, TBX6, TCF-3/E2A, THAP11, UTF1, WDR5, WT1, ZNF206, 및 ZNF281이 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 유도 만능 줄기 세포(iPSC) 전사 인자인 유전자 생성물로부터 유래된다. iPSC 전사 인자의 비제한적인 예에는 KLF2, KLF4, c-Maf, c-Myc, 나녹, Oct-3/4, p53, SOX1, SOX2, SOX3, SOX15, SOX18, 및 TBX18이 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 상피 줄기 세포 전사 인자인 유전자 생성물로부터 유래된다. 상피 줄기 세포 전사 인자의 비제한적인 예에는 ASCL2/Mash2, CDX2, DNMT1, ELF3, Ets-1, FoxM1, FoxN1, GATA-6, 헤어리스(Hairless), HNF-4 알파/NR2A1, IRF6, c-Maf, MITF, Miz-1/ZBTB17, MSX1, MSX2, MYB, c-Myc, 뉴로게닌(Neurogenin)-3, NFATC1, NKX3.1, Nrf2, p53, p63/TP73L, Pax2, Pax3, RUNX1/CBFA2, RUNX2/CBFA1, RUNX3/CBFA3, Smad1, Smad2, Smad2/3, Smad4, Smad5, Smad7, Smad8, Snail, SOX2, SOX9, STAT 활성화제, STAT 억제제, STAT3, SUZ12, TCF-3/E2A, 및 TCF7/TCF1이 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 암 줄기세포 전사 인자인 유전자 생성물로부터 유래된다. 암 줄기세포 전사 인자의 비제한적인 예에는 안드로겐 R/NR3C4, AP-2 감마, 베타-카테닌, 베타-카테닌 억제제, 브라키우리, CREB, ER 알파/NR3A1, ER 베타/NR3A2, FoxM1, FoxO3, FRA-1, GLI-1, GLI-2, GLI-3, HIF-1 알파/HIF1A, HIF-2 알파/EPAS1, HMGA1B, c-Jun, JunB, KLF4, c-Maf, MCM2, MCM7, MITF, c-Myc, 나녹, NFkB/IkB 활성화제, NFkB/IkB 억제제, NFkB1, NKX3.1, Oct-3/4, p53, PRDM14, Snail, SOX2, SOX9, STAT 활성화제, STAT 억제제, STAT3, TAZ/WWTR1, TBX3, 트위스트-1, 트위스트-2, WT1, 및 ZEB1이 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 암 관련 전사 인자인 유전자 생성물로부터 유래된다. 암 관련 전사 인자의 비제한적인 예에는 ASCL1/Mash1, ASCL2/Mash2, ATF1, ATF2, ATF4, BLIMP1/PRDM1, CDX2, CDX4, DLX5, DNMT1, E2F-1, EGR1, ELF3, Ets-1, FosB/G0S3, FoxC1, FoxC2, FoxF1, GADD153, GATA-2, HMGA2, HMGB1/HMG-1, HNF-3 알파/FoxA1, HNF-6/ONECUT1, HSF1, ID1, ID2, JunD, KLF10, KLF12, KLF17, LMO2, MEF2C, MYCL1/L-Myc, NFkB2, Oct-1, p63/TP73L, Pax3, PITX2, Prox1, RAP80, Rex-1/ZFP42, RUNX1/CBFA2, RUNX3/CBFA3, SALL4, SCL/Tal1, 시르투인(Sirtuin) 2/SIRT2, Smad3, Smad4, Smad5, SOX11, STAT5a/b, STAT5a, STAT5b, TCF7/TCF1, TORC1, TORC2, TRIM32, TRPS1, 및 TSC22가 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 면역 세포 전사 인자인 유전자 생성물로부터 유래된다. 면역 세포 전사 인자의 비제한적 예에는 AP-1, Bcl6, E2A, EBF, Eomes, FoxP3, GATA3, Id2, 이카로스(Ikaros), IRF, IRF1, IRF2, IRF3, IRF3, IRF7, NFAT, NFkB, Pax5, PLZF, PU.1, ROR-감마-T, STAT, STAT1, STAT2, STAT3, STAT4, STAT5, STAT5A, STAT5B, STAT6, T-bet, TCF7, 및 ThPOK가 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 RNA 폴리머라제 관련 단백질인 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 기본 도메인을 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 아연 배위 DNA 결합 도메인을 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 나선-회전-나선 도메인을 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 알파나선형 DNA 결합 도메인을 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 베타 구조에 의해 노출된 알파 나선을 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 면역글로불린 폴드를 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 알파/베타-스캐폴드에 의해 노출된 베타-헤어핀을 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 DNA에 결합하는 베타 시트를 갖는 전사 인자로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 베타 배럴 DNA 결합 도메인을 갖는 전사 인자로부터 유래된다.
일부 실시양태에서, 이종성 유전자 이펙터는 핵 수용체, 예를 들어 핵 호르몬 수용체인 유전자 생성물로부터 유래된다. 핵 호르몬 수용체의 비제한적 예에는 NR0B1, NR0B2, NR1A1, NR1A2, NR1B1, NR1B2, NR1B3, NR1C1, NR1C2, NR1C3, NR1D1, NR1D2, NR1F1, NR1F2, NR1F3, NR1H4, NR1H5, NR1H3, NR1H2, NR1I1, NR1I2, NR1I3, NR2A1, NR2A2, NR2B1, NR2B2, NR2B3, NR2C1, NR2C2, NR2E1, NR2E3, NR2F1, NR2F2, NR2F6, NR3A1, NR3A2, NR3B1, NR3B2, NR3B3, NR3C4, NR3C1, NR3C2, NR3C3, NR4A1, NR4A2, NR4A3, NR5A1, NR5A2, 및 NR6A1에 의해 코딩되는 것들이 포함된다.
일부 실시양태에서, 이종성 유전자 이펙터는 뉴클레오솜 조립에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 DNA 대사에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 뉴클레오티드 대사에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 리보솜 생합성에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 단백질 폴딩에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 번역에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 신호전달에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 단백질분해에 관여하는 유전자 생성물로부터 유래된다. 일부 실시양태에서, 이종성 유전자 이펙터는 엔도펩티다제 활성의 음성 조절에 관여하는 유전자 생성물로부터 유래된다.
일부 실시양태에서, 후보 이종성 유전자 이펙터의 목록은 활성화 대 억제, 표적 세포 경로, 진화적 서열 제약, DNA/RNA/둘 모두의 결합, 단백질 폴딩 패턴, 숙주/세포 친화성, 직접/간접 활성, 결합 난잡함, 핵/세포질 활동, 및 기타 기준에 의해 계층화된다. 일부 실시양태에서, 이러한 계층화는 잠재적인 분자 기능의 광범위한 스펙트럼을 포함하는 본 개시내용의 스크린 라이브러리의 설계를 허용함으로써, 본원에 개시된 목적에 적합한 이종성 유전자 이펙터의 발견 가능성을 증가시킨다.
일부 실시양태에서, 예측 필터링 기술은 예를 들어 인실리코(in silico)로 후보 이종성 유전자 이펙터 서열에 적용된다. 예측 필터링 기술은 예를 들어 효모에서의 실험을 통해 핵심 활성화제 도메인(예를 들어 13bp까지)에 대한 적합한 생물물리학적 특성; 산성, 부피가 큰 소수성, 알파 나선. 및/또는 음전하의 존재; 효과의 지속기간에 영향을 줄 수 있는 모티프 반복부의 존재; 및 PADDLE과 유사한 통상의 중성 네트워크/형질전환체 알고리즘의 확인 또는 유사한 예측 기술을 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 숙주 대상체에 대해 외인성인 표적 유전자, 예를 들어 병원체 표적 유전자 또는 치료적 개입의 결과로서 발현되는 외인성 유전자의 발현을 조절할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상과, 예를 들어, 전체 길이에 걸쳐, 적어도 약 70%, 적어도 약 71%, 적어도 약 72%, 적어도 약 73%, 적어도 약 74%, 적어도 약 75%, 적어도 약 76%, 적어도 약 77%, 적어도 약 78%, 적어도 약 79%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 95.5%, 적어도 약 96%, 적어도 약 96.5%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.1%, 적어도 약 99.2%, 적어도 약 99.3%, 적어도 약 99.4%, 적어도 약 99.5%, 적어도 약 99.6%, 적어도 약 99.7%, 적어도 약 99.8%, 적어도 약 99.9%, 적어도 약 99.95%, 적어도 약 99.99%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하고, 필수적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상과, 예를 들어, 전체 길이에 걸쳐, 최대 약 70%, 최대 약 71%, 최대 약 72%, 최대 약 73%, 최대 약 74%, 최대 약 75%, 최대 약 76%, 최대 약 77%, 최대 약 78%, 최대 약 79%, 최대 약 80%, 최대 약 81%, 최대 약 82%, 최대 약 83%, 최대 약 84%, 최대 약 85%, 최대 약 86%, 최대 약 87%, 최대 약 88%, 최대 약 89%, 최대 약 90%, 최대 약 91%, 최대 약 92%, 최대 약 93%, 최대 약 94%, 최대 약 95%, 최대 약 95.5%, 최대 약 96%, 최대 약 96.5%, 최대 약 97%, 최대 약 97.5%, 최대 약 98%, 최대 약 98.5%, 최대 약 99%, 최대 약 99.1%, 최대 약 99.2%, 최대 약 99.3%, 최대 약 99.4%, 최대 약 99.5%, 최대 약 99.6%, 최대 약 99.7%, 최대 약 99.8%, 최대 약 99.9%, 최대 약 99.95%, 최대 약 99.99%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하고, 필수적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상과, 예를 들어, 전체 길이에 걸쳐, 약 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 78%, 약 79%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 95.5%, 약 96%, 약 96.5%, 약 97%, 약 97.5%, 약 98%, 약 98.5%, 약 99%, 약 99.1%, 약 99.2%, 약 99.3%, 약 99.4%, 약 99.5%, 약 99.6%, 약 99.7%, 약 99.8%, 약 99.9%, 약 99.95%, 약 99.99% 또는 약 100%의 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상과 비교하여 하나 이상의 아미노산 삽입, 결실, 또는 치환을 갖는 펩티드 서열을 포함한다.
예를 들어, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 또는 적어도 50개의 아미노산 삽입을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 최대 1개, 최대 2개, 최대 3개, 최대 4개, 최대 5개, 최대 6개, 최대 7개, 최대 8개, 최대 9개, 최대 10개, 최대 11개, 최대 12개, 최대 13개, 최대 14개, 최대 15개, 최대 16개, 최대 17개, 최대 18개, 최대 19개, 최대 20개, 최대 25개, 최대 30개, 최대 35개, 최대 40개, 최대 45개, 또는 최대 50개의 아미노산 삽입을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45 또는 50개의 아미노산 삽입을 갖는 아미노산 서열을 포함할 수 있다.
하나 이상의 삽입은 아미노산 서열 내의 N-말단, C-말단, 또는 이들의 조합에 있을 수 있다. 하나 이상의 삽입은 연속적, 비연속적, 또는 이들의 조합일 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 임의의 아미노산 서열, 예를 들어, 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 또는 적어도 50개의 아미노산 결실을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 임의의 아미노산 서열, 예를 들어, 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 최대 1개, 최대 2개, 최대 3개, 최대 4개, 최대 5개, 최대 6개, 최대 7개, 최대 8개, 최대 9개, 최대 10개, 최대 11개, 최대 12개, 최대 13개, 최대 14개, 최대 15개, 최대 16개, 최대 17개, 최대 18개, 최대 19개, 최대 20개, 최대 25개, 최대 30개, 최대 35개, 최대 40개, 최대 45개, 또는 최대 50개의 아미노산 결실을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 임의의 아미노산 서열, 예를 들어, 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45 또는 50개의 아미노산 결실을 갖는 아미노산 서열을 포함한다.
하나 이상의 결실은 아미노산 서열 내의 N-말단, C-말단, 또는 이들의 조합에 있을 수 있다. 하나 이상의 결실은 연속적, 비연속적, 또는 이들의 조합일 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 임의의 아미노산 서열, 예를 들어, 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 또는 적어도 50개의 아미노산 치환을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 임의의 아미노산 서열, 예를 들어, 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 최대 1개, 최대 2개, 최대 3개, 최대 4개, 최대 5개, 최대 6개, 최대 7개, 최대 8개, 최대 9개, 최대 10개, 최대 11개, 최대 12개, 최대 13개, 최대 14개, 최대 15개, 최대 16개, 최대 17개, 최대 18개, 최대 19개, 최대 20개, 최대 25개, 최대 30개, 최대 35개, 최대 40개, 최대 45개, 또는 최대 50개의 아미노산 치환을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 임의의 아미노산 서열, 예를 들어, 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45 또는 50개의 아미노산 치환을 갖는 아미노산 서열을 포함한다.
하나 이상의 치환은 아미노산 서열 내의 N-말단, C-말단, 또는 이들의 조합에 있을 수 있다. 하나 이상의 치환은 연속적, 비연속적, 또는 이들의 조합일 수 있다. 하나 이상의 치환은 상이한 잔기, 예를 들어 류신에 대한 N-말단 메티오닌의 치환을 포함할 수 있다
일부 실시양태에서, 이종성 유전자 이펙터는 N-말단 메티오닌을 함유하지 않는다. 일부 실시양태에서, 서열번호: 16-16154, 16-13605, 16155-47350, 16155-43953, 47351-49333, 또는 16-49333 중 어느 하나에서 발견되는 N-말단 메티오닌은 다른 잔기의 경우 결실되거나, 부재하거나, 또는 다른 잔기로 치환된다. 예를 들어, 서열번호: 49353-50052는 N-말단 메티오닌이 N-말단 류신으로 치환된 서열의 예시적인 예를 제공한다. 일부 실시양태에서, 이종성 유전자 이펙터는 N-말단 메티오닌을 포함한다.
하나 이상의 치환은 보존적, 비-보존적, 또는 이들의 조합일 수 있다. 보존적 아미노산 치환은 하나의 아미노산을 유사한 생화학적 특성(예: 전하, 크기 및/또는 소수성)을 갖는 다른 아미노산으로 치환하는 것일 수 있다. 비보존적 아미노산 치환은 하나의 아미노산을 다른 생화학적 특성(예를 들어 전하, 크기, 및/또는 소수성)을 갖는 또 다른 아미노산으로 치환하는 것일 수 있다. 보존적 아미노산 변화는 예를 들어 폴리펩티드의 2차 또는 3차 구조에 최소한의 영향을 미치는 치환일 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23631, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 1102와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 2057과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 5543과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 9066과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 11948과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 15646과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 17629와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 19860과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 21015와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 21166과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 22149와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 22707과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 23631과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 23639와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 25430과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 25555와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 32678과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 33890과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 34047과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 35737과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 38138과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 38780과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 40913과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 40985와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 40986과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 42623과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 서열번호: 16, 17, 23, 26, 35, 66, 67, 71, 74, 126, 148, 159, 160, 166, 171, 172, 174, 176, 178, 185, 188, 189, 210, 225, 237, 240, 245, 253, 259, 298, 302, 308, 316, 334, 335, 360, 362, 375, 377, 394, 398, 415, 426, 460, 476, 480, 486, 515, 527, 539, 548, 565, 571, 604, 630, 643, 676, 720, 734, 746, 774, 797, 812, 833, 835, 841, 852, 871, 874, 879, 881, 927, 934, 947, 952, 967, 986, 993, 1009, 1033, 1042, 1044, 1054, 1075, 1076, 1077, 1079, 1084, 1094, 1102, 1111, 1113, 1120, 1129, 1131, 1149, 1156, 1161, 1186, 1190, 1225, 1253, 1258, 1261, 1262, 1265, 1289, 1295, 1299, 1303, 1308, 1311, 1313, 1315, 1328, 1350, 1355, 1368, 1374, 1375, 1380, 1388, 1395, 1400, 1406, 1424, 1427, 1430, 1437, 1440, 1493, 1498, 1502, 1510, 1511, 1519, 1522, 1581, 1591, 1597, 1615, 1630, 1644, 1662, 1675, 1714, 1718, 1720, 1730, 1735, 1745, 1778, 1785, 1791, 1803, 1812, 1820, 1828, 1835, 1869, 1870, 1888, 1889, 1908, 1911, 1912, 1940, 1980, 1981, 2011, 2046, 2057, 2086, 2109, 2119, 2192, 2204, 2233, 2247, 2257, 2276, 2285, 2296, 2304, 2309, 2316, 2335, 2338, 2339, 2347, 2352, 2378, 2382, 2394, 2397, 2429, 2493, 2507, 2519, 2534, 2557, 2572, 2595, 2642, 2650, 2681, 2707, 2725, 2767, 2768, 2804, 2807, 2825, 2837, 2865, 2878, 2888, 2889, 2899, 2966, 2980, 3069, 3073, 3078, 3081, 3093, 3116, 3130, 3175, 3191, 3217, 3222, 3225, 3244, 3254, 3255, 3256, 3261, 3287, 3292, 3299, 3309, 3330, 3353, 3361, 3363, 3379, 3383, 3389, 3392, 3402, 3407, 3416, 3424, 3425, 3444, 3445, 3457, 3462, 3486, 3508, 3528, 3531, 3535, 3541, 3550, 3561, 3563, 3572, 3586, 3590, 3597, 3608, 3630, 3714, 3718, 3723, 3726, 3730, 3735, 3764, 3771, 3786, 3803, 3804, 3851, 3869, 3873, 3907, 3911, 3914, 3918, 3926, 3946, 3965, 4010, 4016, 4025, 4032, 4047, 4063, 4065, 4072, 4082, 4131, 4143, 4150, 4161, 4201, 4225, 4231, 4239, 4261, 4274, 4284, 4289, 4295, 4298, 4325, 4327, 4346, 4358, 4362, 4368, 4444, 4459, 4516, 4547, 4549, 4562, 4571, 4598, 4610, 4618, 4640, 4653, 4669, 4684, 4706, 4721, 4751, 4753, 4763, 4770, 4776, 4807, 4812, 4820, 4826, 4852, 4857, 4867, 4880, 4886, 4892, 4899, 4958, 4961, 4972, 4991, 4998, 5002, 5005, 5006, 5009, 5025, 5027, 5028, 5038, 5045, 5055, 5062, 5081, 5093, 5095, 5129, 5169, 5172, 5189, 5211, 5219, 5245, 5250, 5272, 5273, 5274, 5285, 5294, 5306, 5307, 5351, 5359, 5395, 5402, 5405, 5412, 5444, 5448, 5497, 5502, 5524, 5543, 5559, 5570, 5577, 5604, 5612, 5646, 5649, 5655, 5667, 5697, 5699, 5724, 5734, 5735, 5743, 5747, 5758, 5764, 5782, 5783, 5849, 5856, 5858, 5875, 5898, 5901, 5913, 5921, 5928, 5954, 5959, 5963, 5969, 5980, 5985, 5998, 6003, 6021, 6033, 6036, 6050, 6052, 6073, 6075, 6102, 6107, 6121, 6134, 6158, 6173, 6179, 6182, 6198, 6205, 6236, 6272, 6276, 6298, 6310, 6332, 6335, 6356, 6384, 6386, 6389, 6414, 6431, 6446, 6447, 6470, 6502, 6508, 6522, 6533, 6545, 6558, 6580, 6588, 6604, 6608, 6610, 6628, 6632, 6648, 6651, 6652, 6659, 6673, 6681, 6682, 6698, 6699, 6752, 6757, 6761, 6795, 6813, 6818, 6819, 6828, 6838, 6842, 6848, 6868, 6873, 6874, 6882, 6893, 6895, 6900, 6902, 6903, 6928, 6931, 6941, 6952, 6953, 6955, 6984, 7027, 7029, 7030, 7034, 7070, 7076, 7106, 7115, 7128, 7140, 7143, 7166, 7171, 7187, 7226, 7259, 7279, 7281, 7286, 7291, 7296, 7304, 7320, 7325, 7336, 7375, 7391, 7405, 7414, 7432, 7433, 7443, 7462, 7489, 7500, 7501, 7508, 7520, 7551, 7570, 7576, 7590, 7596, 7608, 7611, 7613, 7621, 7625, 7637, 7643, 7651, 7661, 7696, 7701, 7703, 7705, 7711, 7717, 7722, 7728, 7736, 7770, 7781, 7803, 7807, 7809, 7831, 7833, 7834, 7856, 7888, 7890, 7894, 7926, 7927, 7943, 7949, 7965, 7984, 8010, 8018, 8027, 8028, 8041, 8068, 8089, 8097, 8102, 8105, 8111, 8129, 8149, 8186, 8189, 8219, 8223, 8227, 8236, 8243, 8249, 8255, 8256, 8258, 8259, 8272, 8278, 8280, 8283, 8297, 8301, 8308, 8314, 8324, 8328, 8347, 8357, 8363, 8371, 8386, 8394, 8408, 8420, 8421, 8429, 8432, 8436, 8437, 8439, 8468, 8485, 8488, 8489, 8505, 8538, 8551, 8563, 8564, 8574, 8579, 8628, 8629, 8631, 8634, 8636, 8637, 8641, 8670, 8692, 8699, 8729, 8730, 8752, 8779, 8805, 8841, 8854, 8865, 8886, 8893, 8931, 8933, 8973, 8981, 8985, 8998, 9000, 9003, 9017, 9021, 9024, 9026, 9027, 9040, 9050, 9053, 9055, 9066, 9069, 9072, 9078, 9094, 9095, 9100, 9110, 9119, 9130, 9152, 9153, 9189, 9194, 9222, 9223, 9225, 9231, 9262, 9264, 9267, 9273, 9283, 9297, 9304, 9307, 9314, 9320, 9324, 9328, 9338, 9380, 9386, 9397, 9403, 9413, 9442, 9472, 9516, 9528, 9534, 9542, 9552, 9568, 9602, 9611, 9626, 9632, 9648, 9649, 9663, 9667, 9669, 9670, 9672, 9673, 9675, 9678, 9682, 9700, 9741, 9750, 9761, 9771, 9829, 9845, 9853, 9854, 9879, 9880, 9891, 9893, 9894, 9899, 9901, 9903, 9922, 9933, 9937, 9940, 9943, 9948, 9962, 9965, 9971, 9988, 9990, 10007, 10014, 10016, 10025, 10040, 10058, 10069, 10072, 10095, 10097, 10113, 10123, 10160, 10230, 10234, 10235, 10236, 10238, 10250, 10252, 10279, 10289, 10292, 10309, 10313, 10314, 10315, 10316, 10329, 10348, 10357, 10364, 10383, 10394, 10405, 10407, 10414, 10420, 10421, 10423, 10427, 10428, 10436, 10437, 10439, 10446, 10451, 10459, 10463, 10466, 10489, 10490, 10491, 10512, 10516, 10555, 10566, 10570, 10584, 10587, 10588, 10607, 10615, 10624, 10637, 10648, 10663, 10701, 10732, 10759, 10778, 10788, 10796, 10813, 10853, 10865, 10878, 10919, 10943, 10945, 10950, 10955, 10957, 10969, 10984, 10991, 10998, 10999, 11018, 11019, 11027, 11035, 11036, 11042, 11045, 11079, 11090, 11095, 11106, 11129, 11187, 11207, 11218, 11223, 11233, 11260, 11265, 11272, 11290, 11297, 11306, 11326, 11374, 11386, 11396, 11411, 11432, 11437, 11455, 11459, 11471, 11481, 11485, 11486, 11506, 11511, 11550, 11555, 11557, 11577, 11601, 11621, 11642, 11652, 11670, 11673, 11705, 11709, 11712, 11713, 11715, 11716, 11723, 11730, 11737, 11741, 11749, 11750, 11778, 11784, 11785, 11794, 11797, 11799, 11804, 11810, 11835, 11888, 11893, 11895, 11904, 11931, 11932, 11948, 11969, 11982, 11985, 12020, 12024, 12029, 12055, 12061, 12066, 12067, 12069, 12072, 12096, 12114, 12121, 12132, 12161, 12183, 12187, 12191, 12199, 12227, 12254, 12266, 12344, 12345, 12362, 12393, 12400, 12401, 12422, 12427, 12436, 12448, 12451, 12476, 12498, 12526, 12542, 12558, 12560, 12567, 12570, 12590, 12591, 12609, 12613, 12626, 12632, 12660, 12669, 12671, 12681, 12692, 12706, 12716, 12722, 12723, 12738, 12753, 12757, 12771, 12775, 12783, 12786, 12806, 12809, 12822, 12838, 12843, 12846, 12847, 12892, 12904, 12925, 12928, 12932, 12945, 12947, 12958, 12960, 12965, 12982, 13022, 13027, 13031, 13032, 13038, 13046, 13083, 13092, 13124, 13149, 13174, 13190, 13195, 13198, 13211, 13219, 13226, 13229, 13233, 13273, 13283, 13288, 13327, 13345, 13363, 13364, 13385, 13394, 13395, 13403, 13420, 13452, 13497, 13509, 13517, 13528, 13553, 13569, 16179, 16218, 16224, 16251, 16278, 16313, 16319, 16335, 16364, 16381, 16414, 16440, 16472, 16482, 16501, 16505, 16506, 16514, 16515, 16516, 16524, 16535, 16541, 16578, 16618, 16667, 16677, 16699, 16702, 16705, 16769, 16771, 16786, 16807, 16856, 16867, 16916, 16935, 17012, 17029, 17032, 17054, 17067, 17084, 17087, 17107, 17115, 17121, 17127, 17142, 17146, 17193, 17196, 17209, 17231, 17247, 17256, 17264, 17268, 17273, 17275, 17298, 17314, 17326, 17332, 17349, 17354, 17377, 17385, 17434, 17444, 17447, 17469, 17475, 17491, 17494, 17511, 17528, 17538, 17546, 17556, 17563, 17565, 17570, 17608, 17613, 17629, 17633, 17639, 17666, 17674, 17691, 17697, 17735, 17793, 17816, 17817, 17821, 17842, 17843, 17883, 17901, 17928, 17950, 17956, 17961, 17965, 17983, 18026, 18092, 18106, 18113, 18125, 18144, 18162, 18221, 18237, 18340, 18351, 18355, 18388, 18439, 18444, 18468, 18499, 18504, 18555, 18561, 18579, 18587, 18588, 18599, 18618, 18642, 18664, 18696, 18725, 18736, 18741, 18787, 18809, 18827, 18854, 18864, 18872, 18888, 18936, 19013, 19034, 19048, 19063, 19075, 19078, 19079, 19092, 19123, 19126, 19156, 19188, 19211, 19212, 19235, 19237, 19239, 19248, 19261, 19289, 19292, 19320, 19325, 19387, 19389, 19424, 19435, 19445, 19490, 19512, 19542, 19556, 19559, 19568, 19571, 19581, 19583, 19591, 19599, 19621, 19624, 19633, 19642, 19671, 19684, 19711, 19731, 19738, 19745, 19761, 19771, 19781, 19809, 19815, 19858, 19860, 19877, 19888, 19916, 19973, 19989, 19998, 20006, 20028, 20055, 20100, 20101, 20116, 20144, 20169, 20207, 20266, 20273, 20285, 20316, 20317, 20321, 20342, 20352, 20365, 20375, 20383, 20387, 20390, 20415, 20416, 20429, 20484, 20506, 20521, 20526, 20541, 20556, 20578, 20637, 20657, 20668, 20703, 20746, 20767, 20818, 20839, 20857, 20871, 20876, 20877, 20878, 20881, 20887, 20939, 20946, 20993, 20998, 21001, 21004, 21015, 21024, 21042, 21054, 21057, 21091, 21123, 21126, 21134, 21139, 21149, 21166, 21211, 21229, 21238, 21291, 21294, 21295, 21306, 21312, 21339, 21455, 21488, 21492, 21507, 21518, 21557, 21610, 21616, 21623, 21633, 21644, 21646, 21661, 21709, 21755, 21767, 21768, 21788, 21792, 21804, 21806, 21882, 21932, 21974, 21985, 22046, 22059, 22096, 22123, 22149, 22164, 22193, 22206, 22221, 22232, 22240, 22241, 22275, 22284, 22302, 22344, 22358, 22359, 22392, 22410, 22433, 22437, 22449, 22459, 22462, 22469, 22510, 22536, 22540, 22542, 22563, 22592, 22613, 22639, 22655, 22693, 22695, 22707, 22710, 22711, 22723, 22726, 22742, 22745, 22753, 22838, 22889, 22899, 22912, 22916, 23003, 23014, 23039, 23060, 23112, 23131, 23136, 23157, 23160, 23168, 23171, 23199, 23214, 23216, 23244, 23257, 23260, 23261, 23269, 23278, 23280, 23305, 23316, 23326, 23351, 23370, 23383, 23404, 23415, 23442, 23443, 23449, 23451, 23501, 23515, 23521, 23526, 23534, 23557, 23562, 23567, 23568, 23579, 23585, 23626, 23631, 23632, 23639, 23644, 23814, 23832, 23895, 23926, 23929, 23987, 23990, 24041, 24071, 24077, 24119, 24122, 24136, 24179, 24214, 24218, 24242, 24245, 24292, 24303, 24304, 24316, 24391, 24393, 24422, 24424, 24429, 24433, 24493, 24501, 24525, 24535, 24578, 24587, 24631, 24645, 24649, 24652, 24656, 24667, 24668, 24679, 24682, 24727, 24742, 24815, 24831, 24838, 24871, 24881, 24914, 24921, 24972, 24973, 24988, 25001, 25022, 25040, 25050, 25051, 25062, 25091, 25108, 25164, 25168, 25171, 25190, 25191, 25192, 25198, 25210, 25242, 25252, 25281, 25400, 25430, 25442, 25444, 25470, 25515, 25530, 25543, 25547, 25555, 25565, 25567, 25569, 25598, 25663, 25669, 25675, 25677, 25681, 25692, 25695, 25707, 25712, 25714, 25747, 25762, 25778, 25815, 25834, 25842, 25856, 25858, 25859, 25874, 25878, 25897, 25911, 25925, 25939, 25956, 25966, 25976, 26006, 26060, 26081, 26097, 26101, 26119, 26146, 26161, 26191, 26218, 26221, 26239, 26249, 26324, 26335, 26337, 26379, 26391, 26392, 26411, 26424, 26456, 26460, 26481, 26528, 26575, 26578, 26588, 26589, 26600, 26606, 26633, 26634, 26651, 26672, 26679, 26706, 26728, 26729, 26734, 26750, 26806, 26808, 26818, 26831, 26893, 26896, 26898, 26991, 26999, 27024, 27026, 27033, 27087, 27088, 27119, 27122, 27191, 27229, 27257, 27284, 27322, 27337, 27384, 27446, 27450, 27482, 27486, 27499, 27511, 27520, 27541, 27584, 27612, 27673, 27681, 27766, 27795, 27807, 27814, 27833, 27835, 27851, 27856, 27874, 27876, 27917, 27953, 27995, 28039, 28046, 28083, 28084, 28089, 28094, 28099, 28100, 28104, 28160, 28161, 28165, 28166, 28171, 28172, 28173, 28176, 28177, 28197, 28251, 28276, 28302, 28308, 28312, 28354, 28394, 28440, 28445, 28462, 28464, 28477, 28490, 28555, 28564, 28572, 28576, 28598, 28621, 28630, 28648, 28652, 28691, 28692, 28725, 28728, 28732, 28744, 28746, 28751, 28774, 28806, 28816, 28817, 28826, 28848, 28849, 28854, 28864, 28899, 28904, 28914, 28925, 28966, 28968, 29015, 29039, 29055, 29075, 29121, 29127, 29137, 29140, 29144, 29175, 29219, 29226, 29241, 29249, 29273, 29295, 29300, 29317, 29353, 29368, 29393, 29404, 29448, 29460, 29506, 29511, 29530, 29531, 29558, 29573, 29609, 29628, 29781, 29794, 29816, 29864, 29869, 29889, 29915, 29917, 29931, 29951, 29985, 30005, 30015, 30032, 30037, 30039, 30095, 30110, 30112, 30117, 30121, 30142, 30148, 30159, 30176, 30207, 30217, 30238, 30294, 30324, 30371, 30387, 30452, 30465, 30477, 30482, 30492, 30494, 30514, 30520, 30532, 30547, 30580, 30586, 30621, 30627, 30634, 30650, 30655, 30672, 30676, 30702, 30709, 30724, 30728, 30777, 30781, 30793, 30802, 30815, 30818, 30861, 30874, 30883, 30892, 30898, 31020, 31041, 31044, 31054, 31058, 31059, 31060, 31112, 31131, 31153, 31160, 31211, 31213, 31234, 31240, 31253, 31257, 31316, 31339, 31347, 31372, 31413, 31430, 31484, 31488, 31527, 31550, 31583, 31608, 31623, 31628, 31641, 31654, 31663, 31697, 31701, 31703, 31721, 31750, 31755, 31784, 31786, 31797, 31832, 31846, 31878, 31889, 31954, 31969, 31975, 31993, 32009, 32014, 32034, 32055, 32057, 32076, 32077, 32127, 32133, 32205, 32236, 32293, 32301, 32360, 32365, 32379, 32386, 32419, 32453, 32454, 32455, 32464, 32466, 32489, 32514, 32520, 32534, 32538, 32542, 32573, 32592, 32634, 32642, 32653, 32659, 32678, 32679, 32725, 32758, 32767, 32771, 32788, 32816, 32829, 32851, 32874, 32875, 32881, 32883, 32885, 32887, 32891, 32892, 32900, 32905, 32912, 32913, 32922, 32932, 32940, 32961, 33008, 33021, 33048, 33059, 33108, 33110, 33115, 33151, 33166, 33207, 33210, 33220, 33223, 33230, 33261, 33314, 33326, 33349, 33351, 33359, 33365, 33368, 33379, 33391, 33423, 33438, 33473, 33497, 33527, 33538, 33555, 33576, 33582, 33607, 33613, 33619, 33625, 33630, 33641, 33670, 33671, 33689, 33696, 33730, 33733, 33777, 33799, 33830, 33869, 33882, 33886, 33890, 33915, 33974, 34043, 34047, 34048, 34059, 34074, 34079, 34134, 34149, 34163, 34182, 34234, 34244, 34260, 34291, 34365, 34373, 34384, 34415, 34421, 34423, 34445, 34452, 34462, 34481, 34483, 34487, 34501, 34507, 34509, 34524, 34560, 34563, 34584, 34642, 34660, 34672, 34685, 34689, 34723, 34754, 34755, 34778, 34794, 34801, 34816, 34818, 34819, 34824, 34826, 34856, 34883, 34886, 34888, 34902, 34933, 34945, 34949, 35017, 35106, 35138, 35158, 35183, 35216, 35226, 35274, 35275, 35293, 35297, 35329, 35368, 35371, 35382, 35440, 35470, 35503, 35517, 35530, 35543, 35557, 35571, 35597, 35605, 35617, 35654, 35676, 35730, 35737, 35755, 35762, 35763, 35781, 35787, 35833, 35863, 35871, 35907, 35928, 35953, 35973, 36062, 36067, 36071, 36122, 36159, 36160, 36165, 36179, 36180, 36190, 36238, 36241, 36270, 36271, 36275, 36276, 36312, 36329, 36388, 36450, 36453, 36460, 36464, 36480, 36512, 36513, 36525, 36541, 36547, 36550, 36566, 36593, 36602, 36652, 36656, 36716, 36754, 36760, 36763, 36777, 36790, 36792, 36793, 36808, 36813, 36818, 36839, 36862, 36887, 36900, 36977, 36987, 37000, 37014, 37039, 37041, 37067, 37076, 37101, 37114, 37116, 37125, 37175, 37195, 37197, 37199, 37200, 37203, 37204, 37320, 37321, 37324, 37379, 37394, 37397, 37422, 37426, 37436, 37456, 37481, 37485, 37486, 37495, 37540, 37560, 37564, 37584, 37593, 37595, 37617, 37619, 37663, 37687, 37734, 37736, 37738, 37739, 37749, 37782, 37783, 37792, 37832, 37839, 37841, 37856, 37871, 37876, 37900, 37931, 37932, 37946, 37971, 38002, 38014, 38025, 38059, 38064, 38080, 38099, 38100, 38102, 38103, 38110, 38116, 38131, 38134, 38135, 38138, 38146, 38147, 38167, 38170, 38214, 38220, 38250, 38255, 38264, 38291, 38303, 38308, 38325, 38331, 38347, 38352, 38368, 38382, 38397, 38399, 38448, 38456, 38457, 38504, 38515, 38520, 38524, 38536, 38540, 38560, 38567, 38601, 38610, 38632, 38637, 38641, 38687, 38690, 38704, 38765, 38780, 38789, 38803, 38847, 38850, 38853, 38855, 38860, 38879, 38882, 38896, 38905, 38937, 39020, 39049, 39109, 39110, 39117, 39132, 39137, 39161, 39165, 39166, 39171, 39180, 39231, 39239, 39243, 39249, 39266, 39298, 39329, 39332, 39385, 39389, 39409, 39413, 39419, 39435, 39457, 39463, 39511, 39512, 39525, 39527, 39551, 39559, 39576, 39606, 39646, 39670, 39675, 39695, 39702, 39772, 39783, 39785, 39802, 39804, 39818, 39875, 39879, 39890, 39891, 39924, 39997, 40000, 40027, 40033, 40048, 40067, 40119, 40132, 40170, 40226, 40261, 40268, 40284, 40292, 40314, 40321, 40324, 40338, 40341, 40345, 40357, 40385, 40395, 40411, 40462, 40476, 40477, 40479, 40486, 40489, 40511, 40524, 40531, 40561, 40562, 40577, 40614, 40632, 40648, 40651, 40661, 40673, 40677, 40680, 40686, 40690, 40691, 40704, 40710, 40711, 40733, 40747, 40763, 40764, 40788, 40830, 40900, 40909, 40913, 40918, 40925, 40932, 40935, 40966, 40970, 40973, 40985, 40986, 41006, 41008, 41032, 41040, 41041, 41061, 41069, 41081, 41119, 41173, 41175, 41176, 41179, 41180, 41227, 41230, 41234, 41272, 41299, 41314, 41318, 41382, 41385, 41417, 41424, 41435, 41481, 41513, 41522, 41524, 41536, 41567, 41578, 41654, 41701, 41702, 41707, 41709, 41752, 41762, 41765, 41768, 41771, 41781, 41795, 41804, 41805, 41824, 41876, 41900, 41902, 41922, 41926, 41968, 42008, 42021, 42081, 42103, 42115, 42139, 42147, 42174, 42185, 42186, 42262, 42270, 42277, 42279, 42299, 42301, 42302, 42303, 42310, 42327, 42339, 42343, 42348, 42350, 42354, 42373, 42406, 42450, 42462, 42472, 42486, 42507, 42540, 42571, 42581, 42582, 42587, 42592, 42623, 42656, 42667, 42673, 42689, 42718, 42723, 42772, 42781, 42800, 42805, 42835, 42838, 42872, 42963, 42964, 42966, 42977, 43010, 43039, 43040, 43043, 43053, 43080, 43122, 43126, 43148, 43156, 43224, 43228, 43236, 43237, 43260, 43292, 43314, 43394, 43434, 43446, 43451, 43465, 43477, 43481, 43492, 43523, 43531, 43571, 43612, 43615, 43640, 43656, 43725, 43737, 43751, 43769, 43803, 43810, 43819, 43881, 43885, 43902, 43903, 43911, 43941, 43946, 43952, 49354, 49374, 49390, 49498, 49518, 49520, 49532, 49547, 49559, 49588, 49594, 49595, 49606, 49619, 49622, 49625, 49646, 49649, 49662, 49675, 49680, 49687, 49691, 49695, 49712, 49720, 49728, 49737, 49738, 49747, 49760, 49772, 49779, 49780, 49788, 49832, 49850, 49874, 49894, 49904, 49955, 49969, 49971, 및 49974 중 어느 하나와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 최대 약 500개, 최대 약 450개, 최대 약 400개, 최대 약 350개, 최대 약 300개, 최대 약 250개, 최대 약 200개, 최대 약 190개, 최대 약 180개, 최대 약 170개, 최대 약 160개, 최대 약 150개, 최대 약 140개, 최대 약 130개, 최대 약 120개, 최대 약 110개, 최대 약 100개, 최대 약 90개, 최대 약 85개, 최대 약 80개, 최대 약 75개, 최대 약 70개, 최대 약 65개, 최대 약 60개, 최대 약 55개, 최대 약 50개, 최대 약 45개, 최대 약 40개, 최대 약 35개, 최대 약 30개, 최대 약 25개, 또는 최대 약 20개의 아미노산 길이인 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 적어도 약 10개, 적어도 약 20개, 적어도 약 30개, 적어도 약 40개, 적어도 약 50개, 적어도 약 55개, 적어도 약 60개, 적어도 약 65개, 적어도 약 70개, 적어도 약 75개, 적어도 약 80개, 또는 적어도 약 85개의 아미노산 길이인 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 이종성 유전자 이펙터는 약 20-500개, 약 20-400개, 약 20-300개, 약 20-250개, 약 20-200개, 약 20-150개, 약 20-125개, 약 20-100개, 약 20-75개, 약 20-50개, 50-500개, 약 50-400개, 약 50-300개, 약 50-250개, 약 50-200개, 약 50-150개, 약 50-125개, 약 50-100개, 약 50-75개, 약 80-500개, 약 80-400개, 약 80-300개, 약 80-250개, 약 80-200개, 약 80-150개, 약 80-125개, 약 80-100개, 또는 약 80-90개의 아미노산 길이인 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 구성된다. 일부 실시양태에서, 이종성 유전자 이펙터는 길이가 약 85개 아미노산인 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
두 서열 사이의 서열 동일성 정도는 예를 들어 전역 또는 국소 정렬 알고리즘과 같이 이 목적을 위해 일반적으로 사용되는 컴퓨터 프로그램을 사용하여 두 서열을 비교함으로써 결정될 수 있다. 비제한적인 예에는 BLASTp, BLASTn, Clustal W, MAFFT, Clustal Omega, AlignMe, Praline, GAP, BESTFIT, 또는 다른 적합한 방법 또는 알고리즘이 포함된다. Needleman 및 Wunsch 전역 정렬 알고리즘을 사용하면 두 시퀀스를 전체 길이에 걸쳐 정렬하여, 일치 항목 수를 최대화하고 간격 수를 최소화할 수 있다. 기본 설정을 사용할 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 2개 이상의 서열, 예를 들어 서열번호: 16-49333 및 49353-50052 중 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상을 포함한다. 일부 실시양태에서, 2개 이상의 서열은 동일한 DNA 서열로부터 유래하거나 이에 의해 코딩되며, 예를 들어 추정 또는 예측되는 정지 코돈 전후와 같이 동일한 공급원 유전자 또는 게놈으로부터의 인접한 뉴클레오티드 스트레치에 의해 코딩된다. 일부 실시양태에서, 2개 이상의 서열은 상이한 DNA 서열, 예를 들어 상이한 유전자로부터 유래되거나 이에 의해 코딩된다.
일부 실시양태에서, 이종성 유전자 이펙터는 이전에 확인된 염색질 조절인자가 아니거나 이로부터의 서열을 함유하지 않는다. 일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 바와 같은 가이드 모이어티를 사용하여 유전자의 발현을 조절하기 위해 이전에 표적화되었던 염색질 조절인자가 아니거나 이로부터의 서열을 함유하지 않는다. 일부 실시양태에서, 이종성 유전자 이펙터는 P300, TET1, TET2, TET3 및/또는 HSF1이 아니거나, P300, TET1, TET2, TET3 및/또는 HSF1로부터의 서열을 함유하지 않는다.
일부 실시양태에서, 이종성 유전자 이펙터는 이전에 확인된 전사 활성화제가 아니거나 이로부터의 서열을 함유하지 않는다. 일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 바와 같은 가이드 모이어티를 사용하여 유전자의 발현을 조절하도록 이전에 표적화되었던 전사 활성화제가 아니거나 이로부터의 서열을 함유하지 않는다. 일부 실시양태에서, 이종성 유전자 이펙터는 VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR(Vp64+p65+Rta)의 서열이 아니거나, 이로부터의 서열을 포함하지 않는다.
일부 실시양태에서, 이종성 유전자 이펙터는 이전에 확인된 전사 억제인자가 아니거나, 이로부터의 서열을 함유하지 않는다. 일부 실시양태에서, 이종성 유전자 이펙터는 본원에 개시된 바와 같은 가이드 모이어티를 사용하여 유전자의 발현을 조절하도록 이전에 표적화되었던 전사 억제인자가 아니거나 이로부터의 서열을 함유하지 않는다. 일부 실시양태에서, 이종성 유전자 이펙터는 KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노산 서열, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A의 서열이 아니거나, 이로부터의 서열을 포함하지 않는다.
이종성 유전자 이펙터는 문헌 및 데이터베이스 소스로부터 도출될 수 있으며 다양한 단백질 계열을 포함하도록 표적화될 수 있다.
바이러스성 이종성 유전자 이펙터
일부 실시양태에서, 바이러스 공급원으로부터의 이종성 유전자 이펙터, 예를 들어 바이러스성 유전자 이펙터를 활용하는 조성물 및 방법이 본원에 개시된다.
수백 종의 바이러스가 인간을 감염시킨다. 유전자 이펙터 도메인은 바이러스 게놈에 의해 코딩되어 숙주 및/또는 바이러스 유전자의 발현을 조절할 수 있다. 20종의 바이러스 계열로부터의 바이러스 전사 조절인자의 조사에서 419개의 전사 조절인자가 확인되었으며, 그 중 171개가 DNA-결합이었다(Liu, Xing, et al. "인간 바이러스 전사 조절인자" Cell 182.1 (2020): 24-37). 또한, 존재하는 것으로 추정되는 대다수의 바이러스 입자는 특성화되지 않았지만, 본 개시내용의 조성물 및 방법에 통합될 때 유용할 수 있는 이종성 유전자 이펙터를 보유할 수 있다. 예를 들어, 바이러스 공급원으로부터의 이러한 바이러스성 이종성 유전자 이펙터는 새로운 이펙터 활성, 게놈 조직 제어, 및/또는 핵산 패키징 기능을 포함할 수 있다. 그럼에도 불구하고 인간 친화성이 결여된 바이러스는 본 개시내용의 조성물 및 방법에 사용될 때(예를 들어, 본원에 개시된 조작된 복합체에 사용될 때) 바람직한 활성을 생성할 수 있다. 역학 연구에서는 박쥐와 같은 주요 바이러스 저장고의 풍부한 진화 과정에서 나타나는 인간-향성 활성이 확인된 인수공통감염성 바이러스 종을 확인하였으며, 이는 인간 친화성이 결여된 바이러스에서도 유전자 이펙터 활성이 존재할 수 있다는 생각을 뒷받침한다. 따라서, 일부 실시양태에서, 본 개시내용은 메타게놈 조사로부터 수집된 서열 데이터를 포함한다.
바이러스성 이종성 유전자 이펙터의 전사 조절 활성은 예를 들어 염색질 리모델링, RNA 폴리머라제 동원(예를 들어, RNA Pol II), 전사 모방, 전사 신장, DNA 복제, 바이러스 전사, 핵산 수송, 또는 이들의 조합을 포함하거나 영향을 줄 수 있다. 바이러스성 이종성 유전자 이펙터의 전사 조절 활성은 예를 들어, 핵산(예: E2, ICP4, Zta, IRF)에 대한 직접적인 결합, 핵산(예: EBNA2, E1A)에 대한 간접적 결합, 전사 기구 또는 이의 성분의 조절(예를 들어, Tat, E1A, IE2), 염색질의 변형(예를 들어, E1A, Hbx, Tat), 또는 이들의 조합을 포함할 수 있다.
인간 전사 조절인자와 비교하여, 바이러스성 전사 조절인자는 DNA 결합 도메인의 서열 보존이 거의 없고, 돌연변이율이 높으며, 구조적으로 구획이 불량하다(<12%). 별개의 바이러스성 전사 조절인자를 정의하려면 종의 동원체 상동성에 의존해야 할 수 있으며, 제한된 DNA 모티프 지식은 바이러스성 전사 조절인자 결합 표적을 정의하려면 실험 데이터(ChIP, EMSA, DNase 지문 등)가 필요하다는 것을 의미할 수 있다.
일부 실시양태에서, 후보 바이러스성 이종성 유전자 이펙터의 목록은 활성화 대 억제, 표적 세포 경로, 진화적 서열 제약, DNA/RNA/둘 모두의 결합, 단백질 폴딩 패턴, 숙주/세포 친화성, 직접/간접 활성, 결합 난잡함, 핵/세포질 활동, 및 기타 기준과 같은 요인에 의해 계층화될 수 있다. 일부 실시양태에서, 이러한 계층화는 잠재적인 분자 기능의 광범위한 스펙트럼을 포함하는 본 개시내용의 스크린 라이브러리의 설계를 허용함으로써, 신규 이펙터 발견 가능성을 증가시킨다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 검증된 인간 바이러스 전사 조절인자로부터의 후보 이종성 유전자 이펙터를 활용한다. 이러한 전사 조절인자는 예를 들어 ChIP/ChIP-seq, EMSA, SELEX, 리포터 분석, 결합 분석, 또는 결정 구조에 의해 검증될 수 있다. 검증된 인간 바이러스 전사 조절인자를 가질 수 있는 바이러스 계열의 비제한적 예에는 아데노바이러스과, 아레나바이러스과, 보르나바이러스과, 코로나바이러스과, 필로바이러스과, 플라비바이러스과, 헤파드나바이러스과, 헤르페스바이러스과, 오르토믹소바이러스과, 파필로마바이러스과, 파라믹소바이러스과, 파르보바이러스과, 페리분야바이러스과, 페누이바이러스과, 뉴모바이러스과, 폴리오마바이러스과, 폭스바이러스과, 레트로바이러스과, 및 랍도바이러스과가 포함된다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 인간에게 인수공통감염이 가능한 것으로 밝혀진 바이러스 또는 바이러스 계열로부터의 후보 이종성 유전자 이펙터를 활용한다. 상기 바이러스는 예를 들어 포유동물, 조류, 돼지, 인간이 아닌 영장류, 설치류, 유제류, 파충류, 또는 양서류를 감염시킬 수 있다. 인간에게 인수공통감염이 가능한 것으로 밝혀진 바이러스 계열의 비제한적 예에는 플라비바이러스과, 라이사바이러스과, 필로바이러스과, 파라믹소바이러스과, 오르토믹소바이러스과, 코로나바이러스과, 레오바이러스과, 토가바이러스과, 페뉴바이러스과, 한타바이러스과, 분야바이러스과, 및 랍도바이러스과가 포함된다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 인간 및 박쥐를 감염시킬 수 있는 바이러스 또는 바이러스 계열로부터의 후보 이종성 유전자 이펙터를 활용한다. 일부 실시양태에서, 인간 및 박쥐를 감염시킬 수 있는 바이러스 또는 바이러스 계열로부터의 후보 이종성 유전자 이펙터에 대한 서열 데이터는 dBatVir와 같은 데이터베이스로부터 획득된다. 인간과 박쥐를 감염시킬 수 있는 바이러스 계열의 비제한적인 예로는 플라비바이러스과, 라이사바이러스과, 필로바이러스과, 파라믹소바이러스과, 오르토믹소바이러스과, 코로나바이러스과, 레오바이러스과, 토가바이러스과, 페뉴바이러스과, 한타바이러스과, 분야바이러스과, 및 랍도바이러스과가 포함된다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 메타게놈 바이러스 서열로부터의 후보 이종성 유전자 이펙터를 활용한다. 바이러스성 메타게놈 데이터 소스의 비제한적인 예로는 인간 장 바이러스체, 극한 환경(예, 고세균-향성 바이러스(예: 술포로부스) 등을 포함하여 최적의 이펙터 품질을 위해 강화될 수 있는 고온 및/또는 고산성 생태계), 해양, 지열 분출공, 비-인간 종을 감염시키는 바이러스 및/또는 인간에게 인수공통감염을 보이는 바이러스 계열에 속하는 바이러스, 및 공공 데이터베이스의 구조적 데이터(예: X선, NMR)를 활용하는 소스가 포함된다. 일부 실시양태에서, 본 개시내용의 조성물 및 방법은 고세균, 박테리아, 시아노박테리아, 조류, 식물 등을 감염시키는 바이러스로부터의 후보 이종성 유전자 이펙터를 활용한다. 메타게놈 소스로부터 얻은 서열 데이터를 갖는 바이러스 종의 비제한적 예에는 술포로부스(sulfolobus), 시포바이러스과(Siphoviridae), 포도바이러스과, 미오바이러스과(myoviridae), 미미바이러스과(Mimiviridae), 니마바이러스과(Nimaviridae), 리가멘바이러스목(Ligamenvirales), 글로불로바리어스과(Globuloviridae), 푸셀로바이러스과(Fuselloviridae), 비카우다바이러스과(Bicaudaviridae), 위성 바이러스, 이리도바이러스과(Iridoviridae), 투리바이러스과(Turriviridae), 카우도바이러스목(Caudovirales), 및 피코드나바이러스과(Phycodnaviridae)가 포함된다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 아비소바이러스과(Abyssoviridae), 아커만바이러스과(Ackermannviridae), 아데노바이러스과, 아딘토바이러스과(Adintoviridae), 알리우스바이러스과(Aliusviridae), 알로헤르페스바이러스과(Alloherpesviridae), 알파플렉시바이러스과(Alphaflexiviridae), 알파새털라이티다에(Alphasatellitidae), 알파테트라바이러스과(Alphatetraviridae), 알베르나바이러스과(Alvernaviridae), 아말가바이러스과(Amalgaviridae), 암눈바이러스과(Amnoonviridae), 암풀라바이러스과(Ampullaviridae), 아넬로바이러스과(Anelloviridae), 아레나바이러스과(Arenaviridae), 아르테리바이러스과(Arteriviridae), 아르토바이러스과(Artoviridae), 아스코바이러스과(Ascoviridae), 아스파르바이러스과(Asfarviridae), 아스피바이러스과(Aspiviridae), 아스트로바이러스과(Astroviridae), 아트킨스바이러스과(Atkinsviridae), 오토그라피바이러스과(Autographiviridae), 아브순비로이다에(Avsunviroidae), 바실라드나바이러스과(Bacilladnaviridae), 바쿨로바이러스과(Baculoviridae), 바르나바이러스과(Barnaviridae), 벨파오바이러스과(Belpaoviridae), 베니바이러스과(Benyviridae), 베타플렉시바이러스과(Betaflexiviridae), 비카우다바이러스과(Bicaudaviridae), 비드나바이러스과(Bidnaviridae), 비르나바이러스과(Birnaviridae), 블루메바이러스과(Blumeviridae), 보르나바이러스과(Bornaviridae), 보토우르미아바이러스과(Botourmiaviridae), 브로모바이러스과(Bromoviridae), 칼리시바이러스과(Caliciviridae), 카르모테트라바이러스과(Carmotetraviridae), 카울리모바이러스과(Caulimoviridae), 체이스바이러스과(Chaseviridae), 크리소바이러스과(Chrysoviridae), 추바이러스과(Chuviridae), 씨르코바이러스과(Circoviridae), 클라바바이러스과(Clavaviridae), 클로스테로바이러스과(Closteroviridae), 코로나바이러스과, 코르티코바이러스과(Corticoviridae), 크레메가바이러스과(Cremegaviridae), 크레푸스쿠바이러스과(Crepuscuviridae), 크룰리바이러스과(Cruliviridae), 쿠르불라바이러스과(Curvulaviridae), 씨스토바이러스과(Cystoviridae), 델타플렉시바이러스과(Deltaflexiviridae), 데메렉바이러스과(Demerecviridae), 디시스트로바이러스과(Dicistroviridae), 드렉슬러바이러스과(Drexlerviridae), 두인바이러스과(Duinviridae), 엔도르나바이러스과(Endornaviridae), 유로니바이러스과(Euroniviridae), 피에르스바이러스과(Fiersviridae), 필로바이러스과, 피모바이러스과(Fimoviridae), 핀레이크바이러스과(Finnlakeviridae), 플라비바이러스과(Flaviviridae), 푸셀로바이러스과(Fuselloviridae), 감마플렉시바이러스과(Gammaflexiviridae), 제미니바이러스과(Geminiviridae), 제노모바이러스과(Genomoviridae), 글로불로바이러스과(Globuloviridae), 그레스나바이러스과(Gresnaviridae), 구엘린바이러스과(Guelinviridae), 구타바이러스과(Guttaviridae), 할스피바이러스과(Halspiviridae), 한타바이러스과, 헤파드나바이러스과(Hepadnaviridae), 헤페바이러스과(Hepeviridae), 헤렐레바이러스과(Herelleviridae), 헤르페스바이러스과, 하이포바이러스과(Hypoviridae), 하이트로사바이러스과(Hytrosaviridae), 이플라바이러스과(Iflaviridae), 이노바이러스과(Inoviridae), 이리도바이러스과(Iridoviridae), 키타바이러스과(Kitaviridae), 콜미오바이러스과(Kolmioviridae), 라비다바이러스과(Lavidaviridae), 레이쉬부바이러스과(Leishbuviridae), 리포트릭스바이러스과(Lipothrixviridae), 리스피바이러스과(Lispiviridae), 말라코헤르페스바이러스과(Malacoherpesviridae), 마르나바이러스과(Marnaviridae), 마르세일레바이러스과(Marseilleviridae), 마토나바이러스과(Matonaviridae), 마쓰시타바이러스과(Matshushitaviridae), 마요바이러스과(Mayoviridae), 메디오니바이러스과(Medioniviridae), 메가비르나바이러스과(Megabirnaviridae), 메소니바이러스과(Mesoniviridae), 메타바이러스과(Metaviridae), 메탁시바이러스과(Metaxyviridae), 마이크로바이러스과(Microviridae), 미미바이러스과, 미토바이러스과(Mitoviridae), 모노니바이러스과(Mononiviridae), 미모나바이러스과(Mymonaviridae), 미오바이러스과(Myoviridae), 미포바이러스과(Mypoviridae), 미리아바이러스과(Myriaviridae), 나이로바이러스과(Nairoviridae), 낭고샤바이러스과(Nanghoshaviridae), 난하이포바이러스과(Nanhypoviridae), 나노바이러스과(Nanoviridae), 나르나바이러스과(Narnaviridae), 나타레바이러스과(Natareviridae), 니마바이러스과(Nimaviridae), 노다바이러스과(Nodaviridae), 누디바이러스과(Nudiviridae), 니아미바이러스과(Nyamiviridae), 올리포바이러스과(Olifoviridae), 오르토믹소바이러스과(Orthomyxoviridae), 오발리바이러스과(Ovaliviridae), 파필로마바이러스과(Papillomaviridae), 파라믹소바이러스과, 파르티티바이러스과(Partitiviridae), 파르보바이러스과, 파울리노바이러스과(Paulinoviridae), 페리분야바이러스과(Peribunyaviridae), 페르무토테트라바이러스과(Permutotetraviridae), 파스마바이러스과(Phasmaviridae), 페누이바이러스과(Phenuiviridae), 피코드나바이러스과(Phycodnaviridae), 피코비르나바이러스과(Picobirnaviridae), 피코르나바이러스과(Picornaviridae), 플라스마바이러스과(Plasmaviridae), 플렉트로바이러스과(Plectroviridae), 플레오리포바이러스과(Pleolipoviridae), 뉴모바이러스과(Pneumoviridae), 포도바이러스과, 폴리시피바이러스과(Polycipiviridae), 폴리드나바이러스과(Polydnaviridae), 폴리미코바이러스과(Polymycoviridae), 폴리오마바이러스과(Polyomaviridae), 포르토글로보바이러스과(Portogloboviridae), 포스피바이러스과(Pospiviroidae), 포티바이러스과(Potyviridae), 폭스바이러스과, 슈도바이러스과(Pseudoviridae), 퀸바이러스과(Qinviridae), 콰드리바이러스과(Quadriviridae), 레돈도바이러스과(Redondoviridae), 레오바이러스과(Reoviridae), 레트로바이러스과(Retroviridae), 랍도바이러스과(Rhabdoviridae), 로니바이러스과(Roniviridae), 라운트리바이러스과(Rountreeviridae), 루디바이러스과(Rudiviridae), 살라스마바이러스과(Salasmaviridae), 사르트로바이러스과(Sarthroviridae), 쉬토바이러스과(Schitoviridae), 세코바이러스과(Secoviridae), 시물로바이러스과(Simuloviridae), 신할리바이러스과(Sinhaliviridae), 시포바이러스과(Siphoviridae), 스마코바이러스과(Smacoviridae), 솔레모바이러스과(Solemoviridae), 솔린비바이러스과(Solinviviridae), 솔스피바이러스과(Solspiviridae), 스패롤리포바이러스과(Sphaerolipoviridae), 스피라바이러스과(Spiraviridae), 스테이츠바이러스과(Steitzviridae), 순바이러스과(Sunviridae), 텍티바이러스과(Tectiviridae), 타스피바이러스과(Thaspiviridae), 토바니바이러스과(Tobaniviridae), 토가바이러스과(Togaviridae), 톨레쿠사텔리티다에(Tolecusatellitidae), 톰부스바이러스과(Tombusviridae), 토스포바이러스과(Tospoviridae), 토티바이러스과(Totiviridae), 트리스트로마바이러스과(Tristromaviridae), 투리바이러스과, 티모바이러스과(Tymoviridae), 비르가바이러스과(Virgaviridae), 우페데바이러스과(Wupedeviridae), 크신모바이러스과(Xinmoviridae), 유에바이러스과(Yueviridae), 조벨바이러스과(Zobellviridae) 계열, 또는 이의 임의의 조합으로부터의 하나 이상의 바이러스로부터의 후보 이종성 유전자 이펙터를 활용한다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 악탄타바이러스아과(Actantavirinae), 아간타바이러스아과(Agantavirinae), 아글림바이러스아과(Aglimvirinae), 알파헤르페스바이러스아과, 알파이리도바이러스아과(Alphairidovirinae), 알파랍도바이러스아과(Alpharhabdovirinae), 아르콰트로바이러스아과(Arquatrovirinae), 아불라바이러스아과(Avulavirinae), 아제레도바이러스아과(Azeredovirinae), 바스틸레바이러스아과(Bastillevirinae), 비클라스바이러스아과(Bclasvirinae), 비프바이러스아과(Beephvirinae), 베이제링크바이러스아과(Beijerinckvirinae), 베타헤르페스바이러스아과(Betaherpesvirinae), 베타이리도바이러스아과(Betairidovirinae), 베타랍도바이러스아과(Betarhabdovirinae), 브라운바이러스아과(Braunvirinae), 브록바이러스아과(Brockvirinae), 브론펜브렌바이러스아과(Bronfenbrennervirinae), 불라바이러스아과(Bullavirinae), 칼부스바이러스아과(Calvusvirinae), 세로니바이러스아과(Ceronivirinae), 체브루바이러스아과(Chebruvirinae), 치마니바이러스아과(Chimanivirinae), 초르도폭스바이러스아과(Chordopoxvirinae), 클레오파트라바이러스아과(Cleopatravirinae), 코바바이러스아과(Cobavirinae), 콜웰바이러스아과(Colwellvirinae), 코모바이러스아과(Comovirinae), 코르크바이러스아과(Corkvirinae), 크로카르테리바이러스아과(Crocarterivirinae), 크루스토니바이러스아과(Crustonivirinae), 씨비바이러스아과(Cvivirinae), 디클라스바이러스아과(Dclasvirinae), 데자이바이러스아과(Deejayvirinae), 데니스왓슨바이러스아과(Denniswatsonvirinae), 덴소바이러스아과(Densovirinae), 돌리코세팔로바이러스아과(Dolichocephalovirinae), 에카이바이러스아과(Eekayvirinae), 엠머리치바이러스아과(Emmerichvirinae), 엔콰트로바이러스아과(Enquatrovirinae), 엔토모폭스바이러스아과(Entomopoxvirinae), 이콰르테리바이러스아과(Equarterivirinae), 에르몰리에바바이러스아과(Ermolyevavirinae), 에르스키네바이러스아과(Erskinevirinae), 유캄피바이러스아과(Eucampyvirinae), 퍼스트파필로마바이러스아과(Firstpapillomavirinae), 푸르만바이러스아과(Fuhrmanvirinae), 감마헤르페스바이러스아과(Gammaherpesvirinae), 감마랍도바이러스아과(Gammarhabdovirinae), 제미니알파새털라이티나에아과(Geminialphasatellitinae), 고크나우어바이러스아과(Gochnauervirinae), 고포사바이러스아과(Gofosavirinae), 고쿠쇼바이러스아과(Gokushovirinae), 고르곤바이러스아과(Gorgonvirinae), 구언세이바이러스아과(Guernseyvirinae), 구트만바이러스아과(Gutmannvirinae), 하마파르보바이러스아과(Hamaparvovirinae), 헨드릭스바이러스아과(Hendrixvirinae), 헤로아르테리바이러스아과(Heroarterivirinae), 헥사포니바이러스아과(Hexponivirinae), 험프리스바이러스아과(Humphriesvirinae), 하이포람사바이러스아과(Hyporhamsavirinae), 자신카바이러스아과(Jasinkavirinae), 크릴로바이러스아과(Krylovirinae), 랑글레이할바이러스아과(Langleyhallvirinae), 레토바이러스아과(Letovirinae), 맘만타바이러스아과(Mammantavirinae), 마르카담스바이러스아과(Markadamsvirinae), 맥클레스키바이러스아과(Mccleskeyvirinae), 맥코르콰달레바이러스아과(Mccorquodalevirinae), 엠클라스바이러스아과(Mclasvirinae), 메디오니바이러스아과(Medionivirinae), 멜니크바이러스아과(Melnykvirinae), 메타파라믹소바이러스아과(Metaparamyxovirinae), 미굴라바이러스아과(Migulavirinae), 몰리뉵스바이러스아과(Molineuxvirinae), 모노니바이러스아과(Mononivirinae), 나노알파새털라이티나에(Nanoalphasatellitinae), 엔클라스바이러스아과(Nclasvirinae), 네페르티바이러스아과(Nefertitivirinae), 노르트로프바이러스아과(Northropvirinae), 님박스테르바이러스아과(Nymbaxtervirinae), 오카베바이러스아과(Okabevirinae), 오카니바이러스아과(Okanivirinae), 오르토코로나바이러스아과(Orthocoronavirinae), 오르토파라믹소바이러스아과(Orthoparamyxovirinae), 오르토레트로바이러스아과(Orthoretrovirinae), 오우나바이러스아과(Ounavirinae), 파르보바이러스아과, 피클라스바이러스아과(Pclasvirinae), 페두오바이러스아과(Peduovirinae), 페트로모알파새털라이티나에(Petromoalphasatellitinae), 피코바이러스아과, 피스카니바이러스아과(Piscanivirinae), 폰토스바이러스아과(Pontosvirinae), 프로세도바이러스아과(Procedovirinae), 쿠에우오바이러스아과(Queuovirinae), 퀸바이러스아과, 라키에텐바이러스아과(Rakietenvirinae), 레그레소바이러스아과(Regressovirinae), 레모토바이러스아과(Remotovirinae), 레판타바이러스아과(Repantavirinae), 리터니바이러스아과(Reternivirinae), 로도바이러스아과(Rhodovirinae), 로데포바이러스아과(Rodepovirinae), 로구나바이러스아과(Rogunavirinae), 로트만데네스바이러스아과(Rothmandenesvirinae), 루불라바이러스아과(Rubulavirinae), 사를레스바이러스아과(Sarlesvirinae), 세컨드파필로마바이러스아과(Secondpapillomavirinae), 세도레오바이러스아과(Sedoreovirinae), 세프바이러스아과(Sepvirinae), 세르펜토바이러스아과(Serpentovirinae), 시마르테리바이러스아과(Simarterivirinae), 스크리아빈바이러스아과(Skryabinvirinae), 슬로페크바이러스아과(Slopekvirinae), 스피나레오바이러스아과(Spinareovirinae), 스포우나바이러스아과(Spounavirinae), 스푸마레트로바이러스아과(Spumaretrovirinae), 스투디에르바이러스아과(Studiervirinae), 타타르스탄바이러스아과(Tatarstanvirinae), 템페바이러스아과(Tempevirinae), 테벤바이러스아과(Tevenvirinae), 티아마트바이러스아과(Tiamatvirinae), 토로바이러스아과(Torovirinae), 트라비바이러스아과(Trabyvirinae), 트리바이러스아과(Trivirinae), 투나바이러스아과(Tunavirinae), 투니카니바이러스아과(Tunicanivirinae), 트와로그바이러스아과(Twarogvirinae), 트워르트바이러스아과(Twortvirinae), 타이벡바이러스아과(Tybeckvirinae), 바리아르테리바이러스아과(Variarterivirinae), 베퀸타바이러스아과(Vequintavirinae), 질라르테리바이러스아과(Zealarterivirinae) 하위계열, 또는 이의 임의의 조합으로부터의 하나 이상의 바이러스로부터의 후보 이종성 유전자 이펙터를 활용한다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 예를 들어 폭스바이러스과, 헤르페스바이러스과, 또는 아데노바이러스과 계열과 같은, 높은 수준의 문서화된 전사 조절인자 모듈성을 갖는 바이러스로부터의 후보 이종성 유전자 이펙터를 활용한다. 일부 실시양태에서, 높은 수준의 문서화된 전사 조절인자 모듈성을 갖는 바이러스로부터의 이종성 유전자 이펙터는 다른 유전자 이펙터와 조합할 때 유용할 수 있으며, 예를 들어, 유전자 전사에 대한 조합 또는 상승적 효과를 촉진할 가능성이 더 높을 수 있다.
임의의 특정 이론에 얽매이기를 바라지 않고, 바이러스성 이펙터는 대안적 소스로부터의 유전자 이펙터에 비해 컴팩트한 크기 및 신규한 기능적 특성의 이점을 제공할 수 있다.
가이드 모이어티
본 개시내용의 조성물 및 방법은 이종성 유전자 이펙터를 표적 유전자(예를 들어, 표적 내인성 유전자) 또는 표적 유전자 조절 서열로 지시하기 위해 가이드 모이어티를 활용할 수 있다. 가이드 모이어티는 표적 유전자 또는 표적 유전자 조절 서열을 인식하고 이에 특이적으로 결합하는 능력을 부여할 수 있다.
가이드 모이어티는 가이드 핵산을 포함할 수 있다. 가이드 모이어티는 본원에 개시된 바와 같은 뉴클레아제 및 가이드 핵산을 포함할 수 있다. 가이드 모이어티는 뉴클레아제 또는 이의 일부, 예를 들어 이종성 엔도뉴클레아제와 같은 엔도뉴클레아제를 포함할 수 있다. 뉴클레아제는 예를 들어 DNA 뉴클레아제 및/또는 RNA 뉴클레아제, 야생형 뉴클레아제와 비교하여 뉴클레아제가 결핍되거나 감소된 뉴클레아제 활성을 갖는 변형된 뉴클레아제, 이의 유도체, 이의 변이체, 또는 이의 단편일 수 있다. 일부 실시양태에서, 가이드 모이어티는 최소의 뉴클레아제 활성을 갖는다.
임의의 적합한 뉴클레아제, 이의 단편 또는 유도체가 가이드 모이어티에 사용될 수 있다. 적합한 뉴클레아제에는 I형 CRISPR 관련(Cas) 폴리펩티드, II형 CRISPR 관련(Cas) 폴리펩티드, III형 CRISPR 관련(Cas) 폴리펩티드, IV형 CRISPR 관련(Cas) 폴리펩티드, V형 CRISPR 관련(Cas) 폴리펩티드, 및 VI형 CRISPR 관련(Cas) 폴리펩티드를 포함한 CRISPR 관련(Cas) 단백질 또는 Cas 뉴클레아제; 아연 핑거 뉴클레아제(ZFN); 전사 활성화제 유사 이펙터 뉴클레아제(TALEN); 메가뉴클레아제; RNA 결합 단백질(RBP); CRISPR 관련 RNA 결합 단백질; 재조합효소; 플립파제; 트랜스포사제; Argonaute(Ago) 단백질(예를 들어, 원핵생물 Argonaute(pAgo), 고세균 Argonaute(aAgo), 및 진핵생물 Argonaute(eAgo)); 이의 임의의 유도체; 이의 임의의 변이체 및 임의의 단편이 포함되지만 이에 제한되지는 않는다.
일부 실시양태에서, 가이드 모이어티는 뉴클레아제가 결핍된 조작된(예를 들어, 프로그래밍 가능하거나 표적화 가능한) DNA 뉴클레아제와 같은 DNA 뉴클레아제를 포함한다. 일부 실시양태에서, 가이드 모이어티는 본 개시내용의 하나 이상의 이종성 유전자 이펙터와 복합체로 존재하지 않는 한 표적 DNA 서열의 전사 활성화 또는 억제를 유도하지 않는 DNA 뉴클레아제로부터 유래된 뉴클레아제-무효 DNA 결합 단백질을 포함한다. 일부 실시양태에서, 가이드 모이어티는 표적 DNA 서열의 전사 활성화 또는 억제를 유도할 수 있는(예를 들어, 본 개시내용의 이종성 유전자 이펙터의 존재에 의해 변경되거나 증강될 수 있는) DNA 뉴클레아제로부터 유래된 뉴클레아제-무효 DNA 결합 단백질을 포함한다.
일부 실시양태에서, 가이드 모이어티는 조작된(예를 들어, 프로그래밍 가능하거나 표적화 가능한) RNA 뉴클레아제와 같은 RNA 뉴클레아제를 포함한다. 일부 실시양태에서, 가이드 모이어티는 본 개시내용의 하나 이상의 이종성 유전자 이펙터와 복합체로 존재하지 않는 한 표적 RNA 서열의 전사 활성화 또는 억제를 유도하지 않는 RNA 뉴클레아제로부터 유래된 뉴클레아제-무효 RNA 결합 단백질을 포함한다. 일부 실시양태에서, 가이드 모이어티는 표적 RNA 서열의 전사 활성화 또는 억제를 유도할 수 있는(예를 들어, 본 개시내용의 이종성 유전자 이펙터의 존재에 의해 변경되거나 증강될 수 있는) RNA 뉴클레아제로부터 유래된 뉴클레아제-무효 RNA 결합 단백질을 포함한다.
일부 실시양태에서, 가이드 모이어티는 핵산-가이드된 표적화 시스템을 포함한다. 일부 실시양태에서, 가이드 모이어티는 DNA-가이드된 표적화 시스템을 포함한다. 일부 실시양태에서, 가이드 모이어티는 RNA-가이드된 표적화 시스템을 포함한다. 가이드 모이어티는 예를 들어, CRISPR-Cas 시스템(예를 들어 dCas9와 같은 이의 뉴클레아제 결핍 형태)의 표적 유전자(예를 들어 표적 내인성 유전자) 또는 표적 유전자 조절 서열에 대한 특이적 결합을 촉진하는 가이드 핵산 서열을 포함하고 활용할 수 있다. 결합 특이성은 단일 가이드 RNA(sgRNA) 또는 이의 일부와 같은 가이드 핵산을 사용하여 결정될 수 있다. 일부 실시양태에서, 상이한 sgRNA의 사용은 본 개시내용의 조성물 및 방법이 상이한 표적 유전자(예를 들어, 표적 내인성 유전자) 또는 표적 유전자 조절 서열과 함께 사용되는(예를 들어, 표적화되는) 것을 허용한다.
원핵생물 CRISPR-Cas(클러스터형 규칙적으로 간격을 둔 짧은 회문식 반복부 - CRISPR 관련) 시스템, 예를 들어 Cas9 및 Cpfl과 같은 클래스 II CRISPR-Cas 시스템은 유전자 발현 조절, 후성유전체 편집, 및 본 개시내용의 조성물 및 방법에서의 염색질 루핑의 조절용 도구로서 용도에 맞게 만들어질 수 있다. 이종성 유전자 이펙터와 복합된 뉴클레아제 불활성화된 Cas(dCas) 단백질은 dCas에 의해 결합된 부위에 인접한 표적 유전자(예: 표적 내인성 유전자)의 발현 조절을 허용할 수 있다.
일부 실시양태에서, 가이드 모이어티는 비천연 발생 CRISPR(클러스터형 규칙적으로 간격을 둔 짧은 회문식 반복부)/Cas(CRISPR 관련) 시스템에서 기능하는 CRISPR 관련(Cas) 단백질 또는 Cas 뉴클레아제를 포함한다. 박테리아에서, 이 시스템은 외부 DNA에 대한 적응 면역을 제공할 수 있다.
다양한 포유류, 동물, 식물, 미생물, 및 효모를 포함한 다양한 유기체에서, CRISPR/Cas 시스템(예: 변형 및/또는 비변형)이 게놈 조작 도구로 활용될 수 있거나, 본원에 개시된 바와 같이 조작된 단백질의 표적 유전자좌로 특이적 결합을 지시하도록 변형될 수 있다. CRISPR/Cas 시스템은 유전자 발현 및/또는 활성 또는 핵산 결합의 표적화된 조절을 위해 Cas 단백질과 복합화된 가이드 RNA(gRNA)와 같은 가이드 핵산을 포함할 수 있다. RNA-가이드된 Cas 단백질(예를 들어, Cas9 뉴클레아제와 같은 Cas 뉴클레아제)은 서열 의존적 방식으로 표적 폴리뉴클레오티드(예를 들어 DNA)에 특이적으로 결합할 수 있다. Cas 단백질은 뉴클레아제 활성을 갖고 있으면 DNA를 절단할 수 있다.
일부 경우에, Cas 단백질은 돌연변이되고/되거나 변형되어 뉴클레아제 결핍 단백질 또는 야생형 Cas 단백질에 비해 뉴클레아제 활성이 감소된 단백질을 생성한다. 뉴클레아제 결핍 단백질은 DNA 결합 능력을 유지할 수 있지만, 핵산 절단 활성이 부족하거나 감소할 수 있다.
일부 실시양태에서, 가이드 모이어티는 가이드 RNA 또는 이의 일부와 같은 가이드 핵산과 복합체를 형성하는 Cas 단백질을 포함한다. 일부 실시양태에서, 가이드 모이어티는 단일 가이드 RNA(sgRNA)와 같은 단일 가이드 핵산과 복합체를 형성하는 Cas 단백질을 포함한다. 일부 실시양태에서, 가이드 모이어티는 Cas 단백질과 복합체를 형성할 수 있는 가이드 RNA(예를 들어, sgRNA)와 같은 가이드 핵산과 선택적으로 복합체화된 RNA 결합 단백질(RBP)을 포함한다. 일부 실시양태에서, 가이드 모이어티는 표적 DNA 서열의 전사 활성화 또는 억제를 유도할 수 있는 DNA 뉴클레아제로부터 유래된 뉴클레아제-무효 DNA 결합 단백질을 포함한다. 일부 실시양태에서, 가이드 모이어티는 RNA로부터 유래된 뉴클레아제-무효 RNA 결합 단백질을 포함한다.
본 개시내용의 조성물 및 방법에 사용되는 가이드 핵산은 예를 들어 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 적어도 30개, 적어도 31개, 적어도 32개, 적어도 33개, 적어도 34개, 적어도 35개, 적어도 36개, 적어도 37개, 적어도 38개, 적어도 39개, 또는 적어도 40개의 뉴클레오티드일 수 있다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법에 사용되는 가이드 핵산은 예를 들어 최대 10개, 최대 11개, 최대 12개, 최대 13개, 최대 14개, 최대 15개, 최대 16개, 최대 17개, 최대 18개, 최대 19개, 최대 20개, 최대 21개, 최대 22개, 최대 23개, 최대 24개, 최대 25개, 최대 26개, 최대 27개, 최대 28개, 최대 29개, 최대 30개, 최대 31개, 최대 32개, 최대 33개, 최대 34개, 최대 35개, 최대 36개, 최대 37개, 최대 38개, 최대 39개, 또는 최대 40개의 뉴클레오티드일 수 있다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법에 사용되는 가이드 핵산은 약 8개 내지 약 40개의 뉴클레오티드, 약 10개 내지 약 40개의 뉴클레오티드, 약 11개 내지 약 40개의 뉴클레오티드, 약 12개 내지 약 40개의 뉴클레오티드, 약 13개 내지 약 40개의 뉴클레오티드, 약 14개 내지 약 40개의 뉴클레오티드, 약 15개 내지 약 40개의 뉴클레오티드, 약 16개 내지 약 40개의 뉴클레오티드, 약 17개 내지 약 40개의 뉴클레오티드, 약 18개 내지 약 40개의 뉴클레오티드, 약 19개 내지 약 40개의 뉴클레오티드, 약 20개 내지 약 40개의 뉴클레오티드, 약 22개 내지 약 40개의 뉴클레오티드, 약 24개 내지 약 40개의 뉴클레오티드, 약 26개 내지 약 40개의 뉴클레오티드, 약 28개 내지 약 40개의 뉴클레오티드, 약 30개 내지 약 40개의 뉴클레오티드, 약 8개 내지 약 30개의 뉴클레오티드, 약 10개 내지 약 30개의 뉴클레오티드, 약 11개 내지 약 30개의 뉴클레오티드, 약 12개 내지 약 30개의 뉴클레오티드, 약 13개 내지 약 30개의 뉴클레오티드, 약 14개 내지 약 30개의 뉴클레오티드, 약 15개 내지 약 30개의 뉴클레오티드, 약 16개 내지 약 30개의 뉴클레오티드, 약 17개 내지 약 30개의 뉴클레오티드, 약 18개 내지 약 30개의 뉴클레오티드, 약 19개 내지 약 30개의 뉴클레오티드, 약 20개 내지 약 30개의 뉴클레오티드 뉴클레오티드, 약 22개 내지 약 30개의 뉴클레오티드, 약 24개 내지 약 30개의 뉴클레오티드, 약 26개 내지 약 30개의 뉴클레오티드, 약 28개 내지 약 30개의 뉴클레오티드, 약 8개 내지 약 25개의 뉴클레오티드, 약 10개 내지 약 25개의 뉴클레오티드, 약 11개 내지 약 25개의 뉴클레오티드, 약 12개 내지 약 25개의 뉴클레오티드, 약 13개 내지 약 25개의 뉴클레오티드, 약 14개 내지 약 25개의 뉴클레오티드, 약 15개 내지 약 25개의 뉴클레오티드, 약 16개 내지 약 25개의 뉴클레오티드, 약 17개 내지 약 25개의 뉴클레오티드, 약 18개 내지 약 25개의 뉴클레오티드, 약 19개 내지 약 25개의 뉴클레오티드, 약 20개 내지 약 25개의 뉴클레오티드, 약 22개 내지 약 25개의 뉴클레오티드, 약 24개 내지 약 25개의 뉴클레오티드, 약 8개 내지 약 20개의 뉴클레오티드, 약 10개 내지 약 20개의 뉴클레오티드, 약 11개 내지 약 20개의 뉴클레오티드, 약 12개 내지 약 20개의 뉴클레오티드, 약 13개 내지 약 20개의 뉴클레오티드, 약 14개 내지 약 20개의 뉴클레오티드, 약 15개 내지 약 20개의 뉴클레오티드, 약 16개 내지 약 20개의 뉴클레오티드, 약 17개 내지 약 20개의 뉴클레오티드, 약 18개 내지 약 20개의 뉴클레오티드, 약 19개 내지 약 20개의 뉴클레오티드, 약 8개 내지 약 18개의 뉴클레오티드, 약 10개 내지 약 18개의 뉴클레오티드, 약 11개 내지 약 18개의 뉴클레오티드, 약 12개 내지 약 18개의 뉴클레오티드, 약 13개 내지 약 18개의 뉴클레오티드, 약 14개 내지 약 18개의 뉴클레오티드, 약 15개 내지 약 18개의 뉴클레오티드, 약 16개 내지 약 18개의 뉴클레오티드, 약 8개 내지 약 16개의 뉴클레오티드, 약 10개 내지 약 16개의 뉴클레오티드, 약 11개 내지 약 16개의 뉴클레오티드, 약 12개 내지 약 16개의 뉴클레오티드, 약 13개 내지 약 16개의 뉴클레오티드, 약 14개 내지 약 16개의 뉴클레오티드, 또는 약 15개 뉴클레오티드 내지 약 16개의 뉴클레오티드이다.
가이드 핵산은 가이드 RNA 또는 이의 일부일 수 있다.
임의의 적합한 CRISPR/Cas 시스템이 사용될 수 있다. CRISPR/Cas 시스템은 다양한 명명 시스템을 사용하여 언급될 수 있다. CRISPR/Cas 시스템은 유형 I, 유형 II, 유형 III, 유형 IV, 유형 V, 유형 VI 시스템, 또는 기타 적합한 CRISPR/Cas 시스템일 수 있다. 본원에 사용된 CRISPR/Cas 시스템은 클래스 1, 클래스 2, 또는 기타 적절하게 분류된 CRISPR/Cas 시스템일 수 있다. 클래스 1 또는 클래스 2 결정은 이펙터 모듈을 코딩하는 유전자를 기초하여 할 수 있다. 클래스 1 시스템은 일반적으로 다중 하위 단위 crRNA-이펙터 복합체를 갖는 반면, 클래스 2 시스템은 일반적으로 Cas9, Cpfl, C2c1, C2c2, C2c3 또는 crRNA-이펙터 복합체와 같은 단일 단백질을 갖는다. 클래스 1 CRISPR/Cas 시스템은 여러 Cas 단백질의 복합체를 사용하여 조절을 수행할 수 있다. 클래스 1 CRISPR/Cas 시스템은 예를 들어 유형 I(예: I, IA, IB, IC, ID, IE, IF, IU), 유형 III(예: III, IIIA, IIIB, IIIC, IIID), 및 유형 IV(예: IV, IVA, IVB) CRISPR/Cas 유형을 포함할 수 있다. 클래스 2 CRISPR/Cas 시스템은 단일 대형 Cas 단백질을 사용하여 조절을 수행할 수 있다. 클래스 2 CRISPR/Cas 시스템은 예를 들어 유형 II(예: II, IIA, IIB) 및 유형 V CRISPR/Cas 유형을 포함할 수 있다. CRISPR 시스템은 서로 보완적일 수 있으며/있거나 CRISPR 유전자좌 표적화를 촉진하기 위해 기능 단위를 트랜스로 빌려줄 수 있다.
본원에 개시된 가이드 모이어티는 뉴클레아제, 예를 들어 이종성 뉴클레아제(예를 들어, 이종성 유전자 이펙터에 작동가능하게 결합된 Cas 단백질)를 포함할 수 있다. 뉴클레아제는 역치 길이보다 짧은 길이를 가질 수 있다. 역치 길이는 최대 약 1,000개 아미노산, 최대 약 950개 아미노산, 최대 약 900개 아미노산, 최대 약 850개 아미노산, 최대 약 800개 아미노산, 최대 약 750개 아미노산, 최대 약 700개 아미노산, 최대 약 650개 아미노산, 최대 약 600개 아미노산, 최대 약 550개 아미노산, 최대 약 500개 아미노산, 최대 약 450개 아미노산, 최대 약 400개 아미노산, 최대 약 350개 아미노산, 또는 최대 약 300개의 아미노산일 수 있다. 역치 길이는 적어도 약 300개 아미노산, 적어도 약 350개 아미노산, 적어도 약 400개 아미노산, 적어도 약 450개 아미노산, 적어도 약 500개 아미노산, 적어도 약 550개 아미노산, 적어도 600개 아미노산, 적어도 약 650개 아미노산, 적어도 약 700개 아미노산, 적어도 약 750개 아미노산, 적어도 약 800개 아미노산, 적어도 약 850개 아미노산, 적어도 약 900개 아미노산, 적어도 약 950개 아미노산, 또는 적어도 약 1,000개의 아미노산일 수 있다.
가이드 모이어티가 Cas 단백질 또는 이의 유도체를 포함하는 경우, Cas 단백질 또는 이의 유도체는 클래스 1 또는 클래스 2 Cas 단백질일 수 있다. Cas 단백질은 I형, II형, III형, IV형, V형 Cas 단백질, 또는 VI형 Cas 단백질일 수 있다. Cas 단백질은 하나 이상의 도메인을 포함할 수 있다. 도메인의 비제한적인 예에는 가이드 핵산 인식 및/또는 결합 도메인, 뉴클레아제 도메인(예: DNase 또는 RNase 도메인, RuvC, HNH), DNA 결합 도메인, RNA 결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 및 이량체화 도메인이 포함된다. 가이드 핵산 인식 및/또는 결합 도메인은 가이드 핵산과 상호작용할 수 있다. 뉴클레아제 도메인은 핵산 절단을 위한 촉매 활성을 포함할 수 있다. 뉴클레아제 도메인은 핵산 절단을 방지하기 위하여 촉매 활성이 결여될 수 있다. Cas 단백질은 다른 단백질 또는 폴리펩티드에 융합된 키메라 Cas 단백질 또는 이의 단편일 수 있다. Cas 단백질은 예를 들어 다른 Cas 단백질의 도메인을 포함하는 다양한 Cas 단백질의 키메라일 수 있다.
Cas 단백질의 비제한적인 예에는 c2c1, C2c2, c2c3, Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e(CasD), Cash, Cas6e, Cas6f, Cas7, Cas8a, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9(Csnl 또는 Csx12), Cas10, CaslOd, Cas10, Cas12a, CaslOd, CasF, CasG, CasH, Cpfl, Csyl, Csy2, Csy3, Csel(CasA), Cse2(CasB), Cse3(CasE), Cse4( CasC), Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Csbl, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csxl, Csx15, Csfl, Csf2, Csf3, Csf4, Cul966, Cas13a, Cas13b, Cas13c, Cas13d, Cas13X, Cas13Y, 및 이들의 동족체 또는 변형된 버전이 포함된다.
일부 경우에, 본원에 개시된 바와 같은 Cas 단백질은 Cas9 또는 Cas12a가 아닐 수도 있고 그럴 필요도 없다. 본원에 개시된 바와 같은 Cas 단백질은 Cas9 또는 Cas12a에 비해 더 작은 크기를 가질 수 있다. 본원에 개시된 바와 같은 Cas 단백질은 Un1Cas12f1(또는 Cas14a1)로부터 유래될 수 있다. 예를 들어, 본원에 개시된 바와 같은 Cas 단백질은 서열번호: 49342의 폴리펩티드 서열과 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 실질적으로 약 100% 동일한 아미노산 서열을 포함할 수 있다. 또 다른 예에서, 본원에 개시된 바와 같은 Cas 단백질은 서열번호: 49343의 폴리펩티드 서열과 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 75% 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 실질적으로 약 100% 동일한 아미노산 서열을 포함할 수 있다. 본원에 개시된 바와 같이, 서열번호: 49342는 Un1Cas12f1(또는 Cas14a1)의 폴리펩티드 서열을 코딩한다. 본원에 개시된 바와 같이, 서열번호: 49343은 뉴클레아제 활성이 감소된 Un1Cas12f1의 조작된 변이체를 코딩한다. 일부 실시양태에서, 뉴클레아제 활성이 감소된 Un1Cas12f1의 조작된 변이체와 같은, Un1Cas12f1 또는 이의 유도체는 CasMini 또는 dCasMini로 언급될 수 있다.
[표 1] 예시적인 Cas 서열
Cas 단백질 또는 이의 단편 또는 유도체는 임의의 적합한 유기체로부터 유래될 수 있다. 비제한적인 예에는 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필루스(Streptococcus thermophilus), 스트렙토코커스 종(Streptococcus sp.), 스태필로코커스 아우레우스(Staphylococcus aureus), 노카르디오프시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티나에 스피랄리스(Streptomyces pristinae spiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포란지움 로세움(Streptosporangium roseum), 스트렙토스포란지움 로세움(Streptosporangium roseum), 알리시클로박커스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니트레두센스(Bacillus selenitireducens), 엑시구오박텍리움 시비리움(Exiguobacterium sibiricum), 락토바실러스 델브루엑키(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 마이크로실라 마리나(Microscilla marina), 부르콜데리알레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프 탈레니보란스(Polaromonas nap hthalenivorans), 폴라로모나스 종(Polaromonas sp.), 크로코스패라 왓소니(Crocosphaera watsonii), 시아노테세 종(Cyanothece sp.), 마이스코시스티스 아에루기노사(Microcystis aeruginosa), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 시네코코커스 종(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시(Ammonifex degensii), 칼디셀룰로시럽토 베스시(Caldicelulosiruptor becscii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리디움 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라내로비우스 써모필루스(Natranaerobius thermophilus), 펠로토마쿨룸 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 종(Marinobacter sp.), 니트로소코커스 할로필루스(Nitrosococcus halophilus), 니트로소코커스 왓소니(Nitrosococcus watsoni), 슈도알테로모나스 할로플랑키스(Pseudoalteromonas haloplanktis), 크테도노박터 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나바에나 바리아필리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 종(Nostoc sp.), Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 종(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus), 아카리오클로리스 마리나(Acaryochloris marina), 렙토트리키아 샤히(Leptotrichia shahii), 및 프란시셀라 노비시다(Francisella novicida)가 포함된다. 일부 양태에서, 상기 유기체가 스트렙토코커스 피오게네스(S. pyogenes)이다. 일부 양태에서, 상기 유기체가 스태필로코커스 아우레우스이다. 일부 양태에서, 상기 유기체가 스트렙토코커스 써모필루스(S. thermophilus)이다.
Cas 단백질은 베일로넬라 아티피칼(Veillonella atypical), 푸소박테리움 누클레아툼(Fusobacterium nucleatum), 필리팍터 알로시스(Filifactor alocis), 솔로박테리움 무레이(Solobacterium moorei), 코프로코커스 카투스(Coprococcus catus), 트레포네마 덴티콜라(Treponema denticola), 펩토니필러스 두에르데니(Peptoniphilus duerdenii), 카테니박테리움 미쓰오카이(Catenibacterium mitsuokai), 스트렙토코커스 무탄스(Streptococcus mutans), 리스테리아 이노쿠아(Listeria innocua), 스태필로코커스 슈딘테르메디우스(Staphylococcus pseudintermedius), 아시트아미노코커스 인테스틴(Acidaminococcus intestine), 올세넬라 울리(Olsenella uli), 오에노코커스 키타하라에(Oenococcus kitaharae), 비피도박테리움 비피둠(Bifidobacterium bifidum), 락토바실러스 람노수스(Lactobacillus rhamnosus), 락토바실러스 가세리(Lactobacillus gasseri), 피네골디아 마그나(Finegoldia magna), 마이코플라스마 모바일(Mycoplasma mobile), 마이코플라스마 갈리셉티쿰(Mycoplasma gallisepticum), 마이코플라스마 오비프뉴모니애(Mycoplasma ovipneumoniae), 마이코플라스마 카니스(Mycoplasma canis), 마이코플라스마 시노비애(Mycoplasma synoviae), 유박테리움 렉탈레(Eubacterium rectale), 스트렙토코커스 써모필루스(Streptococcus thermophilus), 유박테리움 돌리쿰(Eubacterium dolichum), 락토바실러스 코리니포르미스 아종 토르쿠엔스(Lactobacillus coryniformis subsp. Torquens), 일로박터 폴리트로푸스(Ilyobacter polytropus), 루미노코커스 알부스(Ruminococcus albus), 아커만시아 무시니필라(Akkermansia muciniphila), 아시도써무스 셀룰로일티쿠스( Acidothermus cellulolyticus), 비피도박테리움 롱굼(Bifidobacterium longum), 비피도박테리움 덴티움(Bifidobacterium dentium), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 엘루시마이크로비움 미누툼(Elusimicrobium minutum), 니트라티프락토르살수기니스(Nitratifractorsalsuginis), 스패로카에타 글로부스(Sphaerochaeta globus), 피브로박터 숙시노게네스 아종 숙시노게네스(Fibrobacter succinogenes subsp. Succinogenes), 박테로이데스 프라길리스(Bacteroides fragilis), 카프노사이토파가 오크라세아(Capnocytophaga ochracea), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 프레보텔라 마이칸스(Prevotella micans), 프레보텔라 루미니콜라(Prevotella ruminicola), 플라보박테리움 콜루마레(Flavobacterium columnare), 아미노모나스 파우치보란스(Aminomonas paucivorans), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 칸디다투스 푸니세이스피릴룸 마리움(Candidatus Puniceispirillum marinum), 베르미네프로박터 에이세니아에(Verminephrobacter eiseniae), 랄스토니아 시지지(Ralstonia syzygii), 디노로세오박터 시배(Dinoroseobacter shibae), 아조스피릴룸 니트로박터 함부르겐시스(Azospirillum, Nitrobacter hamburgensis), 브래디리조비움(Bradyrhizobium), 볼리넬라숙시노게네스(Wolinellasuccinogenes), 캄필로박터 제주니 아종(Campylobacter jejuni subsp. Jejuni), 헬리코박터 무스텔래(Helicobacter mustelae), 바실러스 세레우스(Bacillus cereus), 아시도보락스에브레우스(Acidovorax ebreus), 클로스트리디움 페르프린겐스(Clostridium perfringens), 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans), 로세부리아 인테스티날리스(Roseburia intestinalis), 네이세리아 메닝기티디스(Neisseria meningitidis), 파스퇴렐라 물코시다 아종 물토시다(Pasteurella multocida subsp. Multocida), 수테렐라 와소르텐시스(Sutterella wadsworthensis), 프로테오박테리움(proteobacterium), 레지오넬라 뉴모필라(Legionella pneumophila), 파라수테렐라 엑스크레멘티호미니스(Parasutterella excrementihominis), 볼리넬라 숙시노게네스(Wolinella succinogenes), 및 프란시셀라 노비시다(Francisella novicida)를 포함하지만 이에 국한되지 않는 다양한 박테리아 종으로부터 유래될 수 있다.
본원에 사용된 Cas 단백질은 Cas 단백질의 야생형 또는 변형된 형태일 수 있다. Cas 단백질은 활성 변이체, 비활성 변이체, 야생형 또는 변형된 Cas 단백질의 단편일 수 있다. Cas 단백질은 Cas 단백질의 야생형 버전에 비해 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이들의 임의의 조합과 같은 아미노산 변화를 포함할 수 있다. Cas 단백질은 야생형 Cas 단백질과 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성 또는 서열 유사성을 갖는 폴리펩티드일 수 있다. Cas 단백질은 야생형 Cas 단백질과 최대 약 5%, 최대 약 10%, 최대 약 20%, 최대 약 30%, 최대 약 40%, 최대 약 50%, 최대 약 60%, 최대 약 70%, 최대 약 80%, 최대 약 90%, 또는 최대 약 100% 서열 동일성 또는 서열 유사성을 갖는 폴리펩티드일 수 있다. 변이체 또는 단편은 야생형 또는 변형된 Cas 단백질 또는 이의 일부와 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성 또는 서열 유사성을 포함할 수 있다. 변이체 또는 단편은 가이드 핵산과 복합체를 이루지만 핵산 절단 활성이 결여된 핵산 유전자좌로 표적화될 수 있다.
Cas 단백질은 DNase 도메인과 같은 하나 이상의 뉴클레아제 도메인을 포함할 수 있다. 예를 들어, Cas9 단백질은 RuvC-유사 뉴클레아제 도메인 및/또는 HNH-유사 20개 뉴클레아제 도메인을 포함할 수 있다. Cas9의 뉴클레아제 활성 형태인 RuvC 및 HNH 도메인은 각각 이중 가닥 DNA의 다른 가닥을 절단하여 DNA에서 이중 가닥 절단을 만들 수 있다. Cas 단백질은 단 하나의 뉴클레아제 도메인을 포함할 수 있다(예를 들어, Cpfl은 RuvC 도메인을 포함하지만 HNH 도메인이 결여되어 있음). 일부 실시양태에서, 뉴클레아제 도메인은 존재하지 않는다. 일부 실시양태에서, 뉴클레아제 도메인은 존재하지만 비활성이거나 활성이 감소되거나 최소 활성이다. 일부 실시양태에서, 뉴클레아제 도메인이 존재하고 활성이다.
Cas 단백질의 하나 또는 복수의 뉴클레아제 도메인(예를 들어, RuvC, HNH)은 결실되거나 돌연변이되어 더 이상 기능하지 않거나 감소된 뉴클레아제 활성을 포함할 수 있다. 예를 들어, 적어도 2개의 뉴클레아제 도메인을 포함하는 Cas 단백질(예: Cas9)에서, 뉴클레아제 도메인 중 하나가 결실되거나 돌연변이되면, 니카아제로 알려진, 생성된 Cas 단백질은 이중 가닥 DNA 내에 있는 CRISPR RNA(crRNA) 인식 서열이지만 이중 가닥 절단은 아닌 단일 가닥 절단을 생성할 수 있다. 이러한 니카아제는 상보적 가닥 또는 비상보적 가닥을 절단할 수 있지만, 둘 다 절단할 수는 없다. Cas 단백질의 모든 뉴클레아제 도메인(예: Cas9 단백질의 RuvC 및 HNH 뉴클레아제 도메인; Cpfl 단백질의 RuvC 뉴클레아제 도메인)이 결실되거나 돌연변이된 경우, 생성된 Cas 단백질은 이중 가닥 DNA의 두 가닥을 절단하는 능력이 감소되거나 전혀 없을 수 있다. Cas9 단백질을 니카아제로 전환할 수 있는 돌연변이의 예는 S. 피오게네스 유래 Cas9의 RuvC 도메인에 있는 D10A(Cas9의 위치 10에서 아스파르테이트가 알라닌으로) 돌연변이이다. S. 피오게네스 유래 Cas9의 HNH 도메인에 있는 H939A(아미노산 위치 839에서 히스티딘이 알라닌으로) 또는 H840A(아미노산 위치 840에서 히스티딘이 알라닌으로)는 Cas9를 니카아제로 전환할 수 있다. Cas9 단백질을 사멸 Cas9로 전환할 수 있는 돌연변이의 예로는 RuvC 도메인의 D10A(Cas9의 위치 10에서 아스파르테이트에서 알라닌으로) 돌연변이와 S. 피오게네스 유래의 Cas9의 HNH 도메인에 있는 H939A(아미노산 위치 839에서 히스티딘에서 알라닌으로) 또는 H840A(아미노산 위치 840에서 히스티딘에서 알라닌으로)가 있다.
뉴클레아제 사멸 Cas 단백질은 야생형 버전의 단백질에 비해 하나 이상의 돌연변이를 포함할 수 있다. 돌연변이는 야생형 Cas 단백질의 복수의 핵산 절단 도메인 중 하나 이상에서 핵산 절단 활성의 90% 이하, 80% 이하, 70% 이하, 60% 이하, 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하로 될 수 있다. 돌연변이는 표적 핵산의 상보적 가닥을 절단하는 능력을 유지하지만 표적 핵산의 비-상보적 가닥을 절단하는 능력을 감소시키는 복수의 핵산 절단 도메인 중 하나 이상을 초래할 수 있다. 돌연변이는 표적 핵산의 비-상보적 가닥을 절단하는 능력을 유지하지만 표적 핵산의 상보적 가닥을 절단하는 능력을 감소시키는 복수의 핵산 절단 도메인 중 하나 이상을 초래할 수 있다. 돌연변이는 표적 핵산의 상보적 가닥 및 비-상보적 가닥을 절단하는 능력이 결여된 복수의 핵산 절단 도메인 중 하나 이상을 초래할 수 있다. 뉴클레아제 도메인에서 돌연변이될 잔기는 뉴클레아제의 하나 이상의 촉매 잔기에 해당할 수 있다. 예를 들어, Asp10, His840, Asn854 및 Asn856과 같은 야생형 예시적인 S. 피오게네스 Cas9 폴리펩티드의 잔기는 돌연변이되어 복수의 핵산 절단 도메인(예를 들어, 뉴클레아제 도메인) 중 하나 이상을 비활성화할 수 있다. Cas 단백질의 뉴클레아제 도메인에서 돌연변이될 잔기는 예를 들어 서열 및/또는 구조적 정렬에 의해 결정된 바와 같이 야생형 S. 피오게네스 Cas9 폴리펩티드의 잔기 Asp10, His840, Asn854 및 Asn856에 해당할 수 있다.
비제한적인 예로서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, 및/또는 A987(또는 임의의 Cas 단백질의 상응하는 돌연변이)은 돌연변이될 수 있다. 예를 들어, D10A, G12A, G17A, E762A, H840A, N854A, N863A, H982A, H983A, A984A, 및/또는 D986A. 알라닌 치환 이외의 돌연변이가 적합할 수 있다.
D10A 돌연변이는 H840A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합되어 DNA 절단 활성이 실질적으로 결여된 Cas9 단백질(예를 들어, 사멸 Cas9 단백질)을 생성할 수 있다. H840A 돌연변이는 D10A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합되어 DNA 절단 활성이 실질적으로 결여된 부위 지정 폴리펩티드를 생성할 수 있다. N854A 돌연변이는 H840A, D1OA, 또는 N856A 돌연변이 중 하나 이상과 조합되어 DNA 절단 활성이 실질적으로 결여된 부위 지정 폴리펩티드를 생성할 수 있다. N856A 돌연변이는 H840A, N854A, 또는 D10A 돌연변이 중 하나 이상과 조합되어 DNA 절단 활성이 실질적으로 결여된 부위 지정 폴리펩티드를 생성할 수 있다.
일부 실시양태에서, Cas 단백질은 클래스 2 Cas 단백질이다. 일부 실시양태에서, Cas 단백질은 유형 II Cas 단백질이다. 일부 실시양태에서, Cas 단백질은 Cas9 단백질, Cas9 단백질의 변형된 버전이거나, Cas9 단백질로부터 유래된다. 예를 들어, 절단 활성이 결여된 Cas9 단백질이 있다. 일부 실시양태에서, Cas9 단백질은 S. 피오게네스로부터의 Cas9 단백질(예를 들어, SwissProt 수탁 번호 Q99ZW2)이다. 일부 실시양태에서, Cas9 단백질은 S. 아우레우스로부터의 Cas9(예를 들어, SwissProt 수탁 번호 J7RUA5)이다. 일부 실시양태에서, Cas9 단백질은 S. 피오게네스 또는 S. 아우레우스로부터의 Cas9 단백질의 변형된 버전이다. 일부 실시양태에서, Cas9 단백질은 S. 피오게네스 또는 S. 아우레우스로부터의 Cas9 단백질로부터 유래된다. 예를 들어, 절단 활성이 결여된 S. 피오게네스 또는 S. 아우레우스 Cas9 단백질이 있다.
일부 실시양태에서, Cas9는 일반적으로 야생형 예시적인 Cas9 폴리펩티드(예를 들어, S. 피오게네스로부터의 Cas9)와 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%의 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 언급할 수 있다. 일부 실시양태에서, Cas9는 야생형 Cas9 폴리펩티드(예를 들어, S. 피오게네스로부터의 Cas9)와 최대 약 5%, 최대 약 10%, 최대 약 20%, 최대 약 30%, 최대 약 40%, 최대 약 50%, 최대 약 60%, 최대 약 70%, 최대 약 80%, 최대 약 90%, 또는 약 100%의 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 언급할 수 있다. Cas9는 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이들의 임의의 조합과 같은 아미노산 변화를 포함할 수 있는 Cas9 단백질의 야생형 또는 변형된 형태를 언급할 수 있다.
Cas 단백질은 야생형 Cas 단백질의 뉴클레아제 도메인(예를 들어, RuvC 도메인, HNH 도메인)과 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성 또는 서열 유사성을 갖는 아미노산 서열을 포함할 수 있다.
Cas 단백질, 이의 변이체 또는 유도체는 예를 들어 본원에 개시된 복합체의 일부로서 본 개시내용의 조성물 및 방법에 의해 유전자 발현의 조절을 향상시키기 위해 변형될 수 있다. Cas 단백질은 핵산 결합 친화도, 핵산 결합 특이성, 효소 활성, 및/또는 이종성이량체화 또는 올리고머화 도메인과 같은 다른 요인에 대한 결합을 증가시키거나 감소시키고 리간드를 유도하도록 변형될 수 있다. Cas 단백질은 안정성과 같은 단백질의 다른 활성이나 특성을 변경하도록 변형될 수도 있다. 예를 들어, Cas 단백질의 하나 이상의 뉴클레아제 도메인은 변형, 결실 또는 비활성화될 수 있거나, Cas 단백질은 절단되어 단백질 또는 복합체의 원하는 기능에 필수적이지 않은 도메인을 제거할 수 있다. Cas 단백질은 이종성 유전자 이펙터를 포함하는 본 개시내용의 복합체에 의해 유전자 발현을 조절하기 위한 Cas 단백질의 활성을 조절(예를 들어, 향상 또는 감소)시키기 위해 변형될 수 있다.
예를 들어, Cas 단백질은 이종성 유전자 이펙터(예를 들어 후성적 변형 도메인, 전사 활성화 도메인, 및/또는 전사 억제인자 도메인)에 결합(예를 들어, 융합, 공유 결합 또는 비공유 결합)될 수 있다. Cas 단백질은 본원에 개시된 바와 같은 올리고머화 또는 이량체화 도메인(예를 들어, 이종성이량체화 도메인)에 결합(예를 들어, 융합, 공유 결합 또는 비공유 결합)될 수 있다. Cas 단백질은 증가되거나 감소된 안정성을 제공하는 이종성 폴리펩티드에 결합(예를 들어, 융합, 공유 결합 또는 비공유 결합)될 수 있다. Cas 단백질은 Cas 단백질 또는 Cas 단백질을 함유하는 복합체, 예를 들어 유도성(예: 옥신 유도성) 데그론과 같은 데그론의 분해를 촉진할 수 있는 서열에 결합(예를 들어 융합, 공유 결합 또는 비공유 결합)될 수 있다.
Cas 단백질은 임의의 적합한 수의 파트너, 예를 들어 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개, 적어도 6개, 적어도 7개, 또는 적어도 8개의 파트너에 결합(예를 들어, 융합, 공유 결합 또는 비공유 결합)될 수 있다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 최대 2개, 최대 4개, 최대 5개, 최대 6개, 최대 7개, 최대 8개, 또는 최대 10개의 파트너에 결합(예를 들어, 융합, 공유 결합 또는 비공유 결합)될 수 있다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 1 - 5, 1 - 4, 1 - 3, 1 - 2, 2 - 5, 2 - 4 , 2 - 3, 3 - 5, 3 - 4, 또는 4 - 5개의 파트너에 결합(예를 들어, 융합, 공유 결합 또는 비공유 결합)된다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 하나의 파트너에 결합(예를 들어, 융합, 공유 커플링 또는 비공유 결합)된다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 2개의 파트너에 결합(예를 들어, 융합, 공유 커플링 또는 비공유 결합)된다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 3개의 파트너에 결합(예를 들어, 융합, 공유 커플링, 또는 비공유 결합)된다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 4개의 파트너에 결합(예를 들어, 융합, 공유 커플링, 또는 비공유 결합)된다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 5개의 파트너에 결합(예를 들어, 융합, 공유 커플링, 또는 비공유 결합)된다. 일부 실시양태에서, 본 개시내용의 Cas 단백질은 6개의 파트너에 결합(예를 들어, 융합, 공유 커플링, 또는 비공유 결합)된다.
Cas 단백질은 융합 단백질일 수 있다. 융합된 도메인 또는 이종성 폴리펩티드(예를 들어, 이종성 유전자 이펙터)는 N-말단, C-말단에 위치하거나, Cas 단백질 내부에 위치할 수 있다.
Cas 단백질은 임의의 형태로 제공될 수 있다. 예를 들어, Cas 단백질은 Cas 단백질 단독 또는 리보핵단백질인 가이드 핵산과 복합체를 이루는 등의 단백질 형태로 제공될 수 있다. Cas 단백질은 예를 들어 본 개시내용의 가이드 핵산 및/또는 하나 이상의 이종성 유전자 이펙터와 복합체화된 복합체로 제공될 수 있다. Cas 단백질은 Cas 단백질을 코딩하는 핵산, 예를 들어 RNA(예: 메신저 RNA(mRNA)), 또는 DNA의 형태로 제공될 수 있다. Cas 단백질을 코딩하는 핵산은 특정 세포 또는 유기체에서 단백질로 효율적으로 번역되도록 코돈 최적화될 수 있다.
Cas 단백질, 단편, 또는 이의 유도체를 코딩하는 핵산은 세포의 게놈에 안정적으로 통합될 수 있다. Cas 단백질을 코딩하는 핵산은 프로모터, 예를 들어 세포에서 구성적으로 또는 유도적으로 활성인 프로모터에 작동가능하게 연결될 수 있다. Cas 단백질을 코딩하는 핵산은 발현 작제물의 프로모터에 작동가능하게 연결될 수 있다. 발현 작제물은 유전자 또는 관심 있는 다른 핵산 서열(예를 들어, Cas 유전자)의 발현을 지시할 수 있고 이러한 관심 핵산 서열을 표적 세포로 전달할 수 있는 임의의 핵산 작제물을 포함할 수 있다.
일부 실시양태에서, Cas 단백질, 이의 변이체 또는 유도체는 뉴클레아제 사멸 Cas(dCas) 단백질이다. 사멸 Cas 단백질은 핵산 절단 활성이 결여된 단백질일 수 있다.
Cas 단백질은 야생형 Cas 단백질의 변형된 형태를 포함할 수 있다. 야생형 Cas 단백질의 변형된 형태는 Cas 단백질의 핵산 절단 활성을 감소시키는 아미노산 변화(예를 들어, 결실, 삽입, 또는 치환)를 포함할 수 있다. 예를 들어, Cas 단백질의 변형된 형태는 야생형 Cas 단백질(예: S. 피오게네스 유래의 Cas9)의 핵산 절단 활성의 90% 이하, 80% 이하, 70% 이하, 60% 이하, 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하를 가질 수 있다. 변형된 형태의 Cas 단백질은 실질적인 핵산 절단 활성을 가질 수 없다. Cas 단백질이 실질적인 핵산 절단 활성이 없는 변형된 형태인 경우, 이는 효소적으로 비활성, "비활성화" 및/또는 "사멸"(약어로 "d")이라고 언급할 수 있다. 사멸 Cas 단백질(예: dCas, dCas9)은 표적 폴리뉴클레오티드에 결합할 수 있지만 표적 폴리뉴클레오티드를 절단하지 않거나 최소한으로 절단할 수 있다. 일부 양태에서, 사멸 Cas 단백질은 사멸 Cas9 단백질이다.
dCas9 폴리펩티드는 예를 들어 본원에 개시된 이종성 유전자 이펙터(들)와 함께, 단일 가이드 RNA(sgRNA)와 결합하여 표적 유전자(예를 들어, 표적 내인성 유전자)의 전사를 활성화하거나 억제할 수 있다. sgRNA는 본 개시내용의 Cas 또는 가이드 모이어티 성분을 발현하는 세포 내로 도입될 수 있다. 일부 경우에, 이러한 세포는 동일한 표적 유전자(예: 표적 내인성 유전자) 또는 표적 유전자 조절 서열을 표적으로 하는 하나 이상의 서로 다른 sgRNA를 포함할 수 있다. 다른 경우에, sgRNA는 세포 내의 서로 다른 핵산(예를 들어, 서로 다른 표적 유전자, 서로 다른 표적 유전자 조절 서열, 또는 동일한 표적 유전자 또는 표적 유전자 조절 서열 내의 서로 다른 서열)을 표적으로 한다.
효소적 비활성은 서열 특이적 방식으로 폴리뉴클레오티드의 핵산 서열에 결합할 수 있지만, 표적 폴리뉴클레오티드를 절단하지 않거나 실질적으로 감소된 빈도로 절단하는 뉴클레아제를 언급할 수 있다. 효소적으로 비활성인 가이드 모이어티는 효소적으로 비활성인 도메인(예를 들어 뉴클레아제 도메인)을 포함할 수 있다. 효소적으로 비활성은 활성이 없음을 언급할 수 있다. 효소적으로 비활성인 것은 실질적으로 활성이 없음을 언급할 수 있다. 효소적으로 비활성은 본질적으로 활성이 없음을 언급할 수 있다. 효소적으로 비활성은 유사한 야생형 활성(예를 들어, 핵산 절단 활성, 야생형 Cas9 활성)과 비교하여 1% 이하, 2% 이하, 3% 이하, 4% 이하, 5% 이하, 6% 이하, 7% 이하, 8% 이하, 9% 이하, 또는 10% 이하의 활성을 언급할 수 있다.
일부 실시양태에서, 가이드 모이어티는 핵산 가이드된 표적화 시스템을 함유하지 않는다. 예를 들어, 가이드 모이어티에는 표적 유전자(예: 표적 내인성 유전자) 또는 단백질 구조적 특징에 기초한 표적 유전자 조절 서열, 예를 들어 본원에 개시된 특정 뉴클레아제에 결합하는 단백질이 포함될 수 있다.
일부 실시양태에서, 가이드 모이어티는 아연 핑거 뉴클레아제(ZFN) 또는 이의 변이체, 단편 또는 유도체를 포함한다. ZFN은 FokI의 절단 도메인과 같은 절단 도메인과 적어도 하나의 아연 핑거 모티프(예를 들어, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 아연 핑거 모티프) 사이의 융합을 언급할 수 있으며, 이는 DNA 및 RNA와 같은 폴리뉴클레오타이드와 결합할 수 있다. 일부 실시양태에서, ZFN은 폴리뉴클레오티드(예를 들어, 표적 유전자 또는 표적 유전자 조절 서열)에 결합하기 위해 본 개시내용의 표적화 모이어티에서 사용되지만, ZFN은 폴리뉴클레오티드, 예를 들어 뉴클레아제 사멸 ZFN을 절단하지 않거나 실질적으로 절단하지 않는다. ZFN 또는 이의 변이체, 단편 또는 유도체는 하나 이상의 이종성 유전자 이펙터에 융합되거나 회합되어 본 개시내용의 복합체를 형성할 수 있다.
특정 방향 및 간격으로 2개의 개별 ZFN의 폴리뉴클레오티드의 특정 위치에서 이종성이량체화는 뉴클레아제 활성 ZFN에서 폴리뉴클레오티드의 절단을 초래할 수 있다. 예를 들어, DNA에 결합하는 ZFN은 DNA에서 이중 가닥 절단을 유도할 수 있다. 2개의 절단 도메인이 이량체화하고 DNA를 절단할 수 있도록 하기 위해, 2개의 개별 ZFN은 특정 거리에서 떨어져 있는 이들의 C-말단을 사용하여 반대쪽 DNA 가닥에 결합할 수 있다. 일부 경우에, 아연 핑거 도메인과 절단 도메인 사이의 링커 서열은 각 결합 부위의 5' 가장자리가 약 5-7개의 염기쌍만큼 분리되는 것을 요구할 수 있다. 어떤 경우에는, 절단 도메인이 각 아연 핑거 도메인의 C-말단에 융합된다.
일부 실시양태에서, ZFN을 포함하는 가이드 모이어티의 절단 도메인은 야생형 절단 도메인의 변형된 형태를 포함한다. 절단 도메인의 변형된 형태는 절단 도메인의 핵산 절단 활성을 감소시키는 아미노산 변화(예를 들어, 결실, 삽입, 또는 치환)를 포함할 수 있다. 예를 들어, 절단 도메인의 변형된 형태는 상응하는 야생형 절단 도메인의 핵산 절단 활성의 90% 이하, 80% 이하, 70% 이하, 60% 이하, 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하를 가질 수 있다. 절단 도메인의 변형된 형태는 실질적인 핵산 절단 활성을 가질 수 없다. 일부 실시양태에서, 절단 도메인은 효소적으로 비활성이다.
일부 실시양태에서, 가이드 모이어티는 "TALEN" 또는 "TAL-이펙터 뉴클레아제" 또는 이의 변이체, 단편 또는 유도체를 포함한다. TALEN은 일반적으로 DNA 결합 나란한 반복부의 중앙 도메인과 절단 도메인을 포함하는 조작된 전사 활성화제 유사 이펙터 뉴클레아제를 언급한다. TALEN은 TAL 이펙터 DNA 결합 도메인을 DNA 절단 도메인에 융합시켜 생산될 수 있다. 일부 경우에, DNA 결합 나란한 반복부는 33-35개의 아미노산 길이를 포함하고 적어도 하나의 특정 DNA 염기쌍을 인식할 수 있는 위치 12 및 13에 2개의 초가변 아미노산 잔기를 포함한다. 전사 활성화제 유사 이펙터(TALE) 단백질은 야생형 또는 돌연변이된 Fok1 엔도뉴클레아제 또는 Fok1의 촉매 도메인과 같은 뉴클레아제에 융합될 수 있다. 일부 실시양태에서, TALEN은 폴리뉴클레오티드(예를 들어, 표적 유전자 또는 표적 유전자 조절 서열)에 결합하기 위해 본 개시내용의 표적화 모이어티에 사용되지만, TALEN은 폴리뉴클레오티드, 예를 들어, 뉴클레아제 사멸 TALEN을 절단하지 않거나 실질적으로 절단하지 않는다. TALEN 또는 이의 변이체, 단편, 또는 유도체는 하나 이상의 이종성 유전자 이펙터에 융합되거나 회합되어 본 개시내용의 복합체를 형성할 수 있다.
일부 실시양태에서, TALEN은 감소된 뉴클레아제 활성을 위해 조작된다. 일부 실시양태에서, TALEN의 뉴클레아제 도메인은 야생형 뉴클레아제 도메인의 변형된 형태를 포함한다. 뉴클레아제 도메인의 변형된 형태는 뉴클레아제 도메인의 핵산 절단 활성을 감소시키는 아미노산 변화(예를 들어, 결실, 삽입, 또는 치환)를 포함할 수 있다. 예를 들어, 뉴클레아제 도메인의 변형된 형태는 야생형 뉴클레아제 도메인의 핵산 절단 활성의 90% 이하, 80% 이하, 70% 이하, 60% 이하, 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하를 가질 수 있다. 뉴클레아제 도메인의 변형된 형태는 실질적인 핵산 절단 활성을 가질 수 없다. 일부 실시양태에서, 뉴클레아제 도메인은 효소적으로 비활성이다. TALEN 또는 이의 변이체, 단편, 또는 유도체는 하나 이상의 이종성 유전자 이펙터에 융합되거나 회합되어 본 개시내용의 복합체를 형성할 수 있다.
TALEN에서의 사용을 위해 Fok1에 대한 여러 돌연변이가 만들어졌으며, 이는 예를 들어 절단 특이성 또는 활성을 향상시킨다. 이러한 TALEN은 임의의 원하는 DNA 서열에 결합하도록 조작될 수 있다. TALEN은 표적 DNA 서열에 이중 가닥 절단을 생성하여 유전자 변형(예: 핵산 서열 편집)을 생성하는 데 사용될 수 있으며, 이는 결국 NHEJ 또는 HDR을 겪게 된다.
TALE 또는 이의 변이체, 단편, 또는 유도체는 하나 이상의 이종성 유전자 이펙터에 융합되거나 회합되어 본 개시내용의 복합체를 형성할 수 있다. 일부 실시양태에서, 전사 활성화제 유사 이펙터(TALE) 단백질은 이종성 유전자 이펙터에 융합되고 뉴클레아제를 포함하지 않는다. 일부 실시양태에서, TALEN은 폴리뉴클레오티드, 예를 들어 뉴클레아제 사멸 TALE를 절단하지 않거나 실질적으로 절단하지 않는다. TALE 또는 이의 변이체, 단편, 또는 유도체는 하나 이상의 이종성 유전자 이펙터에 융합되거나 회합되어 본 개시내용의 복합체를 형성할 수 있다.
일부 실시양태에서, 전사 활성화제 유사 이펙터(TALE) 단백질과 이종성 유전자 이펙터의 복합체는 전사 활성화제로서 기능하도록 설계된다. 일부 실시양태에서, 전사 활성화제 유사 이펙터(TALE) 단백질과 이종성 유전자 이펙터의 복합체는 전사 억제인자로서 기능하도록 설계된다. 예를 들어, 전사 활성화제 유사 이펙터(TALE) 단백질의 DNA-결합 도메인은 전사 활성화 도메인을 포함하는 하나 이상의 이종성 유전자 이펙터, 또는 전사 억제 도메인을 포함하는 하나 이상의 이종성 유전자 이펙터에 융합(예를 들어, 연결)될 수 있다.
일부 실시양태에서, 가이드 모이어티는 메가뉴클레아제를 포함한다. 메가뉴클레아제는 일반적으로 서열 특이성이 매우 높을 수 있는 희귀 절단 엔도뉴클레아제 또는 호밍 엔도뉴클레아제를 언급한다. 메가뉴클레아제는 적어도 12개의 염기쌍 길이, 예를 들어 12 내지 40개의 염기쌍, 12 내지 50개의 염기쌍, 또는 12 내지 60개의 염기쌍 길이 범위의 DNA 표적 부위를 인식할 수 있다. 메가뉴클레아제는 엔도뉴클레아제의 적어도 하나의 촉매 도메인과 적어도 하나의 DNA 결합 도메인 또는 핵산 표적 서열을 지정하는 단백질을 포함하는 임의의 융합 단백질과 같은 모듈식 DNA-결합 뉴클레아제일 수 있다. DNA 결합 도메인은 단일 가닥 또는 이중 가닥 DNA를 인식하는 모티프를 적어도 하나 포함할 수 있다. 뉴클레아제 활성 메가뉴클레아제는 이중 가닥 절단을 생성할 수 있다. 일부 실시양태에서, 메가뉴클레아제는 폴리뉴클레오티드(예를 들어, 표적 유전자 또는 표적 유전자 조절 서열)에 결합하기 위해 본 개시내용의 표적화 모이어티에 사용되지만, 메가뉴클레아제는 폴리뉴클레오티드를 절단하지 않거나 실질적으로 절단하지 않는, 예를 들어 뉴클레아제 사멸 메가뉴클레아제이다. 메가뉴클레아제 또는 이의 변이체, 단편 또는 유도체는 하나 이상의 이종성 유전자 이펙터에 융합되거나 회합되어 본 개시내용의 복합체를 형성할 수 있다.
메가뉴클레아제는 단량체 또는 이량체일 수 있다. 일부 실시양태에서, 메가뉴클레아제는 자연 발생(자연에서 발견됨) 또는 야생형이고, 다른 경우에, 메가뉴클레아제는 비천연, 인공, 조작, 합성, 합리적으로 설계되거나, 인공 제조된다. 일부 실시양태에서, 본 개시내용의 메가뉴클레아제에는 I-CreI 메가뉴클레아제, I-CeuI 메가뉴클레아제, I-Msol 메가뉴클레아제, I-SceI 메가뉴클레아제, 이들의 변이체, 이들의 유도체, 및 이들의 단편이 포함된다
일부 실시양태에서, 메가뉴클레아제의 뉴클레아제 도메인은 야생형 뉴클레아제 도메인의 변형된 형태를 포함한다. 뉴클레아제 도메인의 변형된 형태는 뉴클레아제 도메인의 핵산 절단 활성을 감소시키거나 제거하는 아미노산 변화(예를 들어, 결실, 삽입, 또는 치환)를 포함할 수 있다. 예를 들어, 뉴클레아제 도메인의 변형된 형태는 야생형 뉴클레아제 도메인의 핵산 절단 활성의 90% 이하, 80% 이하, 70% 이하, 60% 이하, 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하를 가질 수 있다. 뉴클레아제 도메인의 변형된 형태는 실질적인 핵산 절단 활성을 가질 수 없다. 일부 실시양태에서, 뉴클레아제 도메인은 효소적으로 비활성이다. 일부 실시양태에서, 메가뉴클레아제는 DNA에 결합할 수 있지만 DNA를 절단할 수 없다. 일부 실시양태에서, 뉴클레아제-비활성 메가뉴클레아제는 하나 이상의 이종성 유전자 이펙터와 융합되거나 회합되어 본 개시내용의 복합체를 생성한다.
일부 실시양태에서, 가이드 모이어티는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성을 조절할 수 있다. 일부 실시양태에서, 가이드 모이어티는 핵산(예를 들어, 유전자 및/또는 유전자 생성물)의 서열을 편집할 수 있다. 뉴클레아제 활성 Cas 단백질은 표적 폴리뉴클레오티드에서 이중 가닥 절단 또는 단일 가닥 절단을 생성하여 핵산 서열을 편집할 수 있다.
일부 실시양태에서, 뉴클레아제를 포함하는 가이드 모이어티는 DNA와 같은 표적 폴리뉴클레오티드에서 이중 가닥 절단을 생성할 수 있다. DNA의 이중 가닥 절단은 유전자 변형(들)(예: 핵산 편집)의 도입을 허용하는 DNA 절단 복구를 초래할 수 있다. 일부 실시양태에서, 뉴클레아제는 부위 특이적 단일 가닥 DNA 절단 또는 흠집을 유도하여, HDR을 초래한다.
DNA의 이중 가닥 절단은 유전자 변형(들)(예: 핵산 편집)의 도입을 허용하는 DNA 절단 복구를 초래할 수 있다. DNA 절단 복구는 NHEJ(비상동 말단 결합) 또는 HDR(상동성 지시된 복구)을 통해 발생할 수 있다. HDR에서, 표적 DNA의 상동성 암 측면 부위를 포함하는 공여자 DNA 복구 주형 또는 주형 폴리뉴클레오티드가 제공될 수 있다.
일부 실시양태에서, 뉴클레아제를 포함하는 가이드 모이어티 또는 복합체는 DNA와 같은 표적 폴리뉴클레오티드에서 이중 가닥 절단을 생성하지 않는다.
복합체
일부 양태에서, 이종성 유전자 이펙터 및 가이드 모이어티, 예를 들어 가이드 핵산 및/또는 절단 활성이 결여되거나 실질적으로 결여된 엔도뉴클레아제와 같은 뉴클레아제를 포함하는 복합체가 본원에 개시된다.
본 개시내용의 복합체는 예를 들어 하나 이상의 이종성 유전자 이펙터를 표적 유전자(예를 들어, 표적 내인성 유전자) 또는 표적 유전자 조절 서열과 근접하게 하여, 표적 유전자의 발현 또는 활성 수준의 조절을 촉진하는 데 유용할 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 DNA, 예를 들어 게놈 DNA에 결합한다. 일부 실시양태에서, 본 개시내용의 복합체는 RNA, 예를 들어 mRNA, 마이크로RNA, siRNA, 또는 비-코딩 RNA에 결합한다. 일부 실시양태에서, 본 개시내용의 복합체는 DNA 및 RNA에 결합한다.
일부 실시양태에서, 복합체는 폴리뉴클레오티드 서열(예를 들어, 프로모터, 인핸서, 억제인자, 작동인자, 또는 사일렌서, 절연체, 시스-조절 요소, 트랜스-조절 요소, 후성적 변형(예: DNA 메틸화) 부위, 코딩 서열)의 물리적 방해에 의해 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성을 조절(예를 들어, 증가 또는 감소)할 수 있다.
일부 실시양태에서, 복합체는 표적 유전자의 발현을 억제하거나 향상시키는 데 효과적인 추가 인자를 모집함으로써 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성을 조절(예를 들어, 증가 또는 감소)할 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자) 또는 표적 유전자 조절 서열(예를 들어, 프로모터, 인핸서, 사일렌서, 절연체, 시스-조절 요소, 트랜스-조절 요소 또는 후성적 변형(예: DNA 메틸화) 부위)에 후성적 변형을 도입하기 위해 사용된다. 일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자 또는 표적 유전자 조절 서열(예를 들어, 표적 유전자로부터 원위 또는 근위 유전자)을 포함하는 3차원 구조, 위상학적으로 연관된 도메인, 또는 게놈 경계를 생성하는 데 사용된다.
일부 경우에, 하나 이상의 이종성 유전자 이펙터 및 가이드 핵산을 포함하는 복합체와 같은, 본원에 개시된 복합체에 의한 표적 유전자(예를 들어, 표적 내인성 유전자)의 조절은 표적 유전자에 작동적으로 결합된 내인성 표적 유전자 조절 서열(예를 들어, 프로모터, 인핸서, 억제인자, 사일렌서, 절연체, 시스-조절 요소, 트랜스-조절 요소, 후성적 변형(예를 들어, DNA 메틸화) 부위 등)을 활용할 수 있다. 따라서, 복합체에 의한 표적 유전자의 이러한 조절은 외인성, 합성, 및/또는 이종성 조절 서열, 예컨대 대상체 또는 숙주 세포와 관련하여 이종성인 프로모터, 인핸서, 억제인자, 사일렌서, 절연체, 시스-조절 요소, 트랜스-조절 요소, 후성적 변형(예를 들어, DNA 메틸화) 부위 등을 수반하지 않을 수도 있고 반드시 수반할 필요도 없다. 일부 실시양태에서, 복합체에 의한 표적 유전자의 조절은 조작된 유도성 시스템, 억제성 시스템, 및/또는 리포터 시스템의 사용을 수반하지 않는다. 일부 실시양태에서, 복합체에 의한 표적 유전자의 조절은 외인성, 조작된, 또는 합성 조절 요소의 사용을 수반하지 않으며, 예를 들어 테트라사이클린 또는 이의 유사체에 의해 조절되는 반응 요소를 수반하지 않는다. 일부 실시양태에서, 복합체에 의한 표적 유전자의 조절은 조작된 유도성 시스템, 억제성 시스템, 및/또는 리포터 시스템의 일부로서 기능하는 전사활성화제 또는 역전사활성화제의 사용을 수반하지 않는다. 일부 실시양태에서, 복합체에 의한 표적 유전자의 조절은 Tet off 또는 tTA 의존 시스템, 또는 이의 성분을 수반하지 않는다. 일부 실시양태에서, 복합체에 의한 표적 유전자의 조절은 Tet On 또는 rtTA 의존 시스템, 또는 이의 성분을 수반하지 않는다.
일부 경우에, 본원에 개시된 복합체(예를 들어, 하나 이상의 이종성 유전자 이펙터와 가이드 핵산을 포함하는 복합체)는 복합체가 표적 유전자의 발현을 증가시키거나 감소시키도록 직접적으로 또는 간접적으로 허용하는 제제와 같은 조절제에 의한 추가 제어 없이 표적 유전자(예를 들어, 표적 내인성 유전자)를 조절할 수 있다. 일부 실시양태에서, 복합체는 전사활성화제, 역전사활성화제, 소분자, 약물, 이량체화 또는 다량체화의 화학적 유도제, 추가 유도제, 추가 억제제, 또는 이들의 조합의 수반없이 표적 유전자를 조절할 수 있다. 예를 들어, 개별 복합체를 숙주 세포에 도입할 때(예를 들어, 개별 복합체의 각 개별 성분을 숙주 세포에 발현 및/또는 형질감염시키는 경우), 이러한 도입은 개별 복합체가 표적 유전자의 발현 또는 활성을 조절하도록 하기에 충분할 수 있다.
일부 실시양태에서, 복합체는 이종성 유전자 이펙터 및 가이드 모이어티를 포함한다. 일부 실시양태에서, 복합체는 하나의 이종성 유전자 이펙터 및 하나의 가이드 모이어티를 포함한다. 일부 실시양태에서, 복합체는 2개의 이종성 유전자 이펙터 및 하나의 가이드 모이어티를 포함한다. 일부 실시양태에서, 복합체는 3개의 이종성 유전자 이펙터 및 하나의 가이드 모이어티를 포함한다.
일부 실시양태에서, 복합체는 이종성 유전자 이펙터 및 가이드 핵산을 포함한다. 일부 실시양태에서, 복합체는 하나의 이종성 유전자 이펙터 및 하나의 가이드 핵산을 포함한다. 일부 실시양태에서, 복합체는 2개의 이종성 유전자 이펙터 및 하나의 가이드 핵산을 포함한다. 일부 실시양태에서, 복합체는 3개의 이종성 유전자 이펙터 및 하나의 가이드 핵산을 포함한다.
일부 실시양태에서, 복합체는 이종성 유전자 이펙터 및 뉴클레아제(예를 들어, 이종성 엔도뉴클레아제와 같은 뉴클레아제를 포함하는 가이드 모이어티)를 포함한다. 뉴클레아제와 이종성 유전자 이펙터의 조합은 뉴클레아제와 이종성 유전자 이펙터를 포함하는 키메라 융합 폴리펩티드일 수 있다. 일부 실시양태에서, 뉴클레아제 및 이종성 유전자 이펙터는 키메라 융합 폴리펩티드의 일부가 아니며, 예를 들어 동일한 폴리펩티드 사슬에 존재하지 않는다. 뉴클레아제와 이종성 유전자 이펙터의 조합은 역치 길이보다 짧은 길이를 가질 수 있다. 일부 실시양태에서, 이종성 유전자 이펙터 및 뉴클레아제의 합한 길이는 최대 약 1,200개 아미노산, 최대 약 1,100개 아미노산, 최대 약 1,000개 아미노산, 최대 약 950개 아미노산, 최대 약 900개 아미노산, 최대 약 850개 아미노산, 최대 약 800개 아미노산, 최대 약 750개 아미노산, 최대 약 700개 아미노산, 최대 약 650개 아미노산, 최대 약 600개 아미노산, 최대 약 550개 아미노산, 최대 약 500개 아미노산, 최대 약 450개 아미노산, 최대 약 400개 아미노산, 최대 약 350개 아미노산, 또는 최대 약 300개 아미노산이다. 일부 실시양태에서, 이종성 유전자 이펙터 및 뉴클레아제의 합한 길이는 적어도 약 300개 아미노산, 적어도 약 350개 아미노산, 적어도 약 400개 아미노산, 적어도 약 450개 아미노산, 적어도 약 500개 아미노산, 적어도 약 550개 아미노산, 적어도 약 600개 아미노산, 적어도 약 650개 아미노산, 적어도 약 700개 아미노산, 적어도 약 750개 아미노산, 적어도 약 800개 아미노산, 적어도 약 850개 아미노산, 적어도 약 900개 아미노산, 적어도 약 950개 아미노산, 적어도 약 1,000개 아미노산, 적어도 약 1,100개 아미노산, 또는 적어도 약 1,200개의 아미노산이다.
본원에 개시된 복합체는 (i) 가이드 모이어티(예를 들어, 뉴클레아제 또는 이의 일부, 예컨대 뉴클레아제 불활성화된 Cas, 예를 들어 뉴클레아제 불활성화된 Cas9, Cas12a, 또는 Un1Cas12f1, 선택적으로 가이드 핵산 서열을 갖는다), 및 (ii) 이종성 유전자 이펙터를 포함할 수 있으며, 여기서 이종성 유전자 이펙터는 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상과, 예를 들어 전체 길이에 걸쳐, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
일부 실시양태에서, 본원에 개시된 복합체는 (i) 가이드 모이어티(예를 들어, 가이드 핵산 서열 및/또는 뉴클레아제 또는 이의 일부, 예컨대 뉴클레아제 불활성화된 Cas, 예를 들어 뉴클레아제 불활성화된 Cas9, Cas12a, 또는 Un1Cas12f1), 및 (ii) 이종성 유전자 이펙터를 포함하며, 여기서 이종성 유전자 이펙터는 서열번호: 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23631, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 97.5%, 적어도 약 98%, 적어도 약 98.5%, 적어도 약 99%, 적어도 약 99.5%, 적어도 약 99.9%, 또는 약 100% 서열 동일성 또는 서열 유사성을 갖는 펩티드 서열을 포함하거나, 본질적으로 구성되거나, 구성된다.
복합체에 존재하는 두 성분은 공유적으로 연결될 수 있으며, 예를 들어 융합 단백질에 존재하거나 가교 연결될 수 있으며, 예를 들어 가교제로 처리되거나, 본원에 개시된 바와 같은 펩티드 또는 비펩티드 링커에 의해 연결될 수 있다.
일부 실시양태에서, 복합체에 존재하는 두 성분은 동일한 융합 단백질의 일부이다. 상기 성분은 임의로 펩티드 링커 또는 비펩티드 링커와 같은 링커에 의해 연결될 수 있다.
일부 실시양태에서, 가이드 모이어티 또는 이의 일부(예, 뉴클레아제, 예컨대 dCas9)는 링커에 의해 이종성 유전자 이펙터에 연결된다. 일부 실시양태에서, 상기 가이드 모이어티 또는 이의 일부는 동일하거나 상이한 제2 링커에 의해 제2의 이종성 유전자 이펙터에 추가로 연결된다. 일부 실시양태에서, 가이드 모이어티 또는 이의 일부(예, 뉴클레아제, 예컨대 dCas9)는 링커없이 이종성 유전자 이펙터에 융합된다.
일부 실시양태에서, 가이드 모이어티 또는 이의 일부(예, 뉴클레아제, 예컨대 dCas9)는 링커에 의해 올리고머화 도메인 또는 이량체화(예를 들어 이종성이량체화) 도메인에 연결된다. 일부 실시양태에서, 가이드 모이어티 또는 이의 일부는 동일하거나 상이한 제2 링커에 의해 제2 올리고머화 도메인 또는 이량체화(예를 들어, 이종성이량체화) 도메인에 추가로 연결된다. 일부 실시양태에서, 가이드 모이어티 또는 이의 일부(예를 들어, 뉴클레아제, 예컨대 dCas9)는 링커 없이 제2 올리고머화 도메인 또는 이량체화(예를 들어, 이종성이량체화) 도메인에 융합된다.
일부 실시양태에서, 이종성 유전자 이펙터는 링커에 의해 제2 이종성 유전자 이펙터에 연결된다. 일부 실시양태에서, 이종성 유전자 이펙터는 동일하거나 상이한 제2 링커에 의해 제3 이종성 유전자 이펙터에 추가로 연결된다. 일부 실시양태에서, 이종성 유전자 이펙터는 링커 없이 제2 이종성 유전자 이펙터에 융합된다.
일부 실시양태에서, 이종성 유전자 이펙터는 링커에 의해 올리고머화 도메인 또는 이량체화(예를 들어, 이종성이량체화) 도메인에 연결된다. 일부 실시양태에서, 이종성 유전자 이펙터는 동일하거나 상이한 제2 링커에 의해 제2 올리고머화 도메인 또는 이량체화(예를 들어, 이종성이량체화) 도메인에 추가로 연결된다. 일부 실시양태에서, 이종성 유전자 이펙터는 링커 없이 제2 올리고머화 도메인 또는 이량체화(예를 들어, 이종성이량체화) 도메인에 융합된다.
임의의 적합한 링커가 사용될 수 있다. 유연한 링커는 글리신과 세린 잔기의 스트레칭을 포함하는 서열을 가질 수 있다. 글리신과 세린 잔기의 작은 크기는 유연성을 제공하고 연결된 기능성 도메인의 이동성을 허용한다. 세린 또는 트레오닌의 결합은 물 분자와 수소 결합을 형성함으로써, 이에 의해 링커와 단백질 모이어티 사이의 불리한 상호 작용을 줄여 수용액에서 링커의 안정성을 유지할 수 있다. 유연한 링커에는 유연성을 유지하기 위해 트레오닌 및 알라닌과 같은 추가 아미노산뿐만 아니라 용해도를 향상시키기 위해 라이신 및 글루타민과 같은 극성 아미노산도 포함될 수 있다. 강성 링커는 예를 들어 알파 나선 구조를 가질 수 있다. 알파-나선형 강성 링커는 단백질 도메인 사이의 스페이서 역할을 할 수 있다. 링커의 비제한적 예에는 표 2의 서열, 및 이의 반복부, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 반복부가 포함된다. 서열번호: 1-6은 유연한 링커 또는 이의 하위유닛을 제공한다. 서열번호: 7-10은 경질 링커 또는 이의 하위유닛을 제공한다.
[표 2]
링커 서열은 길이가 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개의 아미노산일 수 있다.
일부 실시양태에서, 링커는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 5개, 적어도 7개, 적어도 9개, 적어도 11개, 적어도 13개, 적어도 15개, 또는 적어도 20개 아미노산이다. 일부 실시양태에서, 링커는 최대 5개, 최대 7개, 최대 9개, 최대 11개, 최대 13개, 최대 15개, 최대 20개, 최대 25개, 최대 30개, 최대 40개, 또는 최대 50개의 아미노산이다.
일부 실시양태에서, 비펩티드 링커가 사용된다. 비펩티드 링커는 예를 들어 화학적 링커일 수 있다. 본 개시내용의 복합체의 두 부분은 화학적 링커에 의해 연결될 수 있다. 본 개시내용의 각각의 화학적 링커는 알킬렌, 알케닐렌, 알키닐렌, 헤테로알킬렌, 사이클로알킬렌, 헤테로사이클로알킬렌, 아릴렌, 또는 헤테로아릴렌일 수 있으며, 이들 중 임의의 것은 선택적으로 치환된다. 일부 실시양태에서, 본 개시내용의 화학적 링커는 에스테르, 에테르, 아미드, 티오에테르, 또는 폴리에틸렌글리콜(PEG)일 수 있다. 일부 실시양태에서, 링커는, 예를 들어 링커에 의해 연결된 아미노산 서열이 머리 대 꼬리가 아닌 머리 대 머리가 되도록 화합물 내 아미노산 서열의 순서를 역전시킬 수 있다. 이러한 링커의 비제한적 예에는 옥살릴 디에스테르, 말로닐 디에스테르, 숙시닐 디에스테르, 글루타릴 디에스테르, 아디필 디에스테르, 피메틸 디에스테르, 푸마릴 디에스테르, 말레일 디에스테르, 프탈릴 디에스테르, 이소프탈릴 디에스테르, 및 테레프탈릴 디에스테르와 같은 디카르복실산의 디에스테르가 포함된다. 이러한 링커의 비제한적인 예에는 옥살릴 디아미드, 말로닐 디아미드, 숙시닐 디아미드, 글루타릴 디아미드, 아디필 디아미드, 피메틸 디아미드, 푸마릴 디아미드, 말레일 디아미드, 프탈릴 디아미드, 이소프탈릴 디아미드, 및 테레프탈릴 디아미드와 같은 디카르복실산의 디아미드가 포함된다. 이러한 링커의 비제한적인 예에는 예를 들어 에틸렌 디아민, 1,2-디(메틸아미노)에탄, 1,3-디아미노프로판, 1,3-디(메틸아미노)프로판, 1,4-디(메틸아미노)부탄, 1,5-디(메틸아미노)펜탄, 1,6-디(메틸아미노)헥산, 및 피피리진과 같은 디아미노 링커의 디아미드가 포함된다. 선택적 치환기의 비제한적 예에는 하이드록실 그룹, 술프하이드릴 그룹, 할로겐, 아미노 그룹, 니트로 그룹, 니트로소 그룹, 시아노 그룹, 아지도 그룹, 술폭사이드 그룹, 술폰 그룹, 술폰아미드 그룹, 카르복실 그룹, 카르복스알데히드 그룹, 이민 그룹, 알킬 그룹, 할로-알킬 그룹, 알케닐 그룹, 할로-알케닐 그룹, 알키닐 그룹, 할로-알키닐 그룹, 알콕시 그룹, 아릴 그룹, 아릴옥시 그룹, 아르알킬 그룹, 아릴알콕시 그룹, 헤테로사이클릴 그룹, 아실 그룹, 아실옥시 그룹, 카바메이트 그룹, 아미드 그룹, 우레이도 그룹, 에폭시 그룹, 및 에스테르 그룹이 포함된다.
복합체에 존재하는 두 성분은 예를 들어 이온 결합, 수소 결합, 본원에 개시된 올리고머화 또는 이량체화 도메인에 의해 매개되는 상호작용 등에 의해 비공유적으로 결합될 수 있다.
일부 실시양태에서, 가이드 모이어티 또는 이의 일부(예를 들어, dCas9와 같은 뉴클레아제)는 비공유 결합에 의해 이종성 유전자 이펙터에 연결된다. 일부 실시양태에서, 가이드 모이어티 또는 이의 일부는 비공유 결합에 의해 제2의 이종성 유전자 이펙터에 추가로 연결된다. 일부 실시양태에서, 가이드 모이어티 또는 이의 일부는 제1 이종성 유전자 이펙터에 공유적으로(예를 들어, 융합 단백질로서, 선택적으로 링커와 함께) 연결되고, 가이드 모이어티 또는 이의 일부는 비-공유 결합에 의해 추가로 제2의 이종성 유전자 이펙터에 연결된다.
일부 실시양태에서, 가이드 모이어티 또는 이의 일부(예를 들어, dCas9와 같은 뉴클레아제)는 비-공유 결합에 의해 올리고머화 도메인 또는 이량체화(예를 들어 이종성이량체화) 도메인에 연결된다. 일부 실시양태에서, 가이드 모이어티 또는 이의 일부는 비-공유 결합에 의해 제2 올리고머화 도메인 또는 이량체화(예를 들어, 이종성이량체화) 도메인에 추가로 연결된다. 일부 실시양태에서, 가이드 모이어티 또는 이의 일부(예를 들어, 뉴클레아제, 예컨대 dCas9)는 공유 결합에 의해(예를 들어, 융합되고, 선택적으로 링커에 의해) 제1 올리고머화 도메인 또는 이량체화(예를 들어, 이종성이량체화) 도메인에 융합되고 비-공유 결합에 의해 제2의 올리고머화 도메인 또는 이량체화(예: 이종성이량체화) 도메인에 연결된다.
일부 실시양태에서, 가이드 모이어티의 제1 성분(예를 들어, 가이드 핵산)은 가이드 모이어티의 제2 성분(예를 들어, 뉴클레아제)에 비공유적으로 연결된다. 일부 실시양태에서, 가이드 모이어티의 제1 성분(예를 들어, 가이드 핵산)은 가이드 모이어티의 제2 성분(예를 들어, 뉴클레아제)에 공유적으로 연결된다.
공유 및 비공유 결합의 임의의 조합이 본 개시내용의 복합체에 사용될 수 있는데, 예를 들어, 하나 이상의 이종성 유전자 이펙트는 가이드 모이어티에 비공유적으로 융합될 수 있고, 하나 이상의 올리고머화 도메인은 복합체의 성분(예: 뉴클레아제)에 공유적으로 결합될 수 있다.
일부 실시양태에서, 증가된 또는 감소된 안정성을 제공하는 폴리펩티드는 본 개시내용의 복합체의 성분, 예를 들어 가이드 모이어티 또는 이종성 유전자 이펙터에 융합되거나 달리 회합된다. 융합된 폴리펩티드는 N-말단, C-말단에 위치하거나, 융합 단백질 내부에 위치할 수 있다.
일부 실시양태에서, 본 개시내용의 복합체의 하나 이상의 성분은 바람직한 세포하 국소화, 예를 들어 내부 핵막, 외부 핵막, 카잘체, 핵반점, 핵공복합체, PML체, 핵소체, P과립, GW체, 스트레스과립, 해면체, 소포체, 미토콘드리아 등에 표적화하기 위한 핵 국소화 신호 또는 단백질로의 국소화를 지시하는 도메인에 융합된다.
일부 실시양태에서, 본 개시내용의 복합체는 제1 올리고머화(예를 들어, 이량체화) 도메인에 연결된 제1 단백질, 및 제2 올리고머화(예를 들어, 이량체화) 도메인에 연결된 제2 단백질을 포함한다. 일부 실시양태에서, 올리고머화 도메인 또는 이량체화 도메인은 펩티드 상호작용 도메인, 예를 들어, sgRNA2.0, SAM, SunTag, RAB, FLAG-비오틴, 또는 본원에 개시된 유도성 올리고머화(예를 들어, 이량체화) 시스템을 활용하는 시스템을 포함할 수 있다.
이종성 유전자 이펙터의 조합을 포함하는 복합체
일부 실시양태에서, 2개 이상의 이종성 유전자 이펙터를 포함하는 복합체, 및 이를 확인하기 위한 시스템 및 방법이 본원에 개시된다.
일부 실시양태에서, 본원에 개시된 바와 같이 관심 유전자좌에 2개 이상의 이종성 유전자 이펙터를 동원하면 이종성 유전자 이펙터 단독에 비해 우수한 전사 조절, 예를 들어 표적 유전자(예: 표적 내인성 유전자) 발현의 보다 강력하고/하거나 지속적인 조절이 발생할 수 있다.
일부 실시양태에서, 본 개시내용의 복합체에서 본원에 개시된 바와 같은 관심 유전자좌에 대한 2개 이상의 이종성 유전자 이펙터를 동원하는 것은 이종성 유전자 이펙터의 조합을 개별적으로 동원하는 것에 비해 우수한 전사 조절, 즉 본 개시내용의 복합체에는 존재하지 않는 우수한 조절이 발생할 수 있다. 우수한 전사 조절은 예를 들어 표적 유전자(예를 들어 표적 내인성 유전자) 발현(예를 들어 활성화 또는 억제)의 더욱 강력하고/하거나 지속적인 조절을 포함할 수 있다.
일부 실시양태에서, 본 개시내용의 분석 시스템, 예를 들어 고처리량 스크린은 원하는 결과, 예를 들어 표적 유전자(예를 들어, 표적 내인성 유전자) 또는 유전자 세트의 발현 증가, 표적 유전자 또는 유전자 세트의 발현 감소, 특정 역치 이상의 발현 증가, 특정 역치 이하의 발현 감소, 원하는 시간 동안 원하는 역치 이상 또는 이하의 발현 지속, 등을 성취하는데 적합한 이종성 유전자 이펙터의 조합을 확인하는데 사용된다.
본 개시내용의 복합체에 존재하고/하거나 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하는 유전자좌에 동원되는 이종성 유전자 이펙터의 조합은 정상적인 생체 내 상황에서는(예를 들어, 세포 유형 공급원, 유기체, 조직 특이적 발현, 주어진 세포 이하 구획 또는 소기관으로의 국소화, 보조 인자, 구조적, 또는 복합적 요구 사항 등으로 인해) 상호작용하지 않지만, 그럼에도 불구하고 예를 들어, 본 개시내용의 복합체에서 관심 표적 유전자좌에 직교적으로 동원될 때 목적하는 후성적 및/또는 전사 효과를 중재하는 인자의 조합일 수 있다.
일부 실시양태에서, 본 개시내용의 복합체에 존재하는 이종성 유전자 이펙터의 조합은 상이한 공급원, 예를 들어 인간 단백질, 바이러스 단백질, 포유동물 단백질, 주로 핵에 국한되는 단백질, 염색질 조절인자, 이종성염색질 형성을 촉진하는 인자, 메틸화를 통해 히스톤을 조절하는 인자, 아세틸화를 통해 히스톤을 조절하는 인자, 인산화를 통해 히스톤을 조절하는 인자, ADP-리보실화를 통해 히스톤을 조절하는 인자, 글리코실화를 통해 히스톤을 조절하는 인자, SUMO화를 통해 히스톤을 조절하는 인자, 유비퀴틴화를 통해 히스톤을 조절하는 인자, 예를 들어 ATP 가수분해 의존 과정을 통해 히스톤 구조를 리모델링하여 히스톤을 조절하는 인자, 히스톤 아세틸트랜스퍼라제, 히스톤 라이신 메틸트랜스퍼라제, 염색질 리모델링 복합체의 성분, 전사 조절인자, 전사 활성화제, 전사 억제인자 도메인, 전사 인자, 중간엽 줄기 세포 전사 인자, 배아 줄기 세포 전사 인자, 유도 만능 줄기 세포( iPSC) 전사 인자, 상피 줄기 세포 전사 인자, 암 줄기 세포 전사 인자, 암 관련 전사 인자, 면역세포 전사 인자, 핵 수용체, 핵 호르몬 수용체, 검증된 인간 바이러스 전사 조절인자, 바이러스 게놈(예를 들어, 본원에 개시된 바이러스 계열, 하위계열, 속, 종 등)으로부터의 인자, 인간에게 인수공통감염이 가능한 바이러스 게놈으로부터의 인자, 공유된 인간/박쥐 바이러스로부터의 인자, 메타게놈 조사에서 나온 바이러스 게놈의 인자, 인간 장에서 발견된 바이러스의 인자, 극한 환경에서 발견된 바이러스의 인자, 문서화된 높은 수준의 전사 조절인자 모듈성이 있는 바이러스 또는 단백질 클래스의 인자, 또는 본원에 개시된 또 다른 공급원 중 임의의 2개 이상으로부터 유래된다.
일부 실시양태에서, 본 개시내용의 복합체에 존재하는 이종성 유전자 이펙터의 조합은 동일하거나 유사한 공급원으로부터 유래하는데, 예를 들어, 2개 이상의 이종성 유전자 이펙터 중 각각은 인간 단백질, 바이러스성 단백질, 포유류 단백질, 주로 핵에 국한되는 단백질, 염색질 조절인자, 이종성염색질 형성을 촉진하는 인자, 메틸화를 통해 히스톤을 조절하는 인자, 아세틸화를 통해 히스톤을 조절하는 인자, 인산화를 통해 히스톤을 조절하는 인자, ADP-리보실화를 통해 히스톤을 조절하는 인자, 글리코실화를 통해 히스톤을 조절하는 인자, SUMO화를 통해 히스톤을 조절하는 인자, 유비퀴틴화를 통해 히스톤을 조절하는 인자, 예를 들어 ATP 가수분해 의존 과정을 통해 히스톤 구조를 리모델링하여 히스톤을 조절하는 인자, 히스톤 아세틸트랜스퍼라제, 히스톤 라이신 메틸트랜스퍼라제, 염색질 리모델링 복합체의 성분, 전사 조절인자, 전사 활성화제, 전사 억제 도메인, 전사 인자, 중간엽 줄기 세포 전사 인자, 배아 줄기 세포 전사 인자, 유도 만능 줄기 세포(iPSC) 전사 인자, 상피 줄기 세포 전사 인자, 암 줄기 세포 전사 인자, 암 관련 전사 인자, 면역 세포 전사 인자, 핵 수용체, 핵 호르몬 수용체, 검증된 인간 바이러스 전사 조절인자, 바이러스 게놈(예를 들어, 본원에 개시된 바이러스 계열, 하위계열, 속, 종 등으로부터 유래)으로부터의 인자, 인간에게 인수공통감염이 가능한 바이러스 게놈으로부터의 인자, 공유된 인간/박쥐 바이러스의 인자, 메타게놈 조사의 바이러스 게놈 인자, 인간 장에서 발견된 바이러스의 인자, 극한 환경에서 발견된 바이러스의 인자, 바이러스 또는 높은 수준의 문서화된 전사 조절 모듈성을 갖는 바이러스 또는 단백질 클래스의 인자, 또는 본원에 개시된 또 다른 공급원으로부터의 서열을 함유한다.
일부 실시양태에서, 복합체는 동일하거나 유사한 공급원으로부터 유래된 2개 이상의 이종성 유전자 이펙터 및 상이한 공급원으로부터 유래된 2개 이상의 이종성 유전자 이펙터를 포함한다.
본 개시내용의 복합체에 존재하는 2개의 이종성 유전자 이펙터는 복합체에 공유적으로 연결될 수 있으며, 예를 들어 융합 단백질에 존재하거나, 본원의 다른 곳에 개시된 임의의 방식으로 가교결합제 등으로 처리될 수 있다.
본 개시내용의 복합체에 존재하는 2개의 이종성 유전자 이펙터는 본원의 다른 곳에서 개시된 바와 같은 임의의 방식으로, 예를 들어 이온 결합, 수소 결합, 유도성 및/또는 가역성 시스템 등을 사용하여 복합체에 비공유적으로 회합될 수 있다.
본 개시내용의 복합체에 존재하는 2개의 이종성 유전자 이펙터는 유도성 시스템을 사용하여 복합체와 회합될 수 있다. 일부 실시양태에서, 상기 유도성 시스템은 예를 들어 유도제를 중단하거나, 해리제로 처리할 때 가역적이다.
복합체 성분을 회합시키기 위한 유도성 시스템은 회합될 단백질에 이량체화, 올리고머화, 또는 다량체화 도메인을 융합시키는 것을 포함할 수 있다. 일부 실시양태에서, 이량체화, 올리고머화, 또는 다량체화 도메인은 회합될 단백질의 N-말단에 융합된다. 일부 실시양태에서, 이량체화, 올리고머화, 또는 다량체화 도메인은 회합될 단백질의 C-말단에 융합된다. 일부 실시양태에서, 이량체화, 올리고머화, 또는 다량체화 도메인은 회합될 단백질의 N-말단 및 C-말단에 융합된다(예를 들어, N-말단 및 C-말단에서 동일하거나 상이한 이량체화, 올리고머화 또는 다량체화 도메인). 일부 실시양태에서, 이량체화, 올리고머화, 또는 다량체화 도메인은 회합될 단백질의 아미노산 서열 내에 인-프레임으로 추가된다.
복합체 성분을 회합하기 위한 유도 시스템은 화학적으로 유도가능한 시스템일 수 있다. 화학적으로 유도가능한 시스템의 비제한적 예로는 소분자 유도 시스템, 테트라사이클린 또는 독시사이클린 기반 시스템, 포나스테론 A 기반 시스템, 아브시스산(ABA) 유도 ABI-PYL1, 지베렐린(GA) 유도 GID1-GAI, 라파마이신 유도 FKBP-FRB, TMP-Htag 유도 HaloTag/DHFR 이량체화 시스템, 효소 촉매 반응을 사용하는 이량체화 시스템, 및 유도성 성분의 조합을 활용하는 시스템이 포함된다.
복합체 성분을 회합하기 위한 유도 시스템은 광 유도 시스템(예: 광유전 시스템)일 수 있다. 광 유도 시스템의 비제한적인 예로는 피토크롬 기반 적색광 유도 PHYB-PIF, 크립토크롬(cryptochrome) 기반 청색광 유도 CRY2PHR-CIBN, 가벼운 산소 전압 기반 청색광 유도 FKF1-GI, pMAG, nMAG, BphS, 및 유도성 성분의 조합을 활용하는 시스템이 포함된다.
일부 실시양태에서, 본 개시내용의 복합체의 성분은 애기장대(Arabidopsis thaliana)로부터의 유도성 및 가역성 이종성이량체 단백질 쌍(PYL1-ABI 및 GID1-GAI)을 사용하여 연관된다. 이 시스템의 이종성이량체화 도메인을 두 개의 개별적으로 발현된 폴리펩티드 각각에 융합하면 유도제(식물 호르몬 ABA 및 GA)로 처리 시 폴리펩티드의 회합이 가능해진다.
예를 들어, 이종성이합체 쌍의 한 단백질을 가이드 모이어티(예: dCas9)에 융합하고 다른 단백질을 이종성 유전자 이펙터에 융합함으로써, 가이드 모이어티에 대한 이펙터의 모집이 적절한 식물 호르몬을 첨가함으로써 달성될 수 있다. 제2 이종성 유전자 이펙터의 모집은 유사하게 제2 이종성이량체 쌍의 한 단백질을 가이드 모이어티에 융합시키고 다른 단백질을 제2 이종성 유전자 이펙터에 융합시킴으로써 달성될 수 있다. 일부 실시양태에서, 동일한 시스템의 대안적인 유도 시스템은 예를 들어 하나의 이종성 유전자 이펙터와 뉴클레아제 사이의 복합체 형성을 가역적으로 유도하기 위해 2개 이상의 서로 다른 이종성 유전자 이펙터를 포함하지 않는 복합체의 성분을 회합시키는 데 사용된다.
일부 실시양태에서, 유도 시스템의 성분은 본 개시내용의 세포에서 일시적으로 또는 영구적으로 발현될 수 있다. 예를 들어, 세포는 GAI와 ABI의 이종성이량체화 도메인의 융합을 통해 가이드 모이어티(예: dCas9)를 일시적으로 또는 안정적으로 발현하도록 형질도입될 수 있다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 높은 수준의 문서화된 전사 조절인자 모듈성을 갖는 후보 이종성 유전자 이펙터를 활용한다. 일부 실시양태에서, 고도로 문서화된 전사 조절인자 모듈성을 갖는 이종성 유전자 이펙터는 다른 유전자 이펙터와 조합하여 유용할 수 있으며, 예를 들어 유전자 전사에 대한 조합 또는 상승적 효과를 촉진할 가능성이 더 높을 수 있다. 예를 들어, 이 시스템을 사용하면 후보 이펙터 도메인을 직교 모집하여 편견 없는 방식으로 수천 가지 가능한 조합을 테스트할 수 있다. 상기 시스템의 유도성과 가역성을 통해 전사 활성화 또는 억제에 대해 관찰된 효과의 지속성을 평가할 수 있다. 상기 시스템의 양태(예를 들어, AND, OR, NAND, 및 NOR 논리 작동자와 하나의 유도제로 유전자 발현을 활성화하고 다른 유도제로 억제하는 직경 조절인자를 허용하는)는 문헌: Gao et al., "직교 및 유도성 dCas9 조절인자를 사용한 복합체 전사 조절" Nature methods 13.12(2016): 1043-1049에 기재되어 있다.
일부 실시양태에서, 복합체는 염색질 조절인자와 전사 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 제1 염색질 조절인자와 제2 염색질 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 제1 전사 조절인자와 제2 전사 조절인자의 조합을 포함한다.
일부 실시양태에서, 복합체는 적어도 하나의 염색질 조절인자와 적어도 하나의 전사 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 제1 염색질 조절인자와 적어도 제2 염색질 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 제1 전사 조절인자와 적어도 제2의 전사 조절인자의 조합을 포함한다.
일부 실시양태에서, 복합체는 염색질 조절인자와 2개의 전사 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 전사 조절인자와 2개의 염색질 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 3개의 염색질 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 3개의 전사 조절인자의 조합을 포함한다.
일부 실시양태에서, 복합체는 적어도 하나의 염색질 조절인자와 적어도 2개의 전사 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 적어도 하나의 전사 조절인자와 적어도 2개의 염색질 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 적어도 3개의 염색질 조절인자의 조합을 포함한다. 일부 실시양태에서, 복합체는 적어도 3개의 전사 조절인자의 조합을 포함한다.
본 개시내용의 복합체는 임의의 적합한 수의 이종성 유전자 이펙터, 예를 들어 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개를 포함할 수 있다. 일부 실시양태에서, 본 개시내용의 복합체는 최대 2개, 최대 3개, 최대 4개, 또는 최대 5개의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 본 개시내용의 복합체는 1 - 5, 1 - 4, 1 - 3, 1 - 2, 2 - 5, 2 - 4, 2 - 3, 3 - 5, 3 - 4, 또는 4 - 5개의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 본 개시내용의 복합체는 최대 1개, 최대 2개, 최대 3개, 최대 4개, 최대 5개, 최대 6개, 최대 7개, 최대 8개, 최대 9개, 또는 최대 10개의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 본 개시내용의 복합체는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 본 개시내용의 복합체는 1개의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 본 개시내용의 복합체는 2개의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 본 개시내용의 복합체는 3개의 이종성 유전자 이펙터를 포함한다.
일부 실시양태에서, 2개의 이종성 유전자 이펙터는 본 개시내용의 복합체에 존재하고/하거나 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하는 유전자좌에 모집된다. 일부 실시양태에서, 3개의 이종성 유전자 이펙터는 본 개시내용의 복합체에 존재하고/하거나 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하는 유전자좌에 모집된다. 일부 실시양태에서, 4개의 이종성 유전자 이펙터는 본 개시내용의 복합체에 존재하고/하거나 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하는 유전자좌에 모집된다. 일부 실시양태에서, 5개의 이종성 유전자 이펙터는 본 개시내용의 복합체에 존재하고/하거나 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하는 유전자좌에 모집된다.
2개 이상의 이종성 유전자 이펙터가 본 개시내용의 복합체에 존재하고/하거나 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하는 유전자좌에 모집되는 경우, 이종성 유전자 이펙터는 동일하거나 상이할 수 있다. 일부 실시양태에서, 본 개시내용의 복합체에 존재하고/하거나 표적 유전자의 발현을 조절하는 유전자좌에 모집되는 2개의 이종성 유전자 이펙터는 서로 상이하다(예를 들어, 다른 단백질 기원으로부터 유래됨). 일부 실시양태에서, 본 개시내용의 복합체에 존재하고/하거나 표적 유전자의 발현을 조절하는 유전자좌에 모집되는 3개의 이종성 유전자 이펙터는 서로 상이하다(예를 들어, 다른 단백질 기원으로부터 유래됨).
일부 실시양태에서, 본 개시내용의 복합체는 P300, TET1, TET2, TET3, 및/또는 HSF1이 아니거나 이로로부터의 서열을 포함하지 않는 적어도 하나의 이종성 유전자 이펙터를 포함한다.
일부 실시양태에서, 본 개시내용의 복합체는 VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR(Vp64+p65+Rta)가 아니거나 이들로부터의 서열을 포함하지 않는 적어도 하나의 이종성 유전자 이펙터를 포함한다.
일부 실시양태에서, 본 개시내용의 복합체는 KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개의 아미노산, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A가 아니거나 이들로부터의 서열을 포함하지 않는 적어도 하나의 이종성 유전자 이펙터를 포함한다.
표적 유전자
본 개시내용은 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현을 조절하기 위한 조성물, 방법 및 시스템을 제공한다. 예를 들어, 표적 유전자의 활성 또는 발현 수준을 증가시키거나 감소시킬 수 있는 가이드 모이어티 및 하나 이상의 이종성 유전자 이펙터를 포함하는 복합체가 본원에 개시되어 있다.
일부 실시양태에서, 표적 유전자 또는 이의 조절 서열은 대상체에 내인성이며, 예를 들어 대상체의 게놈에 존재한다. 일부 실시양태에서, 표적 유전자 또는 이의 조절 서열은 조작된 리포터 시스템의 일부가 아니다.
일부 실시양태에서, 표적 유전자는 숙주 대상체에 대해 외인성이며, 예를 들어 병원체 표적 유전자 또는 유전자 요법 및/또는 세포 요법과 같은 치료적 개입의 결과로 발현되는 외인성 유전자이다. 일부 실시양태에서, 표적 유전자는 본원에 개시된 리포터 유전자(예를 들어, 형광 단백질)와 같은 외인성 리포터 유전자이다. 일부 실시양태에서, 표적 유전자는 외인성 합성 유전자이다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자의 발현을 증가시킬 수 있다(예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때). 일부 실시양태에서, 발현 수준은 RNA 발현 수준이며, 예를 들어 RNAseq, qPCR, 마이크로어레이, 유전자 어레이, FISH 등에 의해 측정될 수 있다. 일부 실시양태에서, 발현 수준은 단백질 발현 수준이고, 예를 들어, 웨스턴 블롯, ELISA, 다중 면역분석법, 질량 분석법, NMR, 단백질체학, 유세포분석법, 질량 세포측정법 등에 의해 측정될 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 11배, 적어도 12배, 적어도 13배, 적어도 14배, 적어도 15배, 적어도 20배, 적어도 30배, 적어도 40배, 적어도 50배, 적어도 60배, 적어도 70배, 적어도 80배, 적어도 90배, 적어도 100배, 적어도 150배, 적어도 200배, 적어도 250배, 적어도 300배, 적어도 350배, 적어도 400배, 적어도 500배, 적어도 600배, 적어도 700배, 적어도 800배, 적어도 900배, 적어도 1000배, 적어도 1500배, 적어도 2000배, 또는 적어도 3000배 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현을 최대 50%, 최대 60%, 최대 70%, 최대 80%, 최대 90%, 최대 2배, 최대 3배, 최대 4배, 최대 5배, 최대 6배, 최대 7배, 최대 8배, 최대 9배, 최대 10배, 최대 11배, 최대 12배, 최대 13배, 최대 14배, 최대 15배, 최대 20배, 최대 30배, 최대 40배, 최대 50배, 최대 60배, 최대 70배, 최대 80배, 최대 90배, 최대 100배, 최대 150배, 최대 200배, 최대 250배, 최대 300배, 최대 350배, 최대 400배, 최대 500배, 최대 600배, 최대 700배, 최대 800배, 최대 900배, 최대 1000배, 최대 1500배, 최대 2000배, 최대 3000배, 최대 5000배, 또는 최대 10000배 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 약 250배, 약 300배, 약 350배, 약 400배, 약 500배, 약 600배, 약 700배, 약 800배, 약 900배, 약 1000배, 약 1500배, 약 2000배, 약 3000배, 약 5000배, 또는 약 10000배 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현 수준을 검출 한계 미만에서 검출 가능한 수준까지 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 11배, 적어도 12배, 적어도 13배, 적어도 14배, 적어도 15배, 적어도 20배, 적어도 30배, 적어도 40배, 적어도 50배, 적어도 60배, 적어도 70배, 적어도 80배, 적어도 90배, 적어도 100배, 적어도 150배, 적어도 200배, 적어도 250배, 적어도 300배, 적어도 350배, 적어도 400배, 적어도 500배, 적어도 600배, 적어도 700배, 적어도 800배, 적어도 900배, 적어도 1000배, 적어도 1500배, 적어도 2000배, 또는 적어도 3000배까지 감소시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현을 최대 50%, 최대 60%, 최대 70%, 최대 80%, 최대 90%, 최대 2배, 최대 3배, 최대 4배, 최대 5배, 최대 6배, 최대 7배, 최대 8배, 최대 9배, 최대 10배, 최대 11배, 최대 12배, 최대 13배, 최대 14, 최대 15배, 최대 20배, 최대 30배, 최대 40배, 최대 50배, 최대 60배, 최대 70배, 최대 80배, 최대 90배, 최대 100배, 최대 150배, 최대 200배, 최대 250배, 최대 300배, 최대 350배, 최대 400배, 최대 500배, 최대 600배, 최대 700배, 최대 800배, 최대 900배, 최대 1000배, 최대 1500배, 최대 2000배, 최대 3000배, 최대 5000배, 또는 최대 10000배 감소시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 약 250배, 약 300배, 약 350배, 약 400배, 약 500배, 약 600배, 약 700배, 약 800배, 약 900배, 약 1000배, 약 1500배, 약 2000배, 약 3000배, 약 5000배, 또는 약 10000배 감소시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 발현 수준을 검출 가능한 수준에서 검출 한계 미만으로 감소시킬 수 있다.
일부 실시양태에서, 발현 변화 정도는 복합체를 세포 또는 세포 집단에 도입하기 전과 대비된 것이다. 일부 실시양태에서, 발현 변화 정도는 복합체로 처리되지 않은 상응하는 대조 세포 또는 세포 집단과 대비된 것이다. 일부 실시양태에서, 발현 변화의 정도는 대체 복합체 또는 유전자 발현 조절인자, 예를 들어 대체 이종성 유전자 이펙터 또는 이들의 조합을 포함하는 복합체, 또는 표적 유전자의 발현을 조절하는 다른 물질로 처리한 상응하는 세포 또는 세포 집단과 대비된 것이다. 일부 실시양태에서, 발현 변화의 정도는 P300, TET1, TET2, TET3, HSF1, VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1 및/또는 VPR(Vp64+p65+Rta), KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, DNMT3A 이소형 1의 마지막 301개 아미노산, DCAS9-KRAB-MECP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DT3A, KRAB-DT3A 3L, LSD1, M.SSSI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다.
일부 실시양태에서, 발현 변화 정도는 VPR로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 변화의 정도는 KRAB 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 변화의 정도는 VP64 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 변화의 정도는 Rta 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 변화의 정도는 p65 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 변화의 정도는 KAL인 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자의 활성 수준을 증가시킬 수 있다(예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때). 활성 수준은 표적 유전자의 기능적 특성에 따라 문제의 표적 유전자에 대한 적절한 기능 분석을 통해 결정될 수 있다. 예를 들어, 미토겐인 표적 유전자의 활성 수준은 세포 증식을 측정함으로써 결정될 수 있으며; 세포사멸을 유도하는 표적 유전자의 활성 수준은 아넥신 V 분석 또는 기타 적합한 세포 사멸 분석에 의해 측정될 수 있고; 항염증 사이토카인의 활성 수준은 LPS 유도 사이토카인 방출 분석으로 측정할 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 11배, 적어도 12배, 적어도 13배, 적어도 14배, 적어도 15배, 적어도 20배, 적어도 30배, 적어도 40배, 적어도 50배, 적어도 60배, 적어도 70배, 적어도 80배, 적어도 90배, 적어도 100배, 적어도 150배, 적어도 200배, 적어도 250배, 적어도 300배, 적어도 350배, 적어도 400배, 적어도 500배, 적어도 600배, 적어도 700배, 적어도 800배, 적어도 900배, 적어도 1000배, 적어도 1500배, 적어도 2000배, 또는 적어도 3000배 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 최대 50%, 최대 60%, 최대 70%, 최대 80%, 최대 90%, 최대 2배, 최대 3배, 최대 4배, 최대 5배, 최대 6배, 최대 7배, 최대 8배, 최대 9배, 최대 10배, 최대 11배, 최대 12배, 최대 13배, 최대 14배, 최대 15배, 최대 20배, 최대 30배, 최대 40배, 최대 50배, 최대 60배, 최대 70배, 최대 80배, 최대 90배, 최대 100배, 최대 150배, 최대 200배, 최대 250배, 최대 300배, 최대 350배, 최대 400배, 최대 500배, 최대 600배, 최대 700배, 최대 800배, 최대 900배, 최대 1000배, 최대 1500배, 최대 2000배, 최대 3000배, 최대 5000배, 또는 최대 10000배 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 약 250배, 약 300배, 약 350배, 약 400배, 약 500배, 약 600배, 약 700배, 약 800배, 약 900배, 약 1000배, 약 1500배, 약 2000배, 약 3000배, 약 5000배, 또는 약 10000배 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 검출 한계 미만에서 검출 가능한 수준으로 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 11배, 적어도 12배, 적어도 13배, 적어도 14배, 적어도 15배, 적어도 20배, 적어도 30배, 적어도 40배, 적어도 50배, 적어도 60배, 적어도 70배, 적어도 80배, 적어도 90배, 적어도 100배, 적어도 150배, 적어도 200배, 적어도 250배, 적어도 300배, 적어도 350배, 적어도 400배, 적어도 500배, 적어도 600배, 적어도 700배, 적어도 800배, 적어도 900배, 적어도 1000배, 적어도 1500배, 적어도 2000배, 또는 적어도 3000배 감소시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 최대 50%, 최대 60%, 최대 70%, 최대 80%, 최대 90%, 최대 2배, 최대 3배, 최대 4배, 최대 5배, 최대 6배, 최대 7배, 최대 8배, 최대 9배, 최대 10배, 최대 11배, 최대 12배, 최대 13배, 최대 14배, 최대 15배, 최대 20배, 최대 30배, 최대 40배, 최대 50배, 최대 60배, 최대 70배, 최대 80배, 최대 90배, 최대 100배, 최대 150배, 최대 200배, 최대 250배, 최대 300배, 최대 350배, 최대 400배, 최대 500배, 최대 600배, 최대 700배, 최대 800배, 최대 900배, 최대 1000배, 최대 1500배, 최대 2000배, 최대 3000배, 최대 5000배, 또는 최대 10000배 감소시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 약 250배, 약 300배, 약 350배, 약 400배, 약 500배, 약 600배, 약 700배, 약 800배, 약 900배, 약 1000배, 약 1500배, 약 2000배, 약 3000배, 약 5000배, 또는 약 10000배 감소시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 (예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때) 표적 유전자의 활성 수준을 검출 가능한 수준에서 검출 한계 미만으로 감소시킬 수 있다.
일부 실시양태에서, 활성 수준의 변화 정도는 복합체를 세포 또는 세포 집단에 도입하기 전과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화 정도는 복합체로 처리되지 않은 상응하는 대조군 세포 또는 세포 집단과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화 정도는 대체 복합체 또는 유전자 발현 조절인자, 예를 들어 대체 이종성 유전자 이펙터 또는 이들의 조합을 포함하는 복합체, 또는 표적 유전자(예를 들어, 표적 내인성 유전자)의 활성 수준을 조절하는 다른 제제로 처리된 상응하는 대조군 세포 또는 세포 집단과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화 정도는 P300, TET1, TET2, TET3, HSF1, VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1 및/또는 VPR(Vp64+p65+Rta), KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M의 산 .SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다.
일부 실시양태에서, 활성 수준의 변화 정도는 VPR로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화의 정도는 KRAB 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화의 정도는 VP64 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화의 정도는 Rta 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화의 정도는 p65 유래의 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 활성 수준의 변화의 정도는 KAL인 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다.
본 개시내용의 복합체는 일부 경우에 대체 조성물 및 방법으로 달성할 수 있는 것보다 더 오랫동안 지속되는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준의 변화를 유도할 수 있다. 일부 실시양태에서, 유전자 발현의 지속적인 조절은 일시적인 조절에 비해 유리하다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 대조군보다 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 20배, 적어도 50배, 또는 적어도 100배 더 긴 기간 동안 특정 역치 이상으로 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 대조군보다 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 20배, 적어도 50배, 또는 적어도 100배 더 긴 기간 동안 특정 역치 미만으로 감소시킬 수 있다.
일부 실시양태에서, 유전자 발현의 일시적인 조절은 지속적인 조절에 비해 유리하며, 예를 들어 지속적인 과발현 또는 과소발현은 독성 또는 표적을 벗어난 효과를 초래할 수 있다. 본 개시내용의 복합체는 일부 경우에 대체 조성물 및 방법으로 달성할 수 있는 것보다 더 짧은 기간 동안 지속되는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준의 변화를 유도할 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 대조군보다 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 20배, 적어도 50배, 또는 적어도 100배 더 짧은 기간 동안 특정 역치 이상으로 증가시킬 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 대조군보다 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 20배, 적어도 50배, 또는 적어도 100배 더 짧은 기간 동안 특정 역치 미만으로 감소시킬 수 있다.
발현 및/또는 활성 수준이 조절되는 시간에 대한 대조군은 예를 들어 대체 복합체 또는 유전자 발현 조절인자, 예를 들어 대체 이종성 유전자 이펙터 또는 이의 조합을 포함하는 복합체, 또는 표적 유전자(예를 들어, 표적 내인성 유전자)의 활성 수준을 조절하는 다른 작용제로 처리되는 상응하는 대조군 세포 또는 세포 집단일 수 있다. 일부 실시양태에서, 발현 및/또는 활성 수준의 변화 지속성은 P300, TET1, TET2, TET3, HSF1, VP64, P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1 및/또는 VPR(Vp64+p65+Rta), KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다.
일부 실시양태에서, 발현 및/또는 활성 수준 변화의 지속성은 VPR로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 및/또는 활성 수준 변화의 지속성은 KRAB으로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 및/또는 활성 수준 변화의 지속성은 VP64로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 및/또는 활성 수준 변화의 지속성은 Rta로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 및/또는 활성 수준 변화의 지속성은 p65로부터 유래된 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다. 일부 실시양태에서, 발현 및/또는 활성 수준 변화의 지속성은 KAL인 이종성 유전자 이펙터를 포함하는 대조 약제로 처리된 상응하는 세포 또는 이의 집단과 대비된 것이다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 적어도 1시간, 적어도 2시간, 적어도 3시간, 적어도 4시간, 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 12시간, 적어도 14시간, 적어도 18시간, 적어도 20시간, 적어도 1일, 적어도 2일, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 6일, 적어도 7일, 적어도 8일, 적어도 9일, 적어도 10일, 적어도 14일, 적어도 21일, 적어도 28일, 적어도 5주, 적어도 6주, 적어도 7주, 적어도 8주, 적어도 9주, 적어도 10주, 적어도 12주, 적어도 14주, 적어도 18주, 적어도 20주, 또는 적어도 26주 동안 특정 역치 이상으로 증가시킬 수 있다. 역치는, 예를 들어 복합체로 치료하기 전에 또는 복합체로 치료되지 않은 상응하는 세포 집단에서 관찰된 기준선 수준일 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 적어도 1시간, 적어도 2시간, 적어도 3시간, 적어도 4시간, 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 12시간, 적어도 14시간, 적어도 18시간, 적어도 20시간, 적어도 1일, 적어도 2일, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 6일, 적어도 7일, 적어도 8일, 적어도 9일, 적어도 10일, 적어도 14일, 적어도 21일, 적어도 28일, 적어도 5주, 적어도 6주, 적어도 7주, 적어도 8주, 적어도 9주, 적어도 10주, 적어도 12주, 적어도 14주, 적어도 18주, 적어도 20주, 또는 적어도 26주 동안 특정 역치 미만으로 감소시킬 수 있다. 역치는, 예를 들어 복합체로 치료하기 전에 또는 복합체로 치료되지 않은 상응하는 세포 집단에서 관찰된 기준선 수준일 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 최대 1시간, 최대 2시간, 최대 3시간, 최대 4시간, 최대 5시간, 최대 6시간, 최대 7시간, 최대 8시간, 최대 9시간, 최대 10시간, 최대 12시간, 최대 14시간, 최대 18시간, 최대 20시간, 최대 1일, 최대 2일, 최대 3일, 최대 4일, 최대 5일, 최대 6일, 최대 7일, 최대 8일, 최대 9일, 최대 10일, 최대 14일, 최대 21일, 최대 28일, 최대 5주, 최대 6주, 최대 7주, 최대 8주, 최대 9주, 최대 10주, 최대 12주, 최대 14주, 최대 18주, 최대 20주, 또는 최대 26주 동안 특정 역치 이상으로 증가시킬 수 있다. 역치는, 예를 들어 복합체로 치료하기 전에 또는 복합체로 치료되지 않은 상응하는 세포 집단에서 관찰된 기준선 수준일 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 최대 1시간, 최대 2시간, 최대 3시간, 최대 4시간, 최대 5시간, 최대 6시간, 최대 7시간, 최대 8시간, 최대 9시간, 최대 10시간, 최대 12시간, 최대 14시간, 최대 18시간, 최대 20시간, 최대 1일, 최대 2일, 최대 3일, 최대 4일, 최대 5일, 최대 6일, 최대 7일, 최대 8일, 최대 9일, 최대 10일, 최대 14일, 최대 21일, 최대 28일, 최대 5주, 최대 6주, 최대 7주, 최대 8주, 최대 9주, 최대 10주, 최대 12주, 최대 14주, 최대 18주, 최대 20주, 또는 최대 26주 동안 특정 역치 미만으로 감소시킬 수 있다. 역치는, 예를 들어 복합체로 치료하기 전에 또는 복합체로 치료되지 않은 상응하는 세포 집단에서 관찰된 기준선 수준일 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 약 1시간, 약 2시간, 약 3시간, 약 4시간, 약 5시간, 약 6시간, 약 7시간, 약 8시간, 약 9시간, 약 10시간, 약 12시간, 약 14시간, 약 18시간, 약 20시간, 약 1일, 약 2일, 약 3일, 약 4일, 약 5일, 약 6일, 약 7일, 약 8일, 약 9일, 약 10일, 약 14일, 약 21일, 약 28일, 약 5주, 약 6주, 약 7주, 약 8주, 약 9주, 약 10주, 약 12주, 약 14주, 약 18주, 약 20주, 또는 약 26주 동안 특정 역치 이상으로 증가시킬 수 있다. 역치는, 예를 들어 복합체로 치료하기 전에 또는 복합체로 치료되지 않은 상응하는 세포 집단에서 관찰된 기준선 수준일 수 있다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준을 약 1시간, 약 2시간, 약 3시간, 약 4시간, 약 5시간, 약 6시간, 약 7시간, 약 8시간, 약 9시간, 약 10시간, 약 12시간, 약 14시간, 약 18시간, 약 20시간, 약 1일, 약 2일, 약 3일, 약 4일, 약 5일, 약 6일, 약 7일, 약 8일, 약 9일, 약 10일, 약 14일, 약 21일, 약 28일, 약 5주, 약 6주, 약 7주, 약 8주, 약 9주, 약 10주, 약 12주, 약 14주, 약 18주, 약 20주, 또는 약 26주 동안 특정 역치 미만으로 감소시킬 수 있다. 역치는, 예를 들어 복합체로 치료하기 전에 또는 복합체로 치료되지 않은 상응하는 세포 집단에서 관찰된 기준선 수준일 수 있다.
표적 유전자(예를 들어, 표적 내인성 유전자) 또는 이의 조절 서열은 줄기 세포, 조혈 세포, 면역 세포, 또는 본원에 개시된 다른 세포 유형과 같은 세포에 존재하는 임의의 적합한 유전자 또는 이의 조절 서열일 수 있다.
표적 유전자(예를 들어, 표적 내인성 유전자)는 면역 세포 조절에 관여하는 유전자일 수 있다. 일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 암과 연관되어 있다. 암과 관련된 표적 유전자는 세포 주기 유전자, 세포 반응 유전자, 세포사멸 유전자, 또는 식세포작용 유전자일 수 있다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)라는 용어는 또한 표적 유전자 조절 서열, 예를 들어 프로모터, 인핸서, 억제인자, 사일렌서, 절연체, 시스-조절 요소, 트랜스-조절 요소, 예를 들어 복합체, 이종성 유전자 이펙터 및/또는 기타 인자가 조절 서열에 결합할 때 표적 유전자의 발현 또는 활성 수준에 영향을 미칠 수 있는 후성적 변형(예: DNA 메틸화) 부위 등, 및/또는 조절 서열에 대한 기타 인자를 포함할 수 있다. 표적 유전자 조절 서열은 표적 유전자의 생성물을 코딩하는 전사 단위 또는 개방 판독 프레임 외부에 물리적으로 위치할 수 있다.
표적 유전자 조절 서열은 내인성 조절 서열, 예를 들어 표적 유전자(예를 들어, 표적 내인성 유전자)에 작동적으로 결합되는, 내인성 프로모터, 내인성 인핸서, 내인성 억제인자, 내인성 사일렌서, 내인성 절연체, 내인성 시스-조절 요소, 내인성 트랜스-조절 요소, 내인성 후성적 변형(예: DNA 메틸화) 부위 등일 수 있다. 일부 실시양태에서, 표적 유전자 조절 서열은 조작된 또는 합성 리포터 시스템의 성분을 함유하지 않는다. 일부 실시양태에서, 표적 유전자 조절 서열은 조작된 리포터 시스템의 일부로서 기능하지 않는다. 일부 실시양태에서, 표적 유전자 조절 서열은 외인성, 조작된, 또는 합성 조절 요소를 함유하지 않는데, 예를 들어, 테트라사이클린 또는 이의 유사체에 의해 조절되는 반응 요소를 함유하지 않는다. 일부 실시양태에서, 표적 유전자 조절 서열은 외인성, 조작된, 또는 합성 인자에 의해 조절되는 반응 요소를 함유하지 않는데, 예를 들어, 전사활성화제 또는 역전사활성화제에 의해 조절되는 반응 요소를 함유하지 않는다. 일부 실시양태에서, 표적 유전자 조절 서열은 조작된 유도성 시스템, 억제성 시스템, 및/또는 리포터 시스템의 일부로서 기능하는 전사활성화제 또는 역전사활성화제에 반응하는 요소를 함유하지 않는다. 일부 실시양태에서, 표적 유전자 조절 서열은 Tet off 또는 tTA-의존 시스템의 성분이 아니다. 일부 실시양태에서, 표적 유전자 조절 서열은 Tet On 또는 rtTA-의존 시스템의 성분이 아니다.
일부 실시양태에서, 표적 유전자 조절 서열은 대상체 또는 숙주 세포에 외인성인 뉴클레오티드 서열을 함유하지 않는다. 일부 실시양태에서, 표적 유전자 조절 서열은 조작되거나 인공적으로 생성되거나 도입된 뉴클레오티드 서열을 함유하지 않는다.
일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성유전자 이펙터는 특정 표적 유전자(예를 들어, 표적 내인성 유전자)에 특이적인 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 2개 이상의 표적 유전자(예를 들어, 표적 내인성 유전자)에 적용가능한 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 3개 이상의 표적 유전자(예를 들어, 표적 내인성 유전자)에 적용가능한 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 표적 유전자(예를 들어, 표적 내인성 유전자)의 부류, 예를 들어 동일한 경로로 기능하거나, 유사한 내인성 자극에 반응하는, 기능적 역할이 중복되는 유전자에 적용 가능한 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 광범위한 표적 유전자(예를 들어, 표적 내인성 유전자)에 광범위하게 적용가능한 바람직한 변화를 가져오는데, 예를 들어, 표적 유전자 또는 이의 조절 서열에 대한 결합을 지시하도록 적합한 가이드 모이어티와 복합체로 존재할 때 다중 표적 유전자에 대한 특정 역치 이상 또는 미만인 발현 수준을 이끌어낸다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 질병 또는 병태에서 과발현되거나 과소발현되는 유전자이다. 일부 실시양태에서, 표적 유전자는 유전성 유전 질환에서 과발현되거나 과소발현되는 유전자이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 자가면역 질환에서 과발현되거나 과소발현되는 유전자이다. 일부 실시양태에서, 표적 유전자는 급성 파종성 뇌척수염, 급성 운동축삭 신경병증, 애디슨병, 동통성지방증, 성인형 스틸병, 원형 탈모증, 강직척추염, 항사구체 기저막신염, 항호중구 세포질 항체 관련 혈관염, 항-N-메틸-D-아스파르트산 수용체 뇌염, 항인지질증후군, 항합성효소증후군, 재생 불량성 빈혈, 자가면역 혈관성부종, 자가면역 뇌염, 자가면역 장질환, 자가면역 용혈성빈혈, 자가면역 간염, 자가면역 내이 질환, 자가면역 림프증식 증후군, 자가면역 호중구 감소증, 자가면역 난소염, 자가면역 고환염, 자가면역 췌장염, 자가면역 다내분비 증후군, 자가면역 다내분비 증후군 2형, 자가면역 다내분비 증후군 3형, 자가면역 프로게스테론 피부염, 자가면역 망막병증, 자가면역 혈소판감소자반증, 자가면역 갑상선염, 자가면역 두드러기, 자가면역 포도막염, 발로 동심성 경화증, 베체트병, 비커스태프 뇌염, 수포성 유천포창, 셀리악병, 만성 피로 증후군, 만성 염증성 탈수초성 다발신경병증, 처그-스트라우스 증후군, 반흔성 유천포창, 코간 증후군, 한랭응집병, 복합 부위 통증 증후군, CREST 증후군, 크론병, 포진성 피부염, 피부근염, 제1형 당뇨병, 원반형 홍반성 루푸스, 자궁내막증, 골부착염, 골부착염 관련 관절염, 호산구성 식도염, 호산구성 근막염, 후천성 표피수포증, 결절성 홍반, 본태성 혼합 한랭글로불린혈증, 에반스 증후군, 펠티 증후군, 섬유근육통, 위염, 임신성 천포창, 거대 세포 동맥염, 굿패스쳐 증후군, 그레이브스병, 그레이브스 안병증, 길랭-바레 증후군, 하시모토 뇌병증, 하시모토 갑상선염, 헤노흐-숀라인 자반증, 화농성한선염, 특발성 확장성 심근병증, 특발성 염증성 탈수초성 질환, IgA 신장병, IgG4 관련 전신 질환, 포함체 근육염, 염증성 장 질환(IBD), 중간 포도막염, 간질성 방광염, 연소성 관절염, 가와사키병, 램버트-이튼 근무력증 증후군, 백혈구파괴성 혈관염, 편평 태선, 경화 태선, 목질결막염, 선형 IgA병, 루푸스신염, 루푸스혈관염, 라임병, 메니에르병, 미세대장염, 미세다발혈관염, 혼합결합조직병, 무렌궤양, 모르피아, 무하-하베르만병, 다발성경화증, 중증근육무력증, 심근염, 근육염, 시신경척수염, 신경근긴장증, 안구간대경력-근간대경력(Opsoclonus myoclonus) 증후군, 시신경염, Ord 갑상선염, 회문성 류머티즘, 부종양성소뇌퇴화, Parry Romberg 증후군, 파르소니지-터너(Parsonage-Turner) 증후군, 연쇄상구균 관련 소아 자가면역 신경정신병, 심상성천포창, 악성빈혈, 태선비강(Pityriasis lichenoides et varioliformis) 아쿠타, POEMS증후군, 결절다발동맥염, 류마티스다발근육통, 다발근염, 심근경색후증후군, 심낭절개후증후군, 원발성 담도경변증, 원발성 면역결핍, 원발성 경화성 담관염, 진행성 염증성 신경병증, 건선, 건선성 관절염, 순적혈구무형성증, 괴저성농피증, 레이노현상, 반응성 관절염, 재발성 다발연골염, 하지 불안 증후군, 후복막 섬유증, 류마티스열, 류마티스 관절염, 류마티스 혈관염, 유육종증, 슈니츨러 증후군, 피부경화증, 쇼그렌 증후군, 경직증후군, 아급성 세균성 심내막염, 수삭 증후군, 시덴함 무도병, 교감성 안염, 전신 홍반루푸스, 전신경화증, 혈소판 감소증, Tolosa-Hunt 증후군, 횡단 척수염, 궤양성 대장염, 미분화 결합 조직 질환, 두드러기, 두드러기성 혈관염, 혈관염, 또는 백반증에서 과발현되거나 과소발현되는 유전자이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 암, 예를 들어 급성 백혈병, 성상세포종, 담도암(담관암종), 골암, 유방암, 뇌간 신경교종, 세기관지폐포세포폐암, 부신암, 항문 부위의 암, 방광암, 내분비계암, 식도암, 두경부암, 신장암, 부갑상선암, 음경암, 흉막/복막암, 타액선암, 소장암, 갑상선암, 요관암, 요도암, 자궁경부암종, 자궁내막암종, 나팔관암종, 신우암종, 질암종, 외음부암종, 자궁경부암, 만성 백혈병, 대장암, 결장직장암, 피부 흑색종, 상의세포종, 유표피종양, 유잉 육종, 위암, 교모세포종, 다형성 교모세포종, 신경교종, 혈액 악성종양, 간세포(간) 암종, 간암, 호지킨병, 안내 흑색종, 카포시 육종, 폐암, 림프종, 수모세포종, 흑색종, 수막종, 중피종, 다발성 골수종, 근육암, 중추신경계(CNS) 신생물, 신경암, 소세포폐암, 비소세포폐암, 골육종, 난소암, 췌장암, 소아 악성종양, 뇌하수체 선종, 전립선암, 직장암, 신장세포 암종, 연조직 육종, 신경초종, 피부암, 척추 축 종양, 편평 세포 암종, 위암, 윤활막 육종, 고환암, 자궁암, 또는 상기 암의 난치성 버전을 포함한 종양 및 전이, 또는 이의 조합에서 과발현되거나 과소발현되는 유전자이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 분화 관련 유전자, 예를 들어 SSEA1, SSEA3/4, SSEA5, TRA1-60/81, TRA1-85, TRA2-54, GCTM-2, TG343, TG30, CD9, CD29, CD133/프로미닌, CD140a, CD56, CD73, CD90, CD105, OCT4, NANOG, SOX2, CD30, CD50, AHR, 아이올로스/IKZF3, CDX4, CREB, DNMT3A, DNMT3B, EGR1, FoxO3, GATA-1, GATA-2, GATA-3, 헬리오스, HES-1, HHEX, HIF-1 알파/HIF1A, HMGB1/HMG-1, HMGB3, 이카로스, c-Jun, LMO2, LMO4, c-Maf, MafB, MEF2C, MYB, c-Myc, NFATC2, NFIL3/E4BP4, Nrf2, p53, PITX2, PRDM16/MEL1, Prox1, PU.1/Spi-1, RUNX1/CBFA2, SALL4, SCL/Tal1, Smad2, Smad2/3, Smad4, Smad7, Spi-B, STAT 활성화제, STAT 억제제, STAT3, STAT4, STAT5a, STAT6, TSC22, DUX4, DUX4/DUX4c, DUX4c, EBF-1, EBF-2, EBF-3, ETV5, FoxC2, FoxF1, GATA-4, GATA-6, HMGA2, c-Jun, MYF-5, 미오카르딘(Myocardin), MyoD, 미오게닌(Myogenin), NFATC2, p53, Pax3, PDX-1/IPF1, PLZF, PRDM16/MEL1, RUNX2/CBFA1, Smad1, Smad3, Smad4, Smad5, Smad8, Smad9, Snail, SOX2, SOX9, SOX11, STAT 활성화제, STAT 억제제, STAT1, STAT3, TBX18, Twist-1, Twist-2, 브라키우리, EOMES, FoxC2, FoxD3, FoxF1, FoxH1, FoxO1/FKHR, GATA-2, GATA-3, GBX2, 구스코이드, HES-1, HNF-3 알파/FoxA1, c-Jun, KLF2, KLF4, KLF5, c-Maf, Max, MEF2C, MIXL1, MTF2, c-Myc, 나녹(Nanog), NFkB/IkB 활성화제, NFkB/IkB 억제제, NFkB1, NFkB2, Oct-3/4, Otx2, p53, Pax2, Pax6, PRDM14, Rex-1/ZFP42, SALL1, SALL4, Smad1, Smad2, Smad2/3, Smad3, Smad4, Smad5, Smad8, Snail, SOX2, SOX7, SOX15, SOX17, STAT 활성화제, STAT 억제제, STAT3, SUZ12, TBX6, TCF-3/E2A, THAP11, UTF1, WDR5, WT1, ZNF206, ZNF281, KLF2, KLF4, c-Maf, c-Myc, 나녹, Oct-3/4, p53, SOX1, SOX2, SOX3, SOX15, SOX18, TBX18, ASCL2/Mash2, CDX2, DNMT1, ELF3, Ets-1, FoxM1, FoxN1, GATA-6, 헤어리스(Hairless), HNF-4 알파/NR2A1, IRF6, c-Maf, MITF, Miz-1/ZBTB17, MSX1, MSX2, MYB, c-Myc, 뉴로게닌(Neurogenin)-3, NFATC1, NKX3.1, Nrf2, p53, p63/TP73L, Pax2, Pax3, RUNX1/CBFA2, RUNX2/CBFA1, RUNX3/CBFA3, Smad1, Smad2, Smad2/3, Smad4, Smad5, Smad7, Smad8, Snail, SOX2, SOX9, STAT 활성제, STAT 억제제, STAT3, SUZ12, TCF-3/E2A, TCF7/TCF1, 안드로겐 R/NR3C4, AP-2 감마, 베타-카테닌, 베타-카테닌 억제제, 브라키우리, CREB, ER 알파/NR3A1, ER 베타/NR3A2, FoxM1, FoxO3, FRA-1, GLI-1, GLI-2, GLI-3, HIF-1 알파/HIF1A, HIF-2 알파/EPAS1, HMGA1B, c-Jun, JunB, KLF4, c-Maf, MCM2, MCM7, MITF, c-Myc, 나녹, NFkB/IkB 활성화제, NFkB/IkB 억제제, NFkB1, NKX3.1, Oct-3/4, p53, PRDM14, Snail, SOX2, SOX9, STAT 활성화제, STAT 억제제, STAT3, TAZ/WWTR1, TBX3, Twist-1, Twist-2, WT1, 또는 ZEB1이다.
일부 실시양태에서, 이종성 유전자 이펙터는 조혈 줄기 세포 전사 인자인 유전자 생성물로부터 유래된다. 일부 실시양태에서, 표적 유전자는 중간엽 줄기 세포 전사 인자이다. 일부 실시양태에서, 표적 유전자는 배아 줄기 세포 전사인자이다. 일부 실시양태에서, 표적 유전자는 유도 만능 줄기 세포(iPSC) 전사 인자이다. 일부 실시양태에서, 표적 유전자는 상피 줄기 세포 전사 인자이다. 일부 실시양태에서, 표적 유전자는 암 줄기 세포 전사 인자이다.
일부 실시양태에서, 표적 유전자는 나이 관련 유전자이다. 일부 실시양태에서, 표적 유전자는 노화 관련 단백질이다. 일부 실시양태에서, 표적 유전자는 약물 표적이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 암 관련 유전자이다. 암 관련 유전자의 비제한적 예에는 A1CF, ABI1, ABL1, ABL2, ACKR3, ACSL3, ACSL6, ACVR1, ACVR2A, AFDN, AFF1, AFF3, AFF4, AKAP9, AKT1, AKT2, AKT3, ALDH2, ALK, AMER1, ANK1, APC, APOBEC3B, AR, ARAF, ARHGAP26, ARHGAP5, ARHGEF10, ARHGEF10L, ARHGEF12, ARID1A, ARID1B, ARID2, ARNT, ASPSCR1, ASXL1, ASXL2, ATF1, ATIC, ATM, ATP1A1, ATP2B3, ATR, ATRX, AXIN1, AXIN2, B2M, BAP1, BARD1, BAX, BAZ1A, BCL10, BCL11A, BCL11B, BCL2, BCL2L12, BCL3, BCL6, BCL7A, BCL9, BCL9L, BCLAF1, BCOR, BCORL1, BCR, BIRC3, BIRC6, BLM, BMP5, BMPR1A, BRAF, BRCA1, BRCA2, BRD3, BRD4, BRIP1, BTG1, BTK, BUB1B, C15orf65, CACNA1D, CALR, CAMTA1, CANT1, CARD11, CARS, CASP3, CASP8, CASP9, CBFA2T3, CBFB, CBL, CBLB, CBLC, CCDC6, CCNB1IP1, CCNC, CCND1, CCND2, CCND3, CCNE1, CCR4, CCR7, CD209, CD274, CD28, CD74, CD79A, CD79B, CDC73, CDH1, CDH10, CDH11, CDH17, CDK12, CDK4, CDK6, CDKN1A, CDKN1B, CDKN2A, CDKN2C, CDX2, CEBPA, CEP89, CHCHD7, CHD2, CHD4, CHEK2, CHIC2, CHST11, CIC, CIITA, CLIP1, CLP1, CLTC, CLTCL1, CNBD1, CNBP, CNOT3, CNTNAP2, CNTRL, COL1A1, COL2A1, COL3A1, COX6C, CPEB3, CREB1, CREB3L1, CREB3L2, CREBBP, CRLF2, CRNKL1, CRTC1, CRTC3, CSF1R, CSF3R, CSMD3, CTCF, CTNNA2, CTNNB1, CTNND1, CTNND2, CUL3, CUX1, CXCR4, CYLD, CYP2C8, CYSLTR2, DAXX, DCAF12L2, DCC, DCTN1, DDB2, DDIT3, DDR2, DDX10, DDX3X, DDX5, DDX6, DEK, DGCR8, DICER1, DNAJB1, DNM2, DNMT3A, DROSHA, DUX4L1, EBF1, ECT2L, EED, EGFR, EIF1AX, EIF3E, EIF4A2, ELF3, ELF4, ELK4, ELL, ELN, EML4, EP300, EPAS1, EPHA3, EPHA7, EPS15, ERBB2, ERBB3, ERBB4, ERC1, ERCC2, ERCC3, ERCC4, ERCC5, ERG, ESR1, ETNK1, ETV1, ETV4, ETV5, ETV6, EWSR1, EXT1, EXT2, EZH2, EZR, FAM131B, FAM135B, FAM47C, FANCA, FANCC, FANCD2, FANCE, FANCF, FANCG, FAS, FAT1, FAT3, FAT4, FBLN2, FBXO11, FBXW7, FCGR2B, FCRL4, FEN1, FES, FEV, FGFR1, FGFR1OP, FGFR2, FGFR3, FGFR4, FH, FHIT, FIP1L1, FKBP9, FLCN, FLI1, FLNA, FLT3, FLT4, FNBP1, FOXA1, FOXL2, FOXO1, FOXO3, FOXO4, FOXP1, FOXR1, FSTL3, FUBP1, FUS, GAS7, GATA1, GATA2, GATA3, GLI1, GMPS, GNA11, GNAQ, GNAS, GOLGA5, GOPC, GPC3, GPC5, GPHN, GRIN2A, GRM3, H3F3A, H3F3B, HERPUD1, HEY1, HIF1A, HIP1, HIST1H3B, HIST1H4I, HLA-A, HLF, HMGA1, HMGA2, HMGN2P46, HNF1A, HNRNPA2B1, HOOK3, HOXA11, HOXA13, HOXA9, HOXC11, HOXC13, HOXD11, HOXD13, HRAS, HSP90AA1, HSP90AB1, ID3, IDH1, IDH2, IGF2BP2, IGH, IGK, IGL, IKBKB, IKZF1, IL2, IL21R, IL6ST, IL7R, IRF4, IRS4, ISX, ITGAV, ITK, JAK1, JAK2, JAK3, JAZF1, JUN, KAT6A, KAT6B, KAT7, KCNJ5, KDM5A, KDM5C, KDM6A, KDR, KDSR, KEAP1, KIAA1549, KIF5B, KIT, KLF4, KLF6, KLK2, KMT2A, KMT2C, KMT2D, KNL1, KNSTRN, KRAS, KTN1, LARP4B, LASP1, LATS1, LATS2, LCK, LCP1, LEF1, LEPROTL1, LHFPL6, LIFR, LMNA, LMO1, LMO2, LPP, LRIG3, LRP1B, LSM14A, LYL1, LZTR1, MACC1, MAF, MAFB, MALAT1, MALT1, MAML2, MAP2K1, MAP2K2, MAP2K4, MAP3K1, MAP3K13, MAPK1, MAX, MB21D2, MDM2, MDM4, MDS2, MECOM, MED12, MEN1, MET, MGMT, MITF, MLF1, MLH1, MLLT1, MLLT10, MLLT11, MLLT3, MLLT6, MN1, MNX1, MPL, MRTFA, MSH2, MSH6, MSI2, MSN, MTCP1, MTOR, MUC1, MUC16, MUC4, MUTYH, MYB, MYC, MYCL, MYCN, MYD88, MYH11, MYH9, MYO5A, MYOD1, N4BP2, NAB2, NACA, NBEA, NBN, NCKIPSD, NCOA1, NCOA2, NCOA4, NCOR1, NCOR2, NDRG1, NF1, NF2, NFATC2, NFE2L2, NFIB, NFKB2, NFKBIE, NIN, NKX2-1, NONO, NOTCH1, NOTCH2, NPM1, NR4A3, NRAS, NRG1, NSD1, NSD2, NSD3, NT5C2, NTHL1, NTRK1, NTRK3, NUMA1, NUP214, NUP98, NUTM1, NUTM2B, NUTM2D, OLIG2, OMD, P2RY8, PABPC1, PAFAH1B2, PALB2, PATZ1, PAX3, PAX5, PAX7, PAX8, PBRM1, PBX1, PCBP1, PCM1, PDCD1LG2, PDE4DIP, PDGFB, PDGFRA, PDGFRB, PER1, PHF6, PHOX2B, PICALM, PIK3CA, PIK3CB, PIK3R1, PIM1, PLAG1, PLCG1, PML, PMS1, PMS2, POLD1, POLE, POLG, POLQ, POT1, POU2AF1, POU5F1, PPARG, PPFIBP1, PPM1D, PPP2R1A, PPP6C, PRCC, PRDM1, PRDM16, PRDM2, PREX2, PRF1, PRKACA, PRKAR1A, PRKCB, PRPF40B, PRRX1, PSIP1, PTCH1, PTEN, PTK6, PTPN11, PTPN13, PTPN6, PTPRB, PTPRC, PTPRD, PTPRK, PTPRT, PWWP2A, QKI, RABEP1, RAC1, RAD17, RAD21, RAD51B, RAF1, RALGDS, RANBP2, RAP1GDS1, RARA, RB1, RBM10, RBM15, RECQL4, REL, RET, RFWD3, RGPD3, RGS7, RHOA, RHOH, RMI2, RNF213, RNF43, ROBO2, ROS1, RPL10, RPL22, RPL5, RPN1, RSPO2, RSPO3, RUNX1, RUNX1T1, S100A7, SALL4, SBDS, SDC4, SDHA, SDHAF2, SDHB, SDHC, SDHD, 44444, 44445, 44448, SET, SETBP1, SETD1B, SETD2, SETDB1, SF3B1, SFPQ, SFRP4, SGK1, SH2B3, SH3GL1, SHTN1, SIRPA, SIX1, SIX2, SKI, SLC34A2, SLC45A3, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1, SMARCD1, SMARCE1, SMC1A, SMO, SND1, SNX29, SOCS1, SOX2, SOX21, SPECC1, SPEN, SPOP, SRC, SRGAP3, SRSF2, SRSF3, SS18, SS18L1, SSX1, SSX2, SSX4, STAG1, STAG2, STAT3, STAT5B, STAT6, STIL, STK11, STRN, SUFU, SUZ12, SYK, TAF15, TAL1, TAL2, TBL1XR1, TBX3, TCEA1, TCF12, TCF3, TCF7L2, TCL1A, TEC, TENT5C, TERT, TET1, TET2, TFE3, TFEB, TFG, TFPT, TFRC, TGFBR2, THRAP3, TLX1, TLX3, TMEM127, TMPRSS2, TNC, TNFAIP3, TNFRSF14, TNFRSF17, TOP1, TP53, TP63, TPM3, TPM4, TPR, TRA, TRAF7, TRB, TRD, TRIM24, TRIM27, TRIM33, TRIP11, TRRAP, TSC1, TSC2, TSHR, U2AF1, UBR5, USP44, USP6, USP8, VAV1, VHL, VTI1A, WAS, WDCP, WIF1, WNK2, WRN, WT1, WWTR1, XPA, XPC, XPO1, YWHAE, ZBTB16, ZCCHC8, ZEB1, ZFHX3, ZMYM2, ZMYM3, ZNF331, ZNF384, ZNF429, ZNF479, ZNF521, ZNRF3, 및 ZRSR2가 있다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 면역 세포 관련 유전자, 예를 들어 사이토카인, 사이토카인 수용체, 케모카인, 케모카인 수용체, 공동억제 면역 수용체, 공동자극 면역 수용체, 면역세포 전사인자 등이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 사이토카인, 예를 들어, 4-1BBL, APRIL, CD153, CD154, CD178, CD70, G-CSF, GITRL, GM-CSF, IFN-α, IFN-β, IFN-γ, IL-1RA, IL-1α, IL-1β, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-20, IL-23, LIF, LIGHT, LT-β, M-CSF, MSP, OSM, OX40L, SCF, TALL-1, TGF-β, TGF-β1, TGF-β2, TGF-β3, TNF-α, TNF-β, TRAIL, TRANCE, 또는 TWEAK이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 사이토카인 수용체, 예를 들어 공통 감마 사슬 수용체, 공통 베타 사슬 수용체, 인터페론 수용체, TNF 계열 수용체, TGF-β 수용체, Apo3, BCMA, CD114, CD115, CD116, CD117, CD118, CD120, CD120a, CD120b, CD121, CD121a, CD121b, CD122, CD123, CD124, CD126, CD127, CD130, CD131, CD132, CD212, CD213, CD213a1, CD213a13, CD213a2, CD25, CD27, CD30, CD4, CD40, CD95 (Fas), CDw119, CDw121b, CDw125, CDw131, CDw136, CDw137(41BB), CDw210, CDw217, GITR, HVEM, IL-11R, IL-11Ra, IL-14R, IL-15R, IL-15Ra, IL-18R, IL-18Rα, IL-18Rβ, IL-20R, IL-20Rα, IL-20Rβ, IL-9R, LIFR, LTβR, OPG, OSMR, OX40, RANK, TACI, TGF-βR1, TGF-βR2, TGF-βR3, TRAILR1, TRAILR2, TRAILR3, 또는 TRAILR4이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 케모카인, 예를 들어 ACT-2, AMAC-a, ATAC, ATAC, BLC, CCL1, CCL11, CCL13, CCL14, CCL15, CCL16, CCL17, CCL18, CCL19, CCL2, CCL20, CCL21, CCL22, CCL23, CCL24, CCL25, CCL26, CCL27, CCL3, CCL4, CCL5, CCL7, CCL8, CKb-6, CKb-8, CTACK, CX3CL1, CXCL1, CXCL10, CXCL11, CXCL12, CXCL13, CXCL14, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, CXCL8, CXCL9, DC-CK1, ELC, ENA-78, 에오탁신, 에오탁신-2, 에오탁신-3, 에스킨, 엑소더스-1, 엑소더스-2, 엑소더스-3, 프랙탈카인, GCP-2, GROa, GROb, GROg, HCC-1, HCC-2, HCC-4, I-309, IL-8, ILC, IP-10, I-TAC, LAG-1, LARC, LCC-1, LD78α, LEC, Lkn-1, LMC, 림포액틴, 림포액틴 b, MCAF, MCP-1, MCP-2, MCP-3, MCP-4, MDC, MDNCF, MGSA-a, MGSA-b, MGSA-g, Mig, MIP-1d, MIP-1α, MIP-1βMIP-2a, MIP-2b, MIP-3, MIP-3α, MIP-3βMIP-4, MIP-4a, MIP-5, MPIF-1, MPIF-2, NAF, NAP-1, NAP-2, 온코스타틴, PARC, PF4, PPBP, RANTES, SCM-1a, SCM-1b, SDF-1α/β-, SLC, STCP-1, TARC, TECK, XCL1, 또는 XCL2이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 케모카인 수용체, 예를 들어 CCR1, CCR2, CCR3, CCR4, CCR5, CCR6, CCR7, CCR8, CCR9, CCR10, CX3CR1, CXCR1, CXCR2, CXCR3, CXCR4, CXCR5, XCR1, 또는 XCR1이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 활성화 NK 수용체, 예를 들어 CD100(SEMA4D), CD16(FcgRIIIA), CD160(BY55), CD244(2B4, SLAMF4), CD27, CD94- NKG2C, CD94-NKG2E, CD94-NKG2H, CD96, CRTAM, DAP12, DNAM1(CD226), KIR2DL4, KIR2DS1, KIR2DS2, KIR2DS3, KIR2DS4, KIR2DS5, KIR3DS1, Ly49, NCR, NKG2D(KLRK1, CD314), NKp30(NCR3), NKp44(NCR2), NKp46(NCR1), NKp80(KLRF1, CLEC5C), NTB-A(SLAMF6), PSGL1, 또는 SLAMF7(CRACC, CS1, CD319)이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 억제성 NK 수용체, 예를 들어 CD161(NKR-P1A, NK1.1), CD94-NKG2A, CD96, CEACAM1, KIR2DL1, KIR2DL2, KIR2DL3, KIR2DL4, KIR2DL5A, KIR2DL5B, KIR3DL1, KIR3DL2, KIR3DL3, KLRG1, LAIR1, LIR1(ILT2, LILRB1), Ly49a, Ly49b, NKR-P1A(KLRB1), SIGLEC-10, SIGLEC-11, SIGLEC-14, SIGLEC-16, SIGLEC-3(CD33), SIGLEC-5(CD170), SIGLEC-6(CD327), SIGLEC-7(CD328), SIGLEC-8, SIGLEC-9(CD329), SIGLEC-E, SIGLEC-F, SIGLEC- G, SIGLEC-H, 또는 TIGIT이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 공동억제성 면역 수용체, 예를 들어 2B4, B7-1, BTLA, CD160, CTLA-4, DR6, Fas, LAG3, LAIR1, Ly108, PD-1, PD-L1, PD1H, TIGIT, TIM1, TIM2, 또는 TIM3이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 공동자극 면역 수용체, 예를 들어 2B4, 4-1BB, CD2, CD4, CD8, CD21, CD27, CD28, CD30, CD40, CD84, CD226, CD355, CRACC, DcR3, DR3, GITR, HVEM, ICOS, Ly9, Ly108, LIGHT, LTβR, OX40, SLAM, TIM1, 또는 TIM2이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 자체 유전자 이펙터, 예컨대 본원에 개시된 임의의 유전자 이펙터(예를 들어, 본원에 개시된 전사 인자)이다.
일부 실시양태에서, 표적 유전자(예를 들어, 표적 내인성 유전자)는 면역 세포 전사 인자, 예를 들어 AP-1, Bcl6, E2A, EBF, Eomes, FoxP3, GATA3, Id2, Ikaros, IRF, IRF1, IRF2, IRF3, IRF3, IRF7, NFAT, NFkB, Pax5, PLZF, PU.1, ROR-감마-T, STAT, STAT1, STAT2, STAT3, STAT4, STAT5, STAT5A, STAT5B, STAT6, T-bet, TCF7, 또는 ThPOK이다.
일부 실시양태에서, 표적 유전자는 키나제, 예를 들어 티로신 키나제, 또는 세린/트레오닌 키나제이다. 일부 실시양태에서, 표적 유전자는 포스파타제, 예를 들어 티로신 포스파타제, 또는 세린/트레오닌 포스파타제이다.
일부 실시양태에서, 표적 유전자는 수용체이다. 일부 실시양태에서, 표적 유전자는 이온 채널이다. 일부 실시양태에서, 표적 유전자는 GPCR이다. 일부 실시양태에서, 표적 유전자는 수용체 티로신 키나제이다. 일부 실시양태에서, 표적 유전자는 리보솜 단백질이다. 일부 실시양태에서, 표적 유전자는 막 단백질이다. 일부 실시양태에서, 표적 유전자는 세포질 단백질이다. 일부 실시양태에서, 표적 유전자는 핵 단백질이다. 일부 실시양태에서, 표적 유전자는 미토콘드리아 단백질이다. 일부 실시양태에서, 표적 유전자는 유비퀴틴 리가제이다. 일부 실시양태에서, 표적 유전자는 메틸트랜스퍼라제이다. 일부 실시양태에서, 표적 유전자는 글리코실트랜스퍼라제이다. 일부 실시양태에서, 표적 유전자는 가수분해효소이다.
일부 실시양태에서, CD45는 본 개시내용의 조성물 및 방법(예를 들어, 유전자 발현 활성화 스크린을 위해)에 사용되는 표적 유전자이다. 일부 실시양태에서, CD45는 표적 유전자로서 사용되지 않는다. CD45 발현을 조절하는 복합체를 확인하기 위해 본원에 개시된 조성물 및 방법은 유사하게 변형되어 본원에 개시된 것들을 포함하여, 다른 표적 유전자(예를 들어, 표적 내인성 유전자)에 적응될 수 있다.
일부 실시양태에서, CD71은 본 개시내용의 조성물 및 방법(예를 들어, 유전자 발현 억제 스크린을 위해)에 사용되는 표적 유전자이다. 일부 실시양태에서, CD71은 표적 유전자로서 사용되지 않는다. CD71 발현을 조절하는 복합체를 확인하기 위해 본원에 개시된 조성물 및 방법은 유사하게 변형되어 본원에 개시된 것들을 포함하여, 다른 표적 유전자(예를 들어, 표적 내인성 유전자)에 적응될 수 있다.
라이브러리
일부 양태에서, 복합체의 라이브러리가 본원에 개시된다. 본 개시내용의 라이브러리는 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 및/또는 활성 수준의 바람직한 변화를 유도하는 이종성 유전자 이펙터, 이들의 조합, 및 이를 함유하는 복합체를 확인하기 위한 스크리닝 분석에 유용할 수 있다. 본 개시내용의 라이브러리는 관심 있는 세포 유형, 예를 들어 특정 대상체, 특정 조직 또는 계통, 주어진 질병 또는 병태를 가진 대상체 등의 세포에서 표적 유전자(들)(예: 표적 내인성 유전자(들))의 발현 및/또는 활성 수준의 바람직한 변화를 유도할 수 있는 이종성 유전자 이펙터, 이의 조합, 및 이를 함유하는 복합체를 확인하기 위해 다양한 공급원으로부터의 다양한 세포 유형에서 본원에 개시된 방법을 사용하여 분석될 수 있다.
라이브러리의 구성원인 복합체는 동일한 가이드 모이어티, 가이드 핵산, 라이브러리에 존재하는 이종성 유전자 이펙터의 공급원, 표적 유전자의 클래스 등을 공유하는 것과 같은, 공통 속성을 공유할 수 있다. 라이브러리가 복합체당 2개 이상의 이종성 유전자 이펙터를 갖는 복합체로 구성된 경우, 이종성 유전자 이펙터 중 하나는 라이브러리의 다른 구성원과 공통 속성을 공유할 수 있는 반면, 다른 하나는 공통 속성을 공유하지 않을 수 있다. 일부 실시양태에서, 라이브러리가 복합체당 2개 이상의 이종성 유전자 이펙터를 갖는 복합체를 포함하는 경우, 이종성 유전자 이펙터 중 하나는 라이브러리의 다른 구성원과 첫 번째 공통 속성을 공유할 수 있고, 두 번째 이종성 유전자 이펙터는 라이브러리 다른 구성원과 함께 두 번째 공통 속성을 공유할 수 있다. 일부 실시양태에서, 라이브러리는 이종성 유전자 이펙터 사이의 공통 속성 없이 설계되는데, 예를 들어 편향되지 않은 라이브러리이다.
일부 실시양태에서, 복합체의 라이브러리는 인간 공급원으로부터의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 복합체의 라이브러리는 바이러스 공급원으로부터의 이종성 유전자 이펙터를 포함한다. 일부 실시양태에서, 복합체의 라이브러리는 본원에 개시된 다른 공급원으로부터의 이종성 유전자 이펙터를 포함한다.
일부 실시양태에서, 복합체의 라이브러리는 특정 공급원으로부터의 이종성 유전자 이펙터를 포함하는데, 예를 들어, 각각의 이종성 유전자 이펙터는 인간 단백질, 바이러스 단백질, 포유동물 단백질, 핵에 주로 국소화되는 단백질, 염색질 조절인자, 이종성염색질 형성을 촉진하는 인자, 메틸화를 통해 히스톤을 조절하는 인자, 아세틸화를 통해 히스톤을 조절하는 인자, 인산화를 통해 히스톤을 조절하는 인자, ADP-리보실화를 통해 히스톤을 조절하는 인자, 글리코실화를 통해 히스톤을 조절하는 인자, SUMO화를 통해 히스톤을 조절하는 인자, 유비퀴틴화를 통해 히스톤을 조절하는 인자, 예를 들어 ATP 가수분해 의존 과정을 통해 히스톤 구조를 리모델링하여 히스톤을 조절하는 인자, 히스톤 아세틸트랜스퍼라제, 히스톤 라이신 메틸트랜스퍼라제, 염색질 리모델링 복합체의 성분, 전사 조절인자, 전사 활성화제, 전사 억제인자 도메인, 전사 인자, 중간엽 줄기 세포 전사 인자, 배아 줄기 세포 전사 인자, 유도 만능 줄기 세포(iPSC) 전사 인자, 상피 줄기 세포 전사 인자, 암 줄기 세포 전사 인자, 암 관련 전사 인자, 면역 세포 전사 인자, 핵 수용체, 핵 호르몬 수용체, 검증된 인간 바이러스 전사 조절인자, 바이러스(예를 들어, 본원에 개시된 바이러스 계열, 하위계열, 속, 종 등으로부터 유래)게놈으로부터의 인자, 인간에게 인수공통전염이 가능한 바이러스 게놈으로부터의 인자, 공유된 인간/박쥐 바이러스로부터의 인자, 메타유전체 조사에서 얻은 바이러스 게놈의 인자, 인간 장에서 발견된 바이러스의 인자, 극한 환경에서 발견된 바이러스의 인자, 고도로 문서화된 전사 조절 모듈성을 지닌 바이러스 또는 단백질 클래스의 인자, 또는 본원에 공개된 또 다른 공급원으로부터 유래될 수 있다.
일부 실시양태에서, 복합체의 라이브러리는 예를 들어, 인간 단백질, 바이러스 단백질, 포유동물 단백질, 핵에 주로 국소화되는 단백질, 염색질 조절인자, 이종성염색질 형성을 촉진하는 인자, 메틸화를 통해 히스톤을 조절하는 인자, 아세틸화를 통해 히스톤을 조절하는 인자, 인산화를 통해 히스톤을 조절하는 인자, ADP-리보실화를 통해 히스톤을 조절하는 인자, 글리코실화를 통해 히스톤을 조절하는 인자, SUMO화를 통해 히스톤을 조절하는 인자, 유비퀴틴화를 통해 히스톤을 조절하는 인자, 예를 들어 ATP 가수분해 의존 과정을 통해 히스톤 구조를 리모델링하여 히스톤을 조절하는 인자, 히스톤 아세틸트랜스퍼라제, 히스톤 라이신 메틸트랜스퍼라제, 염색질 리모델링 복합체의 성분, 전사 조절인자, 전사 활성화제, 전사 억제인자 도메인, 전사 인자, 중간엽 줄기 세포 전사 인자, 배아 줄기 세포 전사 인자, 유도 만능 줄기 세포(iPSC) 전사 인자, 상피 줄기 세포 전사 인자, 암 줄기 세포 전사 인자, 암 관련 전사 인자, 면역 세포 전사 인자, 핵 수용체, 핵 호르몬 수용체, 검증된 인간 바이러스 전사 조절인자, 바이러스(예를 들어, 본원에 개시된 바이러스 계역, 하위계열, 속, 종 등으로부터 유래)게놈으로부터의 인자, 인간에게 인수공통전염이 가능한 바이러스 게놈으로부터의 인자, 공유된 인간/박쥐 바이러스로부터의 인자, 메타유전체 조사에서 얻은 바이러스 게놈의 인자, 인간 장에서 발견된 바이러스의 인자, 극한 환경에서 발견된 바이러스의 인자, 고도로 문서화된 전사 조절 모듈성을 지닌 바이러스 또는 단백질 클래스의 인자, 또는 본원에 공개된 또 다른 공급원 중 임의의 2종 이상의 공급원의 조합으로부터 유래된 이종성 유전자 이펙터를 포함한다.
일부 실시양태에서, 복합체의 라이브러리는 특정 세포하 국소화로부터의 이종성 유전자 이펙터, 예를 들어 세포의 핵에 국소화할 수 있거나 주로 국소화하는 인자를 포함한다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 복합체의 이종성 유전자 이펙터와는 다른 이종성 유전자 이펙터; 및 (ii) 라이브러리의 다른 복합체에서 핵산 서열을 가이드하기 위해 100% 서열 동일성을 나타내는 가이드 핵산 서열을 포함한다.
일부 실시양태에서, 라이브러리의 다양한 개별 복합체는 라이브러리의 다른 복합체에서 핵산 서열을 가이드하기 위하여 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 가이드 핵산을 포함한다. 일부 경우에, 본원에 개시된 라이브러리 내의 가이드 핵산 분자(예를 들어, sgRNA)가 서로 100% 서열 동일성을 나타내지 않더라도(예를 들어, 서로간에 약 80% 내지 99% 서열 동일성), 가이드 핵산 분자는 동일한 표적 유전자(예를 들어, 동일한 게놈 서열과 같은 동일한 표적 폴리뉴클레오티드 서열)에 결합하고 복합체를 형성할 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 이종성 유전자 이펙터; (ii) 라이브러리의 다른 개별 복합체와 유사하거나 동일한, 예를 들어 라이브러리의 모든 개별 복합체에 대해 동일한 가이드 모이어티(예를 들어, 가이드 핵산 서열을 포함)를 포함한다. 일부 실시양태에서, 가이드 모이어티는 본원에 개시된 뉴클레아제, 예를 들어 유전자 이펙터에 대하여 이종성인 엔도뉴클레아제를 포함한다. 상기 뉴클레아제는 본 개시내용의 뉴클레아제-결핍 또는 뉴클레아제-사멸 뉴클레아제일 수 있다. 상기 뉴클레아제는 라이브러리에 있는 다른 복합체(예를 들어, 다른 모든 복합체)의 이종성 뉴클레아제와 100% 서열 동일성을 나타낼 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 제1 이종성 유전자 이펙터; (ii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와 동일한 제2 이종성 유전자 이펙터; 및 (iii) 라이브러리의 다른 개별 복합체와 동일한 가이드 모이어티, 예를 들어 라이브러리의 모든 개별 복합체에 대해 동일한 가이드 모이어티를 포함한다. 상기 가이드 모이어티는 라이브러리 내의 다른(예를 들어, 모든) 다른 개별 복합체에 대해 100% 동일성을 나타내는 가이드 핵산일 수 있거나 이를 포함할 수 있다. 상기 가이드 모이어티는 라이브러리 내의 다른 복합체(예를 들어, 다른 모든 복합체)의 이종성 뉴클레아제에 대해 100% 서열 동일성을 나타내는 뉴클레아제(예를 들어, 이종성 엔도뉴클레아제)를 포함할 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 제1 이종성 유전자 이펙터; (ii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와 동일한 제2 이종성 유전자 이펙터; (iii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와 동일한 제3의 이종성 유전자 이펙터; 및 (iv) 라이브러리의 다른 개별 복합체와 동일한 가이드 모이어티, 예를 들어 라이브러리의 모든 개별 복합체에 대해 동일한 가이드 모이어티를 포함한다. 상기 가이드 모이어티는 라이브러리 내의 다른 것(예를 들어, 다른 모든 개별 복합체)과 100% 동일성을 나타내는 가이드 핵산일 수 있거나 이를 포함할 수 있다. 상기 가이드 모이어티는 라이브러리 내의 다른 복합체(예를 들어, 다른 모든 복합체)의 이종성 뉴클레아제에 대해 100% 서열 동일성을 나타내는 뉴클레아제(예를 들어, 이종성 엔도뉴클레아제)를 포함할 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 제1 이종성 유전자 이펙터; (ii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 제2 이종성 유전자 이펙터; (iii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와 동일한 제3의 이종성 유전자 이펙터; 및 (iv) 라이브러리의 다른 개별 복합체와 동일한 가이드 모이어티, 예를 들어 라이브러리의 모든 개별 복합체에 대해 동일한 가이드 모이어티를 포함한다. 상기 가이드 모이어티는 라이브러리 내의 다른 것(예를 들어, 다른 모든 개별 복합체)과 100% 동일성을 나타내는 가이드 핵산일 수 있거나 이를 포함할 수 있다. 상기 가이드 모이어티는 라이브러리 내의 다른 복합체(예를 들어, 다른 모든 복합체)의 이종성 뉴클레아제에 대해 100% 서열 동일성을 나타내는 뉴클레아제(예를 들어, 이종성 엔도뉴클레아제)를 포함할 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리 내의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 제1 이종성 유전자 이펙터; (ii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와 다르며 라이브러리의 또 다른 개별 복합체와 동일한 제2 이종성 유전자 이펙터; (iii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와 동일한 제3의 이종성 유전자 이펙터; 및 (iv) 라이브러리의 다른 개별 복합체와 동일한 가이드 모이어티, 예를 들어 라이브러리의 모든 개별 복합체에 대해 동일한 가이드 모이어티를 포함한다. 상기 가이드 모이어티는 라이브러리 내의 다른(예를 들어, 다른 모든) 개별 복합체에 대해 100% 동일성을 나타내는 가이드 핵산일 수 있거나 이를 포함할 수 있다. 상기 가이드 모이어티는 라이브러리 내의 다른 복합체(예를 들어, 다른 모든 복합체)의 이종성 뉴클레아제에 대해 100% 서열 동일성을 나타내는 뉴클레아제(예를 들어, 이종성 엔도뉴클레아제)를 포함할 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리 내의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 제1 이종성 유전자 이펙터; (ii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와 다르며 라이브러리의 또 다른 개별 복합체와 동일한 제2 이종성 유전자 이펙터; (iii) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 제3의 이종성 유전자 이펙터; 및 (iv) 라이브러리의 다른 개별 복합체와 동일한 가이드 모이어티, 예를 들어 라이브러리의 모든 개별 복합체에 대해 동일한 가이드 모이어티를 포함한다. 상기 가이드 모이어티는 라이브러리 내의 다른(예를 들어, 다른 모든) 개별 복합체에 대해 100% 동일성을 나타내는 가이드 핵산일 수 있거나 이를 포함할 수 있다. 가이드 모이어티는 라이브러리 내의 다른 복합체(예를 들어, 다른 모든 복합체)의 이종성 뉴클레아제에 대해 100% 서열 동일성을 나타내는 뉴클레아제(예를 들어, 이종성 엔도뉴클레아제)를 포함할 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체는 (i) 라이브러리의 다른 개별 복합체에 존재하는 이종성 유전자 이펙터와는 다른 이종성 유전자 이펙터; 및 (ii) 라이브러리 내의 다른 개별 복합체와는 다른 가이드 모이어티(예를 들어, 가이드 핵산 서열을 포함)를 포함한다. 상기 가이드 모이어티는 라이브러리 내의 다른 개별 복합체에 존재하는 가이드 서열과 다른 가이드 핵산 서열을 포함할 수 있다. 상기 가이드 모이어티는 라이브러리 내의 다른 복합체(예를 들어, 다른 모든 복합체)의 이종성 뉴클레아제에 대해 100% 서열 동일성을 나타내는 뉴클레아제(예를 들어, 이종성 엔도뉴클레아제)를 포함할 수 있다. 상기 가이드 모이어티는 라이브러리의 다른 개별 복합체와는 다른 뉴클레아제(예: 이종성 엔도뉴클레아제)를 포함할 수 있다.
일부 실시양태에서, 라이브러리의 개별 복합체(예를 들어, 상이한 이종성 유전자 이펙터를 포함하는 것)는 동일한 표적 유전자(예를 들어, 표적 내인성 유전자) 또는 표적 유전자 조절 서열에 특이적으로 결합한다. 일부 실시양태에서, 라이브러리의 개별 복합체(예를 들어, 동일 및/또는 다른 이종성 유전자 이펙터를 포함하는 것)는 표적 유전자 또는 표적 유전자 조절 서열의 다른 부분(예를 들어, 하위서열)에 특이적으로 결합한다. 일부 실시양태에서, 라이브러리의 개별 복합체(예를 들어, 동일하고/하거나 상이한 이종성 유전자 이펙터를 포함하는 것)는 상이한 표적 유전자 조절 서열에 특이적으로 결합하며, 이들 각각은 동일한 유전자의 발현을 조절할 수 있다. 일부 실시양태에서, 라이브러리의 개별 복합체(예를 들어, 동일 및/또는 다른 이종성 유전자 이펙터를 포함하는 것)은 상이한 표적 유전자(예를 들어, 표적 내인성 유전자) 또는 표적 유전자 조절 서열에 특이적으로 결합한다.
본 개시내용의 라이브러리는 라이브러리의 의도된 목적을 위해 임의의 적합한 수의 상이한 복합체를 포함하거나, 본질적으로 구성하거나, 구성할 수 있다. 일부 실시양태에서, "상이한 복합체", "개별 복합체", 또는 "상이한 개별 복합체"는 서로 조성이 다른 라이브러리의 구성원을 언급할 수 있으며, 예를 들어 서로 비교할 때, 서로 다른 이종성 유전자 이펙터(또는 이종성 유전자 이펙터의 조합)를 포함한다. 이러한 경우 "다른 복합체", "개별 복합체", 또는 "다른 개별 복합체"의 여러 카피가 라이브러리에 존재할 수 있으며, 동일한 복합체의 여러 카피는 "다른 복합체", "개별 복합체" 또는 "다른 개별 복합체"가 아니다. 예를 들어, 라이브러리에 각각 다른 이종성 유전자 이펙터를 포함하는 5개의 서로 다른 복합체가 포함될 수 있으며, 각 복합체의 100개의 카피가 라이브러리에 존재할 수 있으므로, 500개의 분자 복합체가 있는 라이브러리가 생성되지만 "다른 복합체"는 5개만 존재하게 된다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 160개, 적어도 170개, 적어도 180개, 적어도 190개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 350개, 적어도 400개, 적어도 450개, 적어도 500개, 적어도 550개, 적어도 600개, 적어도 650개, 적어도 700개, 적어도 750개, 적어도 800개, 적어도 850개, 적어도 900개, 적어도 950개, 적어도 1000개, 적어도 1100개, 적어도 1200개, 적어도 1300개, 적어도 1400개, 적어도 1500개, 적어도 1600개, 적어도 1700개, 적어도 1800개, 적어도 1900개, 적어도 2000개, 적어도 2500개, 적어도 3000개, 적어도 3500개, 적어도 4000개, 적어도 4500개, 적어도 5000개, 적어도 5500개, 적어도 6000개, 적어도 6500개, 적어도 7000개, 적어도 7500개, 적어도 8000개, 적어도 8500개, 적어도 9000개, 적어도 9500개, 적어도 10000개, 적어도 10500개, 적어도 11000개, 적어도 11500개, 적어도 12000개, 적어도 12500개, 적어도 13,000개, 적어도 13,500개, 적어도 14,000개, 적어도 14,500개, 적어도 15,000개, 적어도 15,500개, 적어도 16,000개, 적어도 16,500개, 적어도 17,000개, 적어도 17,500개, 적어도 18,000개, 적어도 18,500개, 적어도 19000개, 적어도 19500개, 적어도 20000개, 적어도 20500개, 적어도 21000개, 적어도 21500개, 적어도 22000개, 적어도 22500개, 적어도 23000개, 적어도 23500개, 적어도 24000개, 적어도 24500개, 적어도 25000개, 적어도 25,500개, 적어도 26,000개, 적어도 26,500개, 적어도 27,000개, 적어도 27,500개, 적어도 28,000개, 적어도 28,500개, 적어도 29,000개, 적어도 29,500개, 적어도 30,000개, 적어도 35,000개, 적어도 40,000개, 적어도 45,000개, 적어도 50,000개, 적어도 60,000개, 적어도 70,000개, 적어도 80,000개, 적어도 90,000개, 또는 적어도 100,000개의 서로 다른 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 25개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 100개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 500개의 서로 다른 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 1000개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 15000개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 25000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 최대 5개, 최대 10개, 최대 15개, 최대 20개, 최대 25개, 최대 30개, 최대 35개, 최대 40개, 최대 45개, 최대 50개, 최대 60개, 최대 70개, 최대 80개, 최대 90개, 최대 100개, 최대 110개, 최대 120개, 최대 130개, 최대 140개, 최대 150개, 최대 160개, 최대 170개, 최대 180개, 최대 190개, 최대 200개, 최대 250개, 최대 300개, 최대 350개, 최대 400개, 최대 450개, 최대 500개, 최대 550개, 최대 600개, 최대 650개, 최대 700개, 최대 750개, 최대 800개, 최대 850개, 최대 900개, 최대 950개, 최대 1000개, 최대 1100개, 최대 1200개, 최대 1300개, 최대 1400개, 최대 1500개, 최대 1600개, 최대 1700개, 최대 1800개, 최대 1900개, 최대 2000개, 최대 2500개, 최대 3000개, 최대 3500개, 최대 4000개, 최대 4500개, 최대 5000개, 최대 5500개, 최대 6000개, 최대 6500개, 최대 7000개, 최대 7500개, 최대 8000개, 최대 8500개, 최대 9000개, 최대 9500개, 최대 10000개, 최대 10500개, 최대 11000개, 최대 11500개, 최대 12000개, 최대 12500개, 최대 13000개, 최대 13500개, 최대 14000개, 최대 14500개, 최대 15000개, 최대 15500개, 최대 16000개, 최대 16500개, 최대 17000개, 최대 17500개, 최대 18000개, 최대 18500개, 최대 19000개, 최대 19500개, 최대 20000개, 최대 20500개, 최대 21000개, 최대 21500개, 최대 22000개, 최대 22500개, 최대 23000개, 최대 23500개, 최대 24000개, 최대 24500개, 최대 25000개, 최대 25500개, 최대 26000개, 최대 26500개, 최대 27000개, 최대 27500개, 최대 28000개, 최대 28500개, 최대 29000개, 최대 29500개, 최대 30000개, 최대 35000개, 최대 40000개, 최대 45000개, 최대 50000개, 최대 60000개, 최대 70000개, 최대 80000개, 최대 90000개, 또는 최대 100000개의 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 최대 100,000개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 최대 50000개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 최대 30000개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 최대 20000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 25개의 상이한 복합체 및 최대 100개, 최대 110개, 최대 120개, 최대 130개, 최대 140개, 최대 150개, 최대 160개, 최대 170개, 최대 180개, 최대 190개, 최대 200개, 최대 250개, 최대 300개, 최대 350개, 최대 400개, 최대 450개, 최대 500개, 최대 550개, 최대 600개, 최대 650개, 최대 700개, 최대 750개, 최대 800개, 최대 850개, 최대 900개, 최대 950개, 최대 1000개, 최대 1100개, 최대 1200개, 최대 1300개, 최대 1400개, 최대 1500개, 최대 1600개, 최대 1700개, 최대 1800개, 최대 1900개, 최대 2000개, 최대 2500개, 최대 3000개, 최대 3500개, 최대 4000개, 최대 4500개, 최대 5000개, 최대 5500개, 최대 6000개, 최대 6500개, 최대 7000개, 최대 7500개, 최대 8000개, 최대 8500개, 최대 9000개, 최대 9500개, 최대 10000개, 최대 10500개, 최대 11000개, 최대 11500개, 최대 12000개, 최대 12500개, 최대 13000개, 최대 13500개, 최대 14000개, 최대 14500개, 최대 15000개, 최대 15500개, 최대 16000개, 최대 16500개, 최대 17000개, 최대 17500개, 최대 18000개, 최대 18500개, 최대 19000개, 최대 19500개, 최대 20000개, 최대 20500개, 최대 21000개, 최대 21500개, 최대 22000개, 최대 22500개, 최대 23000개, 최대 23500개, 최대 24000개, 최대 24500개, 최대 25000개, 최대 25500개, 최대 26000개, 최대 26500개, 최대 27000개, 최대 27500개, 최대 28000개, 최대 28500개, 최대 29000개, 최대 29500개, 최대 30000개, 최대 35000개, 최대 40000개, 최대 45000개, 최대 50000개, 최대 60000개, 최대 70000개, 최대 80000개, 최대 90000개, 또는 최대 100000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 100개의 상이한 복합체 및 최대 100개, 최대 110개, 최대 120개, 최대 130개, 최대 140개, 최대 150개, 최대 160개, 최대 170개, 최대 180개, 최대 190개, 최대 200개, 최대 250개, 최대 300개, 최대 350개, 최대 400개, 최대 450개, 최대 500개, 최대 550개, 최대 600개, 최대 650개, 최대 700개, 최대 750개, 최대 800개, 최대 850개, 최대 900개, 최대 950개, 최대 1000개, 최대 1100개, 최대 1200개, 최대 1300개, 최대 1400개, 최대 1500개, 최대 1600개, 최대 1700개, 최대 1800개, 최대 1900개, 최대 2000개, 최대 2500개, 최대 3000개, 최대 3500개, 최대 4000개, 최대 4500개, 최대 5000개, 최대 5500개, 최대 6000개, 최대 6500개, 최대 7000개, 최대 7500개, 최대 8000개, 최대 8500개, 최대 9000개, 최대 9500개, 최대 10000개, 최대 10500개, 최대 11000개, 최대 11500개, 최대 12000개, 최대 12500개, 최대 13000개, 최대 13500개, 최대 14000개, 최대 14500개, 최대 15000개, 최대 15500개, 최대 16000개, 최대 16500개, 최대 17000개, 최대 17500개, 최대 18000개, 최대 18500개, 최대 19000개, 최대 19500개, 최대 20000개, 최대 20500개, 최대 21000개, 최대 21500개, 최대 22000개, 최대 22500개, 최대 23000개, 최대 23500개, 최대 24000개, 최대 24500개, 최대 25000개, 최대 25500개, 최대 26000개, 최대 26500개, 최대 27000개, 최대 27500개, 최대 28000개, 최대 28500개, 최대 29000개, 최대 29500개, 최대 30000개, 최대 35000개, 최대 40000개, 최대 45000개, 최대 50000개, 최대 60000개, 최대 70000개, 최대 80000개, 최대 90000개, 또는 최대 100000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 500개의 상이한 복합체 및 최대 100개, 최대 110개, 최대 120개, 최대 130개, 최대 140개, 최대 150개, 최대 160개, 최대 170개, 최대 180개, 최대 190개, 최대 200개, 최대 250개, 최대 300개, 최대 350개, 최대 400개, 최대 450개, 최대 500개, 최대 550개, 최대 600개, 최대 650개, 최대 700개, 최대 750개, 최대 800개, 최대 850개, 최대 900개, 최대 950개, 최대 1000개, 최대 1100개, 최대 1200개, 최대 1300개, 최대 1400개, 최대 1500개, 최대 1600개, 최대 1700개, 최대 1800개, 최대 1900개, 최대 2000개, 최대 2500개, 최대 3000개, 최대 3500개, 최대 4000개, 최대 4500개, 최대 5000개, 최대 5500개, 최대 6000개, 최대 6500개, 최대 7000개, 최대 7500개, 최대 8000개, 최대 8500개, 최대 9000개, 최대 9500개, 최대 10000개, 최대 10500개, 최대 11000개, 최대 11500개, 최대 12000개, 최대 12500개, 최대 13000개, 최대 13500개, 최대 14000개, 최대 14500개, 최대 15000개, 최대 15500개, 최대 16000개, 최대 16500개, 최대 17000개, 최대 17500개, 최대 18000개, 최대 18500개, 최대 19000개, 최대 19500개, 최대 20000개, 최대 20500개, 최대 21000개, 최대 21500개, 최대 22000개, 최대 22500개, 최대 23000개, 최대 23500개, 최대 24000개, 최대 24500개, 최대 25000개, 최대 25500개, 최대 26000개, 최대 26500개, 최대 27000개, 최대 27500개, 최대 28000개, 최대 28500개, 최대 29000개, 최대 29500개, 최대 30000개, 최대 35000개, 최대 40000개, 최대 45000개, 최대 50000개, 최대 60000개, 최대 70000개, 최대 80000개, 최대 90000개, 또는 최대 100000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 1000개의 상이한 복합체 및 최대 100개, 최대 110개, 최대 120개, 최대 130개, 최대 140개, 최대 150개, 최대 160개, 최대 170개, 최대 180개, 최대 190개, 최대 200개, 최대 250개, 최대 300개, 최대 350개, 최대 400개, 최대 450개, 최대 500개, 최대 550개, 최대 600개, 최대 650개, 최대 700개, 최대 750개, 최대 800개, 최대 850개, 최대 900개, 최대 950개, 최대 1000개, 최대 1100개, 최대 1200개, 최대 1300개, 최대 1400개, 최대 1500개, 최대 1600개, 최대 1700개, 최대 1800개, 최대 1900개, 최대 2000개, 최대 2500개, 최대 3000개, 최대 3500개, 최대 4000개, 최대 4500개, 최대 5000개, 최대 5500개, 최대 6000개, 최대 6500개, 최대 7000개, 최대 7500개, 최대 8000개, 최대 8500개, 최대 9000개, 최대 9500개, 최대 10000개, 최대 10500개, 최대 11000개, 최대 11500개, 최대 12000개, 최대 12500개, 최대 13000개, 최대 13500개, 최대 14000개, 최대 14500개, 최대 15000개, 최대 15500개, 최대 16000개, 최대 16500개, 최대 17000개, 최대 17500개, 최대 18000개, 최대 18500개, 최대 19000개, 최대 19500개, 최대 20000개, 최대 20500개, 최대 21000개, 최대 21500개, 최대 22000개, 최대 22500개, 최대 23000개, 최대 23500개, 최대 24000개, 최대 24500개, 최대 25000개, 최대 25500개, 최대 26000개, 최대 26500개, 최대 27000개, 최대 27500개, 최대 28000개, 최대 28500개, 최대 29000개, 최대 29500개, 최대 30000개, 최대 35000개, 최대 40000개, 최대 45000개, 최대 50000개, 최대 60000개, 최대 70000개, 최대 80000개, 최대 90000개, 또는 최대 100000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 5000개의 상이한 복합체 및 최대 100개, 최대 110개, 최대 120개, 최대 130개, 최대 140개, 최대 150개, 최대 160개, 최대 170개, 최대 180개, 최대 190개, 최대 200개, 최대 250개, 최대 300개, 최대 350개, 최대 400개, 최대 450개, 최대 500개, 최대 550개, 최대 600개, 최대 650개, 최대 700개, 최대 750개, 최대 800개, 최대 850개, 최대 900개, 최대 950개, 최대 1000개, 최대 1100개, 최대 1200개, 최대 1300개, 최대 1400개, 최대 1500개, 최대 1600개, 최대 1700개, 최대 1800개, 최대 1900개, 최대 2000개, 최대 2500개, 최대 3000개, 최대 3500개, 최대 4000개, 최대 4500개, 최대 5000개, 최대 5500개, 최대 6000개, 최대 6500개, 최대 7000개, 최대 7500개, 최대 8000개, 최대 8500개, 최대 9000개, 최대 9500개, 최대 10000개, 최대 10500개, 최대 11000개, 최대 11500개, 최대 12000개, 최대 12500개, 최대 13000개, 최대 13500개, 최대 14000개, 최대 14500개, 최대 15000개, 최대 15500개, 최대 16000개, 최대 16500개, 최대 17000개, 최대 17500개, 최대 18000개, 최대 18500개, 최대 19000개, 최대 19500개, 최대 20000개, 최대 20500개, 최대 21000개, 최대 21500개, 최대 22000개, 최대 22500개, 최대 23000개, 최대 23500개, 최대 24000개, 최대 24500개, 최대 25000개, 최대 25500개, 최대 26000개, 최대 26500개, 최대 27000개, 최대 27500개, 최대 28000개, 최대 28500개, 최대 29000개, 최대 29500개, 최대 30000개, 최대 35000개, 최대 40000개, 최대 45000개, 최대 50000개, 최대 60000개, 최대 70000개, 최대 80000개, 최대 90000개, 또는 최대 100000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 적어도 10000개의 상이한 복합체 및 최대 100개, 최대 110개, 최대 120개, 최대 130개, 최대 140개, 최대 150개, 최대 160개, 최대 170개, 최대 180개, 최대 190개, 최대 200개, 최대 250개, 최대 300개, 최대 350개, 최대 400개, 최대 450개, 최대 500개, 최대 550개, 최대 600개, 최대 650개, 최대 700개, 최대 750개, 최대 800개, 최대 850개, 최대 900개, 최대 950개, 최대 1000개, 최대 1100개, 최대 1200개, 최대 1300개, 최대 1400개, 최대 1500개, 최대 1600개, 최대 1700개, 최대 1800개, 최대 1900개, 최대 2000개, 최대 2500개, 최대 3000개, 최대 3500개, 최대 4000개, 최대 4500개, 최대 5000개, 최대 5500개, 최대 6000개, 최대 6500개, 최대 7000개, 최대 7500개, 최대 8000개, 최대 8500개, 최대 9000개, 최대 9500개, 최대 10000개, 최대 10500개, 최대 11000개, 최대 11500개, 최대 12000개, 최대 12500개, 최대 13000개, 최대 13500개, 최대 14000개, 최대 14500개, 최대 15000개, 최대 15500개, 최대 16000개, 최대 16500개, 최대 17000개, 최대 17500개, 최대 18000개, 최대 18500개, 최대 19000개, 최대 19500개, 최대 20000개, 최대 20500개, 최대 21000개, 최대 21500개, 최대 22000개, 최대 22500개, 최대 23000개, 최대 23500개, 최대 24000개, 최대 24500개, 최대 25000개, 최대 25500개, 최대 26000개, 최대 26500개, 최대 27000개, 최대 27500개, 최대 28000개, 최대 28500개, 최대 29000개, 최대 29500개, 최대 30000개, 최대 35000개, 최대 40000개, 최대 45000개, 최대 50000개, 최대 60000개, 최대 70000개, 최대 80000개, 최대 90000개, 또는 최대 100000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 약 5개, 약 10개, 약 15개, 약 20개, 약 25개, 약 30개, 약 35개, 약 40개, 약 45개, 약 50개, 약 60개, 약 70개, 약 80개, 약 90개, 약 100개, 약 110개, 약 120개, 약 130개, 약 140개, 약 150개, 약 160개, 약 170개, 약 180개, 약 190개, 약 200개, 약 250개, 약 300개, 약 350개, 약 400개, 약 450개, 약 500개, 약 550개, 약 600개, 약 650개, 약 700개, 약 750개, 약 800개, 약 850개, 약 900개, 약 950개, 약 1000개, 약 1100개, 약 1200개, 약 1300개, 약 1400개, 약 1500개, 약 1600개, 약 1700개, 약 1800개, 약 1900개, 약 2000개, 약 2500개, 약 3000개, 약 3500개, 약 4000개, 약 4500개, 약 5000개, 약 5500개, 약 6000개, 약 6500개, 약 7000개, 약 7500개, 약 8000개, 약 8500개, 약 9000개, 약 9500개, 약 10000개, 약 10500개, 약 11000개, 약 11500개, 약 12000개, 약 12500개, 약 13000개, 약 13500개, 약 14000개, 약 14500개, 약 15000개, 약 15500개, 약 16000개, 약 16500개, 약 17000개, 약 17500개, 약 18000개, 약 18500개, 약 19000개, 약 19500개, 약 20000개, 약 20500개, 약 21000개, 약 21500개, 약 22000개, 약 22500개, 약 23000개, 약 23500개, 약 24 000개, 약 24500 개, 약 25000개, 약 25500개, 약 26000개, 약 26500개, 약 27000개, 약 27500개, 약 28000개, 약 28500개, 약 29000개, 약 29500개, 약 30000개, 약 35000개, 약 40000개, 약 45000개, 약 50000개, 약 60000개, 약 70000개, 약 80000개, 약 90000개, 또는 약 100000개의 상이한 복합체를 포함한다.
일부 실시양태에서, 본 개시내용의 라이브러리는 약 10000개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 약 16000개의 상이한 복합체를 포함한다. 일부 실시양태에서, 본 개시내용의 라이브러리는 약 28000개의 상이한 복합체를 포함한다.
세포
본 개시내용의 조성물, 방법 및 시스템은 다양한 유형의 세포 및 이의 집단에 적용될 수 있다. 예를 들어, 본 개시내용의 복합체는 특정 유형의 세포 또는 이의 집단에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 유도하는 데 사용될 수 있다. 본 개시내용의 방법은 특정 유형의 세포 또는 이의 집단에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성의 변화를 유도할 수 있는 복합체를 확인하는 데 사용될 수 있다.
일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 특정 세포 유형에 특이적인 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현에 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 2개 이상의 세포 유형에 적용가능한 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현에 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 3개 이상의 세포 유형에 적용가능한 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현에 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 세포 유형의 부류, 예를 들어 유사한 조직에 존재하거나, 동일하거나 유사한 분화 계통, 예를 들어 줄기 세포, 면역 세포, T 세포, T 이펙터 세포 등에서 유래하는 중복되는 기능적 역할을 갖는 세포 유형의 부류에 적용가능한 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현에 바람직한 변화를 가져온다. 일부 실시양태에서, 복합체 또는 이종성 유전자 이펙터는 다양한 세포 유형에 광범위하게 적용 가능한 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현에 바람직한 변화를 가져오는데, 예를 들어, 적합한 방법을 사용하여 세포에 도입되었을 때 다중 표적 세포 유형에 대한 특정 역치 이상이거나 미만인 표적 유전자의 발현 수준을 유도한다.
일부 실시양태에서, 본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 1차 세포에서 표적 유전자의 발현 또는 활성 수준의 변화를 가져오기 위해 사용된다. 일부 실시양태에서, 본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 세포주에서 표적 유전자의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용된다. 일부 실시양태에서, 본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 불멸화 세포에서 표적 유전자의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용된다.
일부 실시양태에서, 본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 포유동물 세포, 예를 들면, 인간 세포, 비-인간 영장류 세포, 비-설치류 포유동물 세포, 비-인간 포유동물 세포, 돼지 세포, 토끼류 세포, 개 세포 등에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용된다. 일부 실시양태에서, 본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 식물 세포, 조류 세포, 파충류 세포, 박테리아 세포, 또는 고세균 세포에서 표적 유전자의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용된다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 인간 세포에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 줄기 세포에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 분화된 세포에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 질병 관련 세포에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 암 세포에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 비-암 세포에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위하여 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 림프구 세포, 예컨대 B 세포, T 세포(세포독성 T 세포, 자연 살해 T 세포, 조절 T 세포, T 보조 세포), 자연 살해 세포, 사이토카인 유도 살해(CIK) 세포(예를 들어 US20080241194 참조); 골수 세포, 예컨대 과립구(호염기성 과립구, 호산구 과립구, 호중구 과립구/과분절된 호중구), 단핵구/대식세포, 적혈구, 망상적혈구, 비만세포, 혈소판/거핵구, 수지상 세포; 갑상선(갑상선 상피 세포, 여포 주위 세포), 부갑상선(부갑상선 수석 세포, 호산 세포), 부신(크로마핀 세포), 송과체(송과체세포) 세포를 포함하는 내분비계 세포; 신경교 세포(성상교세포, 소교세포), 거대세포 신경분비 세포, 성상 세포, Boettcher 세포, 및 뇌하수체(성선 자극 분비세포, 코르티코트로프, 갑상선 자극 호르몬 분비세포, 성장호르몬 분비세포, 락토트로프)를 포함하는 신경계 세포; 폐세포(제I형 폐세포, 제II형 폐세포), 클라라 세포, 술잔세포, 진애세포를 포함하는 호흡기계 세포; 심근세포, 혈관주위세포를 포함한 순환계 세포; 위(위 주요 세포, 벽 세포), 술잔세포, 파네스세포, G 세포, D 세포, ECL 세포, I 세포, K 세포, S 세포를 포함하는 소화 시스템의 세포; 장크롬친화성세포, APUD 세포, 간 세포(예를 들어, 간세포 또는 쿠퍼세포), 연골/뼈/근육을 포함하는 장내분비 세포; 조골세포(Osteoblast), 골세포(Osteocyte), 파골세포(Osteoclast), 치아 세포(Cementoblast, Ameloblast)를 포함하는 뼈 세포; 연골모세포, 연골세포를 포함하는 연골 세포; 트라이코사이트(Trichocyte), 케라틴세포, 멜라닌세포(모반세포)를 포함한 피부 세포; 근세포를 포함한 근육 세포; 다리세포, 사구체혈관사이세포, 사구체내 혈관사이세포/사구체외 혈관사이세포, 신장 근위세뇨관 브러시 경계 세포, 치밀황반 세포를 포함하는 비뇨기계 세포; 정자(Spermatozoon), 세르톨리(Sertoli)세포, 레이디히(Leydig)세포, 난자를 포함하는 생식계 세포; 및 지방세포, 섬유아세포, 힘줄 세포, 표피 케라틴세포, 표피 기저 세포, 손톱 및 발톱의 각질 세포, 손발톱 기저 세포, 수질 모간 세포, 피질 모간 세포, 큐티클 모간 세포, 큐티클 모근초 세포, 헉슬리층의 모근초세포, 헨레층의 모근초세포, 외모근초세포, 모발기질세포, 습중층장벽상피세포, 각막, 혀, 구강, 식도, 항문관, 원위 요도 및 질의 중층편평상피 표면상피세포, 각막 상피, 혀, 구강, 식도, 항문관, 원위 요도 및 질의 기저 세포, 요로 상피 세포, 외분비 분비 상피 세포, 침샘 점액 세포, 침샘 장액 세포, 혀의 본 에브너선 세포, 유선 세포, 눈물샘 세포, 귀의 귀지선 세포, 에크린 한선 암색 세포, 에크린 한선 투명 세포, 아포크린 땀샘 세포, 눈꺼풀의 몰선 세포, 피지선 세포, 코의 보우만선 세포, 십이지장의 브루너선 세포, 정낭 세포, 전립선 세포, 구요도선 세포, 바르톨린선 세포, 리트르선 세포, 자궁 자궁내막세포, 호흡기 및 소화관의 고립잔세포, 위내막점액세포, 위선 자임세포, 위샘 산소세포, 췌장선조세포, 소장 판레스세포, 폐의 제2형 폐포세포, 폐의 클라라세포, 호르몬 분비 세포, 뇌하수체 전엽 세포, 체세포 자극, 유산 자극, 갑상선 자극, 성선 자극, 피질 자극, 뇌하수체 중기 세포, 거대 세포 신경 분비 세포, 장 및 호흡기 세포, 갑상선 세포, 갑상선 상피 세포, 부엽 세포, 부갑상선 세포, 부갑상선 주요 세포, 옥시필 세포, 부신 세포, 크로마핀 세포, 고환의 레이 디그 세포, 난소 난포의 내부 테카 세포, 파열된 난포의 황체 세포, 과립구 루테인 세포, 테카 루테인 세포, 사구체 세포, 신장의 치밀황반 세포, 대사 및 저장 세포, 장벽 기능 세포(예: 폐, 장, 외분비선 및 비뇨생식관), 신장, 제1형 폐포세포, 췌장관 세포(중심선 세포), 비횡문관 세포(한선, 침샘, 유선 등), 관 세포(정낭, 전립선 등), 폐쇄된 내부 체강을 감싸는 상피 세포, 추진 기능을 가진 섬모 세포, 세포외 기질 분비 세포, 수축 세포를 포함한 기타 세포; 골격근 세포, 줄기세포, 심장 근육 세포, 혈액 및 면역체계 세포, 적혈구, 거핵구, 단핵구, 결합 조직 대식세포(다양한 유형), 표피 랑게르한스 세포, 파골세포, 수지상 세포, 소교세포, 호중구 과립구, 호산구 과립구, 호염기성 과립구, 비만세포, 보조 T 세포, 억제인자 T 세포, 세포독성 T 세포, 자연살해 T 세포, B 세포, 자연살해 세포, 망상적혈구, 줄기세포 및 혈액 및 면역 체계에 사용되는 전구 세포(다양한 유형), 다능성줄기세포, 전분화줄기세포, 유도만능줄기세포, 성체줄기세포, 감각변환세포, 신경세포, 자율신경세포, 감각기관 및 말초신경 지지세포, 중추신경계 신경교세포 및 신경교세포, 수정체 세포, 색소세포, 멜라닌세포, 망막색소세포 상피 세포, 생식 세포, 난원세포/난모세포, 정세포, 정모세포, 정조세포, 정자, 보육세포, 난소 여포 세포, 세르톨리 세포, 흉선 상피 세포, 간질 세포, 간질 신장 세포, 총골수 전구 세포, 총 림프 전구 세포, 및 본원에 개시된 임의의 세포 유형으로 분화되거나 분화될 줄기 세포에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위해 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 줄기 세포, 예를 들어 분리된 줄기 세포(예: ESC) 또는 유도된 줄기 세포(예: iPSC)에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오는 데 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 조혈 줄기 세포, 예를 들어, 대상체로부터의 조혈 줄기세포, 예컨대 골수 또는 말초 혈액으로부터의 조혈 줄기 세포(예를 들어, 동원된 말초 혈액 성분채집 제품, 예를 들어 GCSF, GM-CSF, 모조빌 또는 이들의 조합의 투여에 의해 동원됨)에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위해 사용될 수 있다.
일부 경우에, 줄기세포(예를 들어, ESC 또는 iPSC)의 다능성은 부분적으로 세포의 다능성 특성을 평가함으로써 결정될 수 있다. 다능성 특성에는 다능성 줄기세포 형태; 무제한의 자가 갱신 가능성; SSEA1, SSEA3/4, SSEA5, TRA1-60/81, TRA1-85, TRA2-54, GCTM-2, TG343, TG30, CD9, CD29, CD133/프로미닌, CD140a, CD56, CD73, CD90, CD105, OCT4, NANOG, SOX2, CD30 및/또는 CD50을 포함하지만 이에 제한되지 않는 다능성 줄기세포 마커의 발현; 3종의 체세포 계통(외배엽, 중배엽 및 내배엽) 모두로 분화하는 능력; 3종의 체세포 계통을 포함하는 기형종을 형성하는 능력; 및/또는 (vi) 3종의 체세포 계통의 세포를 포함하는 배아체의 형성 능력이 포함될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 면역 세포, 예를 들어 림프구, T 세포, CD4+ T 세포, CD8+ T 세포, 알파-베타 T 세포, 감마-델타 T 세포, T 조절 세포(Tregs), 세포독성 T 림프구, Th1 세포, Th2 세포, Th17 세포, Th9 세포, 미접촉 T 세포, 기억 T 세포, 이펙터 T 세포, 이펙터-기억 T 세포(TEM), 중추 기억 T 세포(TCM), 상주 기억 T 세포(TRM), 여포 보조 T 세포(TFH), 자연살해 T 세포(NKT), 종양침윤림프구(TIL), 자연살해세포(NK), 선천적인 림프세포(ILC), ILC1 세포, ILC2 세포, ILC3 세포, 림프조직유도세포(LTi) 세포, B 세포, B1 세포, B1a 세포, B1b 세포, B2 세포, 형질세포, B 조절 세포, 기억 B 세포, 변연부 B 세포, 여포성 B 세포, 배중심 B 세포, 항원 제시 세포(APC), 단핵구, 대식세포, M1 대식세포, M2 대식세포, 조직-관련 대식세포, 수지상 세포, 형질세포형 수지상 세포, 호중구, 비만 세포, 호염기구, 호산구, 공통 골수 전구 세포, 공통 림프 전구 세포, 또는 이들의 임의의 조합에서 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준의 변화를 가져오기 위해 사용될 수 있다.
본 개시내용의 조성물, 복합체, 시스템, 또는 방법은 생물학적 제제, 예를 들어 항체 또는 다른 단백질 기반 치료제를 제조하는 데 사용되는 조작된 세포의 발현 또는 활성 수준의 변화를 가져오는 데 사용될 수 있다.
분석 시스템, 대상체, 및 예시적 적용
본 개시내용의 분석 시스템은 이종성 유전자 이펙터, 이들의 조합, 이종성 유전자 이펙터(들)를 포함하는 복합체, 및 이의 라이브러리의 체계적인 대규모 조사는 예를 들어 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준에서 바람직한 변화를 유도하는 하나 이상의 이종성 선도 유전자 이펙터 또는 복합체를 확인하도록 한다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 바람직한 변화, 예를 들어 표적 유전자(예를 들어 표적 내인성 유전자)의 특정 역치 이상으로 발현 증가, 또는 특정 역치 미만으로 표적 유전자의 발현의 감소를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터를 확인하는 데 사용될 수 있다.
일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 이종성 유전자 이펙터(예를 들어, 서열번호: 16-16154 중 어느 하나, 서열번호: 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호 16155-43953 중 어느 하나, 서열번호 47351-49333 중 어느 하나, 서열번호 49353-50052 중 어느 하나, 또는 서열번호 16-49333 및 49353-50052 중 임의의 2개 이상, 또는 다른 서열)는 하나 이상의 아미노산 삽입, 결실, 또는 치환을 포함하도록 변형되고, 표적 유전자에서 유도된 발현 변화에 대한 돌연변이(들)의 영향을 평가한다. 이러한 전략은 예를 들어 이종성 유전자 이펙터의 활성을 개선하기 위해 또는 처음에 확인된 서열과 비교하여 개선된 특성을 갖는 이종성 유전자 이펙터 서열을 확인하기 위해 사용될 수 있다. 일부 실시양태에서, 본 개시내용의 방법은 하나 이상의 선도 이종성 유전자 이펙터를 확인하는 것, 이종성 유전자 이펙터의 하나 이상의 아미노산 잔기를 돌연변이시키는 것(예를 들어, 본원에 개시된 원래 서열과의 서열 동일성 또는 서열 유사성의 정도를 맞추기 위하여 하나 이상의 결실, 삽입, 및/또는 치환으로), 및 이종성 유전자 이펙터에 의해 유도된 표적 유전자의 발현에서의 변화에 대한 하나 이상의 아미노산 돌연변이의 영향을 시험하는 것을 포함한다. 일부 실시양태에서, 본 개시내용은 서열번호: 16-16154 중 어느 하나, 서열번호 16-13605 중 어느 하나, 서열번호: 16155-47350 중 어느 하나, 서열번호: 16155-43953 중 어느 하나, 서열번호: 47351-49333 중 어느 하나, 서열번호: 49353-50052 중 어느 하나, 또는 서열번호: 16-49333 및 49353-50052 중 임의의 2개 이상에 대해 하나 이상의 아미노산 삽입, 결실, 또는 치환을 포함하는 이종성 유전자 이펙터를 제공한다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 바람직한 변화, 예를 들어 특정 역치 이상의 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 증가, 또는 특정 역치 미만으로 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 감소를 가져오는 2개 이상의 이종성 유전자 이펙터(예를 들어, 동일한 복합체에 존재하는 것)의 조합을 확인하는 데 사용될 수 있다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 바람직한 변화, 예를 들어 특정 역치 이상의 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 증가, 또는 특정 역치 미만으로 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 감소를 가져오는 3개 이상의 이종성 유전자 이펙터(예를 들어, 동일한 복합체에 존재하는 것)의 조합을 확인하는 데 사용될 수 있다.
일부 실시양태에서, 분석 시스템은 설계에 의해 편향되지 않는다. 일부 실시양태에서, 분석 시스템은 설계에 의해 표적화 된다.
이종성 유전자 이펙터(들)를 포함하는 복합체는 임의의 적합한 방법을 사용하여 세포로 운반될 수 있다
일부 실시양태에서, 이종성 유전자 이펙터(들)를 포함하는 복합체는 임의의 적합한 방법, 예를 들어 전기천공법 또는 바이러스 벡터, 리포솜 벡터, 미세입자, 나노입자, 덴드리머 등과 같은 적합한 벡터의 사용을 사용하여 복합체의 하나 이상의 성분을 코딩하는 핵산으로서 운반된다. 일부 실시양태에서, 복합체의 하나 이상의 성분은 일시적 발현, 예를 들어 일시적 형질감염을 초래하는 방식으로 운반된다. 일부 실시양태에서, 복합체의 하나 이상의 성분은 지속적인 발현을 초래하는 방식, 예를 들어 렌티바이러스 형질도입, 본원에 개시된 뉴클레아제 시스템을 사용한 게놈 통합 등으로 운반된다. 복합체의 성분은 별도의 벡터/방법 또는 동일한 벡터를 사용하여 운반될 수 있다. 일부 실시양태에서, 하나 이상의 성분은 예를 들어 렌티바이러스 형질도입을 사용하여 지속적인 발현을 초래하는 방식으로 운반되고, 하나 이상의 다른 성분은 일시적인 발현을 초래하는 방식으로 운반된다.
일부 실시양태에서, 이종성 유전자 이펙터(들)를 포함하는 복합체는 예를 들어 리포솜 벡터, 나노입자, 바이러스 벡터, 비-바이러스 벡터 등과 같은 적합한 벡터를 사용하여 단백질 또는 리보핵단백질로서 운반된다.
선택적으로, 본 개시내용의 시스템 또는 복합체의 하나 이상의 성분(예를 들어, 가이드 모이어티, 가이드 핵산, 뉴클레아제, 이종성 유전자 이펙터, 유도 시스템의 성분 등)을 적절한 수준으로 발현하는 세포는 예를 들어 선택 가능한 마커(예: 저항성 또는 감수성 유전자)를 사용하거나, 예를 들어 상기 성분의 발현을 기초로 하거나 상기 성분과 동시 발현되는 리포터 유전자의 발현을 기초로 하는 세포 분류를 통해 농축될 수 있다.
표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준은 복합체 또는 복합체의 성분이 세포로 운반된 후 임의의 적합한 시간 동안 측정될 수 있다. 일부 실시양태에서, 표적 유전자의 발현 또는 활성 수준은 복합체 또는 복합체의 성분이 세포로 운반된 후 적어도 1시간, 적어도 2시간, 적어도 3시간, 적어도 4시간, 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 12시간, 적어도 14시간, 적어도 18시간, 적어도 20시간, 적어도 1일, 적어도 2일, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 6일, 적어도 7일, 적어도 8일, 적어도 9일, 적어도 10일, 적어도 14일, 적어도 21일, 적어도 28일, 적어도 5주, 적어도 6주, 적어도 7주, 적어도 8주, 적어도 9주, 적어도 10주, 적어도 12주, 적어도 14주, 적어도 18주, 적어도 20주, 또는 적어도 26주 동안 측정된다.
일부 실시양태에서, 표적 유전자의 발현 또는 활성 수준은 복합체 또는 복합체의 성분이 세포로 운반된 후 최대 1시간, 최대 2시간, 최대 3시간, 최대 4시간, 최대 5시간, 최대 6시간, 최대 7시간, 최대 8시간, 최대 9시간, 최대 10시간, 최대 12시간, 최대 14시간, 최대 18시간, 최대 20시간, 최대 1일, 최대 2일, 최대 3일, 최대 4일, 최대 5일, 최대 6일, 최대 7일, 최대 8일, 최대 9일, 최대 10일, 최대 14일, 최대 21일, 최대 28일, 최대 5주, 최대 6주, 최대 7주, 최대 8주, 최대 9주, 최대 10주, 최대 12주, 최대 14주, 최대 18주, 최대 20주, 또는 최대 26주 동안 측정된다.
일부 실시양태에서, 표적 유전자의 발현 또는 활성 수준은 복합체 또는 복합체의 성분이 세포로 운반된 후 약 1시간, 약 2시간, 약 3시간, 약 4시간, 약 5시간, 약 6시간, 약 7시간, 약 8시간, 약 9시간, 약 10시간, 약 12시간, 약 14시간, 약 18시간, 약 20시간, 약 1일, 약 2일, 약 3일, 약 4일, 약 5일, 약 6일, 약 7일, 약 8일, 약 9일, 약 10일, 약 14일, 약 21일, 약 28일, 약 5주, 약 6주, 약 7주, 약 8주, 약 9주, 약 10주, 약 12주, 약 14주, 약 18주, 약 20주, 또는 약 26주 동안 측정된다.
일부 실시양태에서, 발현 수준은 예를 들어 웨스턴 블롯, ELISA, 다중 면역검정, 질량 분석법, NMR, 단백질체학, 유세포분석법, 질량 세포측정법 등에 의해 측정될 수 있는 단백질 발현 수준이다.
일부 실시양태에서, 본 개시내용의 복합체는 표적 유전자의 발현을 증가시킬 수 있다(예를 들어, 세포 또는 세포 집단에 복합체를 도입할 때). 일부 실시양태에서, 발현 수준은 RNA 발현 수준이며, 예를 들어 RNAseq, qPCR, 마이크로어레이, 유전자 어레이, FISH 등에 의해 측정될 수 있다.
높거나 낮은 수준의 표적 유전자(예를 들어, 표적 내인성 유전자)를 발현하는 세포는 선택적으로 예를 들어 형광 활성화된 세포 분류, 자기 활성화된 세포 분류 또는 이들의 조합을 사용하여, 분류에 의해 농축될 수 있다. 표적 유전자의 활성 수준이 높거나 낮은 세포는 기능 분석을 사용하여 확인될 수 있다.
표적 유전자(예를 들어, 표적 내인성 유전자)의 발현 또는 활성 수준에서 바람직한 변화를 유도하는 하나 이상의 선도 이종성 유전자 이펙터 또는 복합체는 특정 이종성 유전자 이펙터, 이들의 조합, 복합체 등에 대응하도록 설계된 고유한 분자 식별자(예를 들어, 바코드)의 사용을 기초로 하여 확인될 수 있다.
고유한 분자 식별자는 분명한 작제물을 고유하게 태그하는 데 사용되는 짧은 서열일 수 있는데, 예를 들어 각 이종성 유전자 이펙터는 미리 결정된 방식으로 고유한 분자 식별자와 연관될 수 있으며, 정보는 예를 들어, 고유한 분자 식별자가 서열분석에 의해, 발견된 경우, 특정 이종성 유전자 이펙터에 대한 고유의 분자 식별자의 매핑을 허용하도록 저장될 수 있다. 고유한 분자 식별자는 예를 들어 렌티바이러스 벡터, 발현 플라스미드, 게놈에 통합될 서열 등과 같은 벡터로의 클로닝을 위해 본원에 개시된 이종성 유전자 이펙터에 대한 코딩 서열과 함께 합성될 수 있다. 고유한 분자 식별자는 임의의 적합한 길이일 수 있으며, 예를 들어 약 8-30개, 약 8-25개, 약 8-20개, 약 8-15개, 약 10-30개, 약 10-25개, 약 10-20개, 약 10-15개의 뉴클레오티드 길이일 수 있다. 고유한 분자 식별자의 길이는 약 12개 뉴클레오티드일 수 있다.
일부 실시양태에서, 이종성 유전자 이펙터를 태그하고 확인하기 위해 단일의 고유한 분자 식별자가 사용된다. 일부 실시양태에서, 2개 이상의 고유한 분자 식별자가 이종성 유전자 이펙터를 확인하는 데 사용되는데, 예를 들어, 동일한 공급원 단백질, 단백질 클래스, 또는 하위 라이브러리로부터 유래된 이종성 유전자 이펙터 사이에 공유되는 하나의 서열이 사용될 수 있고, 제2의 고유한 분자 식별자는 별개의 서열간에, 예를 들어 라이브러리의 다른 구성원에 의해 코딩되는 단백질의 타일 세그먼트를 구별하는 데 사용된다. 일부 실시양태에서, 고유한 분자 식별자의 한 세트는 이종성 유전자 이펙터를 확인하는 데 사용되고, 고유한 분자 식별자의 별도 세트는 서열 분석, 예를 들어 중복 제거를 위해 서열분석용 샘플을 처리하는 동안 생성된 분자를 고유하게 태그하는 데 사용된다.
고유한 분자 식별자는 인실리코에서 합리적으로 설계될 수 있다. 고유 분자 식별자를 설계하는 방법은 예를 들어 고유 분자 식별자 사이의 최소 쌍별 해밍 거리, 최대 동종중합체 길이, GC 함량 하한 및 상한, 블랙리스트에 등록된 서열(예: 라이브러리 및/또는 게놈의 내용을 기초로 함), Markov 사슬 모델, 및/또는 그리드 검색을 통한 하이퍼 매개변수 최적화에 대한 기준을 포함할 수 있다.
일부 실시양태에서, 본 개시내용의 분석 시스템은 반복될 수 있으며, 예를 들어 이펙터의 강력한 2원 조합의 경우, 삼원 복합체를 확인하기 위한 스크린이 수행될 수 있다. 이 시나리오에서는, GA1-dCas-2원 이펙터를 사용하여 안정적인 세포주를 생성할 수 있으며, GID1 태그된 개별 이펙터를 도입할 수 있다.
일부 실시양태에서, 본 개시내용의 복합체의 일부인 폴리펩티드(예를 들어, 이종성 유전자 이펙터, 가이드 모이어티, 융합 단백질 등)는 정제 태그 또는 에피토프 태그와 같은 태그에 융합된다. 태그의 예로는 글루타티온-S-트랜스퍼라제(GST), 키틴 결합 단백질(CBP), 말토스 결합 단백질, 티오레독신(TRX), 폴리(NANP), 나란한 친화성 정제(TAP) 태그, myc, AcV5, AU1, AUS, E, ECS, E2, FLAG, 헤마글루티닌(HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, SI, T7, V5, VSV-G, 히스티딘(His), 비오틴 카르복실 운반체 단백질(BCCP),및 칼모듈린이 포함된다.
일부 실시양태에서, 본 개시내용의 복합체의 일부인 폴리펩티드(예를 들어, 이종성 유전자 이펙터, 가이드 모이어티, 뉴클레아제, 융합 단백질 등)는 dCas9-이펙터의 일시적 제어를 허용하기 위해 데그론, 예를 들어 미니 옥신 유도성 데그론(mAID; Yesbolatova et al., Nature Communications 2020)에 융합된다. 일부 실시양태에서, 리포터 세포주가 생성된다. 상기 세포주는 OsTIR1을 발현하도록 조작될 수 있다. TIR(수송 억제제 1 단백질)은 옥신이 있을 때 AID와 상호작용하는 Oryza 타액의 유비퀴틴 리가제 복합체의 하위 단위이다. 이러한 상호작용은 AID 태그된 단백질의 유비퀴틴화와 분해를 촉진하여, 옥신 처리 시 dCas9 이펙터가 분해되도록 한다. OsTIR1 발현 작제물은 스크리닝 분석에서 일관된 발현 수준을 위해 안전한 항구 부위(예: AAVS1)에 통합될 수 있다. OsTIR1 작제물은 또한 주어진 스크리닝 분석에서 관심 있는 게놈 유전자좌(예: 프로모터)에 dCas9를 표적화하는 가이드 RNA를 발현하도록 변형될 수도 있거나, 가이드 RNA가 별도로 도입될 수 있다.
일부 실시양태에서, 본 개시내용의 복합체의 일부인 폴리펩티드(예를 들어, 이종성 유전자 이펙터, 가이드 모이어티, 융합 단백질 등)는 형광 또는 발광 단백질과 같은 리포터 유전자에 융합된다. 일부 실시양태에서, 본 개시내용의 복합체의 일부인 폴리펩티드(예를 들어, 이종성 유전자 이펙터 또는 가이드 모이어티)는 리포터 유전자와 동시 발현되며, 예를 들어 IRES에 의해 분리된 발현 작제물로부터 동시 발현된다. 리포터 유전자의 비제한적인 예에는 녹색 형광 단백질(예: GFP, GFP-2, tagGFP, 터보GFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreen1), 노란색 형광 단백질(예: YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYelowl), 청색 형광 단백질(예: eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire), 청록색 형광 단백질(예: eCFP, Cerulean, CyPet, AmCyanl, Midoriishi- 청록색), 적색 형광 단백질(mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), 주황색 형광 단백질 (mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato), 및 기타 적합한 형광 단백질이 포함된다.
일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 특정 대상체에 특이적인 표적 유전자(예를 들어, 표적 내인성 유전자)의 발현에 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 2명 이상의 대상체에 적용할 수 있는 표적 유전자의 발현에 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 대상체 부류, 예를 들어 포유동물 대상체, 인간 대상체, 남성 대상체, 여성 대상체, 특정 연령 범위의 대상체, 유사한 질병 또는 병태(예: 유전적 기반이 있는 질병 및/또는 표적 유전자 또는 관련되거나 반대 기능을 갖는 유전자를 포함한, 하나 이상의 내인성 유전자의 발현 수준에 의해 영향을 받는 질병을 앓는 대상체)에 적용할 수 있는 표적 유전자의 발현에 바람직한 변화를 가져온다. 일부 실시양태에서, 본 개시내용의 방법에 의해 확인된 복합체 또는 이종성 유전자 이펙터는 매우 다양한 대상체에게 광범위하게 적용가능한 표적 유전자의 발현의 바람직한 변화를 가져오고, 예를 들어 적합한 방법을 사용하여 대상체의 세포에 도입할 때 여러 대상체에 대한 특정 역치보다 높거나 낮은 표적 유전자의 발현 수준을 유도한다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 질병 기전을 이해하기 위한 유도성 및 가역성 질병 모델을 확립하는데 사용될 수 있다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 하나 이상의 특정 유전자의 비정상적인 발현을 포함하는 질병에 대한 잠재적인 치료제 또는 치료제를 확인하고/하거나 테스트하는 데 사용될 수 있다.
일부 실시양태에서, 본 개시내용의 조성물 및 방법은 세포 운명 및 계통 결정의 주요 동인의 발현을 조절함으로써 세포 분화를 제어하는데 사용될 수 있으며, 예를 들어 특정 세포 유형으로의 분화 또는 줄기세포와 같이 다양한 경로로 분화할 수 있는 세포 유형으로의 역분화를 유도할 수 있다.
본 개시내용은 본원에 개시된 임의의 하나 이상의 요소, 예를 들어 이종성 유전자 이펙터(들), 가이드 모이어티, 가이드 핵산, 복합체, 올리고머화(예를 들어, 이종성이량체화) 도메인, 이들의 조합, 및 다수의 동일한 것을 포함하는 라이브러리을 코딩하는 핵산을 추가로 포함한다.
본 개시내용은 본원에 개시된 요소 중 하나 이상, 예를 들어 이종성 유전자 이펙터(들), 가이드 모이어티, 가이드 핵산, 복합체, 올리고머화(예를 들어, 이종성이량체화) 도메인, 이들의 조합, 및 다수의 동일한 것을 포함하는 라이브러리, 및 이를 코딩하는 핵산을 포함하는 키트를 추가로 포함한다. 키트는 예를 들어 사용 설명서를 추가로 포함할 수 있다.
리포터 발현 벡터
본 개시내용은 예를 들어 본원에 개시된 분석 시스템 및 방법에서 활용될 수 있는 리포터 발현 벡터를 제공한다. 리포터 발현 벡터는 예를 들어, 조작된 합성 리포터(ESR) 시스템 또는 본원에 기술된 세포주에 사용될 수 있다.
일부 실시양태에서, 본 개시내용은 임의의 이종성 유전자 이펙터 및/또는 가이드 핵산 서열(예를 들어, (i) 전사/염색질 조절인자에 결합된 Cas 단백질 및 (ii) 가이드 RNA를 포함하는 복합체)에 의해 표적화될 수 있는 적어도 하나의 폴리뉴클레오티드 서열(예를 들어, 하나 이상의 이종성 폴리뉴클레오티드 서열)을 포함하는 발현 벡터(예를 들어, 이종성 발현 벡터)를 제공한다. 적어도 하나의 폴리뉴클레오티드 서열은 표적 유전자(예를 들어, 조절 서열, 예컨대 표적 유전자의 프로모터에 인접하여 상류에 배치됨)에 작동가능하게 결합될 수 있어, 이종성 유전자 이펙터 및/또는 가이드 핵산 서열 중 임의의 것에 의해 적어도 하나의 폴리뉴클레오티드 서열을 표적화하는 것은 표적 유전자의 발현을 조절할 수 있도록 한다. 적어도 하나의 폴리뉴클레오티드 서열은 예를 들어 표적 유전자의 발현을 조절하는데 바람직한 특성을 나타내는 이펙터 도메인(들) 및 이의 복합체(들)를 스크리닝할 때, 표적을 벗어난 효과(들)를 최소화(예를 들어 회피)하기 위해, 세포(예를 들어 포유동물 세포)에 일반적으로 존재하지 않는 합성 서열일 수 있다. 따라서, 본 개시내용의 추가 양태는 이러한 발현 벡터, 이를 포함하는 세포, 및 이를 사용하는 방법의 다양한 실시양태를 제공한다.
발현 벡터는 이종성 폴리뉴클레오티드 서열(예를 들어, 단일 이종성 폴리뉴클레오티드 서열)을 포함할 수 있다. 대안적으로 또는 추가적으로, 발현 벡터는 복수의 이종성 폴리뉴클레오티드 서열을 포함할 수 있다. 발현 벡터는 적어도 또는 최대 약 2개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 3개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 4개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 5개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 6개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 7개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 8개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 9개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 10개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 15개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 20개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 30개의 이종성 폴리뉴클레오티드 서열, 적어도 또는 최대 약 40개의 이종성 폴리뉴클레오티드 서열, 또는 적어도 또는 최대 약 50개의 이종성 폴리뉴클레오티드 서열을 포함할 수 있다.
발현 벡터의 복수의 이종성 폴리뉴클레오티드 서열 각각은 실질적으로 동일할 수 있다. 일부 실시양태에서, 복수의 이종성 폴리뉴클레오티드 서열 중 적어도 일부(예를 들어, 각각)는 서로 상이할 수 있다(예를 들어, 적어도 또는 최대 약 1개의 핵염기, 적어도 또는 최대 약 2개의 핵염기, 적어도 또는 최대 약 3개의 핵염기, 적어도 또는 최대 약 4개의 핵염기, 적어도 또는 최대 약 5개의 핵염기, 6개의 핵염기, 적어도 또는 최대 약 7개의 핵염기, 적어도 또는 최대 약 8개의 핵염기, 적어도 또는 최대 약 9개 핵염기, 또는 적어도 또는 최대 약 10개 핵염기 등).
발현 벡터의 복수의 이종성 폴리뉴클레오티드 서열 중 적어도 2개(예를 들어, 각각)는 서로 직접적으로 인접할 수 있다(예를 들어, 임의의 다른 핵염기에 의해 분리되지 않음). 대안적으로, 발현 벡터의 복수의 이종성 폴리뉴클레오티드 서열 중 적어도 2개(예를 들어, 각각)는 스페이서, 예를 들어 하나 이상의 핵염기(예를 들어, 적어도 또는 최대 약 1개의 핵염기, 적어도 또는 최대 약 2개의 핵염기, 적어도 또는 최대 약 3개의 핵염기, 적어도 또는 최대 약 4개의 핵염기, 적어도 또는 최대 약 5개의 핵염기, 적어도 또는 최대 약 6개의 핵염기, 적어도 또는 최대 약 7개의 핵염기, 적어도 또는 최대 약 8개의 핵염기, 적어도 또는 최대 약 9개의 핵염기, 적어도 또는 최대 약 10개의 핵염기, 적어도 또는 최대 약 15개의 핵염기, 적어도 또는 최대 약 20개의 핵염기, 적어도 또는 최대 약 20개의 핵염기, 적어도 또는 최대 약 30개의 핵염기, 적어도 또는 최대 약 40개의 핵염기, 적어도 또는 최대 약 50개의 핵염기, 적어도 또는 최대 약 60개의 핵염기, 적어도 또는 최대 약 70개의 핵염기, 적어도 또는 최대 약 80개의 핵염기, 적어도 또는 최대 약 90개의 핵염기, 또는 적어도 또는 최대 약 100개의 핵염기 등)에 의해 분리될 수 있다.
본원에 개시된 바와 같이, 발현 벡터의 이종성 폴리뉴클레오티드 서열은 (i) 엔도뉴클레아제 표적 서열(예를 들어, CRISPR/Cas 단백질 표적 서열) 및/또는 (ii) 하나 이상의 CRISPR 프로토스페이서 인접 모티프(PAM) 서열을 포함할 수 있다. 상기 이종성 폴리뉴클레오티드 서열은 단일 PAM 서열을 포함할 수 있다. 대안적으로, 이종성 폴리뉴클레오티드 서열은 복수의 PAM 서열(예를 들어, 적어도 또는 최대 약 2개의 PAM 서열, 적어도 또는 최대 약 3개의 PAM 서열, 적어도 또는 최대 약 4개의 PAM 서열, 적어도 또는 최대 약 5개의 PAM 서열, 적어도 또는 최대 약 6개의 PAM 서열, 적어도 또는 최대 약 7개의 PAM 서열, 적어도 또는 최대 약 8개의 PAM 서열, 적어도 또는 최대 약 9개의 PAM 서열, 또는 적어도 또는 최대 약 10개의 PAM 서열)을 포함할 수 있다. 복수의 PAM 서열은 동일할 수 있다. 일부 실시양태에서, 복수의 PAM 서열 중 2개 이상이 상이할 수 있는데, 예를 들어, 제1 PAM 서열은 제1 유형의 CRISPR/Cas 단백질(예를 들어, SpCas9 및/또는 SaCas9와 같은 Cas9)에 대한 것일 수 있고 제2 PAM 서열은 CRISPR/Cas 단백질(예를 들어, SpCas PAM)의 제2 유형에 대한 것일 수 있다. 복수의 PAM 서열 중 적어도 2개는 서로 중첩되지 않을 수 있다(예를 들어, Cas12a PAM 및 Cas9 PAM). 대안적으로, 복수의 PAM 서열 중 일부는 서로 중첩될 수 있다(예를 들어, SpCas9 PAM 및 SaCas9 PAM).
본원에 개시된 바와 같은 2개의 PAM 서열 사이의 거리는 적어도 또는 최대 약 1개의 핵염기, 적어도 또는 최대 약 5개의 핵염기, 적어도 또는 최대 약 10개의 핵염기, 적어도 또는 최대 약 15개의 핵염기, 적어도 또는 최대 약 20개의 핵염기, 적어도 또는 최대 약 25개의 핵염기, 적어도 또는 최대 약 30개의 핵염기, 적어도 또는 최대 약 35개의 핵염기, 적어도 또는 최대 약 40개의 핵염기, 적어도 또는 최대 45개의 핵염기, 적어도 또는 최대 약 50개의 핵염기, 적어도 또는 최대의 약 55개 핵염기, 적어도 또는 최대 약 60개의 핵염기, 적어도 또는 최대 약 70개의 핵염기, 적어도 또는 최대 약 80개의 핵염기, 적어도 또는 최대 약 90개의 핵염기, 또는 적어도 또는 최대 약 100개의 핵염기일 수 있다. 일부 실시양태에, 적어도 2개의 PAM 서열은 이종성 폴리뉴클레오티드 서열의 말단(예를 들어, 5' 말단 또는 3' 말단)에 배치될 수 있다. 적어도 2개의 PAM 서열은 이종성 폴리뉴클레오티드 서열의 반대쪽 말단에 배치될 수 있다(예를 들어, 이종성 폴리뉴클레오티드 서열은 2개의 상이한 PAM 서열 옆에 있을 수 있다).
본원에 개시된 바와 같이, 이종성 폴리뉴클레오티드 서열의 엔도뉴클레아제 표적 서열(예를 들어, Cas/가이드 RNA 복합체의 가이드 RNA 분자에 의해 표적화됨)은 적어도 또는 최대 약 10개의 핵염기, 적어도 또는 최대 약 15개의 핵염기, 적어도 또는 최대 약 20개의 핵염기, 적어도 또는 최대 약 25개의 핵염기, 적어도 또는 최대 약 30개의 핵염기, 적어도 또는 최대 약 35개의 핵염기, 적어도 또는 최대 약 40개의 핵염기, 적어도 또는 최대 약 45개의 핵염기, 적어도 또는 최대 약 50개의 핵염기, 적어도 또는 최대 약 60개의 핵염기, 적어도 또는 최대 약 70개의 핵염기, 적어도 또는 최대 약 80개의 핵염기, 적어도 또는 최대 약 90개의 핵염기, 또는 적어도 또는 최대 약 100개의 핵염기일 수 있다.
본원에 개시된 이종성 폴리뉴클레오티드 서열의 엔도뉴클레아제 표적 서열(예를 들어, Cas/가이드 RNA 복합체의 가이드 RNA 분자에 의해 표적화됨)은 다양한 공급원으로부터 유래된 복수의 폴리뉴클레오티드 서열을 포함할 수 있다. 다양한 공급원의 비제한적인 예는 동일한 유전자, 다양한 유전자, 다양한 염색체(예를 들어, 다양한 인간 염색체) 등의 엑손 및 인트론일 수 있다. 다양한 염색체는 1번 염색체, 2번 염색체, 3번 염색체, 4번 염색체, 5번 염색체, 6번 염색체, 7번 염색체, 8번 염색체, 9번 염색체, 10번 염색체, 11번 염색체, 12번 염색체, 13번 염색체, 14번 염색체, 15번 염색체, 16번 염색체, 17번 염색체, 18번 염색체, 19번 염색체, 20번 염색체, 21번 염색체, 22번 염색체, 염색체 X, 및/또는 염색체 Y로부터 유래할 수 있다. 일부 예에서, 복수의 폴리뉴클레오티드 서열 중 하나의 폴리뉴클레오티드 서열은 CD1a, CD2, CD3, CD4, CD5, CD7, CD8, CD10, CD15, CD20, CD23, CD30, CD31, CD33, CD34, CD42b, CD43, CD45, CD45 RO, CD56, CD57, CD61, CD68, CD71, CD79a, CD99, CD103, CD117, CD138, CD163 등과 같은 분화 클러스터(CD) 단백질을 코딩하는 유전자로부터 유래될 수 있다.
복수의 폴리뉴클레오티드 서열은 적어도 또는 최대 약 2개의 폴리뉴클레오티드 서열, 적어도 또는 최대 약 3개의 폴리뉴클레오티드 서열, 적어도 또는 최대 약 4개의 폴리뉴클레오티드 서열, 적어도 또는 최대 약 5개의 폴리뉴클레오티드 서열, 적어도 또는 최대 약 6개의 폴리뉴클레오티드 서열, 적어도 또는 최대 약 7개의 폴리뉴클레오티드 서열, 적어도 또는 최대 약 8개의 폴리뉴클레오티드 서열, 적어도 또는 최대 약 9개의 폴리뉴클레오티드 서열, 또는 적어도 또는 최대 약 10개의 폴리뉴클레오티드 서열을 포함할 수 있다. 복수의 폴리뉴클레오티드 서열의 크기(예를 들어, 길이)는 동일할 수 있다. 대안적으로, 복수의 폴리뉴클레오티드 서열의 크기는 상이할 수 있다. 복수의 폴리뉴클레오티드 서열 중 2개의 폴리뉴클레오티드 서열의 크기는 적어도 또는 최대 약 2개의 폴리뉴클레오티드, 적어도 또는 최대 약 3개의 폴리뉴클레오티드, 적어도 또는 최대 약 4개의 폴리뉴클레오티드, 적어도 또는 최대 약 5개의 폴리뉴클레오티드, 적어도 또는 최대 약 6개의 폴리뉴클레오티드, 적어도 또는 최대 약 7개의 폴리뉴클레오티드, 적어도 또는 최대 약 8개의 폴리뉴클레오티드, 적어도 또는 최대 약 9개의 폴리뉴클레오티드, 또는 적어도 또는 최대 약 10개의 폴리뉴클레오티드 만큼 상이할 수 있다.
본원에 개시된 바와 같은 발현 벡터는 본원에 개시된 바와 같은 하나 이상의 이종성 폴리뉴클레오티드 서열(예를 들어, 각각의 이종성 폴리뉴클레오티드 서열)의 하류에 있는 상류 활성화 서열(UAS)을 포함할 수 있다. UAS는 비-인간 UAS일 수 있다. UAS는 프로모터(예를 들어, GAL4 프로모터)로부터 유래될 수 있다. 이러한 프로모터의 비제한적인 예에는 U6, H1, CYC1, HIS3, GAL1, GAL4, GAL10, ADH1, PGK, PHO5, GAPDH, T7, CMV, SV40 및 EF1a가 포함될 수 있다. UAS는 예를 들어 프로모터, 및/또는 리포터 유전자와 같은 리포터 발현 벡터에 의해 발현이 조절되는 표적 유전자의 상류에 있을 수 있다.
본원에 개시된 바와 같은 발현 벡터는 프로모터를 포함할 수 있다. 일부 경우에, 하나 이상의 이종성 폴리뉴클레오티드 서열은 프로모터의 상류에 있을 수 있다. 일부 경우에, 하나 이상의 이종성 폴리뉴클레오티드 서열은 프로모터의 하류에 있을 수 있다. 어떤 경우에는, 프로모터가 강력한 구성적 프로모터(예: EF1a)일 수 있다. 일부 경우에, 프로모터는 약한 최소 바이러스 프로모터(예: CMV)일 수 있다. 상기 프로모터는 표적 유전자의 발현을 제어할 수 있으며, 예를 들어 표적 유전자는 프로모터의 조절 제어 하에 있을 수 있다.
본원에 개시된 바와 같은 발현 벡터의 이종성 폴리뉴클레오티드 서열은 표 3에 제공된 바와 같은 서열번호: 49334-49341 또는 49344-49352 중 어느 하나 이상과 적어도 또는 최대 약 70%, 적어도 또는 최대 약 75%, 적어도 또는 최대 약 80%, 적어도 또는 최대 약 85%, 적어도 또는 최대 약 90%, 적어도 또는 최대 약 91%, 적어도 또는 최대 약 92%, 적어도 또는 최대 약 93%, 적어도 또는 최대 약 94%, 적어도 또는 최대 약 95%, 적어도 또는 최대 약 96%, 적어도 또는 최대 약 97%, 적어도 또는 최대 약 98%, 적어도 또는 최대 약 99%, 또는 실질적으로 약 100% 서열 동일성 또는 서열 유사성을 나타낼 수 있다. 본원에 개시된 바와 같은 발현 벡터의 이종성 폴리뉴클레오티드 서열은 서열번호: 49346, 49347, 49351, 또는 49352 중 어느 하나와 적어도 또는 최대 약 70%, 적어도 또는 최대 약 75%, 적어도 또는 최대 약 80%, 적어도 또는 최대 약 85%, 적어도 또는 최대 약 90%, 적어도 또는 최대 약 91% 이상, 적어도 또는 최대 약 92%, 적어도 또는 최대 약 93%, 적어도 또는 최대 약 94%, 적어도 또는 최대 약 95%, 적어도 또는 최대 약 96%, 적어도 또는 최대 약 97%, 적어도 또는 최대 약 98%, 적어도 또는 최대 약 99%, 또는 실질적으로 약 100% 서열 동일성 또는 서열 유사성을 나타내는 프로모터에 연결되거나 작동가능하게 결합될 수 있다.
본 개시내용의 또 다른 양태는 본원에 개시된 임의의 발현 벡터를 포함하는 세포(예를 들어, 리포터 세포주), 세포를 생산하는 방법, 및 예를 들어 본원에 개시된 바와 같은 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터를 확인하기 위한 스크리닝에 세포를 사용하는 방법을 제공한다. 발현 벡터는 세포의 하나 이상의 염색체(예를 들어, 핵 염색체)에 통합될 수 있다. 대안적으로, 발현 벡터는 염색체 내로 통합되지 않을 수 있다(예를 들어, 첨단체일 수 있음).
본원에 개시된 발현 벡터(예를 들어, 도 11 참조)를 포함하는 세포 집단은 대조 발현 벡터(예를 들어, 도 12 참조)를 포함하는 대조 세포 집단과 비교하여, 적어도 또는 최대 약 1%, 적어도 또는 최대 약 2%, 적어도 또는 최대 약 5%, 적어도 또는 최대 약 10%, 적어도 또는 최대 약 15%, 적어도 또는 최대 약 20%, 적어도 또는 최대 약 30%, 적어도 또는 최대 약 40%, 적어도 또는 최대 약 50%, 적어도 또는 최대 약 60%, 적어도 또는 최대 약 70%, 적어도 또는 최대 약 80%, 적어도 또는 최대 약 90%, 적어도 또는 최대 약 95%, 적어도 또는 최대 약 100%, 적어도 또는 최대 약 0.1배, 적어도 또는 최대 약 0.2배, 적어도 또는 최대 약 0.5배, 적어도 또는 최대 약 1배, 적어도 또는 최대 약 1.5배, 적어도 또는 최대 약 2배, 적어도 또는 최대 약 3배, 적어도 또는 최대 약 4배, 적어도 또는 최대 약 5배, 또는 적어도 또는 최대 약 10배 더 좁은 표적 유전자-양성 세포의 분포를 나타낼 수 있다. (도 19 참조). 분포는 예를 들어 유세포분석법에 의해 결정된 바와 같이 집단 내 세포에 의한 리포터 유전자의 발현에 대한 형광 강도의 범위, 사분위간 범위, 또는 약 5 내지 95 백분위수 범위일 수 있다.
실시예
다음 실시예는 본 개시내용의 다양한 실시양태를 예시할 목적으로 제공되며 어떠한 방식으로도 본 개시내용을 제한하려는 의도는 아니다. 본원에 기술된 방법과 함께 본 실시예는 현재 바람직한 실시양태를 대표하며, 예시적이며, 본 개시내용의 범위를 제한하려는 의도는 아니다.
실시예 1: 인간 후성적 이펙터 스크린
본 실시예는 인간 핵 프로테옴으로부터 신규한 유전자 이펙터(예를 들어, 유전자 발현을 조절하는 도메인)의 확인 및 특성규명을 설명한다.
뉴클레아제 사멸 Cas9(dCas9) 및 이종성 유전자 이펙터 후보 펩티드 서열을 포함하는 복합체의 라이브러리를 활용하여 높은 처리량 스크린을 수행한다. 각각의 이종성 유전자 이펙터 후보 펩티드 서열은 dCas9에 융합되어 인간 세포에서 표적 유전자 조절 서열(예: 프로모터)에 모집되고, 표적 유전자 발현에 대한 효과가 결정된다. 예시적인 이펙터 스크린 설계의 개요가 도 1에 제공된다.
라이브러리 설계
이종성 유전자 이펙터 후보 펩티드 서열은 인간 핵 프로테옴으로부터의 단백질 서열을 포괄하도록 설계된다. 실험적으로 핵에 국한된(예: 독점적으로 국한된) 것으로 결정된 인간 단백질 분석(ProteinAtlas.org)을 수행하여 549개 단백질의 최종 후보 목록을 작성하였다. 이종성 유전자 이펙터 후보 펩티드 서열은 길이가 300개 뉴클레오티드인 합성 DNA 올리고뉴클레오티드로부터 생성되며, 그 중 255개 뉴클레오티드는 표적 특이적이다. 각 올리고의 5' 및 3' 말단에는 수신 벡터(p-dCas9)에 상보적인 서열이 포함되어 있으며, 3' 15개 뉴클레오티드 중첩부는 Illumina 판독부 1 프라이머의 일부를 포함한다. 올리고뉴클레오티드는 또한 각각의 이종성 유전자 이펙터 후보 펩티드 서열에 대한 고유한 분자 식별자(예를 들어 "바코드")를 함유한다. 이 설계를 통해 NEB HiFi 클로닝를 사용하여 라이브러리를 클로닝하고 Illumina Hiseq 호환 NGS 라이브러리의 하류 생성이 가능하다. 각 표적 유전자에 대해, 올리고는 유전자의 코딩 뉴클레오티드 서열을 5'에서 3'로 가로질러 타일링되어 129개의 뉴클레오티드가 중첩되도록 설계된다.
양성 및 음성 대조군을 포함하여, 총 16,139개의 올리고가 상기 초기 이펙터 라이브러리에서 설계되었다. 다음은 다음과 같이 주석이 달린 본 실시예의 올리고뉴클레오티드의 예시적인 예를 제공한다: 벡터 중첩 1(서열번호: 11) - 표적 서열(서열번호: 12) -[정지 코돈; 서열번호: 13] - 고유 분자 식별자(서열번호: 14) - 벡터 중첩부 2(서열번호: 15; (Illumina 판독부 1 부분) :
GCAGTGGTGGACATA ATGTCTATGCCAGAACATGTTTTAACGAGTGAATCCATGCATGTGTGTGACATTGGACATGTTGAACATATGGTGCATGATAGTGTAGTGGAAGCAGAAATCATTACTGATCCTCTGACGAGTGACATAGTTTCAGAAGAAGTATTGGTAGCAGACTGTGCCCCTGAAGCAGTCATAGATGCCAGCGGGATCTCAGTGGACCAGCAAGATAATGACAAAGCCAGCTGTGAGGACTACCTAATGATTTCGTTGGAT[TAG]AGGGGTTCACTA TACGTTACTGGCCGA
본 개시내용의 라이브러리에 사용되는 올리고는 유사한 형식을 활용하여 고유한 분자 식별자를 각 표적 서열에 연관시키고, 클로닝을 위한 벡터 중첩 서열을 제공할 수 있다.
라이브러리 클로닝
올리고뉴클레오티드는 올리고당 >0.2 fmol의 수율로 얻어진다(예를 들어, 수백 나노그램의 동결건조된 DNA). 올리고는 스톡 농도가 20 ng/㎕가 되도록 10mM Tris pH 8.0에 재현탁된다. 스톡액은 -20℃에서 유지될 수 있다.
NEBuilder HiFi 클로닝에 바로 사용할 수 있도록, ssDNA를 dsDNA로 전환하기 위해 PCR을 수행한다. KAPA HiFi HotStart PCR 키트(카탈로그 #KK2502)가 대략 12-14주기로 사용된다.
표 4는 라이브러리 증폭을 위한 예시적인 PCR 반응 성분을 제공한다. 400 ㎕ 반응은 각각 50 ㎕로 구성된 8개의 PCR 튜브로 분할된 양이다.
표 5는 예시적인 PCR 조건을 제공한다.
PCR 생성물은 컬럼 정제를 통해 정제된다.
각 올리고의 5' 및 3' 말단에 존재하는 중첩 서열은 수신 벡터로의 클로닝을 허용한다(예: NEB HiFi를 통해).
pSLQ6604를 기반으로 렌티바이러스 백본을 변형하여 수신 벡터(p-dCas9)를 생성한다. 수신 벡터는 짧고 유연한 GS 링커를 통해 dCas9의 C 말단에 이종성 유전자 이펙터가 융합될 수 있도록 설계되었다. 수신 벡터는 직접 합성(예: GenScript) 또는 어셈블리(예: IDT의 3개의 합성 gBlock 단편을 사용한 HiFI PCR 어셈블리, 이후 EcoRI NotI 선형화된 pSLQ6604에 결찰)에 의해 생성된다.
도 2에 도시된 시작 수신 벡터는 선형화된다(예를 들어, EcoRI(고충실도) 및 NotI(고충실도) 제한 효소를 사용한 분해를 통해). 3개의 합성 gBlock 단편으로부터 생성된 삽입 서열은 도 3에 도시된 바와 같이 HiFi 어셈블리를 통해 삽입되어 p-dCas9를 생성한다.
p-dCas9 수신 벡터는 선형화되고(예를 들어, MluI(고충실도)를 사용한 분해를 통해), 이종성 유전자 이펙터 서열을 코딩하는 삽입물은 HiFi 어셈블리를 사용하여 약 10:1의 삽입물 대 벡터의 비율로 벡터에 첨가된다.
예시적 활성화제 스크린
라이브러리는 표적 유전자의 발현을 활성화하거나 증가시키는 이종성 유전자 이펙터를 확인하는 데 사용된다. 각 스크린에 대해, 적합한 세포 유형/세포주 및 표적 유전자 또는 표적 유전자 조절 서열이 선택된다. 가이드 RNA는 dCas9-이펙터를 내인성 유전자의 조절 서열(예: 프로모터)로 지시하는 데 사용된다. 가이드 RNA는 검증된 가이드 RNA일 수 있다. 라이브러리에는 양성 대조군 올리고뉴클레오티드(예: P300, TET1, TET2, TET3, 및 HSF1 유전자에 걸쳐 타일링됨)가 포함되어 있다.
주어진 세포 유형에서 낮은 수준으로 발현되는 세포 표면 단백질을 코딩하는 표적 유전자가 사용될 수 있다. 예를 들어, 낮은 수준의 CD45를 발현하는 세포주는 도 4에 예시되어 있다.
한 번의 반복에서, CD45를 표적 유전자로 하여 K562 세포가 사용된다. K562 세포는 낮은 수준의 CD45를 발현한다. 가이드 RNA는 dCas9-이펙터를 CD45의 조절 서열(예: 프로모터)로 지시하는 데 사용된다.
한 번의 반복에서, CDB1을 표적 유전자로 하여 K562 세포가 사용된다. K562 세포는 낮은 수준의 CDB1을 발현한다. 가이드 RNA는 dCas9-이펙터를 CDB1의 조절 서열(예: 프로모터)로 지시하는 데 사용된다.
세포는 벡터(예를 들어, 렌티바이러스 입자)로 형질도입되어 라이브러리 복합체의 발현을 유도한다. 하나 이상의 후보 이종성 유전자 이펙터가 형질도입된 세포에서 발현되지 않도록 감염의 다중도가 선택된다. 형질도입된 세포는 dCas9-이펙터를 발현하지 않는 스크린의 배경 세포 수를 최소화하기 위해 리포터 유전자(예: mCherry) 발현을 기초로 분류된다. 그런 다음 세포는 벡터(예: 높은 감염 다중도의 렌티바이러스 입자)로 형질도입되어 스크린에 특이적인 가이드 RNA(예: CD45 프로모터를 표적으로 하는 가이드 RNA)의 발현을 유도한다. 형질도입된 세포는 배양 시 최대 약 5일 동안 유지된다.
더 높은 수준의 표적 유전자를 발현하는 세포는 예를 들어, 표적 유전자의 발현에 기초하여 세포를 분류함으로써(예를 들어, 형광 활성화된 세포 분류 및/또는 자기 활성화된 세포 분류를 통해) 확인될 수 있다.
게놈 DNA가 세포에서 추출되고, 통합된 이펙터 카세트가 PCR에 의해 분리되어, HiSeq 단일 말단 바코드 서열 분석을 위한 라이브러리를 생성하는 데 사용된다. 표적 유전자의 발현을 증가시키는 유전자 이펙터가 확인되었다.
이 접근법은 또한 이종성 유전자 이펙터의 조합을 스크리닝하기 위해 조정될 수 있다.
예시적인 억제인자 스크린
라이브러리는 표적 유전자의 발현을 감소시키는 이종성 유전자 이펙터를 확인하는 데 사용된다. 각 스크린에 대해, 적합한 세포 유형/세포주 및 표적 유전자 또는 표적 유전자 조절 서열이 선택된다. 가이드 RNA는 dCas9-이펙터를 내인성 유전자의 조절 서열(예: 프로모터)로 지시하는 데 사용된다. 가이드 RNA는 검증된 가이드 RNA일 수 있다.
주어진 세포 유형에서 비교적 높은 수준으로 발현되는 세포 표면 단백질을 코딩하는 표적 유전자가 사용될 수 있다. 예를 들어, 트랜스페린 수용체 CD71을 높은 수준으로 발현하는 세포주는 도 5에 예시되어 있다.
한 번의 반복에서, CD71을 표적 유전자로 하여 K562 세포가 사용된다. K562 세포는 상대적으로 높은 수준의 CD71을 발현한다. 가이드 RNA는 dCas9-이펙터를 CD71의 조절 서열(예: 프로모터)로 지시하는 데 사용된다. 가이드 RNA는 예를 들어 GGACGCGCTAGTGTGAGTGC 또는 CGATATCCCGACGCTCTGAG에 의해 코딩될 수 있다.
세포는 벡터(예를 들어, 렌티바이러스 입자)로 형질도입되어 라이브러리 복합체의 발현을 유도한다. 하나 이상의 후보 이종성 유전자 이펙터가 형질도입된 세포에서 발현되지 않도록 감염의 다중도가 선택된다. 형질도입된 세포는 dCas9-이펙터를 발현하지 않는 스크린의 배경 세포 수를 최소화하기 위해 리포터 유전자(예: mCherry) 발현을 기초로 분류된다. 그런 다음 세포는 벡터(예: 높은 감염 다중도의 렌티바이러스 입자)로 형질도입되어 스크린에 특이적인 가이드 RNA(예: CD71 프로모터를 표적으로 하는 가이드 RNA)의 발현을 유도한다. 형질도입된 세포는 배양 시 최대 약 5일 동안 유지된다.
더 낮은 수준의 표적 유전자를 발현하는 세포는 예를 들어 표적 유전자의 발현에 기초하여 세포를 분류함으로써(예를 들어, 형광 활성화된 세포 분류 및/또는 자기 활성화된 세포 분류를 통해) 확인될 수 있다.
게놈 DNA가 세포에서 추출되고, 통합된 이펙터 카세트가 PCR에 의해 분리되어, HiSeq 단일 말단 바코드 서열 분석을 위한 라이브러리를 생성하는 데 사용된다. 표적 유전자의 발현을 감소시키는 유전자 이펙터가 확인되었다.
이 접근법은 또한 이종성 유전자 이펙터의 조합을 스크리닝하기 위해 조정될 수 있다.
실시예 2: 본 개시내용의 복합체에 의한 유전자 발현의 활성화 및 억제를 입증하는 파일로트 실험
본 실시예는 본 개시내용의 방법을 사용하여 표적 유전자의 발현을 활성화 및 억제하는 본 개시내용의 복합체의 능력, 및 표적 유전자의 상향조절 및 하향조절을 검출하는 능력을 입증하는 파일로트 실험을 설명한다.
뉴클레아제 사멸 Cas9(dCas9) 및 이종성 유전자 이펙터 후보 펩티드 서열을 각각 포함하는 복합체의 라이브러리는 실시예 1에 설명된 방법을 사용하여 생성되었다. 각각의 이종성 유전자 이펙터를 코딩하고 5' 및 3' 클로닝 서열을 포함하는 합성 DNA 뉴클레오티드가 생성되어 수신 벡터 p-dCas9에 클로닝되었다. 파일로트 스크린을 위해 후보 이펙터 라이브러리가 풀링되었다. 라이브러리에는 전사 활성을 조절하는 것으로 확인된 유전자(예: P300, TET1, TET2, TET3, HDAC3, HSF1 및 ZIM3, MeCp2, DNMT3L, DNMT3a, DNMT3b, G9a, 및 EZH2)로부터의 것들을 포함하여, 후보 전사 활성화제 및 후보 전사 억제인자를 포함한다.
유전자 발현에 대한 복합체의 영향을 테스트하기 위해 K562 세포주를 사용하였다. 라이브러리 복합체의 발현을 유도하기 위해 후보 이펙터를 코딩하는 작제물로 세포를 형질도입하였다. dCas9-이펙터를 (i) CD45의 조절 서열(활성화제 스크린, 실험 조건), (ii) CD71의 조절 서열(억제인자 스크린, 실험 조건), 또는 (iii) GAL4(대조군)로 지시하기 위해 세포에 렌티바이러스 벡터를 형질도입하여 가이드 RNA의 안정적인 발현을 유도하였다. 형질도입된 세포는 가이드 RNA와 dCas9-이펙터를 모두 발현하는 세포를 강화하기 위해 리포터 유전자 발현을 기초로 분류되었다.
형질도입된 세포는 배양에서 최대 약 5일 동안 유지되었고, CD45 또는 CD71의 발현은 유세포 분석을 통해 정량화되었다. 활성화제 스크린(도 6, 오른쪽 상단 패널)의 실험 조건에서 CD45의 발현 증가가 관찰되었고, 억제인자 스크린(도 6, 오른쪽 하단 패널)의 실험 조건에서 CD71의 발현 감소가 관찰되었다.
실시예 3: 바이러스 후성적 이펙터 스크린 설계
이종성 유전자 이펙터 후보 펩티드 서열은 바이러스 게놈으로부터의 단백질 서열을 포괄하도록 설계된다. 후보 서열은 다음을 근거하여 선택된다:
(i) ChIP/ChIP-seq, EMSA, SELEX, 리포터 분석, 결합 분석, 및/또는 결정 구조에 의해 실험적으로 검증된 바이러스 전사 조절인자. 실험적으로 검증된 바이러스 전사 조절인자는 예를 들어 아데노바이러스과(Adenoviridae), 아레나바이러스과(Arenaviridae), 보르나바이러스과(Bornaviridae), 코로나바이러스과(Coronaviridae), 필로바이러스과(Filoviridae), 플라비바이러스과(Flaviviridae), 헤파드나바이러스과(Hepadnaviridae), 헤르페스바이러스과(Herpesviridae), 오르토믹소바이러스과(Orthomyxoviridae), 파필로마바이러스과(Papillomaviridae), 파라믹소바이러스과(Paramyxoviridae), 파르보바이러스과(Parvoviridae), 페리분야바이러스과(Peribunyaviridae), 페뉴이바이러스과(Phenuiviridae), 뉴모바이러스과(Pneumoviridae), 폴리오마바이러스과(Polyomaviridae), 폭스바이러스과(Poxviridae), 레트로바이러스과(Retroviridae), 및 랍도바이러스과(Rhabdoviridae) 계열 중 임의의 하나 이상으로부터의 바이러스를 나타낼 수 있다. 전사 조절인자는 문헌: Liu et al., 인간 바이러스 전자 조절인자(Human virus transcriptional Regulators). Cell, 182(1), pp.24-37으로부터의 것들이 포함될 수 있다.
(ii) 인간-박쥐 공유 바이러스 및 바이러스 단백질로부터의 바이러스 전사 조절인자, 예를 들어 인간 세포에서 기능하는 것으로 입증된 박쥐 및/또는 바이러스로부터 문서화된 인수공통전염이 있는 바이러스 계열. 인간-박쥐 공유 바이러스 및 바이러스 단백질로부터의 바이러스 전사 조절인자는 예를 들어 플라비바이러스과(Flaviviridae), 라이사바이러스과(Lyssaviridae), 필로바이러스과(Filoviridae), 파라믹소바이러스과(Paramyxoviridae), 오르토믹소바이러스과(Orthomyxoviridae), 코로나바이러스과(Coronaviridae), 레오바이러스과(Reoviridae), 토가바이러스과(Togaviridae), 페뉴바이러스과(Phenuviridae), 및 한타바이러스과(Hantaviridae) 중 하나 이상의 바이러스를 나타낼 수 있다. 예를 들어, 아데노바이러스 및 폭스바이러스의 서열은 이들 바이러스의 높은 수준의 전사 조절 모듈화로 인해 포함될 수 있다. 서열은 dBatVir 데이터베이스에서 수동으로 얻을 수 있다
(iii) 메타게놈성 바이러스 게놈 및 바이러스 단백질. 서열은 예를 들어 장 바이롬을 평가하는 연구로부터의 데이터; 인간 장에 풍부하고 전사 조절인자를 함유하며 산성 환경에서 발생하는 시포바이러스과, 포도바이러스과, 및 미오바이러스과의 게놈; 해양에서 검출된 바이러스 서열; 지열 분출구에서 검출된 바이러스 서열; 공공 데이터베이스의 구조적 데이터(예: X선, NMR)를 활용하는 소스; 수직 대 수평 감염을 선호하는 진화 압력으로 인해 산성 잔류물 및 지속적인 기능과 같은 바람직한 특성을 가진 이펙터가 풍부해질 수 있는 극한 환경(예: 고산성, 고온 환경)의 고세균 친화성 바이러스(예: 술포로부스)에 대한 기록; 및 공개 소스(예: NCBI)에서 수동으로 얻은 서열로부터 얻을 수 있다.
예측 필터링 기술은 예를 들어 효모에서의 실험을 통한 핵심 활성화제 도메인(예를 들어, 13 bp까지)에 대한 적합한 생물물리학적 특성의 확인; 산성, 부피가 큰 소수성, 알파 나선, 및/또는 음전하의 존재; 효과 지속 기간에 영향을 미칠 수 있는 모티프 반복부의 존재; 및 PADDLE과 유사한 나선형 신경망/변환기 알고리즘 또는 유사한 예측 기술을 기반으로 후보 서열에 적용될 수 있다.
실시예 4: 바이러스 후성적 이펙터 스크린
본 실시예는 바이러스 게놈으로부터 신규 유전자 이펙터(예를 들어, 인간 유전자의 발현을 조절하는 도메인)의 확인 및 특성규명을 설명한다.
뉴클레아제 사멸 Cas9(dCas9) 및 바이러스 게놈의 이종성 유전자 이펙터 후보 펩티드 서열을 각각 포함하는 복합체 라이브러리를 활용하여 고처리량 스크린을 수행한다. 이종성 유전자 이펙터 후보 펩티드 서열(예를 들어, 실시예 3에서 확인됨)은 dCas9에 융합되고, 인간 세포에서 표적 유전자 조절 서열(예를 들어, 프로모터)에 동원되고, 표적 유전자 발현에 대한 효과가 결정된다(예를 들어, 실시예 1의 인간 핵 프로테옴 스크린에 대해 설명된 기술을 사용).
27799개의 올리고는 약 3500개의 유전자와 약 3000개의 대조군을 표적으로 설계되었다. 실시예 1에 개시된 바와 같이 양성 및 음성 대조군을 사용하였다. 공개된 실험 데이터를 갖는 바이러스 전사 조절인자를 검정 성능에 대한 벤치마크로 사용하고, 공지된 활성을 수동으로 구성하여 데이터 분석을 가이드하였다.
표적 유전자의 발현을 향상시키거나 감소시키는 유전자 이펙터가 확인되었다.
이 접근법은 또한 이종성 유전자 이펙터의 조합을 스크리닝하기 위해 조정될 수 있다.
실시예 5: 조합 후성적 이펙터 스크린
본 실시예는 유전자 발현을 조절하는 유전자 이펙터의 신규 조합의 확인 및 특성규명을 설명한다.
이종성 유전자 이펙터 후보 펩티드 서열의 조합과 복합체화된 뉴클레아제-사멸 Cas9(dCas9)를 함유하는 복합체 라이브러리를 활용하여 고처리량 스크린을 수행한다. 이 스크린은 인간 세포의 유전자 이펙터(예: 유전적/후성적 인자)의 조합을 체계적이고 대규모로 조사할 수 있도록 설계되었다.
첫 번째 접근법에서는 다양한 단백질 계열의 염색질 조절인자(CR)와 전사 조절인자(TR)가 문헌과 데이터베이스에서 추출된다. CR과 TR의 조합을 스크리닝하여 표적 유전자의 발현을 조절(예: 증가 또는 감소)하는 인자의 새로운 조합을 확인한다. 이 스크린을 통해 생체 내 상황(예: 세포 유형 특이성, 보조 인자 또는 복합 요구 사항 등으로 인해)에서 상호 작용할 수 없지만 그럼에도 불구하고 관심 유전자좌에 직교적으로 모집될 때 후성적 및/또는 전사 효과를 중재할 수 있는 인자의 조합을 확인할 수 있다.
CR 유전자 이펙터에는 다양한 부류의 히스톤 및 DNA 변형 효소(예: DNMT, HAT, HMT 등)의 기능적 도메인이 포함된다. 이들은 주로 인간에게서 유래하지만, 식물이나 다른 종에서 유래한 인자도 포함될 수 있다. CR 라이브러리는 약 100개의 후보 유전자 이펙터 순서이다.
TR 유전자 이펙터에는 다양한 TF 계열(예: KRAB, p65, MED, GTF 등)의 전사 조절 도메인이 포함된다. CR 라이브러리와 유사하게, 이러한 도메인에는 주로 인간 서열이 포함되며, 유사하게 약 100개의 인자의 순서로, 약 10,000개의 고유한 CR+TR 조합을 제공한다.
두 번째 접근법에서는 실시예 1 내지 3에서 확인된 유전자 이펙터를 스크리닝하였다. 이 접근법을 사용하면 서로 또는 다른 이펙터 도메인(예: 문헌의 이펙터 도메인)과 조합하여 배치될 때 활성이 증강될 수 있는 새로운 이펙터 도메인을 확인할 수 있다. 특정 임계값 이상의 활성화 또는 억제를 달성하는 초기 스크린의 이펙터뿐만 아니라 기타 활성화제 및 억제인자로 구성된 쌍을 이루는 라이브러리가 생성된다. 그런 다음 이러한 라이브러리를 쌍을 이루는 방식으로 테스트하여 바람직한(예: 상승적) 활성을 나타내는 이펙터의 조합을 확인한다.
후보 이펙터 도메인의 직교 모집을 촉진하고 수천 개의 가능한 조합이 표적화되거나 편향되지 않은 방식으로 테스트될 수 있도록 하는 유도성 시스템이 사용된다. 상기 시스템의 유도성과 가역성은 또한 전사 활성화 또는 억제에 대한 관찰된 효과의 지속성을 평가할 수 있게 한다.
상기 시스템은 애기장대(PYL1-ABI 및 GID1-GAI)로부터 유래된 유도성 이종성이량체 단백질 쌍을 활용한다. 각 이종성이량체 쌍의 하나의 단백질을 dCas9에 융합하고 동족 단백질을 이펙터 도메인에 융합함으로써, dCas9에 대한 이펙터 모집은 유도 분자(식물 호르몬 ABA 및 GA)를 첨가함으로써 달성된다. 최대 80개의 아미노산 유전자 이펙터가 이종성이량체화 도메인에 융합된다.
각 라이브러리 요소는 고유한 분자 식별자(바코드)를 포함하며, 고유한 분자 식별자는 페어 엔드 Illumina 서열화가 선택 역치를 통과하는 세포에 존재하는 조합을 분리하는 방식으로 배열된다. 최대 80개의 아미노산 유전자 이펙터 단편과 고유한 분자 식별자를 코딩하는 DNA는 약 300개의 뉴클레오티드 올리고뉴클레오티드 형태로 얻어진다. 각각 GID1 및 PYL1과 프레임 내 CR 유전자 이펙터 및 TR 유전자 이펙터를 갖는 단일 플라스미드를 갖는 렌티바이러스 발현 플라스미드가 생성된다. 조합 스크린을 위한 발현 작제물의 예시적인 개략도가 도 7에 제공된다.
실시예 1 내지 3에 기술된 스크린과의 호환성을 위해, 동일한 유전자좌가 표적화되었다(활성화의 경우 CD45, 억제의 경우 CD71). GAI-dCas9-ABI를 발현하는 안정한 K562 세포주는 예를 들어 도 8에 도시된 발현 작제물을 사용하여 생성된다.
조합 라이브러리는 GAI-dCas9-ABI를 안정적으로 발현하는 K562 세포에 렌티바이러스 입자로 형질도입된다. 형질도입된 세포는 PYL- 및 GID1-태그된 후보 이펙터 도메인의 모집을 유도하기 위해 실험적으로 결정된 농도에서 ABA 및 GA에 노출된다. 유전자 이펙터와 dCas9의 조립된 복합체는 유도 호르몬을 중단하기 전 최대 5일 동안 표적 유전자 유전자좌(억제인자 스크린의 CD71, 및 활성화제 스크린의 CD45)와 연관된 상태를 유지하도록 허용된다.
이펙터 조합의 활성은 유도 후 최대 30일 동안 5일 간격으로 원하는 세포 집단을 분류하고 수집함으로써 결정된다. 그런 다음 지정된 시간에 분리된 세포에서 추출된 DNA에서 고유한 분자 식별자를 서열 분석하여 후보 조합의 정체성을 결정한다.
도 9는 dCas9와 관련된 전사 조절인자와 염색질 조절인자의 조합을 포함하는 본 개시내용의 복합체에 의한 CD45 및 CD71 발현의 조절을 예시한다. 상단 이미지는 CD45에 대한 예시적인 활성화제 스크린을 보여주고, 하단 이미지는 CD71에 대한 예시적인 억제인자 스크린을 보여준다. 오른쪽 그래프는 본 개시내용의 복합체에 의한 CD71 발현의 억제, 및 CD45 발현의 증가를 예시한다.
관심 유전자의 발현을 증가시키거나 억제하는 유전자 이펙터의 조합이 확인되었다.
추가적인 후보 유전자 이펙터, 및/또는 3원 복합체를 확인하기 위해 스크린의 추가 반복이 수행될 수 있다. 예를 들어, GA1-dCas-2원 이펙터를 사용하여 K562 세포의 안정적인 세포주를 생성할 수 있으며, GID1 태그된 개별 이펙터를 도입할 수 있다.
실시예 6: 본원에 개시된 시스템 및 방법의 치료적 적용
본원에 개시된 시스템 및 방법은 예를 들어 신규 유전자 이펙터 복합체를 확인하는 데 사용될 수 있다. 신규 유전자 이펙터 복합체는 신규 유전자 이펙터 및/또는 복수의 유전자 이펙터의 신규 조합을 포함할 수 있다. 본원에 개시된 바와 같이 확인된 신규 유전자 이펙터는 특정 표적 유전자, 특정 세포 유형, 특정 표적 질병, 특정 대상체 등에 대해 고유할 수 있다.
a. 동일한 세포 유형, 및 상이한 표적 유전자
본원에 개시된 바와 같은 복합체 라이브러리는 동일한 세포 유형으로부터의 다양한 표적 유전자에 대한 신규한 유전자 이펙터 복합체를 확인하는 데 사용될 수 있다. 동일한 세포 유형 내에서, 제1 유전자의 발현 또는 활성 수준을 조절(예를 들어, 최적으로 상향조절 또는 하향조절)하는 것으로 확인된 제1의 신규 유전자 이펙터 복합체는 제2 유전자(제1 유전자와 다름)의 발현 또는 활성 수준을 조절(예를 들어, 최적으로 상향조절 또는 하향조절)하는 것으로 확인된 제2 신규 유전자 이펙터 복합체와 다를 수 있다.
예를 들어, 동일한 줄기 세포 유형 내에서, 줄기 세포의 재생을 유도하기 위한 텔로머라제의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제1 신규 유전자 이펙터 복합체는 조직 복구/재생을 위한 전환 성장 인자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제2 신규 유전자 이펙터 복합체와 다를 수 있다.
b. 다른 세포 유형, 및 동일한 표적 유전자
본원에 개시된 바와 같은 복합체 라이브러리는 동일한 표적 유전자에 대한 신규한 유전자 이펙터 복합체를 확인하는 데 사용될 수 있지만 다른 세포 유형에서도 사용될 수 있다. 동일한 표적 유전자가 스크리닝에 활용되더라도, 제1 세포 유형에서 표적 유전자의 발현 또는 활성 수준을 조절(예를 들어, 최적으로 상향조절 또는 하향조절)하기 위해 확인된 제1 신규 유전자 이펙터 복합체는 제2 세포 유형에서 동일한 표적 유전자의 발현 또는 활성 수준을 조절(예: 최적으로 상향조절 또는 하향조절)하는 것으로 확인된 제2 신규 유전자 이펙터 복합체와 다를 수 있다.
예를 들어, 동일한 표적 유전자가 주어지면, 줄기 세포의 재생을 유도하기 위한 텔로머라제를 코딩하는 유전자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제1 신규 유전자 이펙터 복합체는 보다 분화된 세포(예를 들어, 피부 세포, 근육 세포, 뉴런 등)의 재생을 유도하기 위해 텔로머라제를 코딩하는 동일한 유전자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제2 신규 유전자 이펙터 복합체와 다를 수 있다.
다른 예에서, 동일한 표적 유전자가 주어지면, 제1 유형의 분화된 세포(예: 피부 세포)의 재생을 유도하기 위한 텔로머라제를 코딩하는 유전자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제1 신규 유전자 이펙터 복합체는 제2 유형의 분화된 세포(예: 근육 세포)의 재생을 유도하기 위한 텔로머라제를 코딩하는 동일한 유전자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제2 신규 유전자 이펙터 복합체와 다를 수 있다.
c. 다른 세포 유형, 및 다른 표적 유전자
본원에 개시된 바와 같은 복합체 라이브러리는 다양한 세포 유형에서 다양한 표적 유전자에 대한 신규 유전자 이펙터 복합체를 확인하는 데 사용될 수 있다. 제1 세포 유형에서 제1 표적 유전자의 발현 또는 활성 수준을 조절(예를 들어, 최적으로 상향조절 또는 하향조절)하는 것으로 확인된 제1 신규 유전자 이펙터 복합체는 제2 세포 유형에서 제2 표적 유전자의 발현 또는 활성 수준을 조절(예를 들어, 최적으로 상향조절 또는 하향조절)하는 것으로 확인된 제2 신규 유전자 이펙터 복합체와 다를 수 있다.
예를 들어, 근육 생성을 유도하기 위해 근육 줄기 세포(또는 근육 위성 세포)에서 근아세포 결정 단백질 1(MyoD)을 코딩하는 제1 유전자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제1의 신규 유전자 이펙터 복합체는 중간엽 줄기세포(MSC)에서 골형성을 유도하기 위한 Runt 관련 전사 인자 2(RUNX2)를 코딩하는 제2 유전자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제2 신규 유전자 이펙터 복합체와 다를 수 있다.
d, 다른 대상체, 및 동일한 표적 유전자
본원에 개시된 바와 같은 복합체 라이브러리는 동일한 표적 세포 유형에 대해서, 그러나 다른 표적 세포 공급원으로부터의 동일한 표적 유전자에 대한 신규한 유전자 이펙터 복합체를 식별하는 데 사용될 수 있다. 어떤 경우에는 동일한 유형의 표적 세포가 다른 대상체로부터 유래될 수도 있다. 다른 대상체는 예를 들어 성별, 연령, 병태(예: 질병 상태) 등에 따라 다를 수 있다. 제1 대상체의 세포 유형에서 표적 유전자의 발현 또는 활성 수준을 조절(예: 최적으로 상향조절 또는 하향조절)하는 것으로 확인된 제1 신규 유전자 이펙터 복합체는 제1 대상체와 다른 제2 대상체로부터의 동일한 세포 유형에서 동일한 표적 유전자의 발현 또는 활성 수준을 조절(예: 최적으로 상향조절 또는 하향조절)하는 것으로 확인된 제2 신규 유전자 이펙터 복합체와는 다를 수 있다.
예를 들어, 동일한 표적 유전자가 주어지면, 여성 대상체로부터 줄기 세포 유형의 재생을 유도하기 위한 텔로머라제를 코딩하는 유전자의 발현 또는 활성 수준을 최적으로 향상시키기 위해 확인된 제1 신규 유전자 이펙터 복합체는 남성 대상체의 동일한 줄기 세포 유형에서 텔로머라제를 코딩하는 동일한 유전자의 발현 또는 활성 수준을 최적으로 향상시키는 것으로 확인된 제2 유전자 이펙터 복합체와 다를 수 있다.
실시예 7: ESR(조작된 합성 리포터)을 위한 설계
도 10은 ESR에 대한 발현 벡터의 예시적인 구조를 개략적으로 보여준다. 발현 벡터는 이종성 폴리뉴클레오티드 서열의 복수의 카피(예를 들어, 7개의 카피)를 포함할 수 있다. 각각의 이종성 폴리뉴클레오티드 서열은 합성 가이드 표적(예를 들어, 가이드 RNA에 의해 표적화 가능함, 예컨대 서열번호: 49334), 복수의 CRISPR PAM 서열(예를 들어, "TTTA"와 같은 Cas12a PAM 서열, "CGG"와 같은 SpCas9 PAM 서열, "CGGAG"와 같은 SaCas9 PAM 서열, 및/또는 UAS(상류 활성화 서열)을 포함할 수 있으며, 이들 성분의 일부는 서로 겹칠 수 있다(예를 들어, 공통 폴리뉴클레오티드 서열과 같이, 하나 이상의 공통 핵염기를 공유할 수 있다). UAS(예를 들어, 프로모터의 상류)는 전사 활성화제에 의해 표적화될 수 있으며, 이러한 표적화는 프로모터의 제어 하에서 표적 유전자의 발현을 조절(예를 들어, 향상)하는 데 충분할 수 있다.
합성 가이드 표적은 2개의 상이한 공급원으로부터의 폴리뉴클레오티드 서열 및 추가의 폴리뉴클레오티드 서열(예를 들어, 인간 CD45(chr1)의 가이드 표적으로부터의 폴리뉴클레오티드 서열(예를 들어, 10개의 핵염기 길이) 및 추가의 폴리뉴클레오티드 서열(예를 들어, 인간 CD71(chr3)의 가이드 표적으로부터의 10개의 핵염기 길이)을 포함할 수 있다.
UAS는 효모 GAL4 프로모터로부터 유래될 수 있다(예를 들어, 효모에서 GAL4 단백질에 의해 결합됨). UAS는 포유동물 세포(예를 들어, 인간 세포)에서 어떤 기능도 나타내거나 영향을 미치지 않을 수 있으므로, 포유동물 세포에서 발현 벡터를 갖는 데 따른 부작용 또는 표적을 벗어난 효과를 최소화할 수 있다.
이종성 폴리뉴클레오티드 서열의 복수의 카피는 유전자, 예컨대 표적 유전자(예를 들어, 유전자 및 이의 프로모터 서열)의 상류에 있을 수 있다. 표적 유전자는 세포에 자연적으로 존재하는 단백질을 코딩할 수 있다. 표적 유전자는 세포에서 자연적으로 발생할 수 있는 단백질을 코딩할 수 있다. 대안적으로, 표적 유전자는 세포에서 자연적으로 발생하지 않는 단백질(예를 들어, 리포터 단백질, 예를 들어 녹색 형광 단백질(GFP)과 같은 형광 단백질)을 코딩할 수 있다. 표적 유전자는 강력한 구성적 인간 프로모터(EF1a) 또는 약한 최소 바이러스 프로모터(예: miniCMV)와 같은 프로모터의 제어 하에 있을 수 있다.
일부 실시예에서, 발현 벡터를 포함하는 ESR 세포 집단은 상이한 이종성 유전자 이펙터 및 합성 가이드 표적에 대한 가이드 핵산 서열의 라이브러리로 처리될 수 있으며, 표적 유전자의 발현 수준의 변화는 선도 이종성 유전자 이펙터(예를 들어, 강력한 구성적 인간 프로모터를 포함하는 발현 벡터에 대한 억제인자, 또는 약한 최소 바이러스 프로모터를 포함하는 발현 벡터에 대한 활성화제)를 스크리닝하기 위해 측정될 수 있다.
도 11은 ESR의 예시적인 서열을 개략적으로 보여준다. 도 12는 대조 리포터 벡터의 예시적인 서열을 개략적으로 보여준다. 어떤 경우에는, ESR의 각 합성 가이드 표적 서열 사이의 간격이 대조 리포터 벡터의 간격과 다를 수 있다. 예를 들어, ESR의 각 합성 가이드 표적 서열 사이의 간격은 대조 리포터 벡터의 간격보다 길 수 있다.
실시예 8: ESR을 포함하는 리포터 세포주의 생성
다른 유형의 다양한 세포가 ESR을 포함하도록 조작되어(예를 들어, 실시예 7에서 입증된 바와 같이), 예를 들어 이종성 유전자 이펙터 도메인(들) 및 표적 유전자 발현을 조절하는데 바람직한 특성을 나타내는 이들의 복합체(들)에 대한 스크리닝에 사용될 수 있는 다양한 유형의 리포터 세포주를 생성할 수 있다.
K562 세포는 miniCMV-GFP(ESR111)를 포함하는 ESR로 조작되어 새로운 유전자 활성화제를 스크리닝할 수 있다. K562 세포는 EF1a-GFP(ESR211)를 포함하는 ESR로 조작되어 유전자 억제인자를 스크리닝할 수 있다. 293T 세포는 유전자 활성화제의 검증을 위해 miniCMV-GFP(ESR121)를 포함하는 ESR로 조작될 수 있다. 293T 세포는 유전자 억제인자의 검증을 위해 EF1a-GFP(ESR221)를 포함하는 ESR로 조작될 수 있다.
도 13은 (i) 형질감염되지 않았거나, (ii) dCas9 및 ESR 벡터(dCas9 + sgT)에 대한 가이드 RNA로 형질감염되거나, (iii) dCas9-VPR 활성제 및 ESR 벡터(dCas9-VPR + sgT)에 대한 가이드 RNA로 형질감염되거나, (iv) dCas9-VPR 활성화제 및 ESR 벡터(dCas9-VPR + sgNT)에 대한 비표적화 제어 가이드 RNA로 형질감염된, miniCMV-GFP(ESR121)을 코딩하는 ESR로 조작된 리포터 293T 세포주의 유세포 분석 데이터 분석을 보여준다. 도 14는 (i) 형질감염되지 않았거나, (ii) dCas9 및 ESR 벡터(dCas9-empty)에 대한 가이드 RNA로 형질감염되거나, (iii) dCas9-KRAB 억제인자와 ESR 벡터(dCas9-KRAB)에 대한 가이드 RNA로 형질감염되거나, (iv) dCas9-KRAB-DNMT3L 억제인자와 ESR 벡터(dCas9-KL)에 대한 가이드 RNA로 형질감염된, EF1a-GFP(ESR221)를 코딩하는 ESR로 조작된 리포터 293T 세포주의 유세포 분석 데이터 분석을 보여준다. 도 13 및 도 14에 근거하여, 293T ESR 세포는 dCas9-VPR 또는 dCas9-KRAB 형질감염 후 강력한 활성화 또는 억제를 나타낸다.
도 15는 (i) 형질감염되지 않거나 (ii) dCas9-VPR 및 ESR 벡터(dCas9-VPR)에 대한 가이드 RNA로 형질감염된, miniCMV-GFP(ESR111)를 코딩하는 ESR로 조작된 리포터 K562 세포주의 유세포 분석 데이터 분석을 보여준다. 도 16은 형질감염되지 않고 3일에 측정(형질감염되지 않은 D3), 형질감염되지 않고 14일에 측정(형질감염되지 않은 D14), dCas9-KRAB 및 ESR 벡터에 대한 가이드 RNA로 형질감염되고 3일에 측정(dCas9-KRAB D3), dCas9-KRAB 및 ESR 벡터에 대한 가이드 RNA로 형질감염되고 4일에 측정(dCas9-KRAB D4), dCas9-KRAB 및 ESR 벡터에 대한 가이드 RNA로 형질감염되고 5일에 측정(dCas9-KRAB D5), dCas9-KRAB 및 ESR 벡터에 대한 가이드 RNA로 형질감염되고 6일에 측정(dCas9-KRAB D6), dCas9-KRAB 및 ESR 벡터에 대한 가이드 RNA로 형질감염되고 10일에 측정(dCas9-KRAB D10)하거나, dCas9-KRAB 및 ESR 벡터에 대한 가이드 RNA로 형질감염되고 14일에 측정(dCas9-KRAB D14)한, EF1a-GFP를 코딩하는 ESR로 조작된 리포터 K562 세포주의 유세포분석 데이터 분석을 보여준다. 도 15 및 도 16에 근거하여, K562 ESR 세포는 dCas9-VPR 또는 dCas9-KRAB mRNA 형질감염 후 강력한 활성화 또는 억제를 나타낸다.
도 17은 (i) dCasMINI 및 ESR 벡터에 대한 가이드 RNA(dCasMINI + sg20)로 형질감염되거나, (ii) dCasMINI-VPR 및 ESR 벡터에 대한 가이드 RNA(dCasMINI-VPR + sg20)로 형질감염되거나, (iii) dCasMINI 및 ESR 벡터에 대한 다른 가이드 RNA(dCasMINI + sg23)로 형질감염되거나, (iv) dCasMINI-VPR 및 ESR 벡터에 대한 다른 가이드 RNA(dCasMINI-VPR + sg23)로 형질감염되거나, (v) dCasMINI-VPR 및 대조군 비특이적 가이드 RNA 서열(dCasMINI-VPR + sgNT)로 형질감염된 미니CMV-GFP를 코딩하는 ESR(ESR121)로 조작된 리포터 293T 세포주의 유세포 분석 데이터 분석을 보여준다. 도 18은 (i) dCasMINI 및 ESR 벡터에 대한 가이드 RNA(dCasMINI + sgT)로 형질감염되거나, (ii) dCasMINI-KRAB 및 ESR 벡터에 대한 가이드 RNA(dCasMINI-KRAB + sgT)로 형질감염되거나, (iii) dCasMINI-KRAB 및 대조군 비특이적 가이드 RNA 서열(dCasMINI-KRAB + sgNT)로 형질감염된, EF1a-GFP를 코딩하는 ESR(ESR221)로 조작된 리포터 293T 세포주의 유세포 분석 데이터 분석을 보여준다. 도 17 및 도 18에 근거하여, 293T ESR 세포는 dCasMini-KRAB에 의해 강력하게 억제되지만, dCasMINI-VPR에 의한 활성화는 덜 강력하다.
실시예 9: 이펙터 라이브러리 스크린
고유한 12mer DNA 고유 분자 식별자(예: 바코드) 및 클로닝 상동성 암과 쌍을 이루는, >46,000개의 후보 이종성 유전자 이펙터(각각 255bp)를 코딩하는 맞춤형 DNA 올리고 라이브러리를 dCas9 렌티바이러스 발현 플라스미드에 클로닝하였다. 코딩된 후보 이종성 유전자 이펙터에는 인간 단백질로부터 유래된 후보 이종성 유전자 이펙터를 포함하는 서열번호: 16-47350 및 49353-50052 각각(예를 들어, 실시예 1에 기술된 바와 같이 확인된 서열번호: 16-13605), 대조군 이펙터(예를 들어, 서열번호: 13606-16154), 바이러스 단백질로부터 유래된 후보 이종성 유전자 이펙터(예를 들어, 실시예 3 및 4에 기술된 바와 같이 확인된 서열번호: 16155-43953), 및 추가의 대조군 이펙터(예를 들어, 서열번호: 43954-47350)가 포함되었다. 255 bp 서열 내 추정 정지 코돈의 하류에 코딩된 추가의 펩티드 서열은 서열번호: 47351-49333으로 제공된다.
동시에, 활성화제를 테스트하기 위해 GFP를 구동하는 최소 CMV 프로모터의 상류에 있는, 고유한 가이드 RNA 표적화 서열(tttaGTTGTTCTAAACGCTCTGAGcgg, 서열번호: 49339; 각각, 굵은 글씨 및 밑줄로 표시된 텍스트 CasMini 및 Cas9 PAM 서열)의 7개 사본 또는 억제인자를 테스트하기 위해 GFP를 구동하는 구성적 인간 EF1 프로모터(예를 들어, 실시예 7 및 도 10에 설명된 바와 같음)를 배치하여 맞춤형 GFP 리포터(조작된 합성 리포터 (ESR)-(GFP)를 생성하였다. 이들 리포터 플라스미드는 렌티바이러스에 포장되어 K562 세포에 형질도입되었다. 형질도입된 세포에 대한 퓨로마이신 선택 후, 제한 희석을 통해 개별 세포를 분리하였다. 클론 확장 후, 각 리포터 세포주의 여러 클론을 표준 조절인자의 형질감염으로 테스트하고 하류 실험을 위해 유리한 클론을 선택하였다.
ESR-GFP, CD45, 또는 CD71을 표적으로 하는 sgRNA-BFP 발현 카세트를 ESR-GFP 또는 WT K562 세포에 개별적으로 형질도입한 후 BFP+ 세포에 대해 FACS를 수행하였다. dCas9 후보 이펙터 라이브러리는 렌티바이러스에 포장되어 적절한 sgRNA를 발현하는 K562 세포에 운반되었다. 형질도입된 세포는 형질도입 후 10일에 블라스티시딘 선택에 이어 형광 활성화된 세포 분류(FACSAria)를 통해 관심 집단(활성화를 위한 GFP-ON 세포 및 억제를 위한 GFP-OFF 세포)을 분리하여 농축하였다. 관심 있는 분류된 집단은 추가로 6일 동안 배양하여 더욱 풍부해졌고 GFP 형광 강도를 기초로 개별 저장소로 4방향 게이트 FACS 분리를 거쳤다. 게놈 DNA는 벌크 GFP-ON 및 GFP-OFF 세포뿐만 아니라 각각의 분리된 빈에서 추출된 후 차세대 서열분석(NGS) 라이브러리로 동시에 처리되고 서열분석되어 각 샘플에 존재하는 바코드를 식별한다(Illumina Next-Seq, 1x75bp). 작업흐름도가 도 20에 요약되어 있다.
조작된 합성 리포터(ESR) 시스템을 사용한 스크린
후보 이종성 유전자 이펙터의 라이브러리를 ESR-GFP 리포터 K562 세포에서 스크리닝하였다. ESR-GFP 리포터는 대조 dCas9-VPR을 이용한 활성화 및 대조 dCas9-KRAB에 대한 반응으로 억제에 반응하여 높은 동적 범위를 나타냈다(도 21a).
각 라이브러리에 대한 판독 카운트 매트릭스는 이종성 유전자 이펙터에 상응하는 서열화된 바코드의 정렬을 기초로 생성되었다. 모든 후속 데이터 분석은 R 버전 4.1.0을 사용하여 수행되었다.
활성화 스크린의 경우, GFP-OFF 라이브러리에 대한 기술적 복제가 붕괴되어(바코드당 개수가 합산됨) 2개의 GFP-OFF 복제가 생성되었다. GFP-ON 조건의 경우, 하나의 GFP-ON 라이브러리는 형질도입 후 10일에 수집되었고 다른 하나는 모든 GFP-ON 게이트의 가중 합계를 취하여 인실리코로 구축되었다(추가 6일의 농축 후 수집). DESEQ2(버전 1.32.0)는 2개의 GFP-OFF 라이브러리와 비교하여 2개의 GFP-ON 라이브러리에서 강화된 통계적으로 유의적인 활성화제 요소를 식별하는 데 사용되었다. 활성화제 스크린의 히트를 보여주는 화산 플롯이 도 22a에 제공되어 있다.
억제인자 스크린의 경우, GFP-ON 라이브러리에 대한 기술적 복제가 붕괴되어(바코드당 개수가 합산됨) 2개의 GFP-ON 복제가 생성되었다. GFP-OFF 조건의 경우, 하나의 GFP-OFF 라이브러리는 형질도입 후 10일에 수집되었고 다른 하나는 모든 GFP-OFF 게이트의 가중 합계를 취하여 인실리코로 구축되었다(추가 6일의 농축 후 수집). DESEQ2(버전 1.32.0)는 2개의 GFP-ON 라이브러리와 비교하여 2개의 GFP-OFF 라이브러리에서 강화된 통계적으로 유의적인 억제인자 요소를 식별하는 데 사용되었다. 억제인자 스크린의 히트를 보여주는 화산 플롯이 도 22b에 제공되어 있다.
내인성 표적을 사용한 스크린
후보 이종성 유전자 이펙터의 라이브러리는 2개의 내인성 인간 유전자 표적: 활성화에 대한 스크리닝의 경우 낮게 발현된 CD45, 또는 억제에 대한 스크리닝의 경우 고도로 발현된 CD71(도 21b)에 대해 sgRNA를 안정적으로 발현하는 야생형 K562 세포에서 스크리닝되었다. 형질도입된 세포는 FACS에 의해 농축된 후, 4방향 게이트 FACS 비닝 이전에 각각의 형광단 결합된 항체로 염색되었으며 위와 같이 NGS 라이브러리 제조 및 서열분석이 이루어졌다.
각 라이브러리에 대한 판독 카운트 매트릭스는 이종성 유전자 이펙터에 상응하는 서열화된 바코드의 정렬을 기초로 생성되었다. 모든 후속 데이터 분석은 R 버전 4.1.0을 사용하여 수행되었다. 활성화 스크린(CD45)의 경우, 가장 낮은 GFP 게이트(GFP-OFF)의 2개의 복제물을 가장 높은 GFP 게이트(GFP-ON)의 2개의 복제물과 비교하여 새로운 활성화제를 확인하였다. 모든 조건에서 판독 카운트가 0인 모든 바코드를 제거한 다음 DESEQ2(버전 1.32.0)를 사용하여 2개의 GFP-OFF 라이브러리와 비교하여 2개의 GFP-ON 라이브러리에 강화된 통계적으로 유의적인 활성화제 요소를 확인하였다. 활성화제 스크린의 히트를 보여주는 화산 플롯이 도 23a에 제공되어 있다. 억제인자 스크린(CD71)에 대한 분석은 2개의 GFP-ON 라이브러리와 비교하여 2개의 GFP-OFF 라이브러리에서 강화된 통계적으로 유의적인 억제인자 요소가 확인되었다는 점을 제외하고는 동일하였다. 억제인자 스크린의 히트를 보여주는 화산 플롯이 도 23b에 제공되어 있다.
실시예 10: 내인성 인간 유전자좌에서의 배열 형식 이종성 유전자 이펙터 검증
FDR(false discovery rate)로 순위가 매겨진 실시예 9의 스크린에서 확인된 상위 ~200개 후보 이종성 유전자 이펙터를 개별적으로 재합성하고 dCasMini 발현 플라스미드로 클로닝하여 실험적 검증을 위해 배열된 96개-웰 플레이트 형식에서 일시적 플라스미드 형질감염에 의한 플라스미드 형질감염을 실시하였다. 야생형 HEK293T 세포를 웰당 20,000개 세포의 밀도로 96개-웰 플레이트에 씨딩하였다. 씨딩 16시간 후, 세포는 배열된 형식으로 sgRNA 및 후보 이펙터 복합체(이펙터-dCasMini 융합)를 발현하는 균일한 질량의 플라스미드로 동시 형질감염되어 각 웰은 테스트할 서로 다른 단일 후보 이펙터 작제물을 수용하게 되지만, 모든 웰에 걸쳐서 동일한 표적화 sgRNA(sgCXCR4)를 수용하게 된다. 각 웰에는 100ng의 이펙터 코딩 플라스미드와 50ng의 sgRNA 플라스미드가 수용되었으며, 실험은 기술적으로 3중으로 수행되었다. 음성 대조군은 이펙터 융합이 없는 dCas9 및 dCasMini 발현 플라스미드였으며, 표적화 및 비표적화 sgRNA 플라스미드로 동시 형질감염되었다. 양성 대조군은 표준 전사 조절인자: 억제인자 대조군의 경우 KRAB 및 활성화 대조군의 경우 p65, Rta, VP64, 및 VPR에 대한 dCas9 및 dCasMini 융합이었다.
형질감염 후 3일 및 7일(d.p.t.)에, 세포를 CXCR4-APC 결합 항체(BioLegend)로 염색하고 유세포 분석기(Cytoflex LX)로 분석하여 CXCR4 단백질 발현을 모니터링하고, 분석 게이트(FlowJo)를 사용하여 mCherry 및 BFP 형광을 통해 각각 이펙터 및 sgRNA 플라스미드 발현을 확인하기 위한 살아있는, 단일 및 이중 형질감염 세포의 측정을 보장하였다. 각 조절인자에 대한 APC 형광의 기하 평균은 음성 대조군에 대해 정규화되었으며 음성 대조군에 대한 배수 변화로 보고되었다.
유전자 발현에 대한 다수의 후보 이펙터의 영향은 2개의 독립적인 실험 사이 및 시점 사이에서 양의 상관관계가 있는 것으로 나타났다(도 24a; x-축은 3 d.p.t.에서 정규화된 형광을 나타내고(2개의 독립적인 실험 중 첫 번째, 각각 3중으로 수행됨), y축은 두 번째 독립적 실험에서 측정된 정규화된 형광을 나타낸다(3중으로 수행됨)). 데이터 포인트는 표시되지 않는 한(dCas9), dCasMini-조절인자 융합체를 나타낸다. 후보 이펙터는 "EPIC"로 시작하는 접두사로 표시되는데, 예를 들면, "EPICXV", "EPIC9V", "EPICXH," 또는 "EPIC9H" 등 뒤에 숫자 지정이 붙는다. 3일 및/또는 7일에 CXCR4 발현의 상향조절을 초래하는 이펙터가 확인되었다(예: EPICXV.1, 서열번호: 23631; EPICXV.8, 서열번호: 35737; EPICXV.3, 서열번호: 23639); EPICXV.16, 서열번호: 17629; 또는 EPICXV.13, 서열번호: 38138; 또는 3일 및/또는 7일에 CXCR4 발현의 하향조절(예를 들어, EPICXV.55, 서열번호: 19860; EPICXV.66, 서열번호: 40986; EPICXV.71, 서열번호: 33890). 이들 후보 이펙터는 대조군 활성화제 또는 억제인자에 비해 표적 유전자의 발현을 필적하거나 우수한 정도로 변경하였다(도 24b, 후보 이종성 유전자 이펙터와 dCasMini의 융합에 대한 3 d.p.t.의 대표적인 유세포 분석 히스토그램). 후보 이펙터는 대조 이펙터보다 상당히 작음에도 불구하고 표적 유전자 발현에서 관찰된 변화를 유도하였다(도 24c).
실시예 11: 내인성 유전자좌에서의 유전자 발현 조절
본 실시예는 내인성 표적 유전자의 발현에 대한 dCasMini에 융합된 후보 이종성 유전자 이펙터의 효과를 입증한다.
야생형 HEK293T 세포를 실시예 10에서와 같이 인간 IFNG, CD45 또는 CD2의 후보 이펙터-dCasMini 융합 및 sgRNA 표적화 프로모터를 발현하는 플라스미드로 씨딩하고 일시적으로 형질감염시켰다.
형질감염 후 72시간에, 형광 현미경(EVOS FL)으로 각각 mCherry 및 BFP 형광을 통해 이펙터 및 sgRNA 플라스미드 발현을 확인한 후, IFNG를 표적으로 하는 sgRNA로 형질감염된 세포의 상등액을 수집하여 ELISA로 IFNG 단백질 발현을 모니터링하였다. 각 이펙터에 대한 인터페론 감마 ELISA 단백질 농도는 음성 대조군의 농도에 대해 정규화되었으며 음성 대조군에 대한 배수 변화로 보고되었다. 인터페론 감마 생산에 대한 다양한 효과가 관찰되었다(도 25a).
형질감염 후 2일에, CD45를 표적으로 하는 sgRNA로 형질감염된 세포를 APC 결합 항-CD45 항체(BioLegend)로 염색하고 유세포 분석기(Cytoflex LX)로 분석하여, 분석 게이트(FlowJo)를 사용하여 mCherry 및 BFP 형광을 통해 각각 이펙터 및 sgRNA 플라스미드 발현을 확인하기 위한 살아있는, 단일 및 이중 형질감염 세포의 측정을 보장하였다. 각 이펙터에 대한 APC 형광의 기하 평균은 음성 대조군에 대해 정규화되었으며 음성 대조군에 대한 배수 변화로 보고되었다. CD45 발현에 대한 다양한 효과가 관찰되었다(도 25b).
CD2를 표적으로 하는 sgRNA로 형질감염한 후 3일 및 5일에, APC 결합 항-CD2 항체(BioLegend)로 염색하고 유세포 분석기(Cytoflex LX)로 분석하여, 분석 게이트(FlowJo)를 사용하여 mCherry 및 BFP 형광을 통해 각각 이펙터 및 sgRNA 플라스미드 발현을 확인하기 위한 살아있는, 단일 및 이중 형질감염 세포의 측정을 보장하였다. 각 이펙터에 대한 APC 형광의 기하 평균은 음성 대조군에 대해 정규화되었으며 음성 대조군에 대한 배수 변화로 보고되었다. CD2 발현에 대한 다양한 효과가 관찰되었다(도 25c 및 도 25d).
실시예 12: 리포터 세포에서의 유전자 발현 조절
안정적으로 통합된 TRE3G 프로모터 구동된 GFP 리포터를 보유하는 HEK293T 세포를 실시예 10에서와 같이 후보 이펙터-dCasMini 융합체 및 합성 TET 프로모터를 표적으로 하는 sgRNA를 발현하는 플라스미드로 씨딩하고 일시적으로 형질감염시켰다. 형질감염 48시간 후, 세포를 유세포 분석기(Cytoflex LX)로 분석하여 GFP 발현을 모니터링하고, 분석 게이트(FlowJo)를 사용하여 mCherry 및 BFP 형광을 통해 각각 이펙터 및 sgRNA 플라스미드 발현을 확인하기 위한 살아있는, 단일 및 이중 형질감염 세포의 측정을 보장하였다. 각 이펙터에 대한 GFP 형광의 기하 평균은 음성 대조군에 대해 정규화되었으며 음성 대조군에 대한 배수 변화로 보고되었다. 리포터 발현에 대한 다양한 효과가 관찰되었다(도 26a).
저발현 miniCMV 프로모터에 의해 구동되는 안정적으로 통합된 GFP 합성 리포터를 보유하는 HEK293T 세포(세포주 ESR121)를 실시예 10에서와 같이 후보 이펙터-dCasMini 융합체 및 리포터를 표적으로 하는 sgRNA를 발현하는 플라스미드로 씨딩하고 일시적으로 형질감염시키고, 형질감염 후 2일에 상기와 같이 분석하여 dCasMini-이펙터 융합에 의한 전사 활성화를 측정하였다. 리포터 발현에 대한 다양한 효과가 관찰되었다(도 26b).
실시예 13: 리포터 세포에서의 유전자 발현 억제
인간 펩티드 서열로부터 유래된 후보 이펙터 라이브러리로부터 확인된 억제 활성을 갖는 이펙터를 dCasMini에 대한 융합체로서 개별적으로 시험하였다. 고발현 EF1α 프로모터에 의해 구동되는 안정적으로 통합된 GFP 합성 리포터를 보유하는 HEK293T 세포(세포주 ESR221)를 실시예 10에서와 같이 일시적으로 씨딩하고 후보 이펙터-dCasMini 또는 -dCas9 융합체와 리포터를 표적으로 하는 sgRNA를 발현하는 플라스미드로 형질감염시키고, 형질감염 후 5일에 분석하여 dCasMini-이펙터 융합에 의한 전사 억제를 측정하였다. 예시적인 후보 이펙터 도메인 EPICXH.6(서열번호: 9066) 및 EPICXH.1(서열번호: 1102)은 리포터 발현의 강력한 억제를 보여주었다(도 27a).
dCas9에 대한 융합체로서 추가의 후보 인간 억제인자 도메인을 테스트하였다. 고발현 EF1α 프로모터에 의해 구동되는 안정적으로 통합된 GFP 합성 리포터를 보유하는 HEK293T 세포(세포주 ESR221)를 씨딩하고, 일시적으로 형질감염시켜, 형질감염 후 5일에 위와 같이 분석하여 전사 억제를 측정하였다. 예시적인 이펙터 도메인 EPIC9H.1(서열번호: 1102), EPIC9H.2(서열번호: 5543), EPIC9H.3(서열번호: 2057), EPIC9H.4(서열번호: 15646), EPIC9H.5 (서열번호: 11948), 및 EPIC9H.6(서열번호: 9066)은 리포터 발현에 대한 강력한 억제를 보여주었다(도 27b).
실시예 14: 내인성 CXCR4 유전자좌에서의 전사 효과의 지속성
야생형 HEK293T 세포를 CXCR4를 표적으로 하는 sgRNA 및 후보 이펙터 복합체(이펙터-dCasMini 융합)를 발현하는 플라스미드로 형질감염시켰다. 형질감염된 세포는 형질감염 후 3일, 7일, 15일, 및 28일에 실시예 10에서와 같이 CXCR4의 전사 조절에 대해 연속적으로 분석되었다(도 28a, 대조군 이펙터 KRAB, VP64, 및 VPR은 명확한 원으로 표시되고 신규 이펙터는 어두운 원으로 표시되는데 각 개별 조절인자의 반복 평균을 나타낸다). 각 시점에서 양성 대조군과 비교하여 선택된 개별 신규 조절인자에 대한 정규화된 형광 값이 각 시점에서 효과 크기에 따라 순위가 매겨진 조절인자에 대해, 도 28b에 나타나 있다. 흥미로운 활성을 보이는 후보 이종성 유전자 이펙터에는 EPICXV.1(서열번호: 23631), EPICXV.95(서열번호: 40913), EPICXV.92(서열번호: 22707), EPICXV.90(서열번호: 42623), EPICXV.65(서열번호: 22149), EPICXV.80(서열번호: 25430), EPICXV.43(서열번호: 34047), EPICXV.58(서열번호: 21166), EPICXV.69(서열번호: 25555), EPICXV.67(서열번호: 40985), EPICXV.79(서열번호: 38780), 및 EPICXV.71(서열번호: 33890)이 포함되었다. 많은 후보 이펙터는 매 시점에서 관찰된 EPICXV.1에 의한 CXCR4 발현의 강력한 상향조절을 포함하여 흥미로운 활성을 나타냈다.
실시예 15: 전사 효과의 지속성
고발현 EF1α 프로모터에 의해 구동되는 안정적으로 통합된 GFP 합성 리포터를 보유하는 HEK293T 세포를 씨딩하고, 후보 이펙터-dCasMini 융합체 및 리포터를 표적으로 하는 sgRNA를 발현하는 플라스미드로 일시적으로 형질감염시켜, 형질감염 후 최대 77일까지 연속적으로 분석하였다. EPICXV.67(서열번호: 40985)을 포함하여, 여러 후보 이종성 유전자 이펙터에 대해 유전자 발현의 지속적인 억제가 관찰되었다(도 29a, 양성 대조군 억제 이펙터는 점선으로 표시되는 반면, 신규 조절인자는 실선으로 표시된다).
양성 대조군 dCas9-KAL(dCas9에 융합된 KRAB, DNMT3A 및 DNMT3L 도메인을 포함하는 지속적인 억제를 위한 작제물)에 대한 시간 경과에 따른 리포터 유전자 발현이 도 29b에 나타나 있으며, 이는 점진적인 시점에 걸쳐 GFP의 증가된 억제를 입증한다. 음성 대조군, 양성 대조군, 및 후보 이종성 유전자 이펙터(EPICXV.97)에 대한 대표적인 히스토그램이 도 29c에 제공되며, 후보 이펙터가 유전자 발현에 대해 강력하고 지속적인 효과를 나타냄을 보여준다.
이종성 유전자 이펙터의 발현 지표인, mCherry 리포터 발현의 종방향 측정은 이종성 유전자 이펙터의 발현이 6-9 d.p.t. 후에 급격히 떨어지다가 후속 시점 전체에서 감지할 수 없는 상태로 유지되는데, 이는 9 d.p.t. 이후에 관찰된 임의의 전사 효과가 이펙터의 발현 유지에 기인하지 않음을 시사한다는 것을 보여준다(도 29d). 대조군 이펙터(도 29e) 및 융합 단백질(도 29f)의 도메인과 비교하여 이펙터 도메인(255개의 뉴클레오티드 코딩 서열에 의해 코딩됨)의 작은 크기에도 불구하고 유전자 발현에 대한 강력하고 지속적인 효과가 관찰되었다.
형질감염 후 77일에 수집된 데이터는 다수의 후보 이종성 유전자 이펙터가 이 시점까지 지속된 표적 유전자 발현의 다양한 정도의 억제를 나타냈음을 보여주었다(도 29g). 발현에 대한 지속 효과를 나타내는 이펙터에는 EPICXV.67(서열번호: 40985), EPICXV.92(서열번호: 22707), EPICXV.90(서열번호: 42623), EPICXV.95(서열번호: 40913), EPICXV.80(서열번호: 25430), EPICXV.58(서열번호: 21166), EPICXV.43(서열번호: 34047), EPICXH.1(서열번호: 1102), EPICXV.79(서열번호: 38780), EPICXV.71(서열번호: 33890), 및 EPICXV.69(서열번호: 25555)가 포함되었다.
실시예 16: 내인성 및 합성 리포터 데이터의 비교
이종성 유전자 이펙터에 대해 수집된 데이터를 내인성 유전자 CXCR4 및 ESR-GFP 합성 리포터 세포의 발현에 대한 효과에 대해 비교하였다(도 30; 확인된 이펙터에는 EPICXV.81(서열번호: 21015), EPICXV.87(서열번호: 32678), 및 본원에 기술된 다른 이펙터가 포함된다). ESR-GFP 합성 리포터 세포의 정규화된 GFP 형광(3~77 d.p.t.의 모든 시점에 걸쳐 평균, y축)과 정규화된 CXCR4-APC 형광(3~28d.p.t.의 모든 시점에 걸쳐 평균; x-축) 사이의 상관관계를 관찰할 수 있다.

Claims (106)

  1. 다음 단계:
    (a) 세포 집단을 복합체 라이브러리와 접촉시키는 단계로, 여기서 라이브러리의 개별 복합체는 다음:
    (i) 라이브러리의 다른 복합체에 있는 이종성 유전자 이펙터와는 다른 이종성 유전자 이펙터; 및
    (ii) 라이브러리의 다른 복합체에서 핵산 서열을 가이드하기 위해 100% 서열 동일성을 나타내는 가이드 핵산 서열을 포함하며,
    여기서, 이종성 유전자 이펙터 및 가이드 핵산 서열은 세포 집단에서 표적 내인성 유전자에 대한 특이적 결합을 나타내는 개별 복합체를 형성하고,
    라이브러리는 적어도 25개의 서로 다른 복합체를 포함하는 것인 단계;
    (b) 접촉 시, 세포 집단 내 표적 내인성 유전자의 발현 또는 활성 수준의 변화에 기초하여 세포 집단을 분류하는 단계; 및
    (c) 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터를 확인하는 단계를 포함하는 방법.
  2. 다음 단계:
    (a) 세포 집단을 복합체 라이브러리와 접촉시키는 단계로, 여기서 라이브러리의 개별 복합체는 다음:
    (i) 라이브러리의 다른 복합체에 있는 이종성 유전자 이펙터와는 다른 이종성 유전자 이펙터; 및
    (ii) 라이브러리의 다른 복합체에서 핵산 서열을 가이드하기 위해 100% 서열 동일성을 나타내는 가이드 핵산 서열을 포함하며,
    여기서, 이종성 유전자 이펙터 및 가이드 핵산 서열은 세포 집단에서 표적 내인성 유전자에 대한 특이적 결합을 나타내는 개별 복합체를 형성하고,
    이종성 유전자 이펙터는 바이러스성 유전자 이펙터를 포함하는 것인 단계;
    (b) 접촉 시, 세포 집단 내 표적 내인성 유전자의 발현 또는 활성 수준의 변화에 기초하여 세포 집단을 분류하는 단계; 및
    (c) 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터를 확인하는 단계를 포함하는 방법.
  3. 제2항에 있어서, 바이러스성 유전자 이펙터가 아데노바이러스과(Adenoviridae), 아레나바이러스과(Arenaviridae), 보르나바이러스과(Bornaviridae), 코로나바이러스과(Coronaviridae), 필로바이러스과(Filoviridae), 플라비바이러스과(Flaviviridae), 헤파바이러스과(Hepadnaviridae), 헤르페스바이러스과(Herpesviridae), 오르토믹소바이러스과(Orthomyxoviridae), 파필로마바이러스과(Papillomaviridae), 파라믹소바이러스과(Paramyxoviridae), 파르보바이러스과(Parvoviridae), 페리분야바이러스과(Peribunyaviridae), 페누이바이러스과(Phenuiviridae), 뉴모바이러스과(Pneumoviridae), 폴리오마바이러스과(Polyomaviridae), 폭스바이러스과(Poxviridae), 레트로바이러스과(Retroviridae), 및 랍도바이러스과(Rhabdoviridae)로 이루어진 군으로부터 선택되는 인간 바이러스로부터 유래되는 것인 방법.
  4. 제2항에 있어서, 바이러스성 유전자 이펙터가 플라비바이러스과(Flaviviridae), 라이사바이러스과(Lyssaviridae), 필로바이러스과(Filoviridae), 파라믹소바이러스과(Paramyxoviridae), 오르토믹소바이러스과(Orthomyxoviridae), 코로나바이러스과(Coronaviridae), 레오바이러스과(Reoviridae), 토가바이러스과(Togaviridae), 페뉴바이러스과(Phenuviridae), 및 한타바이러스과(Hantaviridae)로 이루어진 군으로부터 선택되는 인간-박쥐 공유 바이러스로부터 유래되는 것인 방법.
  5. 제2항에 있어서, 바이러스성 유전자 이펙터가 고세균-향성 바이러스(Archaea-tropic virus), 시포바이러스과(Siphoviridae), 포도바이러스과(podoviridae), 미미바이러스과(Mimiviridae), 니마바이러스과(Nimaviridae), 리가멘바이러스목(Ligamenvirales), 글로불로바이러스과(Globuloviridae), 푸셀로바이러스과(Fuselloviridae), 비카우다바이러스과(Bicaudaviridae), 위성 바이러스(Satellite virus), 이리도바이러스과(Iridoviridae), 투리바이러스과(Turriviridae), 카우도바이러스목(Caudovirales), 피코드나바이러스과(Phycodnaviridae) 및 미오바이러스과(Myoviridae)로 이루어진 군으로부터 선택되는 바이러스로부터 유래되는 것인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 라이브러리가 적어도 30, 50, 100, 200, 500, 1,000, 2,000, 5,000, 또는 10,000개의 서로 다른 복합체를 포함하는 것인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 가이드 핵산 서열이 약 10 내지 약 30개의 뉴클레오티드, 약 15 내지 약 25개의 뉴클레오티드, 또는 약 15개의 뉴클레오티드를 포함하는 것인 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 개별 복합체가 이종성 엔도뉴클레아제를 추가로 포함하는 것인 방법.
  9. 제8항에 있어서, 개별 복합체의 이종성 엔도뉴클레아제가 다른 복합체의 이종성 엔도뉴클레아제와 100% 서열 동일성을 나타내는 것인 방법.
  10. 제8항에 있어서, 이종성 유전자 이펙터와 이종성 엔도뉴클레아제가 서로 융합되는 것인 방법.
  11. 제8항에 있어서, 이종성 유전자 이펙터와 이종성 엔도뉴클레아제가 서로 비공유적으로 결합되는 것인 방법.
  12. 제8항에 있어서, 이종성 엔도뉴클레아제가 Cas 단백질인 방법.
  13. 제12항에 있어서, Cas 단백질이 핵산 절단 활성이 결여되어 있는 것인 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 가이드 핵산 서열이 가이드 RNA 분자의 일부인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 이종성 전사 조절인자를 포함하는 것인 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 이종성 염색질 조절인자를 포함하는 것인 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 변화가 표적 내인성 유전자의 강화된 발현 또는 활성 수준인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 변화가 표적 내인성 유전자의 감소된 발현 또는 활성 수준인 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 서열번호: 16-16154, 16-13605, 또는 49353-50052 중 어느 하나와 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 100% 서열 동일성을 나타내는 것인 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 서열번호: 16155-47350 중 어느 하나 또는 서열번호: 16155-43953 중 어느 하나와 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 100% 서열 동일성을 나타내는 것인 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 복수의 상이한 이종성 유전자 이펙터를 포함하고, 여기서 개별 복합체의 복수의 상이한 이종성 유전자 이펙터의 조합이 라이브러리의 다른 복합체 내의 이종성 유전자 이펙터의 조합과 상이한 것인 방법.
  22. 제21항에 있어서, 복수의 상이한 이종성 유전자 이펙터 중 적어도 하나가 P300, TET1, TET2, TET3, 및/또는 HSF1이 아닌 방법.
  23. 제21항에 있어서, 복수의 상이한 이종성 유전자 이펙터 중 적어도 하나가 P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR(Vp64+p65+Rta)가 아닌 방법.
  24. 제21항에 있어서, 복수의 상이한 이종성 유전자 이펙터 중 적어도 하나가 KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노산, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A가 아닌 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 P300, TET1, TET2, TET3, 및/또는 HSF1이 아닌 방법.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR(Vp64+p65+Rta)가 아닌 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 KRAB, Mad mSIN3 상호작용 도메인(SID), ERF 억제인자 도메인(ERD), cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노산, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A가 아닌 방법.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 하나 이상의 선도 이종성 유전자 이펙터가 최대 1개의 이종성 유전자 이펙터, 최대 2개의 이종성 유전자 이펙터, 최대 5개의 이종성 유전자 이펙터, 최대 10개의 이종성 유전자 이펙터, 최대 15개의 이종성 유전자 이펙터, 최대 20개의 이종성 유전자 이펙터, 또는 최대 50개의 이종성 유전자 이펙터인 방법.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 하나 이상의 선도 이종성 유전자 이펙터에 의해 발생되는 표적 내인성 유전자의 발현 또는 활성 수준의 변화 정도가 대조군에 의한 것보다 적어도 2배 더 큰 것인 방법.
  30. 제29항에 있어서, 정도는 대조군에 의한 것보다 적어도 5배, 10배, 20배, 50배, 또는 100배 더 큰 것인 방법.
  31. 제29항에 있어서, 대조군이 복합체 라이브러리가 없는 세포 집단인 방법.
  32. 제29항에 있어서, 대조군이 대조군 이종성 유전자 이펙터에 의해 접촉된 세포 집단인 방법.
  33. 제32항에 있어서, 대조군 이종성 유전자 이펙터가 P300, TET1, TET2, TET3, 및/또는 HSF1인 방법.
  34. 제32항에 있어서, 대조군 이종성 유전자 이펙터가 P65, Rta, VPR, AD2, CR3, ELKF1, GATA4, PRVIE, p53, SP1, MYOD, MEF2C, TAX, PPAR-감마, MED1, MED7, MED17, MED26, MED29, TBP, GTF2H-2D, GTF2B, CBP, HSF1, MS2-p65-HSF1, MS2-TET1, NLS-dCas9-VP64, P300, p65, PRDM9, PUFa-GADD45A-TET1, R2, SunTag-scFv-sfGFP-TET1CD, TET1, TET2, TET3, VP120, VP16, VP16, VP16, VP48, VP64, VP64 또는 p65 +/- HSF1 또는 MyoD1, 및/또는 VPR(Vp64+p65+Rta)인 방법.
  35. 제32항에 있어서, 대조군 이종성 유전자 이펙터가 KRAB, SID, ERD, cat3a, Dnmt3a 이소형 1의 마지막 301개 아미노산, dCas9-KRAB-MeCP2, DNMT3A, DNMT3A, DNMT3A, DNMT3A R887E-DNMT3L, DNMT3A-DNMT3L, DNMT3B, EZH2, HDAC, KRAB-DNMT3A, KRAB-DNMT3A-DNMT3L, KRAB-DNMT3L, LSD1, M.SssI, MQ1, MQ1 Q147E, SID4x, 및/또는 SuntTag-DNMT3A인 방법.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 추가의 세포 집단에서 추가의 표적 내인성 유전자에 대해 (a)-(c) 단계를 수행하는 것을 추가로 포함하며, 여기서 (1) 표적 내인성 유전자의 발현 또는 활성 수준의 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터는 (2) 추가의 표적 내인성 유전자의 발현 또는 활성 수준의 변화를 가져오는 라이브러리의 하나 이상의 선도 이종성 유전자 이펙터와 다른 것인 방법.
  37. 제36항에 있어서, 상기 세포 집단과 추가의 세포 집단이 동일한 세포 유형인 방법.
  38. 제36항에 있어서, 상기 세포 집단과 추가의 세포 집단이 다른 세포 유형인 방법.
  39. 제1항 내지 제38항 중 어느 한 항에 있어서, 세포 집단이 포유동물 세포를 포함하는 것인 방법.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서, 세포 집단이 인간 세포를 포함하는 것인 방법.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서, 세포 집단이 줄기 세포를 포함하는 것인 방법.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 세포 집단이 분화된 세포를 포함하는 것인 방법.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서, 표적 내인성 유전자가 질병 관련 유전자인 방법.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, 표적 내인성 유전자가 분화 관련 유전자인 방법.
  45. 제1항 내지 제44항 중 어느 한 항에 있어서, 표적 내인성 유전자가 나이 관련 유전자인 방법.
  46. 제1항 내지 제45항 중 어느 한 항의 방법의 복합체 라이브러리를 포함하는 시스템.
  47. 제1항 내지 제46항 중 어느 한 항의 방법의 복합체 라이브러리를 포함하는 키트.
  48. 제1항 내지 제47항 중 어느 한 항의 방법의 복합체 라이브러리의 이종성 유전자 이펙터를 코딩하는 핵산 라이브러리.
  49. 제1항 내지 제48항 중 어느 한 항의 방법의 복합체 라이브러리를 코딩하는 핵산 라이브러리.
  50. 제1항 내지 제49항 중 어느 한 항의 방법의 복합체 라이브러리의 이종성 유전자 이펙터를 집합적으로 발현하는 세포 집단.
  51. 제1항 내지 제50항 중 어느 한 항의 방법의 복합체 라이브러리를 집합적으로 발현하는 세포 집단.
  52. 가이드 모이어티 및 이종성 유전자 이펙터를 포함하는 복합체로서, 이종성 유전자 이펙터가 서열번호: 23631, 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나와 적어도 약 70% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 복합체.
  53. 제52항에 있어서, 아미노산 서열이 서열번호: 23631, 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나와 적어도 약 90% 서열 동일성을 갖는 것인 복합체.
  54. 제52항에 있어서, 이종성 유전자 이펙터가 서열번호: 23631, 1102, 2057, 5543, 9066, 11948, 15646, 17629, 19860, 21015, 21166, 22149, 22707, 23639, 25430, 25555, 32678, 33890, 34047, 35737, 38138, 38780, 40913, 40985, 40986, 및 42623 중 어느 하나의 아미노산 서열을 포함하는 것인 복합체.
  55. 제52항에 있어서, 아미노산 서열이 서열번호: 23631과 적어도 90%의 서열 동일성을 갖는 것인 복합체.
  56. 제52항에 있어서, 이종성 유전자 이펙터가 서열번호: 23631의 아미노산 서열을 포함하는 것인 복합체.
  57. 제52항에 있어서, 아미노산 서열이 서열번호: 33890과 적어도 90%의 서열 동일성을 갖는 것인 복합체.
  58. 제52항에 있어서, 이종성 유전자 이펙터가 서열번호: 33890의 아미노산 서열을 포함하는 것인 복합체.
  59. 제52항에 있어서, 아미노산 서열이 서열번호: 40985와 적어도 90%의 서열 동일성을 갖는 것인 복합체.
  60. 제52항에 있어서, 이종성 유전자 이펙터가 서열번호: 40985의 아미노산 서열을 포함하는 것인 복합체.
  61. 제52항 내지 제60항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 500개 미만의 아미노산을 함유하는 것인 복합체.
  62. 제52항 내지 제61항 중 어느 한 항에 있어서, 이종성 유전자 이펙터가 100개 미만의 아미노산을 함유하는 것인 복합체.
  63. 제52항 내지 제62항 중 어느 한 항에 있어서, 가이드 모이어티가 표적 유전자 또는 표적 유전자 조절 서열에 특이적으로 결합하는 것인 복합체.
  64. 제52항 내지 제63항 중 어느 한 항에 있어서, 가이드 모이어티가 가이드 핵산 서열을 포함하는 것인 복합체.
  65. 제64항에 있어서, 가이드 핵산 서열이 약 10 내지 약 30개의 뉴클레오티드를 포함하거나 이로 구성되는 것인 복합체.
  66. 제64항 또는 제65항에 있어서, 가이드 핵산 서열이 가이드 RNA인 복합체.
  67. 제64항 내지 제66항 중 어느 한 항에 있어서, 가이드 핵산 서열이 단일 가이드 RNA(sgRNA)인 복합체.
  68. 제52항 내지 제67항 중 어느 한 항에 있어서, 가이드 모이어티가 뉴클레아제 또는 이의 일부를 포함하는 것인 복합체.
  69. 제68항에 있어서, 뉴클레아제 또는 이의 일부가 뉴클레아제의 야생형 버전에 비해 뉴클레아제 활성이 감소된 변형된 뉴클레아제인 복합체.
  70. 제68항 또는 제69항에 있어서, 뉴클레아제 또는 이의 일부가 핵산 절단 활성이 실질적으로 결여되어 있는 것인 복합체.
  71. 제68항 내지 제70항 중 어느 한 항에 있어서, 뉴클레아제 또는 이의 일부가 Cas 단백질 또는 이의 일부인 복합체.
  72. 제68항 내지 제71항 중 어느 한 항에 있어서, 뉴클레아제 또는 이의 일부가 뉴클레아제 불활성화된 Cas(dCas) 단백질 또는 이의 일부인 복합체.
  73. 제52항 내지 제72항 중 어느 한 항에 있어서, 가이드 모이어티와 이종성 유전자 이펙터가 선택적으로 링커를 통해 서로 융합되는 것인 복합체.
  74. 제52항 내지 제72항 중 어느 한 항에 있어서, 가이드 모이어티와 이종성 유전자 이펙터가 서로 비공유적으로 결합되는 것인 복합체.
  75. 제52항 내지 제74항 중 어느 한 항의 이종성 유전자 이펙터를 포함하는 벡터.
  76. 제75항에 있어서, 가이드 모이어티를 추가로 포함하는 벡터.
  77. 제52항 내지 제76항 중 어느 한 항의 복합체를 포함하는 벡터.
  78. 제52항 내지 제74항 중 어느 한 항의 이종성 유전자 이펙터를 코딩하는 핵산을 포함하는 벡터.
  79. 제78항에 있어서, 가이드 모이어티 또는 이의 성분을 코딩하는 핵산을 추가로 포함하는 벡터.
  80. 제75항 내지 제79항 중 어느 한 항에 있어서, 벡터가 바이러스성 벡터인 벡터.
  81. 제75항 내지 제79항 중 어느 한 항에 있어서, 벡터가 비-바이러스성 벡터인 벡터.
  82. 제52항 내지 제74항 중 어느 한 항의 복합체를 포함하는 세포 집단.
  83. 표적 유전자의 발현 또는 활성을 조절하는 방법으로서, 표적 유전자를 포함하는 세포 집단을 제52항 내지 제74항 중 어느 한 항의 복합체 또는 제75항 내지 제81항 중 어느 한 항의 벡터와 접촉시키는 것을 포함하는 방법.
  84. 제83항에 있어서, 세포 집단이 포유동물 세포를 포함하는 것인 방법.
  85. 제83항에 있어서, 세포 집단이 인간 세포를 포함하는 것인 방법.
  86. 제83항 내지 제85항 중 어느 한 항에 있어서, 세포 집단이 줄기 세포를 포함하는 것인 방법.
  87. 제83항 내지 제85항 중 어느 한 항에 있어서, 세포 집단이 분화된 세포를 포함하는 것인 방법.
  88. 제83항 내지 제87항 중 어느 한 항에 있어서, 접촉이 시험관내 또는 생체외에서 이루어지는 것인 방법.
  89. 제83항 내지 제87항 중 어느 한 항에 있어서, 접촉이 생체내에서 이루어지는 것인 방법.
  90. 치료가 필요한 대상체를 치료하는 방법으로서, 제52항 내지 제74항 중 어느 한 항의 복합체 또는 제75항 내지 제81항 중 어느 한 항의 벡터를 대상체에게 투여함으로써, 대상체의 세포 집단에서 표적 유전자의 발현 또는 활성을 조절하는 것을 포함하는 방법.
  91. 제83항 내지 제90항 중 어느 한 항에 있어서, 표적 유전자가 표적 내인성 유전자인 방법.
  92. 제83항 내지 제91항 중 어느 한 항에 있어서, 표적 유전자가 질병 관련 유전자인 방법.
  93. 제83항 내지 제92항 중 어느 한 항에 있어서, 표적 유전자가 분화 관련 유전자인 방법.
  94. 제83항 내지 제93항 중 어느 한 항에 있어서, 발현 또는 활성을 조절하는 것이 표적 유전자의 발현 또는 활성 수준을 증가시키는 것을 포함하는 것인 방법.
  95. 제83항 내지 제93항 중 어느 한 항에 있어서, 발현 또는 활성을 조절하는 것이 표적 유전자의 발현 또는 활성 수준을 감소시키는 것을 포함하는 것인 방법.
  96. 제94항에 있어서, 표적 유전자의 발현 또는 활성이 대조군과 비교하여 적어도 2배 증가되는 것인 방법.
  97. 제95항에 있어서, 표적 유전자의 발현 또는 활성이 대조군과 비교하여 적어도 2배 감소되는 것인 방법.
  98. 제83항 내지 제97항 중 어느 한 항에 있어서, 표적 유전자의 발현 또는 활성이 대조군보다 적어도 10% 더 긴 기간 동안 조절되는 것인 방법.
  99. 제83항 내지 제98항 중 어느 한 항에 있어서, 표적 유전자의 발현 또는 활성이 적어도 12시간 동안 조절되는 것인 방법.
  100. 제83항 내지 제98항 중 어느 한 항에 있어서, 표적 유전자의 발현 또는 활성이 적어도 28일 동안 조절되는 것인 방법.
  101. 제96항 내지 제98항 중 어느 한 항에 있어서, 대조군이 접촉 전의 세포 집단인 방법.
  102. 제96항 내지 제98항 중 어느 한 항에 있어서, 대조군이 복합체와 접촉되지 않은 세포 집단인 방법.
  103. 제96항 내지 제98항 중 어느 한 항에 있어서, 대조군이 대조군 복합체와 접촉된 세포 집단인 방법.
  104. 복수의 이종성 폴리뉴클레오티드 서열을 포함하는 발현 벡터로서, 상기 복수의 이종성 폴리뉴클레오티드 서열의 각각의 이종성 폴리뉴클레오티드 서열은 서열번호: 49334-49338 중 어느 하나의 폴리뉴클레오티드 서열과 적어도 약 80%의 서열 동일성을 나타내는, 발현 벡터.
  105. 이종성 폴리뉴클레오티드 서열을 포함하는 핵산 분자로,
    이종성 폴리뉴클레오티드 서열은 (i) CRISPR 표적 서열 및 (ii) CRISPR 프로토스페이서 인접 모티프(PAM) 서열과 추가의 다른 CRISPR PAM 서열을 포함하는 키메라 서열이고,
    여기서 상기 CRISPR 표적 서열은 상기 CRISPR PAM 서열 및 상기 추가의 CRISPR PAM 서열의 측면에 위치하는, 핵산 분자.
  106. 복수의 이종성 폴리뉴클레오티드 서열을 포함하는 핵산 분자로,
    (i) 상기 복수의 이종성 폴리뉴클레오티드 서열의 각각의 이종성 폴리뉴클레오티드 서열은 폴리뉴클레오티드 서열 및 상이한 인간 염색체로부터 유래된 추가의 폴리뉴클레오티드 서열을 포함하고;
    (ii) 상기 각각의 이종성 폴리뉴클레오티드 서열의 크기는 최대 약 50개의 핵염기인, 핵산 분자.
KR1020247005598A 2021-07-20 2022-07-20 표적 유전자 조절을 위한 시스템 및 방법 KR20240036632A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163223842P 2021-07-20 2021-07-20
US63/223,842 2021-07-20
PCT/US2022/073920 WO2023004338A2 (en) 2021-07-20 2022-07-20 Systems and methods for regulating target genes

Publications (1)

Publication Number Publication Date
KR20240036632A true KR20240036632A (ko) 2024-03-20

Family

ID=84978819

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247005598A KR20240036632A (ko) 2021-07-20 2022-07-20 표적 유전자 조절을 위한 시스템 및 방법

Country Status (7)

Country Link
EP (1) EP4374004A2 (ko)
KR (1) KR20240036632A (ko)
AU (1) AU2022314791A1 (ko)
CA (1) CA3226106A1 (ko)
GB (1) GB2626087A (ko)
IL (1) IL310116A (ko)
WO (1) WO2023004338A2 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023183893A1 (en) * 2022-03-24 2023-09-28 Epicrispr Biotechnologies, Inc. Engineered gene effectors, compositions, and methods of use thereof
CN116758975B (zh) * 2023-08-16 2023-11-24 广东药科大学 梧州六堡茶防治岭南特色湿热证效果的检测识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2834357B1 (en) * 2012-04-04 2017-12-27 Life Technologies Corporation Tal-effector assembly platform, customized services, kits and assays

Also Published As

Publication number Publication date
GB202402038D0 (en) 2024-03-27
AU2022314791A1 (en) 2024-02-01
EP4374004A2 (en) 2024-05-29
WO2023004338A3 (en) 2023-03-02
CA3226106A1 (en) 2023-01-26
IL310116A (en) 2024-03-01
WO2023004338A2 (en) 2023-01-26
GB2626087A (en) 2024-07-10

Similar Documents

Publication Publication Date Title
ES2938210T3 (es) Métodos, composiciones y kits para aumentar la eficiencia de edición del genoma
US20220389077A1 (en) Allogeneic cell compositions and methods of use
JP7466448B2 (ja) Dna-pk阻害剤
KR20240036632A (ko) 표적 유전자 조절을 위한 시스템 및 방법
JP7483612B2 (ja) ゲノム編集効率を増加するためのキノキサリノン化合物、組成物、方法、およびキット
EP3443001A2 (en) Regulated biocircuit systems
JP7391854B2 (ja) Dna-pk阻害剤
US20220380760A1 (en) Disrupting genomic complex assembly in fusion genes
US20230245716A1 (en) Systems and Methods for Stable and Heritable Alteration by Precision Editing (SHAPE)
EP3384053B1 (en) Multiplex cellular reference materials
US20080096813A1 (en) Generation of potent dominant negative transcriptional inhibitors
US20150337376A1 (en) Core Transcriptional Circuitry in Human Cells and Methods of Use Thereof
US20240216482A1 (en) Systems and methods for regulating aberrant gene expressions
TW202246309A (zh) 用於靶向蛋白質降解的合成降解系統
Sharma et al. Uncovering a mammalian neural-specific poly (A) binding protein with unique properties
Weingarten-Gabbay et al. Deciphering transcriptional regulation of human core promoters
Curina Dissection of the mechanisms controlling high constitutive activity of housekeeping and tissue-specific cis-regulatory elements
EA042641B1 (ru) Хиноксалиноновые соединения, композиции, способы и наборы для повышения эффективности редактирования генома
Müller HIF1α dependant transcriptional networks in macrophages and hepatocytes
Kelsey et al. Common Features of the DNA Methylation Landscape of Human Naïve and Memory CD4, CD8 T Cells and B Cells
SA MARIO SAARE The influence of AIRE on gene expression–studies of transcriptional regulatory mechanisms in cell culture systems
Dixon Higher Order Chromatin Architecture in Mammalian Genomes