KR20240111821A - B형 간염 바이러스 감염을 치료하기 위한 조성물 및 방법 - Google Patents

B형 간염 바이러스 감염을 치료하기 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20240111821A
KR20240111821A KR1020247012453A KR20247012453A KR20240111821A KR 20240111821 A KR20240111821 A KR 20240111821A KR 1020247012453 A KR1020247012453 A KR 1020247012453A KR 20247012453 A KR20247012453 A KR 20247012453A KR 20240111821 A KR20240111821 A KR 20240111821A
Authority
KR
South Korea
Prior art keywords
seq
hbv
tada
deaminase
cas9
Prior art date
Application number
KR1020247012453A
Other languages
English (en)
Inventor
파비앙 주림
마리아 과달루페 마르티네스
바바라 테스토니
엘레나 스메칼로바
루이스 바레라
Original Assignee
빔 테라퓨틱스, 인크.
바바라 테스토니
마리아 과달루페 마르티네스
인스티튜트 내셔날 드 라 싼테 에 드 라 리셰르셰 메디칼르
파비앙 주림
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 빔 테라퓨틱스, 인크., 바바라 테스토니, 마리아 과달루페 마르티네스, 인스티튜트 내셔날 드 라 싼테 에 드 라 리셰르셰 메디칼르, 파비앙 주림 filed Critical 빔 테라퓨틱스, 인크.
Publication of KR20240111821A publication Critical patent/KR20240111821A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1131Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/505Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim
    • A61K31/513Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim having oxo groups directly attached to the heterocyclic ring, e.g. cytosine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7125Nucleic acids or oligonucleotides having modified internucleoside linkage, i.e. other than 3'-5' phosphodiesters
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2730/00Reverse transcribing DNA viruses
    • C12N2730/00011Details
    • C12N2730/10011Hepadnaviridae
    • C12N2730/10111Orthohepadnavirus, e.g. hepatitis B virus
    • C12N2730/10121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2730/00Reverse transcribing DNA viruses
    • C12N2730/00011Details
    • C12N2730/10011Hepadnaviridae
    • C12N2730/10111Orthohepadnavirus, e.g. hepatitis B virus
    • C12N2730/10161Methods of inactivation or attenuation
    • C12N2730/10162Methods of inactivation or attenuation by genetic engineering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

B형 간염은 B형 간염 바이러스[hepatitis B virus, HBV]에 의해 일어나는 심각한 간 감염이다. HBV 감염에 대한 현재의 치료 접근법에는 심각한 한계가 있다. 항바이러스 약제, 예를 들어 뉴클레오티드 역전사효소 억제제인 테노포비르(tenofovir)는 바이러스 복제를 감소시킬 수 있으나 HBV에 감염된 환자를 치료하지는 않는다. HBV에 의해 일어나는 간 손상 정도로 인해, 일부 경우에 이식이 필요하게 된다. 장기 이식에 내재하는 위험 외에도, 엄청난 비용이 들 수 있다. 그러므로, HBV 감염을 치료하는 개선된 방법이 시급히 요구된다. 본 발명은 B형 간염 바이러스[HBV] 게놈 내로 돌연변이를 도입하기 위한 조성물 및 방법을 특징으로 한다.

Description

B형 간염 바이러스 감염을 치료하기 위한 조성물 및 방법
관련 출원에 대한 상호 참조
본 출원은 2022년 8월 16일에 출원된 미국 가출원 제63/371,634호, 2022년 6월 30일에 출원된 제63/357,623호 및 2021년 9월 27일에 출원된 제63/248,938호의 우선권 및 이익을 주장하고, 그 전체 내용은 참조로 본원에 포함된다.
서열 목록에 대한 참조
전자 서열 목록(180802_053004_PCT_SL.xml; 크기: 10,086,238 바이트; 생성일: 2022년 9월 26일)의 내용은 그 전체가 참조로 본원에 포함된다.
B형 간염은 B형 간염 바이러스[hepatitis B virus, HBV]에 의해 유발되는 심각한 간 감염이다. HBV는 RNA 중간체를 통해 복제되는 작은 DNA 헤파드나바이러스(hepadnavirus)이며 숙주의 게놈 내로 통합됨으로써 감염된 세포에서 지속될 수 있다. 미국 내 850,000 내지 220만 명을 포함하여 전 세계적으로 대략 2억 5700만 명이 HBV에 만성적으로 감염되어 있다. 만성 HBV 감염은 만성 간염, 간경변, 및/또는 간세포 암종으로 나타난다. 만성 HBV 감염이 있는 성인의 20% 내지 30%에 간세포 암종 또는 간경변이 발생한다. HBV 감염은 연간 600,000 내지 1,000,000 명의 사망 원인이다.
HBV 감염에 대한 현재의 치료적 접근법은 심각한 한계가 있다. 항바이러스 약제, 예를 들어, 뉴클레오티드 역전사효소 억제제인 테노포비르(tenofovir)는, 바이러스 복제를 감소시킬 수 있지만 HBV에 감염된 환자를 치유하지 않는다. 환자들이 이러한 항바이러스 요법을 받으려면 매달 $500 내지 $1500 정도 비용이 들 수 있다. HBV에 의해 유발된 간 손상 정도로 인해, 일부 경우에 이식이 필요하게 된다. 장기 이식에 내재하는 위험 외에도, 엄청난 비용이 들 수 있다. 따라서, HBV 감염을 치료하기 위한 개선된 방법이 시급히 요구된다.
아래 기재된 바와 같이, 본 발명은 HBV 게놈 내로 변경을 도입함으로써 B형 간염 바이러스[hepatitis B virus, HBV] 감염을 치료하기 위한 조성물 및 방법을 특징으로 한다. 특정 구현예에서, 본 발명은 조기 종결 코돈 또는 HBV의 코딩 서열 또는 HBV 공유결합폐환형 DNA[covalently closed circular DNA, cccDNA]에서 핵염기의 탈아미노화와 같은 변화를 도입하기 위해 HBV 게놈을 변형시키기 위한 염기 편집기 시스템(예를 들어, 프로그래밍 가능한 DNA 결합 단백질, 핵염기 편집기, 및 gRNA를 포함하는 융합 단백질)을 제공한다.
일 양태에서, 본 개시의 발명은 B형 간염 바이러스[HBV] 게놈의 핵염기를 편집하는 방법을 특징으로 한다. 이 방법은 HBV 게놈을 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제를 함유하는 염기 편집기 및 하나 이상의 가이드 RNA와 접촉시키는 단계를 포함한다. 가이드 RNA는 염기 편집기를 표적으로 하여 HBV 게놈의 핵염기를 변경한다. 하나 이상의 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 함유한다.
또 다른 양태에서, 본 개시의 발명은 B형 간염 바이러스[HBV] 게놈의 핵염기를 편집하는 방법을 특징으로 한다. 이 방법은 (i) HBV 게놈을 함유하는 세포를 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 또는 시티딘 데아미나아제를 함유하는 염기 편집기 및 하나 이상의 가이드 RNA와 접촉시키는 단계를 포함한다. 가이드 RNA는 염기 편집기를 표적으로 하여 HBV 게놈의 핵염기를 변경함으로써 HBV 게놈의 핵염기를 편집한다. 이 방법은 (ii) 세포를 항레트로바이러스 약물과 접촉시키는 단계를 더 포함한다. 세포를 항레트로바이러스 약물과 접촉시키는 단계는 항레트로바이러스 약물과 접촉하지 않은 기준 세포에 비해 염기 편집 효율이 증가하는 것과 관련이 있다.
또 다른 양태에서, 본 개시의 발명은 B형 간염 바이러스[HBV] 게놈의 핵염기를 편집하는 방법을 특징으로 한다. 이 방법은 (i) HBV 게놈을 함유하는 세포를 BE4와 가이드 RNA gRNA37 및 gRNA40을 암호화하는 mRNA와 접촉시키는 단계를 포함한다. 가이드 RNA는 염기 편집기를 표적으로 하여 HBV 게놈의 핵염기를 변경함으로써 HBV 게놈의 핵염기를 편집한다. 이 방법은 (ii) 세포를 라미부딘(lamivudine)과 접촉시키는 단계를 더 포함한다. 세포를 항레트로바이러스 약물과 접촉시키는 단계는 항레트로바이러스 약물과 접촉하지 않은 기준 세포에 비해 염기 편집 효율이 증가하는 것과 관련이 있다.
또 다른 양태에서, 본 개시의 발명은 B형 간염 바이러스[HBV] 게놈의 핵염기를 편집하는 방법을 특징으로 한다. 이 방법은 HBV 게놈을 함유하는 세포를 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 또는 시티딘 데아미나아제를 포함하는 염기 편집기를 암호화하는 mRNA, 및 서열 GAAAGCCCAGGAUGAUGGGA(서열 번호 657) 및 CCAUGCCCCAAAGCCACCCA(서열 번호 662)를 포함하는 가이드 RNA와 접촉시키는 단계를 포함한다. 가이드 RNA는 염기 편집기를 표적으로 하여 HBV 게놈의 핵염기를 변경함으로써 HBV 게놈의 핵염기를 편집한다.
또 다른 양태에서, 본 개시의 발명은 대상에서 B형 간염 바이러스[HBV] 감염을 치료하는 방법을 특징으로 한다. 방법은 이를 필요로 하는 대상에게 융합 단백질, 단백질 복합체, 또는 융합 단백질 또는 단백질 복합체를 암호화하는 폴리뉴클레오티드를 투여하는 단계를 포함한다. 융합 단백질 또는 단백질 복합체는 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 도메인인 염기 편집기 도메인, 그리고 염기 편집기 도메인을 표적으로 하여 A·T에서 G·C로 HBV 게놈의 핵염기를 변경하는 하나 이상의 가이드 RNA를 함유한다. 하나 이상의 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 함유한다.
또 다른 양태에서, 본 개시의 발명은 대상에서 B형 간염 바이러스[HBV] 감염을 치료하는 방법을 특징으로 한다. 방법은 이를 필요로 하는 대상에게 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 도메인인 염기 편집기 도메인을 암호화하는 하나 이상의 폴리뉴클레오티드, 및 염기 편집기 도메인을 표적으로 하여 A·T에서 G·C로 HBV 게놈의 핵염기를 변경하는 하나 이상의 가이드 RNA를 투여하는 단계를 포함한다. 하나 이상의 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 함유한다.
또 다른 양태에서, 본 개시의 발명은 대상에서 B형 간염 바이러스[HBV] 감염을 치료하는 방법을 특징으로 한다. 방법은 이를 필요로 하는 대상에게 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 또는 시티딘 데아미나아제를 함유하는 하나 이상의 가이드 RNA 및 염기 편집기를 투여하는 단계를 포함한다. 하나 이상의 가이드 RNA는 서열 GAAAGCCCAGGAUGUGGGA(서열 번호 657) 및 CCAUGUCCCCAAAGCCACCCA(서열 번호 662)을 함유하고 , 염기 편집기를 표적으로 하여 HBV 게놈의 핵염기를 변경시킴으로써 HBV 게놈에서 핵염기를 편집한다.
또 다른 양태에서, 본 개시의 발명은 가이드 RNA(들)에 결합된 염기 편집기(들)를 함유하는 조성물을 특징으로 한다. 가이드 RNA(들)는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 함유한다.
또 다른 양태에서, 본 개시의 발명은 HBV 감염의 치료를 위한 약학적 조성물을 특징으로 한다. 이 조성물은 (i) 염기 편집기, 또는 염기 편집기를 암호화하는 핵산, 및 약학적으로 허용되는 부형제에서 HBV 유전자에 상보적인 핵산 서열을 함유하는 하나 이상의 가이드 RNA(guide RNA, gRNA)를 포함한다. 하나 이상의 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 함유한다.
또 다른 양태에서, 본 개시의 발명은 HBV 감염을 치료하는 방법을 특징으로 한다. 방법은 이를 필요로 하는 대상에게 위 양태 중 어느 하나의 조성물을 투여하는 단계를 포함한다.
또 다른 양태에서, 본 개시의 발명은 HBV 감염을 치료하는 방법을 특징으로 하고, 방법은 이를 필요로 하는 대상에게 위 양태 중 어느 하나의 약학적 조성물을 투여하는 것을 포함한다.
또 다른 양태에서, 대상에서 HBV 감염 치료에 대한 위의 양태 중 어느 하나의 조성물의 용도를 특징으로 한다.
또 다른 양태에서, 대상에서 HBV 감염 치료에 대한 위의 양태 중 어느 하나의 약학적 조성물의 용도를 특징으로 한다.
또 다른 양태에서, 본 개시의 발명은 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열을 함유하는 가이드 RNA, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 특징으로 한다.
또 다른 양태에서, 본 개시의 발명은 (i) 염기 편집기를 암호화하는 핵산; 및 (ii) 위 양태 중 어느 하나의 가이드 RNA를 특징으로 한다.
임의의 위 양태에서, 항레트로바이러스 약물은 라미부딘, 엔테카비르(Entecavir), 테노포비르, 인터페론(Interferon), 및 페그-인터페론(Peg-Interferon) 중 하나 이상에서 선택된다. 임의의 위 양태에서, 레트로바이러스 약물은 라미부딘이다.
임의의 위 양태에서, 단계 (i)는 단계 (ii)보다 선행하거나 단계 (ii)가 단계 (i)보다 선행한다.
임의의 위 양태에서, 세포는 단계 (i)를 시행하기 약 또는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14일 전에 항레트로바이러스 약물과 처음으로 접촉된다. 임의의 위 양태에서, 세포는 이전에 항레트로바이러스 약물과 접촉된 적이 없다. 임의의 위 양태에서, 세포는 대상 내에 있다. 임의의 위 양태에서, 접촉시키는 단계는 진핵 세포, 포유류 세포, 또는 인간 세포에서 이루어진다. 임의의 위 양태에서, 세포는 생체내 또는 생체외에 있다. 임의의 위 양태 또는 그의 구현예에서, 대상은 포유류 또는 인간이다. 임의의 위 양태 또는 그의 구현예에서, 대상은 포유류이다. 임의의 위 양태 또는 그의 구현예에서, 대상은 인간이다.
임의의 위 양태에서, HBV 게놈은 두 개 이상의 가이드 RNA와 동시에 접촉된다.
임의의 위 양태에서 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택된다.
임의의 위 양태에서, 하나 이상의 가이드 RNA는 표 2A, 표 2B, 표 2C, 및/또는 서열 번호 3105-5485 및 8220-10830에 나열된 서열에서 선택되는 스페이서 서열을 함유한다.
임의의 위 양태에서, 하나 이상의 가이드 RNA는 뉴클레오티드 서열 GAAAGCCCAGGAUGAUGGGA(서열 번호 657) 및 CCAUGCCCCAAAGCCACCCA(서열 번호 662)를 함유하는 스페이서를 함유한다. 임의의 위 양태에서, 하나 이상의 가이드 RNA는 뉴클레오티드 서열 mG*mA*mA*AGCCCAGGAUGAUGGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 424) 및 mC*mC*mA*UGCCCCAAAGCCACCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 422)를 함유한다.
임의의 위 양태에서, 염기 편집 효율은 적어도 약 5%, 10%, 15% 또는 20%가 개선된다.
임의의 위 양태에서, 아데노신 데아미나아제는 B형 간염 바이러스[HBV] 게놈에서 표적을 A·T에서 G·C로 전환시킨다.
임의의 위 양태에서, 핵염기는 HBV 단백질을 암호화하는 폴리뉴클레오티드에 있다. 임의의 위 양태에서, 핵염기는 HBV 코어 단백질(코어), HBV 폴리머라아제(Pol), HBV 표면 단백질 또는 HBV 단백질 X에서 선택되는 HBV 단백질을 암호화하는 폴리뉴클레오티드 서열에 있다. 임의의 위 양태의 구현예에서, HBV 단백질을 암호화하는 폴리뉴클레오티드의 핵염기 변경은 과오[missense] 돌연변이를 초래한다. 임의의 위 양태의 구현예에서, 핵염기의 변경은 HBV 단백질을 암호화하는 폴리뉴클레오티드 서열의 전사가 감소하는 것과 관련이 있다. 임의의 위 양태의 구현예에서, HBV 단백질은 HBV 폴리머라아제(Pol), 및/또는 HBV 단백질 X이다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV pol 유전자에 있다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV pol 유전자에 의해 암호화된 HBV 폴리머라아제 단백질 내에서 E24G, L25F, P26F, R27C, V48A, V48I, S382F, V378I, V378A, V379I, V379A, L377F, D380G, D380N, F381P, R376G, A422T, F423P, A432V, M433V, P434S, D540G, A688V, D689G, A717T, E718K, P713S, P713L, 또는 L719P를 초래한다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV 코어 유전자에 있다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV 코어 유전자에 의해 암호화된 HBV 코어 단백질에서 T160A, T160A, P161F, S162L, C183R, 또는 *184Q를 초래한다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV X 유전자에 있다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV X 유전자에 의해 암호화된 HBV X 단백질에서 H86R, W120R, E122K, E121K, 또는 L141P를 초래한다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV S 유전자에 있다. 임의의 위 양태의 구현예에서, 과오 돌연변이는 HBV S 유전자에 의해 암호화된 HBV S 단백질에서 S38F, L39F, W35R, W36R, T37I, T37A, R78Q, S34L, F80P, 또는 D33G를 초래한다.
임의의 위 양태에서, 핵염기는 전사 부위와 관련이 있다. 임의의 위 양태의 구현예에서, 전사 부위는 인핸서 II 박스 A, 인핸서 I, 및 HBX 프로모터 중 하나 이상에서 선택된다.
임의의 위 양태에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 Cas12 폴리펩티드를 함유한다. 임의의 위 양태에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h 또는 Cas12i를 함유한다. 임의의 위 양태에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 바실루스 히사시이(Bacillus hisashii) Cas12b, 바실루스 써모아빌로보란스(Bacillus thermoamylovorans) Cas12b, 바실루스 속(Bacillus sp.) V3-13 Cas12b, 또는 알리시클로바실루스 아시디필루스(Alicyclobacillus acidiphilus) Cas12b에 대해 적어도 약 85%의 아미노산 서열 동일성을 갖는 서열을 함유한다. 임의의 위 양태에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 바실루스 히사아시(Bacillus hiasashii)Cas12b(bhCas12b)에 대해 적어도 85%의 아미노산 서열 동일성을 갖는다. 임의의 위 양태에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 뉴클레아제 불활성 또는 니카아제(nickase) 변이체를 함유한다. 임의의 위 양태의 구현예에서, 뉴클레아제 불활성 또는 니카아제 변이체는 아미노산 치환 D952A, S893R, K846R, 및 E837G 또는 이의 상응하는 아미노산 치환을 함유하는 뉴클레아제 불활성화 bhCas12b를 함유한다. 임의의 위 양태에서, 염기 편집기는 bhCas12b, 또는 아미노산 치환 D952A, S893R, K846R, 및 E837G를 함유하는 bhCas12b 변이체를 함유한다.
임의의 위 양태에서 염기 편집기는 아데노신 데아미나아제를 함유한다. 임의의 위 양태 또는 그의 구현예에서, 아데노신 데아미나아제 도메인은 데옥시리보핵산[deoxyribonucleic acid, DNA]에서 아데닌을 탈아미노화할 수 있다. 임의의 위 양태 또는 그의 구현예에서, 아데노신 데아미나아제는 TadA 데아미나아제이다. 임의의 위 양태의 구현예에서, TadA 데아미나아제는 TadA*7.10, TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24이다. 임의의 위 양태의 구현예에서, TadA 데아미나아제는 TadA*8.13이다.
임의의 위 양태에서, 하나 이상의 가이드 RNA는 CRISPR RNA(crRNA) 및 트랜스 암호화된 작은 RNA[trans-encoded small RNA, tracrRNA]를 함유하되, crRNA는 HBV 핵산 서열에 상보적인 핵산 서열을 함유한다. 임의의 위 양태에서, 하나 이상의 가이드 RNA는 HBV 게놈의 3 개, 4 개, 또는 5 개의 핵염기를 표적으로 한다.
임의의 위 양태에서, 염기 편집기는 HBV 핵산 서열에 상보적인 핵산 서열을 포함하는 단일 가이드 RNA[single guide RNA, sgRNA]와 복합체를 형성한다.
임의의 위 양태에서, 방법은 두 개 이상의 핵염기를 편집하는 것을 포함한다.
임의의 위 양태에서, 방법은 HBV 게놈을 두 개 이상의 HBV 핵산 서열을 표적으로 하는 두 개 이상의 가이드 RNA와 접촉시키는 단계를 포함한다. 임의의 위 양태에서, 방법은 융합 단백질, 융합 단백질을 암호화하는 폴리뉴클레오티드, 또는 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 염기 편집기 도메인을 암호화하는 하나 이상의 폴리뉴클레오티드, 및 하나 이상의 가이드 RNA를 대상의 세포에 전달하는 단계를 포함한다. 임의의 위 양태 또는 그의 구현예에서, 세포는 간세포이다.
임의의 위 양태에서, 염기 편집기는 (i) 뉴클레아제 불활성 bhCas12b를 함유하거나, (ii) 다음 서열 MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIALGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYKERSRFENSRLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCRVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK(서열 번호 418)에 대해 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 함유한다.
임의의 위 양태에서, 조성물 또는 약학적 조성물은 지질을 더 함유한다. 임의의 위 양태의 구현예에서, 지질은 양이온성 지질이다.
임의의 위 양태에서, 조성물은 약학적으로 허용되는 부형제를 함유한다.
임의의 위 양태에서, 하나 이상의 gRNA와 염기 편집기는 함께 제형화된다. 임의의 위 양태에서, 하나 이상의 gRNA와 염기 편집기는 별도로 제형화된다.
임의의 위 양태에서, 조성물 또는 약학적 조성물은 포유류 세포에서의 발현에 적합한 벡터를 더 함유하고, 여기서 벡터는 염기 편집기를 암호화하는 폴리뉴클레오티드를 함유한다. 임의의 위 양태 또는 그의 구현예에서, 벡터는 바이러스 벡터이다. 임의의 위 양태 또는 그의 구현예에서, 바이러스 벡터는 레트로바이러스 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 헤르페스바이러스 벡터, 또는 아데노 연관 바이러스 벡터[adeno-associated viral vector, AAV]이다. 임의의 위 양태 또는 그의 구현예에서, 약학적 조성물은 포유류 세포에서의 발현에 적합한 리보뉴클레오입자[ribonucleoparticle]를 더 함유한다.
임의의 위 양태에서, HBV는 유전자형 A 또는 유전자형 D의 것이다. 임의의 위 양태에서, 방법은 B형 간염 표면 항원, B형 간염 E항원, B형 간염 바이러스 전체 DNA, B형 간염 3.5kb RNA 및 B형 간염 공유결합폐환형 DNA에서 선택되는 마커의 수준을 감소시킨다. 임의의 위 양태에서, 방법은 B형 간염 S항원 부위와 프리코어(PreCore) 부위를 편집한다. 임의의 위 양태 또는 그의 구현예에서, 편집 효율은 S 항원 부위에서 약 30%이고 프리코어 부위에서 약 60%이다.
임의의 위 양태에서, 염기 편집기를 암호화하는 핵산은 mRNA이다.
임의의 위 양태에서, 하나 이상의 가이드 RNA는 다음 스캐폴드 서열gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 포함하되, a, c, u 또는 g는 2'O-메틸(M) 변형이 있는 염기를 나타내고, as, cs, us, 또는 gs는 2'-O-메틸 3'-포스포로티오에이트(MS) 변형이 있는 염기를 나타낸다. 임의의 위 양태에서, 하나 이상의 가이드 RNA는 다음 뉴클레오티드 서열 gsasasAGCCCAGGAUGAUGGGAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 424) 및
cscsasUGCCCCAAAGCCACCCAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 422)를 포함하되, a, c, u 또는 g는 각각 2'O-메틸(M) 변형을 함유하는 A, C, U 또는 G 뉴클레오티드를 나타내고, as, cs, us, 또는 gs는 각각 2'-O-메틸 3'-포스포로티오에이트(MS) 변형을 함유하는 A, C, U 또는 G 뉴클레오티드를 나타낸다.
임의의 위 양태에서, 세포는 제1 및 제2 시점에 하나 이상의 가이드 RNA 및 염기 편집기와 접촉된다. 구현예에서, 세포가 접촉되는 제1 및 제2 시간 사이는 적어도 1주가 소요된다. 구현예에서, 세포가 접촉되는 제1 및 제2 시간 사이는 적어도 2주가 소요된다.
임의의 위 양태에서, 염기 편집기는 BE4이다. 임의의 위 양태에서, gRNA는 GAAAGCCCAAGAUGAUGGGA(서열 번호 10834)를 포함한다.
본 발명에 의해 정의된 조성물 및 제조품은 아래 제공된 예와 관련하여 단리되거나 또는 다른 방식으로 제조되었다. 본 발명의 다른 특징 및 이점은 아래의 상세한 설명, 및 청구범위에 의해 명백해질 것이다.
정의
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 통상적으로 이해되는 의미를 가진다. 다음 참조는 본 발명에 사용된 다수 용어의 일반적인 정의를 당업자에게 제공한다: 문헌[Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994)];문헌[The Cambridge Dictionary of Science and Technology (Walker ed., 1988)];문헌[The Glossary of Genetics, 5th Ed., R. Rieger et al.(eds.), Springer Verlag (1991); 및 Hale & Marham, The Harper Collins Dictionary of Biology (1991)]. 본원에 사용되는 바와 같이, 달리 명시되지 않는 한, 다음 용어들은 아래에 부여된 의미를 갖는다.
'BE4 폴리펩티드'는 다음 아미노산 서열에 대해 적어도 약 85%의 동일성을 갖는 폴리펩티드, 또는 시티딘 데아미나아제 활성을 갖는 이의 단편을 의미한다.
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRK(서열 번호 10832).
'BE4 폴리뉴클레오티드'는 BE4 폴리펩티드를 암호화하는 폴리뉴클레오티드를 의미한다.
'HBV 폴리머라아제(pol) 단백질'은 B형 간염 바이러스 감염에서 기능하는 야생형 HBV 폴리머라아제 아미노산 서열 또는 이의 단편에 대해 적어도 약 95% 동일성을 갖는 폴리펩티드를 의미한다. 일 구현예에서, HBV 폴리머라아제는 HBV A, B, C, D, E, F, G, 또는 H 유전자형에 의해 암호화된다. 일 구현예에서, HBV 폴리머라아제 아미노산 서열은 아래에 제시된 UniPro 수탁 번호 Q8B5R0-1로 제공된다.
MPLSYQHFRRLLLLDDEAGPLEEELPRLADEGLNRRVAEDLNLGNLNVSIPWTHKVGNFTGLYSSTVPVFNPHWKTPSFPNIHLHQDIIKKCEQFVGPLTVNEKRRLQLIMPARFYPKVTKYLPLDKGIKPYYPEHLVNHYFQTRHYLHTLWKAGILYKRETTHSASFCGSPYSWEQDLQHGAESFHQQS(서열 번호 370).
HBV 폴리머라아제의 돌연변이는 E24G, L25F, P26F, R27C, V48A, V48I, S382F, V378I, V378A, V379I, V379A, L377F, D380G, D380N, F381P, R376G, A422T, F423P, A432V, M433V, P434S, D540G, A688V, D689G, A717T, E718K, P713S, P713L, 또는 L719P을 포함한다.
다른 예시적인 HBV DNA 폴리머라아제는, 예를 들어, 다음 서열을 갖는 NCBI 수탁 번호 AAB59972.1을 포함한다.
MPLSYQHFRKLLLLDDEAGPLEEELPRLADEGLNRRVAEDLNLGNLNVSIPWTHKVGNFTGLYSSTVPVFNPHWKTPSFPNIHLHQDIIKKCEQFVGPLTVNEKRRLQLIMPARFYPKVTKYLPLDKGIKPYYPEHLVNHYFQTRHYLHTLWKAGILYKRETTHSASFCGSPYSWEQDLQHGAESFHQQSSGILSRPPVGSSLQSKHSKSRLGLQSQQGHLARRQQGRSWSIRAGFHPTARRPFGVEPSGSGHTTNFASKSASCLHQSPDRKAAYPAVSTFEKHSSSGHAVEFHNLSPNSARSQSERPVFPCWWLQFRSSKPCSDYCLSLIVNLLEDWGPCAEHGEHHIRIPRTPSRVTGGVFLVDKNPHNTAESRLVVDFSQFSRGNYRVSWPKFAVPNLQSLTNLLSSNLSWLSLDVSAAFYHLPLHPAAMPHLLVGSSGLSRYVARLSSNSRILNHQHGTMPNLHDYCSRNLYVSLLLLYQTFGRKLHLYSHPIILGFRKIPMGVGLSPFLLAQFTSAICSVVRRAFPHCLAFSYMDDVVLGAKSVQHLESLFTAVTNFLLSLGIHLNPNKTKRWGYSLNFMGYVIGSYGSLPQEHIIQKIKECFRKLPINRPIDWKVCQRIVGLLGFAAPFTQCGYPALMPLYACIQSKQAFTFSPTYKAFLCKQYLNLYPVARQRPGLCQVFADATPTGWGLVMGHQRVRGTFSAPLPIHTAELLAACFARSRSGANIIGTDNSVVLSRKYTSYPWLLGCAANWILRGTSFVYVPSALNPADDPSRGRLGLSRPLLRLPFRPTTGRTSLYADSPSVPSHLPDRVHFASPLHVAWRPP(서열 번호 371).
'HBV 폴리머라아제 유전자'는 HBV 폴리머라아제를 암호화하는 폴리펩티드를 의미한다.
'B형 간염 표면 항원[Hepatitis B surface antigen, HBsAg] 폴리펩티드' 또는 'HBV 표면 단백질(S)'은 HBV 바이러스 감염에서 기능하는 NCBI 수탁 번호 AAB59969.1에 대해 적어도 약 85%의 동일성을 갖는 항원성 단백질 또는 이의 단편을 의미한다. 예시적인 HBsAg 아미노산 서열은 아래에 제공된다.
MENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGGTTVCLGQNSQSPTSNHSPTSCPPTCPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQGMLPVCPLIPGSSTTSTGPCRTCMTTAQGTSMYPSCCCTKPSDGNCTCIPIPSSWAFGKFLWEWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYSILSPFLPLLPIFFCLWVYI(서열 번호 372).
'HbsAg 폴리뉴클레오티드'는 HBsAg 단백질을 암호화하는 폴리뉴클레오티드를 의미한다.
'HBV X-단백질' 또는 'HBV 단백질 X'는 HBV 바이러스 감염에서 기능하는 NCBI 수탁 번호 AAB59970.1에 대해 적어도 약 85%의 동일성을 갖는 폴리펩티드 또는 이의 단편을 의미한다. 예시적인 아미노산 서열은 아래에 제공된다.
maarlccqldpardvlclrpvgaescgrpfsgslgtlsspspsavptdhgahlslrglpvcafssagpcalrftsarrmettvnahrmlpkvlhkrtlglsamsttdleayfkdclfkdweelgeeirlkvfvlggcrhklvcapapcnfftsa(서열 번호 373).
'코어 항원 전구체' , '프리코어 단백질' 또는 'B형 간염 e 항원[Hepatitis B e antigen, HBeAg]은, HBV 바이러스 감염에서 기능하는 아래에 제시된 NCBI 수탁 번호 AAB59971.1에 대해 적어도 약 85%의 동일성이 있는 폴리펩티드 또는 이의 단편을 의미한다.
MQLFHLCLIISCSCPTVQASKLCLGWLWGMDIDPYKEFGATVELLSFLPSDFFPSVRDLLDTASALYREALESPEHCSPHHTALRQAILCWGELMTLATWVGVNLEDPASRDLVVSYVNTNMGLKFRQLLWFHISCLTFGRETVIEYLVSFGVWIRTPPAYRPPNAPILSTLPETTVVRRRGRSPRRRTPSPRRRRSQSPRRRRSQSREPQC(서열 번호 10831).
'HBV 코어 단백질, 'HBc', 또는 '코어 단백질'은 야생형 HBV 코어 단백질 아미노산 서열 또는 이의 단편에 대해 적어도 약 95%의 동일성을 갖는 폴리펩티드를 의미한다. 일 구현예에서, HBV 코어 단백질은 B형 간염 바이러스 감염에서 기능한다. 일 구현예에서, HBV 코어 단백질은 HBV A, B, C, D, E, F, G, 또는 H 유전자형에 의해 암호화된다. 일 구현예에서, HBV 코어 단백질 아미노산 서열은 NCBI GenBank 수탁 번호 AXG50928.1에서 제공되고, 아래에 제공된다.
mdidpykefgasvellsflpsdffpsirdlldtasalyrealespehcsphhtalrqailcwgelmnlatwvgsnledpasrelvvsyvnvnmglkirqllwfhiscltfgretvleylvsfgvwirtppayrppnapilstlpettvvrrrgrsprrrtpsprrrrsqsprrrrsqsresqc(서열 번호 374).'HBV X 단백질'은 HBV X-단백질을 암호화하는 폴리뉴클레오티드를 의미한다.
'HBV X 단백질(유전자형 B)'는 야생형 HBV 유전자형 B X 단백질 아미노산 서열 또는 이의 단편에 대해 적어도 약 95%의 동일성이 있는 폴리펩티드를 의미한다. 일 구현예에서, HBV X 단백질은 B형 간염 바이러스 감염에서 기능한다. 일 구현예에서, HBV 유전자형 B X 단백질 아미노산 서열은 NCBI GenBank 수탁 번호 BAQ95575.1에서 제공되고, 아래에 제공된다.
maarlccqldpardvlclrpvgaesrgrplpgplgalppasppvvpsdhgahlslrglpvcafssxgpcalrftsarrmettvnahrnlpkvlhkrtlglsamsttdleayfkdcvfxeweelgeexrlkvfvlggcrhklvcspapcnfftsa(서열 번호 375).
'HBV X 단백질(유전자형 C)'은 야생형 HBV 유전자형 C X 단백질 아미노산 서열 또는 이의 단편에 대해 적어도 약 95%의 동일성을 갖는 폴리펩티드를 의미한다. 일 구현예에서, HBV X 단백질은 B형 간염 바이러스 감염에서 기능한다. 일 구현예에서, HBV 유전자형 C X 단백질 아미노산 서열은 NCBI GenBank 수탁 번호 BAQ95563.1에서 제공되고, 아래에 제공된다.
maarvccqldpardvlclrpvgaesrgrpvsgpfgplpspsssavpadygahlslrglpvcafssagpcalrftsarrmettvnahqvlpkllhkrtlglsamsttdleayfkdclfkdweelgeeirlkvfvlggcrhklvcspapcnfftsa(서열 번호 376).
'HBV S 단백질'은 야생형 HBV S 단백질 아미노산 서열 또는 이의 단편에 대해 적어도 약 95%의 동일성을 갖는 폴리펩티드를 의미한다. 일 구현예에서, HBV S 단백질은 B형 간염 바이러스 감염에서 기능한다. 일 구현예에서, HBV S 단백질은 HBV A, B, C, D, E, F, G, 또는 H 유전자형에 의해 암호화된다. 일 구현예에서, HBV S 단백질 아미노산 서열은 NCBI GenBank 수탁 번호 ABV02793.1에서 제공되고, 아래에 제공된다.
menttsgflgpllvlqagfflltrnltipqsldswwtslnflggaptcpgqnsqsptsnhsptscppicpgyrwmclrrfiiflfilllclifllvlldyqgmlpvcpllpgtsttstgpcktctipaqgtsmfpsccctkpsdgnctcipipsswafarflwewasvrfswlsllvpfvqwfvglsptvwlsviwmmwywgpslynilspflpllpiffclwvyi(서열 번호 377).
HBV 폴리머라아제, HBsAg 단백질, HBV X 단백질, 및 코어 항원 전구체를 암호화하는 폴리뉴클레오티드를 포함하는 B형 간염 바이러스 아형[subtype] ayw의 완전 게놈은 GenBank 수탁 번호 U95551.1에서 제공되고, 아래에 제시된다. B형 간염 바이러스 게놈 내의 조절 요소(예를 들어, 인핸서 I, 인핸서 II 박스 A, HBX 프로모터) 및 폴리펩티드 암호화 서열에 상응하는 영역의 뉴클레오티드 위치는 당업계에 알려져 있다. (문헌[Panjaworayan, et al. “HBVRegDB: Annotation, comparison, detection and visualization of regulatory elements in hepatitis B virus sequences,” Virol. J., 4:136, DOI: 10.1186/1743-422X-4-136)] 참조).
aattccacaacctttcaccaaactctgcaagatcccagagtgagaggcctgtatttccctgctggtggctccagttcaggagcagtaaaccctgttccgactactgcctctcccttatcgtcaatcttctcgaggattggggaccctgcgctgaacatggagaacatcacatcaggattcctaggaccccttctcgtgttacaggcggggtttttcttgttgacaagaatcctcacaataccgcagagtctagactcgtggtggacttctctcaattttctagggggaactaccgtgtgtcttggccaaaattcgcagtccccaacctccaatcactcaccaacctcctgtcctccaacttgtcctggttatcgctggatgtgtctgcggcgttttatcatcttcctcttcatcctgctgctatgcctcatcttcttgttggttcttctggactatcaaggtatgttgcccgtttgtcctctaattccaggatcctcaaccaccagcacgggaccatgccgaacctgcatgactactgctcaaggaacctctatgtatccctcctgttgctgtaccaaaccttcggacggaaattgcacctgtattcccatcccatcatcctgggctttcggaaaattcctatgggagtgggcctcagcccgtttctcctggctcagtttactagtgccatttgttcagtggttcgtagggctttcccccactgtttggctttcagttatatggatgatgtggtattgggggccaagtctgtacagcatcttgagtccctttttaccgctgttaccaattttcttttgtctttgggtatacatttaaaccctaacaaaacaaagagatggggttactctctgaattttatgggttatgtcattggaagttatgggtccttgccacaagaacacatcatacaaaaaatcaaagaatgttttagaaaacttcctattaacaggcctattgattggaaagtatgtcaacgaattgtgggtcttttgggttttgctgccccatttacacaatgtggttatcctgcgttaatgcccttgtatgcatgtattcaatctaagcaggctttcactttctcgccaacttacaaggcctttctgtgtaaacaatacctgaacctttaccccgttgcccggcaacggccaggtctgtgccaagtgtttgctgacgcaacccccactggctggggcttggtcatgggccatcagcgcgtgcgtggaaccttttcggctcctctgccgatccatactgcggaactcctagccgcttgttttgctcgcagcaggtctggagcaaacattatcgggactgataactctgttgtcctctcccgcaaatatacatcgtatccatggctgctaggctgtgctgccaactggatcctgcgcgggacgtcctttgtttacgtcccgtcggcgctgaatcctgcggacgacccttctcggggtcgcttgggactctctcgtccccttctccgtctgccgttccgaccgaccacggggcgcacctctctttacgcggactccccgtctgtgccttctcatctgccggaccgtgtgcacttcgcttcacctctgcacgtcgcatggagaccaccgtgaacgcccaccgaatgttgcccaaggtcttacataagaggactcttggactctctgcaatgtcaacgaccgaccttgaggcatacttcaaagactgtttgtttaaagactgggaggagttgggggaggagattagattaaaggtctttgtactaggaggctgtaggcataaattggtctgcgcaccagcaccatgcaactttttcacctctgcctaatcatctcttgttcatgtcctactgttcaagcctccaagctgtgccttgggtggctttggggcatggacatcgacccttataaagaatttggagctactgtggagttactctcgtttttgccttctgacttctttccttcagtacgagatcttctagataccgcctcagctctgtatcgggaagccttagagtctcctgagcattgttcacctcaccatactgcactcaggcaagcaattctttgctggggggaactaatgactctagctacctgggtgggtgttaatttggaagatccagcatctagagacctagtagtcagttatgtcaacactaatatgggcctaaagttcaggcaactcttgtggtttcacatttcttgtctcacttttggaagagaaaccgttatagagtatttggtgtctttcggagtgtggattcgcactcctccagcttatagaccaccaaatgcccctatcctatcaacacttccggaaactactgttgttagacgacgaggcaggtcccctagaagaagaactccctcgcctcgcagacgaaggtctcaatcgccgcgtcgcagaagatctcaatctcgggaacctcaatgttagtattccttggactcataaggtggggaactttactggtctttattcttctactgtacctgtctttaatcctcattggaaaacaccatcttttcctaatatacatttacaccaagacattatcaaaaaatgtgaacagtttgtaggcccacttacagttaatgagaaaagaagattgcaattgattatgcctgctaggttttatccaaaggttaccaaatatttaccattggataagggtattaaaccttattatccagaacatctagttaatcattacttccaaactagacactatttacacactctatggaaggcgggtatattatataagagagaaacaacacatagcgcctcattttgtgggtcaccatattcttgggaacaagatctacagcatggggcagaatctttccaccagcaatcctctgggattctttcccgaccaccagttggatccagccttcagagcaaacacagcaaatccagattgggacttcaatcccaacaaggacacctggccagacgccaacaaggtaggagctggagcattcgggctgggtttcaccccaccgcacggaggccttttggggtggagccctcaggctcagggcatactacaaactttgccagcaaatccgcctcctgcctccaccaatcgccagacaggaaggcagcctaccccgctgtctccacctttgagaaacactcatcctcaggccatgcagtgg(서열 번호 378).
'아데닌' 또는 '9H-퓨린(Purin)-6-아민'은 분자식 C5H5N5구조를 가지고, CAS No. 73-24-5에 상응하는 퓨린(Purine) 핵염기를 의미한다.
'아데노신' 또는 '4-아미노-1-[(2R,3R,4S,5R)-3,4-디히드록시-5-(히드록시메틸)옥솔란-2-일]피리미딘-2(1H)-온'은 구조를 가지고, CAS 번호 65-46-3에 상응하는, 글리코시드 결합을 통해 리보스 당에 부착된 아데닌 분자를 의미한다. 이의 분자식은 C10H13N5O4 이다.
'아데노신 데아미나아제' 또는 '아데닌 데아미나아제'는 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매할 수 있는 폴리펩티드 또는 이의 단편을 의미한다. 일부 구현예에서, 데아미나아제 또는 데아미나아제 도메인은 아데노신에서 이노신으로 또는 데옥시 아데노신에서 데옥시이노신으로의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나아제이다.일부 구현예에서, 아데노신 데아미나아제는 데옥시리보핵산[DNA]에서 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매화한다. 본원에서 제공되는 아데노신 데아미나아제(예를 들어, 조작된 아데노신 데아미나아제, 진화된 아데노신 데아미나아제)는 조류[algae], 박테리아, 진균, 식물, 무척추동물(예를 들어, 곤충) 및 척추동물(예를 들어, 양서류, 포유류)을 포함하지만 이에 한정되지 않는 임의의 유기체(예를 들어, 진핵생물, 원핵생물)에서 유래될 수 있다.일부 구현예에서, 아데노신 데아미나아제는 하나 이상의 변경이 있는 아데노신 데아미나아제 변이체이고, 표적 폴리뉴클레오티드(예를 들어, DNA, RNA)에서 아데닌 및 시토신 모두를 탈아미노화할 수 있다.일부 구현예에서, 표적 폴리뉴클레오티드는 단일 또는 이중 가닥이다.일부 구현예에서, 아데노신 데아미나아제 변이체는 DNA의 아데닌 및 시토신 모두를 탈아미노화할 수 있다.일부 구현예에서, 아데노신 데아미나아제 변이체는 단일 가닥 DNA의 아데닌 및 시토신 모두를 탈아미노화할 수 있다.일부 구현예에서, 아데노신 데아미나아제 변이체는 RNA의 아데닌 및 시토신 모두를 탈아미노화할 수 있다.
'아데노신 데아미나아제 활성'은 폴리뉴클레오티드에서 아데닌 또는 아데노신의 구아닌으로의 탈아미노화를 촉매하는 단계를 의미한다. 일부 구현예에서, 본원에서 제공된 바와 같은 아데노신 데아미나아제 변이체는 아데노신 데아미나아제 활성[예를 들어, 기준 아데노신 데아미나아제(예를 들어, TadA*8.20 또는 TadA*8.19)의 활성의 적어도 약 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 그 이상]을 유지한다.
'아데노신 염기 편집기[Adenosine Base Editor, ABE]'는 아데노신 데아미나아제를 포함하는 염기 편집기를 의미한다.
'아데노신 염기 편집기[ABE] 폴리뉴클레오티드'는 ABE를 암호화하는 폴리뉴클레오티드를 의미한다. '아데노신 데아미나아제 염기 편집기 8[ABE8] 폴리펩티드' 또는 'ABE8'은 다음 참조 서열 MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열 번호 1) 중 표 15에 나열된 하나 이상의 변경, 표 15에 나열된 변경의 조합 중 하나, 또는 표 15에 나열된 하나 이상의 부위(예를 들어, 82 및 또는 166)에서의 변경을 포함하는 아데노신 데아미나아제 변이체를 포함하는 본원에 정의된 바와 같은 염기 편집기를 의미한다.
일부 구현예에서, ABE8은 참조 서열에 비해, 본원에 기재된 바와 같이 추가 변경을 포함한다.
'아데노신 데아미나아제 염기 편집기 8[ABE8] 폴리뉴클레오티드'는 ABE8을 암호화하는 폴리뉴클레오티드를 의미한다.
'투여'는 환자 또는 대상에게 본원에 기재된 하나 이상의 조성물을 제공하는 것으로 본원에서 지칭된다.
'제제'는 임의의 소분자 화학적 화합물, 항체, 핵산 분자, 또는 폴리펩티드, 또는 이의 단편을 의미한다.
'변경'은 본원에 기재된 것과 같은 표준 기재 공지 방법에 의해 검출되는 바와 같은 분석물, 유전자 또는 폴리펩티드의 수준, 구조, 또는 활성의 변화(증가 또는 감소)를 의미한다. 본원에 사용된 바와 같이, 변경은 발현 수준의 10% 변화, 발현 수준의 25% 변화, 40% 변화, 및 50% 또는 그 이상의 변화를 포함한다. 일부 구현예에서, 변경은 핵염기 또는 아미노산의 삽입, 결실 또는 치환을 포함한다.
'개선하다'는 질환의 발달 또는 진행을 감소, 억제, 약화, 축소, 저지, 또는 안정화시키는 것을 의미한다.
'유사체'는 동일하지 않지만, 유사한 기능적 또는 구조적 특징을 갖는 분자를 의미한다. 예를 들어, 폴리펩티드 유사체는 상응하는 자연발생적 폴리펩티드의 생물학적 활성을 유지하는 반면, 자연발생 폴리펩티드에 비해 유사체의 기능을 증진시키는 특정 생화학적 변형을 갖는다. 이와 같은 생화학적 변형은, 예를 들어, 리간드 결합을 바꾸지 않으면서, 유사체의 단백질 분해 효소 내성, 막 투과성, 또는 반감기를 증가시킬 수 있다. 유사체에는 비자연 아미노산이 포함될 수 있다.
'염기 편집기[base editor, BE]', 또는 '핵염기 편집기 폴리펩티드[nucleobase editor polypeptide , NBE]'는 폴리뉴클레오티드에 결합하고 핵염기 변형 활성을 갖는 제제를 의미한다. 다양한 구현예에서, 염기 편집기는 가이드 폴리뉴클레오티드[예를 들어, 가이드 RNA(gRNA)]와 함께 핵염기 변형 폴리펩티드(예를 들어, 데아미나아제) 및 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9 or Cpf1)을 포함한다. 염기 편집기의 대표적인 핵산 및 단백질 서열은 서열 목록에서 서열 번호 2-11로 제공된다.
'염기 편집 활성'은 폴리뉴클레오티드 내에서 염기를 화학적으로 변경시키는 작업을 의미한다. 일 구현예에서, 제1 염기는 제2 염기로 전환된다. 일 구현예에서, 염기 편집 활성은 시티딘 데아미나아제 활성, 예를 들어, 표적 C·G를 T·A로 전환시키는 것이다. 또 다른 구현예에서, 염기 편집 활성은 아데노신 또는 아데닌 데아미나아제 활성, 예를 들어, A·T에서 G·C로 전환시키는 것이다.
용어 '염기 편집기 시스템'은 표적 뉴클레오티드 서열의 핵염기를 편집하기 위한 분자간 복합체를 지칭한다. 다양한 구현예에서, 염기 편집기[BE] 시스템은 (1) 표적 뉴클레오티드 서열에서 핵염기를 탈아미노화하기 위한 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인, 데아미나아제 도메인(예를 들어, 시티딘 데아미나아제 또는 아데노신 데아미나아제), 및 (2) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인과 함께 하나 이상의 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)를 포함한다. 다양한 구현예에서, 염기 편집기[BE]시스템은 아데노신 데아미나아제 또는 시티딘 데아미나아제에서 선택되는 핵염기 편집기 도메인, 및 핵산 서열 특이적 결합 활성을 갖는 도메인을 포함한다. 일부 구현예에서, 염기 편집기 시스템은 (1) 표적 뉴클레오티드 서열에서 하나 이상의 핵염기를 탈아미노화하기 위한 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 데아미나아제 도메인을 포함하는 염기 편집기[BE]; 및 (2) 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인과 함께 하나 이상의 가이드 RNA를 포함한다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인이다. 일부 구현예에서, 염기 편집기는 시티딘 염기 편집기[cytidine base editor, CBE]이다. 일부 구현예에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기[ABE]이다. 일부 구현예에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기[ABE] 또는 시티딘 염기 편집기[CBE]이다.
'염기 편집 활성'은 폴리뉴클레오티드 내에서 염기를 화학적으로 변경시키는 작업을 의미한다. 일 구현예에서, 제1 염기는 제2 염기로 전환된다. 일 구현예에서, 염기 편집 활성은 시티딘 데아미나아제 활성, 예를 들어, 표적 C·G를 T·A로 전환시키는 것이다. 또 다른 구현예에서, 염기 편집 활성은 아데노신 데아미나아제 활성, 예를 들어, A·T에서 G·C로 전환시키는 것이다.
용어 'Cas9' 또는 'Cas9 도메인'은 Cas9 단백질, 또는 이의 단편(예를 들어, Cas9의 활성, 불활성, 또는 부분적으로 활성 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는 RNA 가이드된 뉴클레아제를 지칭한다. 또한 Cas9 뉴클레아제는 때때로 casnl 뉴클레아제 또는 CRISPR(클러스터링된 규칙적 간격의 짧은 회문 반복부) 연관 뉴클레아제를 지칭한다.
용어 '보존적 아미노산 치환' 또는 '보존적 돌연변이'는 하나의 아미노산을 공통 특성으로 갖는 또 다른 아미노산으로 대체하는 것을 지칭한다. 개별 아미노산 간의 공통적인 특성을 정의하는 기능적 방법은 상동성 유기체의 상응하는 단백질 간의 아미노산 변화의 표준화된 빈도를 분석하는 것이다.(문헌[Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979)]. 이러한 분석에 따르면, 아미노산의 그룹은 그룹 내의 아미노산이 서로 우선적으로 교환되고, 따라서 전반적인 단백질 구조에 대한 영향이 서로 가장 유사한 것으로 정의될 수 있다(위의 문헌[Schulz, G. E. and Schirmer, R. H.]). 보존적 돌연변이의 비제한적인 예는 아미노산의 아미노산 치환, 예를 들어, 양전하가 유지될 수 있도록 아르기닌을 리신으로 및 그 반대로; 음전하가 유지될 수 있도록 아스파르트산을 글루탐산으로 및 그 반대로; 유리 -OH가 유지될 수 있도록 트레오닌을 세린으로; 및 유리 -NH2가 유지될 수 있도록 아스파라긴을 글루타민으로 치환하는 것을 포함한다.
본원에서 상호교환적으로 사용된 바와 같은 용어 '코딩 서열' 또는 '단백질 코딩 서열'은 단백질을 코딩하는 폴리뉴클레오티드의 분절을 지칭한다. 코딩 서열은 또한 오픈 리딩 프레임으로 지칭될 수 있다. 영역 또는 서열은 시작 코돈에 의해 5' 단부에 더 가깝고 종결 코돈에 따라 3' 단부에 더 가깝게 결합된다. 본원에 기재된 염기 편집기에 유용한 종결 코돈은 다음을 포함한다:
글루타민 CAG→TAG종결 코돈
CAA→TAA
아르기닌 CGA→TGA
트립토판 TGG→TGA
TGG→TAG
TGG→TAA
'복합체'는 상호작용이 분자간 힘에 의존하는 두 개 이상의 분자의 조합을 의미한다. 분자간 힘의 비제한적인 예는 공유 및 비공유 상호작용을 포함한다. 비공유 상호작용의 비제한적인 예는 수소 결합, 이온 결합, 할로겐 결합, 소수성 결합, 반 데르 발스 상호작용(예를 들어, 쌍극자-쌍극자 상호작용, 쌍극자-유도 쌍극자 상호작용, 및 런던 분산력), 및 π-효과를 포함한다. 일 구현예에서, 복합체는 폴리펩티드, 폴리뉴클레오티드, 또는 하나 이상의 폴리펩티드와 하나 이상의 폴리뉴클레오티드의 조합을 포함한다. 일 구현예에서, 복합체는 염기 편집기(예를 들어, Cas9와 같은 핵산 프로그래밍 가능한 DNA 결합 단백질 및 데아미나아제를 포함하는 염기 편집기) 및 폴리뉴클레오티드(예를 들어, 가이드 RNA)를 형성하기 위해 연관되는 하나 이상의 폴리펩티드를 포함한다. 일 구현예에서, 복합체는 수소 결합에 의해 함께 유지된다. 염기 편집기의 하나 이상의 구성요소(예를 들어, 데아미나아제, 또는 핵산 프로그래밍 가능한 DNA 결합 단백질)은 공유적 또는 비공유적으로 결합할 수 있다는 것이 이해되어야 한다. 일례로서, 염기 편집기는 핵산 프로그래밍 가능한 DNA 결합 단백질에 공유적으로(예를 들어, 펩티드 결합에 의해) 연결된 데아미나아제를 포함할 수 있다. 또는, 염기 편집기는 데아미나아제 및 비공유적으로 회합하는 핵산 프로그래밍 가능한 DNA 결합 단백질을 포함할 수 있다(예를 들어, 여기서 염기 편집기의 하나 이상의 구성요소는 트랜스로 공급되고 직접적으로 또는 단백질 또는 핵산과 같은 다른 분자를 통해 회합다). 일 구현예에서, 복합체의 하나 이상의 구성요소는 수소 결합에 의해 함께 유지된다.
'시토신' 또는 ' 4-아미노피리미딘-2(1H)-온'은 구조를 가지고,CAS 번호 71-30-7에 상응하는 분자식 C4H5N3O를 갖는 퓨린(purine) 핵염기를 의미한다.
'시티딘'은 글리코시드 결합을 통해 리보스 당에 부착된 시토신 분자로, 구조를 가지고, CAS No. 65-46-3에 상응하는 것을 의미한다. 이의 분자식은 C9H13N3O5이다.
'시티딘 염기 편집기[CBE]'는 시티딘 데아미나아제를 포함하는 염기 편집기를 의미한다.
'시티딘 염기 편집기[CBE] 폴리뉴클레오티드'는 CBE를 포함하는 폴리뉴클레오티드를 의미한다.
'시티딘 데아미나아제' 또는 '시토신 데아미나아제'는 시티딘 또는 시토신을 탈아미노화할 수 있는 폴리펩티드 또는 이의 단편을 의미한다. 일 구현예에서, 시티딘 데아미나아제는 시토신을 우라실로 또는 5-메틸시토신을 티민으로 전환한다.용어 '시티딘 데아미나아제' 및 '시토신 데아미나아제'는 본 출원 전반에 걸쳐 상호교환적으로 사용된다. 페트로미존 마리누스 시토신 데아미나아제 1(Petromyzon marinus cytosine deaminase 1, PmCDA1)(서열 번호 13-14), 활성 유도된 시티딘 데아미나아제 [Activation-induced cytidine deaminase, AICDA](서열 번호 15-21), 및 APOBEC(서열 번호 12-61)는 예시적인 시티딘 데아미나아제이다. 추가의 예시적인 시티딘 데아미나아제[CDA] 서열은 서열 목록에서 서열 번호 62-66 및 서열 번호 67-189로 제공된다. 구현예에서, 시티딘 데아미나아제는 BE4, rrA3F, 또는 ppApo이다.
'rra3F 폴리펩티드'는 시티딘 데아미나아제 활성을 갖고 다음 서열에 대해 약 또는 적어도 약 85%, 90%, 95%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 시티딘 데아미나아제를 의미한다.
MKPQIRDHRPNPMEAMYPHIFYFHFENLEKAYGRNETWLCFTVEIIKQYLPVPWKKGVFRNQVDPETHCHAEKCFLSWFCNNTLSPKKNYQVTWYTSWSPCPECAGEVAEFLAEHSNVKLTIYTARLYYFWDTDYQEGLRSLSEEGASVEIMDYEDFQYCWENFVYDDGEPFKRWKGLKYNFQSLTRRLREILQ(서열 번호 67).
'ppAPOBEC-1(ppApo)'은 시티딘 데아미나아제 활성을 갖고 다음 서열에 대해 약 또는 적어도 약 85%, 90%, 95%, 99%, 또는 100% 서열 동일성이 있는 아미노산 서열을 갖는 시티딘 데아미나아제를 의미한다:
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR(서열 번호 23).
'시토신'은 분자식 C4H5N3O를 갖는 피리미딘 핵염기를 의미한다.
'시토신 데아미나아제 활성'은 시토신 또는 시티딘의 탈아미노화를 촉매하는 단계를 의미한다. 일 구현예에서,시토신 데아미나아제활성을 갖는 폴리펩티드는 아미노기를 카르보닐기로 전환한다. 일 구현예에서, 시토신 데아미나아제는 시토신을 우라실(즉, C에서 U)로 또는 5-메틸사이토신을 티민(즉, 5mC에서 T로)으로 전환시킨다 일부 구현예에서, 본원에 제공된 바와 같은시토신 데아미나아제는 기준 시토신 데아미나아제에 비해 증가된 시토신 데아미나아제 활성(예를 들어, 적어도 10 배, 20 배, 30 배, 40 배, 50 배, 60 배, 70 배, 80 배, 90 배, 100 배 또는 그 이상)을 갖는다.
본원에 사용된 바와 같은 용어 '데아미나아제' 또는 '데아미나아제 도메인'은 탈아미노화 반응을 촉매하는 단백질 또는 이의 단편을 지칭한다.
'검출'은 검출될 분석물의 존재, 부재 또는 양을 식별하는 것을 지칭한다. 일 구현예에서, 폴리뉴클레오티드 또는 폴리펩티드에서 서열 변경이 검출된다. 또 다른 구현예에서, 인델(indel)의 존재가 검출된다.
'검출가능한 표지'는 관심 분자에 연결될 때, 분광학, 광화학, 생화학, 면역화학, 또는 화학 수단을 통해 후자를 검출가능하게 만드는 조성물을 의미한다. 예를 들어, 유용한 표지는 방사성 동위원소, 자기 비드, 금속성 비드, 콜로이드성 입자, 형광 염료, 전자밀도 시약, (예를 들어, 효소 결합 면역흡착 분석[enzyme linked immunosorbent assay, ELISA]에서 통상적으로 사용되는)효소, 비오틴, 디곡시게닌, 또는 합텐을 포함한다.
'질환'은 세포, 조직, 또는 기관의 정상적인 기능을 손상시키거나 방해하는 임의의 병태 또는 장애를 의미한다. 질환의 예는 HBV 감염뿐만 아니라 간경변, 간세포 암종[hepatocellular carcinoma, HCC], 및 HBV 감염과 연관되거나 또는 이로 인한 임의의 다른 질환을 포함한 관련 질환 또는 장애를 포함한다.
'유효량'은 치료되지 않은 환자에 비해 질환의 증상을 개선하는 데 필요한 양을 의미한다. 질환의 치료적 요법을 위해 본 발명을 실시하는데 사용되는 활성 화합물(들)의 유효량은 투여 방식, 대상의 연령, 체중 및 일반적인 건강 상태에 따라 달라진다. 궁극적으로, 주치의 또는 수의사는 적절한 양 및 용량 용법을 결정할 것이다. 이러한 양을 '유효' 량이라고 한다. 일 구현예에서, 유효량은 세포(예를 들어, 시험관내 또는 생체내 세포)에서의 HBV 게놈에 변경을 도입하기에 충분한 본 발명의 염기 편집기의 양이다. 일 구현예에서, 유효량은 치료적 효과를 달성하는 데(예를 들어, HBV 감염을 줄이거나 제어하는 데) 필요한 염기 편집기의 양이다. 이러한 치료적 효과는 대상, 조직 또는 기관의 모든 세포에서 HBV 게놈을 변경하기에 충분할 필요는 없지만, 대상, 조직 또는 기관에 존재하는 세포의 약 1%, 5%, 10%, 25%, 50%, 75% 또는 그 이상에서 HBV 게놈을 변경하기에는 충분하다. 일 구현예에서, 유효량은 HBV의 하나 이상의 증상을 개선하기에 충분하다.
'엔테카비르'는 CAS 번호 142217-69-4에 상응하는 구조 를 갖는 분자, 및 이의 약학적으로 허용가능한 염을 의미한다. 엔테카비르는 항레트로바이러스 활성을 가지고 있다.
'단편'은 폴리펩티드 또는 핵산 분자의 일부를 의미한다. 이 부분은, 기준 핵산 분자 또는 폴리펩티드 전체 길이의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%를 함유한다. 단편은 10 개, 20 개, 30 개, 40 개, 50 개, 60 개, 70 개, 80 개, 90 개 또는 100 개, 200 개, 300 개, 400 개, 500 개, 600 개, 700 개, 800 개, 900 개, 또는 1000 개의 뉴클레오티드 또는 아미노산을 함유할 수 있다.
'가이드 폴리뉴클레오티드'는 표적 서열에 특이적이고 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 단백질(예를 들어, Cas9 또는 Cpf1)과 복합체를 형성할 수 있는 폴리뉴클레오티드 또는 폴리뉴클레오티드 복합체를 의미한다. 일 구현예에서, 가이드 폴리뉴클레오티드는 가이드 RNA(gRNA)이다. gRNA는 두 개 이상의 RNA의 복합체 또는 단일 RNA 분자로서 존재할 수 있다.
'혼성화[hybridization]'는 수소 결합을 의미하고, 이는 상보적 핵염기 간의 왓슨-크릭(Watson-Crick), 후그스틴(Hoogsteen) 또는 역 후그스틴[reversed Hoogsteen] 수소 결합일 수 있다. 예를 들어, 아데닌 및 티민은 수소 결합의 형성을 통해 쌍을 이루는 상보적 핵염기이다.
'증가'란 적어도 10%, 25%, 50%, 75%, 또는 100%의 양[positive]의 변경을 의미한다.
용어 '염기 복구의 억제제', '염기 복구 억제제', 'IBR' 또는 이들의 문법적 균등물은 핵산 복구 효소, 예를 들어 염기 절제 복구 효소의 활성을 억제할 수 있는 단백질을 지칭한다.
'인테인(intein)'은 단백질 스플라이싱으로 알려진 과정에서 자체 절제하고 나머지 단편[엑스테인(extein)]을 펩티드 결합으로 연결할 수 있는 단백질의 단편이다.
용어 '단리된', '정제된', 또는 '생물학적으로 순수한'은 자연 상태에서 발견되는 바와 같이 일반적으로 동반되는 구성요소에서 다양한 정도로 자유로운 물질을 지칭한다. '단리하다'는 원래의 공급원 또는 주위에서 분리되는 정도를 나타낸다. '정제하다'는 단리보다 더 높은 분리 수준을 나타낸다. '정제된' 또는 '생물학적으로 순수한' 단백질은 다른 물질로부터 충분히 자유로움으로써, 임의의 불순물이 단백질의 생물학적 특성에 물질적으로 영향을 주거나 다른 이상 결과를 일으키지 않는다. 즉, 본 발명의 핵산 또는 펩티드는 재조합 DNA 기술에 의해 생성될 때 세포 물질, 바이러스 물질, 또는 배양 배지, 또는 화학적으로 합성될 때 화학적 전구체 또는 다른 화학물질이 실질적으로 없는 경우 정제된다. 순도 및 균질성은 전형적으로 분석 화학 기술, 예를 들어, 폴리아크릴아미드 겔 전기영동 또는 고성능 액체 크로마토 그래피를 사용하여 결정된다. 용어 '정제된'은 핵산 또는 단백질이 전기영동 겔에서 본질적으로 하나의 밴드를 생성하는 것으로 나타날 수 있다. 변형, 예를 들어, 인산화 또는 글리코실화에 적용될 수 있는 단백질의 경우, 상이한 변형은 개별적으로 정제될 수 있는 상이한 단리된 단백질을 생성할 수 있다.
'단리된 폴리뉴클레오티드'는 본 발명의 핵산 분자가 유래된 유기체의 자연 발생 게놈에서 유전자의 측면에 있는 유전자가 없는 핵산(예를 들어, DNA)을 의미한다. 따라서 용어는 예를 들어, 벡터 내로; 자체적으로 복제하는 플라스미드 또는 바이러스 내로; 또는 원핵생물 또는 진핵생물의 게놈 DNA 내로 혼입되거나; 또는 다른 서열과 독립적으로 별도의 분자(예를 들어, cDNA 또는 PCR 또는 제한 엔도뉴클레아제 소화에 의해 생성된 게놈 또는 cDNA 단편)로 존재하는 재조합 DNA를 포함한다. 또한, 용어는 DNA 분자로부터 전사된 RNA 분자뿐만 아니라 추가적인 폴리펩티드 서열을 암호화하는 하이브리드 유전자의 일부인 재조합 DNA를 포함한다.
'단리된 폴리펩티드'는 자연적으로 동반되는 구성요소에서 분리된 본 발명의 폴리펩티드를 의미한다. 전형적으로, 폴리펩티드는 단백질 및 자연적으로 회합되는 자연 발생 유기 분자에서 중량 기준으로 적어도 60% 없을 때 단리된다. 바람직하게는, 제조물은 중량 기준으로 본 발명의 폴리펩티드의 적어도 75%, 보다 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 99%이다. 본 발명의 단리된 폴리펩티드는 예를 들어, 천연 공급원에서의 추출, 이러한 폴리펩티드를 암호화하는 재조합 핵산의 발현에 의해; 또는 단백질을 화학적으로 합성함으로써 수득될 수 있다. 순도는 임의의 적절한 방법, 예를 들어, 컬럼 크로마토그래피, 폴리아크릴아미드 겔 전기영동, 또는 HPLC 분석에 의해 측정될 수 있다.
'라미부딘' 또는 '3TC'는 CAS 번호 134678-17-4에 상응하는 구조 를 가지고, IUPAC 명칭 2',3'-디데옥시-3'-티아시티딘 4-아미노-1-[(2R,5S)-2-(히드록시메틸)-1,3-옥사티올란-5-일]-1,2-디히드로피리미딘-2-온을 갖는 분자, 및 이의 약학적으로 허용되는 염을 의미한다.
라미부딘은 항레트로바이러스 활성을 가지고 있다. 라미부딘은 뉴클레오시드/뉴클레오티드 역전사효소 억제제[nucleoside/nucleotide reverse transcriptase inhibitor, NRTI]로 분류된다.
본원에 사용된 바와 같은 용어 '링커'는 두 개의 모이어티를 연결하는 분자를 지칭한다. 구현예에서, 용어 '링커'는 공유 링커(예를 들어, 공유 결합) 또는 비공유 링커를 의미한다.
'마커'는 질환 또는 장애와 관련된 발현 수준 또는 활성의 변경을 갖는 임의의 단백질 또는 폴리뉴클레오티드를 의미한다. 질환의 예는 HBV 감염뿐만 아니라 간경변, 간세포 암종[HCC], 및 HBV 감염과 연관되거나 또는 이로 인한 임의의 다른 질환을 포함한 관련 질환 또는 장애를 포함한다. 마커는 HBV 폴리뉴클레오티드 및/또는 폴리펩티드일 수 있다. B형 간염 바이러스 마커의 비제한적 예는 HBsAg, HBeAg, 코어 단백질, 3.5 kb 바이러스 RNA, 및 cccDNA를 포함한다(예를 들어, 문헌[Bai, et al. “Quantification of Pregenomic RNA and Covalently Closed Circular DNA in Hepatitis B Virus-Related Hepatocellular Carcinoma,” Int J Hepatol, 2013:849290 (2013), DOI: 10.1155/2013/849290)] 참조).
본원에 사용된 바와 같은 용어 '돌연변이'는 서열, 예를 들어, 핵산 또는 아미노산 서열내에서 잔기의 또 다른 잔기로의 치환, 또는 서열내에서 하나 이상의 잔기의 결실 또는 삽입을 지칭한다. 돌연변이는 전형적으로 원래 잔기에 이어서 서열 내 잔기의 위치를 식별하고 새로 치환된 잔기의 정체를 식별함으로써 본원에 기재된다. 본원에 제공된 아미노산 치환(돌연변이)를 만드는 다양한 방법은 당업계에 잘 알려져 있고, 예를 들어, 문헌[Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2012))]에 의해 제공된다.
본원에 사용된 바와 같은 용어 '핵산' 및 '핵산 분자'는 핵염기 및 산성 모이어티, 예를 들어, 뉴클레오시드, 뉴클레오티드,또는 뉴클레오티드의 중합체를 포함하는 화합물을 지칭한다. 전형적으로, 중합체성 핵산, 예를 들어, 세 개 이상의 뉴클레오티드를 포함하는 핵산 분자는 선형 분자이며, 여기서 인접한 뉴클레오티드는 포스포디에스테르 연결을 통해 서로 연결된다. 일부 구현예에서, '핵산'은 개별 핵산 잔기(예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 구현예에서, '핵산'은 세 개 이상의 개별 뉴클레오티드 잔기를 포함하는 올리고뉴클레오티드 쇄[chain]를 지칭한다. 본원에 사용된 바와 같이, 용어 '올리고뉴클레오티드' 및 '폴리뉴클레오티드'는 뉴클레오티드의 중합체(예를 들어, 적어도 세 개의 뉴클레오티드의 스트링)를 지칭하기 위해 상호교환적으로 사용될 수 있다. 일부 구현예에서, 단일 및/또는 이중 가닥 DNA 뿐만 아니라 RNA를 포함한다. 핵산은 예를 들어, 게놈, 전사체, mRNA, tRNA, rRNA, siRNA, snRNA, 플라스미드, 코스미드, 염색체, 염색분체, 또는 다른 자연 발생 핵산 분자의 맥락에서 자연 발생할 수 있다. 한편, 핵산 분자는 비자연 발생 분자, 예를 들어, 재조합 DNA 또는 RNA, 인공 염색체, 조작된 게놈, 또는 이의 단편, 또는 합성 DNA, RNA, DNA/RNA 하이브리드일 수 있거나, 비자연 발생 뉴클레오티드 또는 뉴클레오시드를 포함할 수 있다. 또한, 용어 '핵산', 'DNA', 'RNA', 및/또는 유사한 용어는 핵산 유사체, 예를 들어, 포스포디에스테르 골격[backbone] 이외의 것을 갖는 유사체를 포함한다. 핵산은 천연 공급원으로부터 정제되고, 재조합 발현 시스템을 사용하여 생성되고 임의적으로 정제되며, 화학적으로 합성될 수 있다. 적절한 경우, 예를 들어, 화학적으로 합성된 분자의 경우, 핵산은 화학적으로 변형된 염기 또는 당, 및 골격 변형을 갖는 유사체와 같은 뉴클레오시드 유사체를 포함할 수 있다. 핵산 서열은 달리 나타내지 않는 한 5'에서 3' 방향으로 제시된다. 일부 구현예에서, 핵산은 천연 뉴클레오시드(예를 들어 아데노신, 티미딘,구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 및 데옥시시티딘); 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 및 2-티오시티딘); 화학적으로 변형된 염기; 생물학적으로 변형된 염기(예를 들어,메틸화 염기); 삽입된 염기; 변형된 당(2'-예를 들어, 플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스); 및/또는 변형된 인산기(예를 들어, 포스포로티오에이트 및 5'-N-포스포라미다이트 연결)이거나 이를 포함한다.
용어 '핵 국소화 서열', '핵 국소화 신호', 또는 'NLS'는 단백질을 세포 핵 내로의 유입하는 것을 촉진하는 아미노산 서열을 지칭한다. 핵 국소화 서열은 당업계에 알려져 있고, 예를 들어, 2001년 5 월 31일에WO/2001/038547로 공개되고 2000년 11월 23일 출원된 Plank 등의 국제 PCT 출원, PCT/EP2000/011690에 기재되어 있으며, 이의 내용은 예시적인 핵 국소화 서열의 개시에 대해 본원에 참조로 포함된다. 다른 구현예에서, NLS은 예를 들어, 문헌(Koblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172)에 의해 기재된 최적화된 NLS이다. 일부 구현예에서, NLS는 아미노산 서열 KRTADGSEFESPKKKRKV(서열 번호 190), KRPAATKKAGQAKKKK(서열 번호 191), KKTELQTTNAENKTKKL(서열 번호 192), KRGINDRNFWRGENGRKTR(서열 번호 193), RKSGKIAAIVVKRPRK(서열 번호 194), PKKKRKV(서열 번호 195), 또는 MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(서열 번호 196)을 포함한다.
본원에서 상호교환적으로 사용된 용어 '핵염기', '질소성 염기', 또는 '염기는 결국 뉴클레오티드의 구성요소인 뉴클레오시드를 형성하는 질소 함유 생물학적 화합물을 지칭한다. 염기 쌍을 형성하고 하나 위에 다른 것을 쌓는 핵염기의 능력은 리보핵산[ribonucleic acid, RNA] 및 데옥시리보핵산[DNA]과 같은 장쇄 나선 구조를 직접적으로 이끌어낸다. 다섯 개의 핵염기 - 아데닌(A), 시토신(C), 구아닌(G), 티민(T), 및 우라실(U)은 일차[primary] 또는 표준[canonical]이라고 불린다. 아데닌 및 구아닌은 퓨린(Purine)에서 유래되고, 시토신, 우라실, 및 티민은 피리미딘에서 유래된다. DNA 및 RNA는 또한 변형된 다른(비-일차) 염기를 함유할 수 있다. 비제한적인 예시적인 변형된 핵염기는 하이포크산틴, 크산틴, 7-메틸구아닌, 5,6-디히드로우라실, 5-메틸시토신(m5C), 및 5-히드로메틸시토신을 포함할 수 있다. 하이포크산틴 및 크산틴은 돌연변이원 존재를 통해 생성될 수 있고, 이들 모두 탈아미노화(아민기를 카르보닐기로 대체)를 통해 생성될 수 있다. 하이포크산틴은 아데닌에서 변형될 수 있다. 크산틴은 구아닌에서 변형될 수 있다. 우라실은 시토신의 탈아미노화에서 초래될 수 있다. '뉴클레오시드'는 핵염기 및 5탄당(리보스 또는 데옥시리보스)으로 구성된다. 뉴클레오시드의 예는 아데노신, 구아노신, 우리딘, 시티딘, 5-메틸우리딘(5-methyluridine, m5U), 데옥시아데노신, 데옥시구아노신, 티미딘, 데옥시우리딘, 및 데옥시시티딘을 포함한다. 변형된 핵염기가 있는 뉴클레오시드의 예는 이노신(inosine, I), 크산토신(xanthosine, X), 7-메틸구아노신(7-methylguanosine, m7G), 디히드로우리딘(dihydrouridine, D), 5-메틸시티딘(5-methylcytidine, m5C), 및 슈도우리딘(pseudouridine, Ψ)을 포함한다. '뉴클레오티드'는 핵염기, 5탄당(리보스 또는 데옥시리보스), 및 적어도 하나의 인산기로 이루어진다.
용어 '핵산 프로그래밍 가능한 DNA 결합 단백질' 또는 'napDNAbp'는 napDNAbp를 특이적 핵산 서열로 가이드하는, 가이드 핵산 또는 가이드 폴리뉴클레오티드(예를 들어, gRNA)와 같은, 핵산(예를 들어, DNA 또는 RNA)과 회합하는 단백질을 지칭하기 위해 '폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인'과 상호교환적으로 사용될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 RNA 결합 도메인이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 Cas9 단백질이다. Cas9 단백질은 Cas9 단백질을 가이드 RNA에 상보적인 특이적 DNA 서열로 가이드하는 가이드 RNA와 회합할 수 있다. 일부 구현예에서, napDNAbp는 Cas9 도메인, 예를 들어 뉴클레아제 활성 Cas9, Cas9 니카아제(nCas9), 또는 뉴클레아제 불활성 Cas9(dCas9)이다. 핵산 프로그래밍 가능한 DNA 결합 단백질의 비제한적인 예는 Cas9(예를 들어, dCas9 및 nCas9), Cas12a/Cpfl, Cas12b/C2cl, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦ (Cas12j/Casphi)를 포함한다. Cas 효소의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas8a, Cas8b, Cas8c, Cas9(Csn1 또는 Csx12로도 알려짐), Cas10, Cas10d, Cas12a/Cpfl, Cas12b/C2cl, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, Cas12j/CasΦ, Cpf1, Csy1 , Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csx11, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, 유형 II Cas 효과기 단백질, 유형 V Cas 효과기 단백질, 유형 VI Cas 효과기 단백질, CARF, DinG, 이의 상동체, 또는 이의 변형된 또는 조작된 버전을 포함한다. 다른 핵산 프로그래밍 가능한 DNA 결합 단백질은 또한 본 개시의 범위 내에 있지만, 이들은 본 개시에 구체적으로 나열되지 않을 수 있다. 예를 들어, 문헌[Makarova et al. "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?" CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033]; 문헌[Yan et al., "Functionally diverse type V CRISPR-Cas systems" Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271]을 참조하고, 각각의 전체 내용은 본원에 참조로 포함된다. 예시적인 핵산 프로그래밍 가능한 DNA 결합 단백질 및 핵산 프로그래밍 가능한 DNA 결합 단백질을 암호화하는 핵산 서열은 서열 번호 197-230으로 서열 목록에 제공된다.
본원에 사용된 바와 같은 용어 '핵염기 편집 도메인' 또는 '핵염기 편집 단백질'은 RNA 또는 DNA에서 핵염기 변형, 예컨대 시토신(또는 시티딘)에서 우라실(또는 우리딘) 또는 티민(또는 티미딘)으로, 및 아데닌(또는 아데노신)에서 하이포크산틴(또는 이노신)으로의 탈아미노화뿐만 아니라 비주형[non-templated] 뉴클레오티드 부가 및 삽입을 촉매화할 수 있는 단백질 또는 효소를 지칭한다. 일부 구현예에서, 핵염기 편집 도메인은 데아미나아제 도메인(예를 들어, 아데닌 데아미나아제 또는 아데노신 데아미나아제; 또는 시티딘 데아미나아제 또는 시토신 데아미나아제)이다.
본원에 사용된, '제제를 수득하는'에서 '수득하는'에는 그 제제를 통합, 구매, 또는 그 밖의 방법으로 취득하는 것을 포함한다.
'대상'은 포유류를 의미하고, 인간 또는 소, 말, 개, 양 또는 고양이와 같은 비인간 포유류를 포함하지만, 이에 제한되지 않는다. 일 구현예에서, '환자'는 질환 또는 장애가 발병할 가능성이 평균보다 더 높은 포유류의 대상을 지칭한다. 예시적인 환자는 인간, 비인간 영장류, 고양이, 개, 돼지, 소, 고양이, 말, 낙타, 라마, 염소, 양, 설치류(예를 들어, 마우스, 토끼, 래트, 또는 기니 피그) 및 본원에 개시된 요법에서 이익을 얻을 수 있는 다른 포유류일 수 있다. 예시적인 인간 환자는 남성 및/또는 여성일 수 있다. 질환의 예는 HBV 감염뿐만 아니라 간경변, 간세포 암종[HCC], 및 HBV 감염과 연관되거나 또는 이로 인한 임의의 다른 질환을 포함한 관련 질환 또는 장애를 포함한다.
'이를 필요로 하는 환자' 또는 '이를 필요로 하는 대상'은 질환 또는 장애로 진단되거나, 질환 또는 장애를 갖거나 또는 위험이 있거나, 질환 또는 장애를 가질 것으로 미리 결정되거나 질환 또는 장애를 가질 것으로 의심되는 환자로 본원에서 지칭된다.
용어 '병원성 돌연변이', '병원성 변이체', '질환 케이싱(casng) 돌연변이, '질환 유발 변이체, '유해한 돌연변이' 또는 '소인[predisposing] 돌연변이'는 특정 질환 또는 장애에 대한 개별의 민감성 또는 소인을 증가시키는 유전적 변경 또는 돌연변이를 지칭한다. 일부 구현예에서, 병원성 돌연변이는 유전자에 의해 암호화된 단백질 내의 적어도 하나의 병원성 아미노산에 의해 치환된 적어도 하나의 야생형 아미노산을 포함한다.
용어 '단백질', '펩티드', '폴리펩티드', 및 이들의 문법적 균등물은 본원에서 상호교환적으로 사용되며, 펩티드(아미드) 결합에 의해 함께 연결된 아미노산 잔기의 중합체를 지칭한다. 단백질, 펩티드, 또는 폴리펩티드는 자연 발생, 재조합, 또는 합성, 또는 이의 임의의 조합일 수 있다.
본원에 사용된 바와 같은 용어 '융합 단백질'은 적어도 두 개의 상이한 단백질로부터의 단백질 도메인을 포함하는 하이브리드 폴리펩티드를 지칭한다.
단백질 또는 핵산의 맥락에서 본원에 사용된 바와 같은 용어 '재조합'은 자연에서 발생하지 않지만, 인간 조작의 산물인 단백질 또는 핵산을 지칭한다. 예를 들어, 일부 구현예에서, 재조합 단백질 또는 핵산 분자는 임의의 자연 발생 서열과 비교하여 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 또는 적어도 7 개의 돌연변이를 포함하는 아미노산 또는 뉴클레오티드 서열을 포함한다.
'감소'는 적어도 10%, 25%, 50%, 75%, 또는 100%의 음[negative]의 변경을 의미한다.
'기준'은 표준 또는 제어 조건을 의미한다. 일 구현예에서, 기준은 야생형 또는 건강한 세포이다. 다른 구현예에서 및 제한 없이, 기준은 시험 조건에 적용되지 않거나 위약 또는 일반 식염수, 배지, 완충액, 및/또는 관심 폴리뉴클레오티드를 보유하지 않는 대조 벡터에 적용되는 처리되지 않은 세포이다. 기준은 HBV 감염이 없는 세포 또는 대상일 수 있다. 기준은 또한 치료를 받기 전, 또는 치료의 변경 전 대상일 수 있다.
'참조 서열'은 서열 비교를 위한 기준으로 사용되는 정의된 서열이다. 참조 서열은 명시된 서열의 부분집합 또는 전체; 예를 들어, 전장 cDNA 또는 유전자 서열의 분절, 또는 완전한 cDNA 또는 유전자 서열일 수 있다. 폴리펩티드의 경우, 참조 폴리펩티드 서열의 길이는 일반적으로 적어도 약 16 개의 아미노산, 적어도 약 20 개의 아미노산, 적어도 약 25 개의 아미노산, 약 35 개의 아미노산, 약 50 개의 아미노산, 또는 약 100 개의 아미노산일 것이다. 핵산의 경우, 참조 핵산 서열의 길이는 일반적으로 적어도 약 50 개의 뉴클레오티드, 적어도 약 60 개의 뉴클레오티드, 적어도 약 75 개의 뉴클레오티드, 약 100 개의 뉴클레오티드, 또는 약 300 개의 뉴클레오티드 또는 그 부근 또는 그 사이의 임의의 정수일 것이다. 일부 구현예에서, 참조 서열은 관심 단백질의 야생형 서열이다. 다른 구현예에서, 참조 서열은 야생형 단백질을 암호화하는 폴리뉴클레오티드 서열이다.
용어 'RNA-프로그래밍 가능한 뉴클레아제', 및 'RNA-가이드 뉴클레아제'는 절단을 위한 표적이 아닌 하나 이상의 RNA(들)와 함께 사용된다(예를 들어, 이와 결합하거나 회합한다). 일부 구현예에서, RNA-프로그래밍 가능한 뉴클레아제는 RNA와 복합체를 형성할 때, 뉴클레아제:RNA 복합체로 지칭될 수 있다. 전형적으로, 결합된 RNA(들)는 가이드 RNA(gRNA)로 지칭된다. 일부 구현예에서, RNA-프로그래밍 가능한 뉴클레아제는 (CRISPR-회합 시스템) Cas9 엔도뉴클레아제, 예를 들어, 스트렙토코쿠스 파이오게네스(Streptococcus pyogenes)로부터의 Cas9 (Csnl) 이다.
용어 '단일 뉴클레오티드 다형성 [single nucleotide polymorphism, SNP]'은 게놈 내의 특정 위치에서 발생하는 단일 뉴클레오티드에서의 변이이고, 여기서 각각의 변이는 집단 내에서 어느 정도(예를 들어, > 1%) 존재할 수 있다.
'특이적으로 결합한다'는 핵산 분자, 폴리펩티드, 또는 폴리펩티드/폴리뉴클레오티드 복합체, 화합물, 또는 본 발명의 폴리펩티드 및/또는 핵산 분자를 인식하고 결합하지만, 샘플, 예를 들어, 생물학적 샘플에서 다른 분자를 실질적으로 인식하고 결합하지 않는 분자를 의미한다.
'실질적으로 동일한'은 참조 아미노산 서열에 대해 적어도 50%의 동일성을 나타내는 폴리펩티드 또는 핵산 분자를 의미한다. 일 구현예에서, 참조 서열은 야생형 아미노산 또는 핵산 서열이다. 또 다른 구현예에서, 참조 서열은 본원에 기재된 아미노산 또는 핵산 서열 중 임의의 하나이다. 일 구현예에서, 이러한 서열은 아미노산 수준 또는 핵산 수준에서 비교를 위해 사용되는 서열과 적어도 60%, 80%, 85%, 90%, 95% 또는 심지어 99% 동일하다.
서열 동일성은 전형적으로 서열 분석 소프트웨어(예를 들어, Genetics Computer Group의 Sequence Analysis Software Package, 53705 위스콘신주 매디슨 유니버시티 애비뉴 1710 위스콘신 대학 생물공학 센터 소재, BLAST, BESTFIT, GAP, 또는 PILEUP/PRETTYBOX 프로그램)를 사용하여 측정된다. 이러한 소프트웨어는 다양한 치환, 결실, 및/또는 다른 변형에 대한 상동성 정도를 할당함으로써 동일하거나 또는 유사한 서열을 일치시킨다. 보존적 치환은 다음 기 내에서 치환을 전형적으로 포함한다: 글리신, 알라닌; 발린, 이소류신, 류신; 아스파르트산, 글루탐산, 아스파라긴, 글루타민; 세린, 트레오닌; 리신, 아르기닌; 및 페닐알라닌, 티로신. 동일성 정도를 결정하기 위한 예시적인 접근법에서, 밀접하게 관련된 서열을 나타내는 e-3 및 e-100 사이의 확률 점수[probability score]와 함께 BLAST 프로그램이 사용될 수 있다.
예를 들어, 다음 매개변수와 함께 COBALT가 사용된다.
a) 정렬 매개변수: Gap 패널티-11, -1 및 End-Gap 패널티-5, -1,
b) CDD 매개변수: RPS BLAST 사용; 블라스트 E-값 0.003; 보존된 열[column] 발견 및 재계산, 및
c) 쿼리 클러스터링 매개변수: 쿼리 클러스터 사용; 글자 크기 4; 최대 클러스터 거리 0.8; 알파벳 규칙.
예를 들어, 다음 매개변수와 함께 EMBOSS Needle이 사용된다:
a) 행렬: BLOSUM62;
b) GAP 개방: 10;
c) GAP 확장: 0.5;
d) 출력 형식: 쌍;
e) END GAP 패널티: 거짓;
f) END GAP 개방: 10; 및
g) END GAP 확장: 0.5.
본 발명의 방법에 유용한 핵산 분자는 본 발명의 폴리펩티드 또는 이의 단편을 암호화하는 임의의 핵산 분자를 포함한다. 이러한 핵산 분자는 내인성 핵산 서열과 100% 동일할 필요는 없지만, 전형적으로 실질적인 동일성을 나타낼 것이다. 내인성 서열에 대해 '실질적인 동일성'을 갖는 폴리뉴클레오티드는 전형적으로 이중 가닥 핵산 분자의 적어도 하나의 가닥과 혼성화할 수 있다. 본 발명의 방법에 유용한 핵산 분자는 본 발명의 폴리펩티드 또는 이의 단편을 암호화하는 임의의 핵산 분자를 포함한다. 이러한 핵산 분자는 내인성 핵산 서열과 100% 동일할 필요는 없지만, 전형적으로 실질적인 동일성을 나타낼 것이다. 내인성 서열에 대해 '실질적인 동일성'을 갖는 폴리뉴클레오티드는 전형적으로 이중 가닥 핵산 분자의 적어도 하나의 가닥과 혼성화할 수 있다. '혼성화하다'는 다양한 엄격성 조건하에, 상보적 폴리뉴클레오티드 서열(예를 들어, 본원에 기재된 유전자), 또는 이의 부분 간에 이중 가닥 분자를 형성하는 쌍을 의미한다. (예를 들어, 문헌[Wahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507] 참조).
예를 들어, 엄격한 염 농도는 일반적으로 약 750 mM NaCl 및 75 mM 시트르산삼나트륨 미만, 바람직하게는 약 500 mM NaCl 및 50 mM 시트르산삼나트륨 미만, 보다 바람직하게는 약 250 mM NaCl 및 25 mM 시트르산삼나트륨 미만일 것이다. 낮은 엄격성의 혼성화는 유기 용매, 예를 들어, 포름아미드의 부재하에 수득될 수 있는 반면, 높은 엄격성의 혼성화는 적어도 약 35% 포름아미드, 보다 바람직하게는 적어도 약 50% 포름아미드의 존재하에 수득될 수 있다. 엄격한 온도 조건은 일반적으로 적어도 약 30 ℃, 보다 바람직하게는 적어도 약 37 ℃ 가장 바람직하게는 적어도 약 42 ℃의 온도를 포함할 것이다. 혼성화 시간, 청정제 농도, 예를 들어, 나트륨 도데실 술페이트[sodium dodecyl sulfate, SDS]의 농도, 및 담체 DNA의 포함 또는 배제와 같은 다양한 추가적인 매개변수는 당업자에게 잘 알려져 있다. 필요에 따라 이러한 다양한 조건을 조합함으로써 다양한 수준의 엄격성이 달성된다. 바람직한 구현예에서, 혼성화는 30 ℃의 750 mM NaCl, 75 mM 시트르산삼나트륨, 및 1% SDS에서 발생할 것이다. 보다 바람직한 구현예에서, 혼성화는 37 ℃의 500 mM NaCl, 50 mM 시트르산삼나트륨, 1% SDS, 35% 포름아미드, 및 100 ㎍/ml 변성된 연어 정자 DNA[salmon sperm DNA, ssDNA]에서 발생할 것이다. 가장 바람직한 구현예에서, 혼성화는 42 ℃의 250 mM NaCl, 25 mM 시트르산삼나트륨, 1% SDS, 50% 포름아미드, 및 200 ㎍/ml ssDNA에서 발생할 것이다. 이러한 조건에 대한 유용한 변경은 당업자에게 용이하게 명백할 것이다.
대부분의 적용에 있어서, 혼성화 후 세척 단계에서 또한 엄격성이 다를 것이다. 세척 엄격성의 조건은 염 농도 및 온도에 의해 정의될 수 있다. 위와 같이, 세척 엄격성은 염 농도를 감소시키거나 온도를 증가시킴으로써 증가될 수 있다. 예를 들어, 세척 단계에 대한 엄격한 염 농도는 바람직하게는 약 30 mM NaCl 및 3 mM 시트르산삼나트륨 미만, 그리고 가장 바람직하게는 약 15 mM NaCl 및 1.5 mM 시트르산삼나트륨 미만일 것이다. 세척 단계에 대한 엄격한 온도 조건은 일반적으로 적어도 약 25 ℃, 더 바람직하게는 적어도 약 42 ℃ 및 심지어 보다 바람직하게는 적어도 약 68 ℃의 온도를 포함할 것이다. 일 구현예에서, 세척 단계는 25 ℃의 30 mM NaCl, 3 mM 시트르산삼나트륨, 및 0.1% SDS에서 발생할 것이다. 또 다른 구현예에서, 세척 단계는 42 ℃의 15 mM NaCl, 1.5 mM 시트르산삼나트륨, 및 0.1% SDS에서 발생할 것이다. 보다 바람직한 구현예에서, 세척 단계는 68 ℃의 15 mM NaCl, 1.5 mM 시트르산삼나트륨, 및 0.1% SDS에서 발생할 것이다. 이들 조건에 대한 추가 변화는 당업자에게 명백하다. 혼성화 기술은 당업자에게 잘 알려져 있고, 예를 들어, 문헌[Benton and Davis (Science 196:180, 1977)]; 문헌[Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al.(Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001)]; 문헌[Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York)]; 및 문헌(Sambrook et al. , Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York)에 기재되어 있다.
'스플릿'은 두 개 이상의 단편으로 나누어지는 것을 의미한다.
'스플릿 Cas9 단백질' 또는 '스플릿 Cas9'는 두 개의 별개의 뉴클레오티드 서열에 의해 암호화된 N-말단 단편 및 C-말단 단편으로 제공되는 Cas9를 지칭한다. Cas9 단백질의 N-말단 부분 및 C-말단 부분에 상응하는 폴리펩티드는 스플릿되어 '재구축된[reconstitutied]' Cas9 단백질을 형성할 수 있다.
용어 '표적 부위'는 데아미나아제(예를 들어, 시티딘 또는 아데닌 데아미나아제)에 의해 탈아미노화된 핵산 분자 또는 데아미나아제(dCas9-아데노신 데아미나아제 융합 단백질 또는 본원에 개시된 염기 편집기)를 포함하는 융합 단백질 내의 서열을 지칭한다.
'테노포비르'는 CAS 번호 147127-20-6에 상응하는 구조를 갖는 분자, 및 이의 약학적으로 허용가능한 염을 의미한다.테노포비르는 항레트로바이러스 활성이다. 테노포비르는 뉴클레오시드/뉴클레오티드 역전사효소 억제제[nucleoside/nucleotide reverse transcriptase inhibitor, NRTI]로 분류된다.
본원에 사용된 바와 같이, 용어 '치료하다', '치료하는', '치료' 등은 장애 및/또는 이와 연관된 증상을 감소시키거나 개선하거나 원하는 약리학적 및/또는 생리학적 효과를 수득하는 것을 지칭한다. 배제되지는 않지만, 장애 또는 병태를 치료하는 것은 이와 연관된 장애, 병태 또는 증상이 완전히 제거될 것을 요구하지 않는다는 것이 이해될 것이다. 일부 구현예에서, 효과는 치료적이고, , 제한 없이, 효과는 질환 및/또는 질환에 기인하는 유해 증상의 강도, 또는 치료를 부분적으로 또는 완전히 축소, 경감, 폐지, 약화, 개선, 감소시킨다. 일부 구현예에서, 효과는 예방적이고, 즉, 효과는 질환 또는 병태의 발생 또는 재발을 보호 또는 방지한다. 이를 위해, 현재 개시된 방법은 본원에 기재된 바와 같은 치료 유효량의 조성물을 투여하는 단계를 포함한다. 일 구현예에서, 본 발명은 HBV 감염의 치료를 제공한다.
'우라실 글리코실라제 억제제[uracil glycosylase inhibitor]' 또는 'UGI'는 우라실 절제 복구 시스템을 억제하는 제제를 의미한다. 시티딘 데아미나아제를 포함하는 염기 편집기는 시토신을 우라실로 전환한 다음, DNA 복제 또는 복구를 통해 티민으로 전환된다. 염기 편집기에 우라실 DNA 글리코실라제 억제제[UGI]를 포함하는 것은 U를 C로 다시 변경하는 염기 절제 복구를 방지한다. 예시적인 UGI는 다음과 같은 아미노산 서열을 포함한다.
>splP14739IUNGI_BPPB2 우라실-DNA 글리코실라제 억제제MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML(서열 번호 231).
본원에 제공된 범위는 범위 내의 모든 값에 대한 약칭으로 이해된다. 예를 들어, 1 내지 50의 범위는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50으로 이루어진 군에서 임의의 숫자, 숫자들의 조합 또는 하위범위를 포함하는 것으로 이해된다.
본원의 변수의 임의의 정의에서 화학적 작용기의 나열의 언급은 임의의 단일 작용기 또는 나열된 작용기들의 조합의 정의를 포함한다. 본원의 변수 또는 양태에 대한 구현예의 언급은 임의의 단일 구현예로서의 구현예 또는 임의의 다른 구현예 또는 이의 일부와 조합된 구현예를 포함한다.
모든 용어는 당업자에 의해 이해될 수 있는 바와 같이 이해되도록 의도된다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다.
본 출원에서, 단수의 사용은 달리 구체적으로 언급되지 않는 한 복수를 포함한다. 명세서에서 사용된 바와 같이, 단수 형태('a', 'an', 및 'the')는, 문맥이 명확히 달리 언급하지 않는 한 복수의 지시대상을 포함하는 것으로 언급되어야 한다. 본원에서, '또는'의 사용은 달리 언급되지 않는 한 '및/또는'을 의미한다. 더욱이, 용어 '포함하는' 뿐만 아니라 다른 형태, 예컨대 '포함한다, '포함하다', 및 '포함된'의 사용은 제한되지 않는다.
본 명세서 및 청구범위(들)에 사용된 바와 같이, 단어 '포함하는'(및 '포함한다' 및 '포함하다'와 같은 포함하는의 임의의 형태), '갖는'(및 '갖다' 및 '갖는다'와 같은 갖는의 임의의 형태), '포함하는'(및 '포함한다' 및 '포함하다'와 같은 포함하는의 임의의 형태) 또는 '함유하는'(및 '함유한다' 및 '함유하다'와 같은 함유하는의 임의의 형태)은 포괄적 또는 개방형이고 추가적인 인용되지 않은 요소 또는 방법 단계를 배제하지 않는다. 본 명세서에서 논의된 임의의 구현예는 본 개시의 임의의 방법 또는 조성물에 대해 구현될 수 있고, 그 반대도 가능하다는 것이 고려된다. 또한, 본 개시의 조성물은 본 개시의 방법을 달성하기 위해 사용될 수 있다.
용어 '약' 또는 '대략'은 당업자에 의해 결정된 바와 같은 특정 값에 대한 허용가능한 오차 범위 이내를 의미하며, 이는 값이 어떻게 측정 또는 결정되는지, 즉, 측정 시스템의 한계에 따라 부분적으로 달라질 것이다. 예를 들어, '약'은 당업계에서의 실무에 따라, 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 또한, '약'은 주어진 값의 최대 20%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다. 또한, 특히 생물학적 시스템 또는 과정과 관련하여, 용어는 몇 배수 이내, 예를 들어, 값의 5 배 이내, 2 배 이내를 의미할 수 있다. 특정 값이 출원 및 청구범위에 기재된 경우, 달리 언급되지 않는 한, 용어 '약'은 특정 값에 대한 허용가능한 오차 범위 이내를 의미하는 것으로 가정되어야 한다.
명세서에서 '일부 구현예', '구현예', '일 구현예' 또는 '다른 구현예'에 대한 언급은 구현예와 관련하여 기재된 특정 특징, 구조, 또는 특성이 적어도 일부 구현예에 포함되지만, 반드시 본 개시의 모든 구현예에 포함되지 않음을 의미한다.
도 1은 B형 간염 표면 항원[hepatitis B surface antigen, HBsAg] 유전자, 폴리머라아제 유전자, 단백질 X 유전자, 및 코어 유전자에 대한 부분적으로 이중 가닥 및 중첩 오픈 리딩 프레임[overlapping open reading frames, ORF]을 나타내는 예시이다. HBsAg 유전자는 ORF PreS1, ORF PreS2, 및 ORF S를 포함하고, 이들은 각각 큰, 중간, 및 작은 표면 단백질을 암호화한다. ORF 코어 및 Pre C는 캡시드 단백질을 암호화한다.
도 2는 HBV 수명 주기를 도시하는 예시이다. 용어 'ER'은 소포체를 나타낸다. 용어 'HBsAg'는 B형 간염 표면 항원을 나타낸다. 'HBx 전사 활성인자'는 폴리머라아제 II 및 III 프로모터의 HBV 특이적 전사 활성인자이다.
도 3a 및 3b는 지도와 프레젠테이션 슬라이드를 제시한다. 도 3a는 전 세계적인 B형 간염 바이러스 유전자형의 지리적 분포 지도이다. 도 3b는 바이러스 유전자에 종결 코돈을 도입하고 만성 HBV를 치료하기 위한 무염기 부위를 생성하기 위한 염기 편집 전략의 요약을 제공한다.
도 4는 표시된 염기 편집기와 조합하여 사용된 표시된 가이드 RNA 서열에 대한 % A에서 G 편집 효율을 나타내는 막대 그래프를 제공한다. HEK293 렌티 HBV 시스템 및 RNA 형질감염 포맷이 사용되었다. 가이드 RNA 서열 중 일부는 50% 이상의 편집 효율과 연관되었다. 가이드 RNA는 HBV 전사 요소를 표적으로 하거나 HBV 유전자에 과오 돌연변이를 도입했다. 표시된 염기 편집기와 조합하여 사용된 가이드 RNA 서열은 x-축 상에 나열되어 있다(표 1 참조).
도 5a 내지 5c는 HBV-일차 인간 간세포 [HBV-primary human hepatocytes, HBV-PHH] 시스템에서 표시된 (x-축 상에 나열된) 가이드 RNA와 조합하여 사용된 표시된 염기 편집기의 항바이러스 효능을 보여주는 막대 그래프를 제공한다. 도 5a 내지 5c에서, 용어 'HBsAG'는 'B형 간염 표면 항원'을 나타내고, 용어 'HBeAg'는 'B형 간염 e 항원'을 나타낸다. 도 5에서, y축은 비처리 샘플에 대한 배수 변화를 나타낸다.
도 6은 HBV-감염된 HepG2-NTCP 세포에서의 기능적 gRNA 스크리닝에 대한 실험 절차를 개략적으로 나타내는 개략도를 제공한다.
도 7은 HBV 게놈의 개략도를 제공한다. 게놈 지도는 BE4와 조합하여 사용된 gRNA37 및 gRNA40과 연관된 염기 편집의 위치를 가리키기 위해 주석이 달려 있다.
도 8은 HBV-감염된 HepG2pNTCP 세포에서 기능적 gRNA 스크리닝의 결과를 보여주는 막대 그래프의 집합을 제공한다. HBsAg 및 코어 유전자(즉, gRNA37 및 gRNA40)를 표적으로 하는 두 개의 리드 gRNA가 확인되었다. 가이드 gRNA37(종결-S)은 HBsAg의 감소와 연관되었고, gRNA40(종결-프리코어)은 HBeAg의 감소와 연관되었다. 가이드 RNA gRNA37 및 gRNA40 모두는 총 HBV DNA 및 3.5 kb RNA 수준의 저하와 연관되었다. BE4와 조합하여 사용된 gRNA(즉, gRNA12, gRNA37, gRNA19, gRNA190, 및 gRNA40)가 x-축 상에 나열되어 있다. 음성 대조군(-)은 처리되지 않은 세포이고 대조군(contr)은 PCSK9 유전자를 표적으로 하는 gRNA였다.
도9는 다중화 gRNA가 HepG2-NTCP에서 각각의 HBV 바이러스 파라미터를 동시에 감소시켰음을 보여주는 막대 그래프의 집합을 제공한다. x-축 상에는 BE4와 조합하여 사용된 gRNA(즉, gRNA37 및 gRNA40)가 나열된다. 동일한 공유결합폐환형 DNA 가닥[covalently-closed circular DNA strand, cccDNA]을 표적으로 하는 gRNA 및 표적 서열은 둘 다 약 1kb 간격으로 배치되었다. gRNA37 및 gRNA40의 다중화는 총 HBV DNA 및 3.5 kb RNA 뿐만 아니라 HBsAg 및 HbBeAg를 감소시켰다. 사용된 염기 편집기는 BE4이다. 음성 대조군(-)은 처리되지 않은 세포이고 대조군(contr) 은 PCSK9 유전자를 표적으로 하는 gRNA였다.
도 10은 BE4 및 가이드 RNA(들)를 함유하는 염기 편집기 시스템이 cccDNA의 수준을 감소시키지 않으면서 cccDNA 편집을 수행함을 보여주는 막대 그래프를 제공한다. 음성 대조군(-)은 처리되지 않은 세포이고 대조군(contr)은 PCSK9 유전자를 표적으로 하는 gRNA였다.
도 11은 편집에 대한 라미부딘 전처리의 영향을 평가하기 위한 실험 프로토콜을 요약한 개략도를 제공한다.
도 12는 라미부딘으로의 전처리가 증가된 편집 효율과 연관이 있음을 나타내는 막대 그래프를 제공한다. 라미부딘 전처리를 통해 HepG2-NTCP 세포에서 염기 편집 효율을 약 20% 개선시켰다. 라미부딘 전처리된 세포에서의 높은 cccDNA 편집은 CBE가 cccDNA를 직접 표적으로 하였음을 시사했다.
도 13은 라미부딘 전처리와 gRNA40과 gRNA37을 조합하여 사용한 염기 편집(즉, 조합/다중 gRNA 치료)은 B형 간염 바이러스[HBV] 마커의 강력한 감소와 연관되었음을 보여주는 한 세트의 막대 그래프를 제공한다. 음성 대조군(-)은 처리되지 않은 세포이고 대조군(contr)은 PCSK9 유전자를 표적으로 하는 gRNA였다.
도 14는 라미부딘에 대한 염기 편집의 항바이러스 활성을 평가하기 위한 실험 프로토콜을 요약한 개략도를 제공한다. 도 14는 측정된 HBV 매개변수를 나열한다.
도 15는 gRNA40과 gRNA37을 조합하여 사용한 염기 편집(즉, 조합/다중 gRNA 처리)이 처리 후 25일 차에 모든 HBV 바이러스 마커에서 약 70% 내지 약 80%의 감소를 초래한 반면, 라미부딘 [lamivudine, LAM]을 사용한 8일 동안의 처리는 그렇지 않았음을 보여주는 막대 그래프 세트를 제공한다. 음성 대조군(-)은 처리되지 않은 세포이고 대조군(contr)은 PCSK9 유전자를 표적으로 하는 gRNA였다.
도 16은 지시된 처리에 대한 세포 외 HBV DNA 수준의 시간 경과를 나타내는 표시[plot]를 제공한다. 염기 편집은 일차 간세포 공동 배양에서 반등[rebound]을 방지했다. 라미부딘 단독 처리를 중단한 후 HBV가 반등되었다. 대조군 gRNA는 PCSK9 유전자를 표적으로 하였다. 'HBV' 샘플은 처리되지 않은 샘플이었다. 염기 편집 시약으로 2차 형질감염 2주 후에는 HBV 반등이 관찰되지 않았다. HBV 복제는 s/n에서의 HBV DNA qPCR에 의해 평가되었다.
도 17은 HBV cccDNA를 편집하기 위해 두 개의 gRNA를 BE4와 조합하여 함께 사용하였을 때 gRNA37 및 gRNA40에 의해 표적화된 부위에서의 개별 염기 편집 효율을 보여주는 막대 그래프를 제공한다. S 항원 부위에서 약 30% 편집 효율이 관찰되었고, 프리코어(PreCore) 유전자에서 약 60% 편집 효율이 관찰되었다. 이러한 편집 효율은 높은 항바이러스 효능을 가능하게 하고 일차 인간 간세포[PHH]의 반등을 방지하기에 충분했다.
도 18은 라미부딘과 BE4 및 gRNA 37 및 40을 포함하는 염기 편집 시스템을 이용한 병용 치료를 평가하는 실험의 개요를 제공하는 개략도를 제공한다.
도 19는 지시된 처리에 대한 세포 외 HBV DNA 수준의 시간 경과를 나타내는 표시를 제공한다. 'HBV' 샘플은 처리되지 않은 샘플이었다. 라미부딘 전처리는 일차 간세포에서 편집을 개선했다. 염기 편집기 시스템 및 라미부딘이 조합된 처리는 HBV 반등을 방지했다. HBV 복제는 s/n 에서의 HBV DNA qPCR에 의해 평가되었다.
도 20은 gRNA37 및 gRNA40에 의해 표적화된 부위에서의 염기 편집 효율을 나타내는 막대 그래프를 제공한다. 세포를 gRNA37 및 gRNA40과 조합한 BE4와 접촉시키고, 또한 라미부딘(LAM)으로 처리하였다. 라미부딘 전처리는 일차 간세포에서 편집을 개선했다. 대조군 세포(-)는 라미부딘으로 처리되지 않았다.
도 21은 일차 간세포에서 라미부딘 처리와 조합된 염기 편집이 모든 HBV 마커의 약 70% 내지 약 80%의 감소를 초래하였음을 나타내는 막대 그래프를 제공한다. 명칭 'HBV'는 처리되지 않은 대조군을 가리킨다.
도 22는 gRNA37 및 gRNA40에 의해 표적화된 부위에서의 염기 편집 효율을 나타내는 막대 그래프를 제공한다. 세포는 gRNA37 및 gRNA40과 조합하여 BE4, ppApo, 또는 rrA3F와 접촉되었다. BE4 대신에 표적외 활성을 감소시키고 비특이적 효과를 낮추는 ppApo 및 rrA3F 염기 편집기의 사용은 BE4에 비해 염기 편집 효율을 부정적으로 변화시키지 않았다. 모든 염기 편집기는 비슷한 편집 효율과 연관이 있었다.
도 23은 gRNA37 및 gRNA40과 조합하여 염기 편집기 BE4, ppApo, 또는 rrA3F와 세포를 접촉시키는 것이 HBV-감염된 세포에서 HBsAg 수준의 감소를 초래하였음을 나타내는 막대 그래프를 제공한다. 따라서, 세 가지 염기 편집기 시스템 모두 항바이러스 활성을 가졌다. 음성 대조군(HBV)은 처리되지 않은 세포이고 대조군(contr)은 PCSK9 유전자를 표적으로 하는 gRNA였다.
도 24a 내지 24c는 1일 차에 주사 후 복제-적격[replication-competent] HBV서클 마우스 모델(n=5)에서 측정된 B형 간염 바이러스[HBV] 항원, 및 일부 경우에 도면에 표시된 바와 같이, 14일 차에 또 다른 주사 후 BE4를 암호화하는 폴리뉴클레오티드 및 가이드 RNA gRNA37 및 gRNA40을 함유하는 지질 나노입자의 생체내(in vivo) 수준을 보여주는 표시를 제공한다. 도 24a는 시간 경과에 따른 IU/㎖로서 평균% HBsAg를 표시한다. 도 24b는 시간 경과에 따른 PEI(폴 엘리치 인스티튜트 국제 표준 혈청[Paul Elrich Institut international standard serum]) U/㎖로서의 HBeAg를 표시한다. 도 24c는 HBV DNA를 시간 경과에 따른 카피(copy)/ml로 표시한다. 도 24a 내지 24c에서 용어 'HM'은 '중증 변형'(즉, 중증 변형된 가이드 RNA)을 갖는 스캐폴드를 함유하는 gRNA37-HM 및 gRNA40-HM을 가리키고, 용어 'SOC'는 '표준 치료[standard of care]'를 가리키며, 'SEM'은 '평균의 표준 오차[standard error of the mean]'를 가리킨다. 도 24a 내지 24c에서, '1x'는 1일 차 단독 주사('LNP-1차 주사')를 가리키고, '2x'는 1일 차('LNP-1차 주사') 및 14일 차('LNP 2차 주사') 주사를 가리킨다.
도 25a 내지 25c는1일 차에 주사 후 복제-적격[replication-competent] HBV서클 마우스 모델 (n=5)에서 측정된 B형 간염 바이러스[HBV] 항원, 및 일부 경우에 도면에 표시된 바와 같이, 14일 차에 또 다른 주사 후 BE4를 암호화하는 폴리뉴클레오티드 및 가이드 RNA gRNA37 및 gRNA40을 함유하는 지질 나노입자의 생체내(in vivo) 수준을 보여주는 표시를 제공한다. 도 25a는 시간 경과에 따른 IU/㎖로서 평균% HBsAg를 표시한다. 도 25b는 시간 경과에 따른 PEI(폴 엘리치 인스티튜트 국제 표준 혈청[Paul Elrich Institut international standard serum]) U/㎖로서의 HBeAg를 표시한다. 도 25c는 HBV DNA를 시간 경과에 따른 카피/ml로 표시한다. 도 25a 내지 25c에서 용어 'HM'은 '중증 변형'(즉, 중증 변형된 가이드 RNA)을 갖는 스캐폴드를 함유하는 gRNA37-HM 및 gRNA40-HM을 지칭하고, 용어 'ETV'는 '엔테카비르(Entecavir)'를 가리키고, 'SD'는 '표준 편차[standard deviation]'를 가리킨다. 도 25a 내지 25c에서, '1x'는 1일 차 단독 주사('LNP-1차 주사')를 가리키고, '2x'는 1일 차('LNP-1차 주사') 및 14일 차('LNP 2차 주사') 주사를 가리킨다.
도 26a 및 26b는 gRNA 선택 및 스크리닝을 위한 전략을 기술하는 개략도를 제공한다. 이 전략은 전세계적으로 가장 널리 퍼져 있고 세포 및 동물 모델이 모두 존재하는 유전자형 D에 초점을 두고 보존된 HBV 영역을 표적으로 하는 것을 포함한다. 컴퓨터 모의시험(in silico) gRNA 선택은 HBV 유전자를 침묵시키는 gRNA의 잠재성을 기반으로 하였다. 바이러스 유전자(NGG, NGA, NNNRRT PAM)에 종결 코돈을 도입하는 100 gRNA가 설계되었다. 24 개의 보존된 gRNA는 HBV 게놈에 과오 돌연변이를 도입할 것으로 예측되었다. 최종 단계는 Hek293-렌티-HBV 세포주에서 편집을 검출하는 것을 포함한다.
도 27a 내지 27d는 염기 편집이 일차 인간 간세포[PHH]에서 HBV 반등을 방지한다는 것을 나타낸다. 도 27a는 PHH에 사용된 실험 일정을 보여주는 개략도를 제공한다. 도 27b는 형질도입 후 상이한 일자에 PHH 상청액에서 HBV DNA qPCR에 의해 평가된 HBV 복제를 나타내는 그래프이다. 3TC의 중단은 HBV 반등으로 이어지는 반면, 염기 편집은 이러한 반등을 방지한다. 도 27c는 염기 편집이 HBsAg, HBeAg, 3.5kbRNA, 및 HBV DNA의 효율적인 감소로 이어지고, PHH에서 HBV 복제 억제를 더 개선함을 나타내는 그래프이다.도 27d는 S 항원의 약 30% 편집 및 프리코어 유전자의 약 60% 편집이 높은 항바이러스 효능을 가능하게 하고 PHH의 반등을 방지하기에 충분하였음을 보여주는 그래프이다.
도 28a 내지 28d는 두 개의 리드 gRNA를 다중화하는 것은 간암 세포주(HepG2-NTCP)에서 HBV 매개변수를 감소시킨다는 것을 보여준다. 도 28a는 실험 일정을 보여준다. 도 28b는 염기 편집이 세포내(3.5kbRNA, 및 HBV DNA) 뿐만 아니라 바이러스 세포외(HBsAg, HBeAg) 매개변수의 효율적인 감소를 유도한다는 것을 나타내는 다수의 그래프를 포함하고, 도 28c는 3TC 처리 시 HBsAg, HBeAg 및 3.5kbRNA에 대해 관찰된 결과를 보여주는 일련의 그래프를 제공한다. 도 28d는 gRNA B + gRNA H 조합이 또한 웨스턴 블롯팅(Western blotting)에서 관찰된 바와 같이 모든 HBs 이형[isoform]을 억제함을 나타낸다.
도 29a 내지 29c는 염기 편집이 자연적으로 통합된 HBV에서 HBs를 감소시켰음을 나타낸다. 도 29a는 PLC/PRF5 세포에 사용된 실험 프로토콜을 제공한다. 도 29b는 세포외 HBs Ag 수준이 BE4 mRNA 및 gRNA B*의 형질도입 후 6일 차에 ELISA에 의해 결정되었음을 보여주는 그래프이다. 도 29c는 S 항원 부위의 약 50% 편집이 HBs Ag를 강력하게 감소시키기에 충분하다는 것을 나타내는 그래프이다.
도 30a 및 30b는 염기 편집기가 cccDNA 수준을 감소시키지 않고 cccDNA 편집을 통해 기능함을 나타낸다. 도 30a는 그래프이다. cccDNA 수준은 바이러스 복제 중간체를 제거하기 위해 ExoI/III로 전처리된 DNA 샘플에 대한 qPCR로 평가되었다. 3TC의 부재 또는 존재 하에 gRNA B + gRNA H에 의한 염기 편집 시 cccDNA 감소는 관찰되지 않았다. 도 30b는 cccDNA가 풍부한 샘플에서 NGS에 의해 평가된 기능적 편집을 나타내는 그래프이다. 3TC가 있는 경우 더 높은 편집 효율이 감지되었다.
도 31a 내지 31e는 BE4 염기 편집기와 두 개의 gRNA를 다중화하는 것이 HepG2-NTCP에서 HBV 바이러스 매개변수를 동시에 감소시킨다는 것을 보여준다. 도 31a는 관련 없는 PCSK9 유전자를 표적으로 하는 염기 편집 시약으로 처리된 대조군 샘플에 비해 gase 편집이 세포내(3.5kbRNA 및 HBV DNA) 뿐만 아니라 바이러스 세포 외(HBsAg, HBeAg) 매개변수의 효율적인 감소를 유도한다는 것을 보여주는 일련의 그래프를 제공한다. BE4/gRNA(S1+C2) 처리는 웨스턴 블롯팅에서 관찰된 바와 같이 모든 HBs 이형을 억제하였다. 도 31b는 라미부딘으로 전처리하는 경우의 실험 일정을 제공한다. 도 31c는 라미부딘을 사용한 조합 치료가 패널 A에 나타난 결과와 유사하게 HBV 바이러스 마커의 강력한 감소를 유도한다는 것을 나타낸다. 도 31d는 염기 편집이 HepG2-NTCP에서 cccDNA 수준을 감소시키지 않는다는 것을 보여주는 그래프이다. 도 31e는 라미부딘으로의 전처리가 HepG2-NTCP에서 염기 편집율을 20% 증가시켰음을 나타낸다. 이론에 결부되고자 하는 의도 없이, 라미부딘 전처리된 조건에서의 높은 cccDNA 편집은 CBE가 cccDNA를 직접 표적화할 가능성이 있음을 나타낸다.
도 32a 내지 32c는 염기 편집이 PHH의 바이러스 반등을 방지한다는 것을 보여준다. 도 32a는 PHH 상청액에서 HBV DNA qPCR에 의해 평가된 HBV 복제를 보여주는 그래프이다. 라미부딘의 중단은 HBV 반등을 유도하는 반면, 염기 편집은 바이러스 반등을 방지했다.도 32b는 염기 편집이 HBsAg, HBeAg, 3.5kbRNA, 및 HBV DNA의 효율적인 감소를 유도한다는 것을 나타내는 네 개의 그래프를 포함한다.도 32c는 높은 항바이러스 효능을 가능하게 하고 PHH의 반등을 방지하기에 충분한 약 55% 편집 S 항원 및 약 80% 편집 프리코어 유전자를 나타내는 그래프이다.
도 33a 내지 33c는 BE4 mRNA 및 gRNA S1/C2의 LNP-매개 전달이 HBV 미니서클 모델에서 바이러스 마커의 지속적인 감소로 이어진다는 것을 보여준다. 도 33a는 > 2 로그 평균 HBsAg 감소가 있었음을 나타내는 그래프이다. 유의하게, 5/9 마우스는 검출 한계 미만의 HBsAg 감소를 나타내었다. 도 33b는 엔테카비르 처리군(양성 대조군)에서 HBV가 반등함을 나타내는 그래프이다. 염기 편집으로 처리된 그룹에서 혈청 HBV DNA의 > 3 로그 지속적인 감소가 있었다. 염기 편집군에서 HBV 반등은 관찰되지 않았다. 도 33c는 모든 마우스에서 1차 LNP 주사 2주 후 검출 한계 미만의 HBeAg 발현 손실을 나타낸다. 데이터는 평균 +/- SEM으로 표시되고, 그룹당 n=4 또는 5이다.
도 34a 및 34b는 스페이서 서열 서열 번호 578을 갖는 gRNA EMSbeam12 및 스페이서 서열 서열 번호 10834를 갖는 MSPbeam37-PLC와 조합된 BE4가 알렉산더 간암 세포주인 PLC/PRF/5(도 34a) 내에 존재하는 자연적으로 통합된 HBV 게놈을 편집하였고 이는 HBsAg 분비를 감소시켰음을 나타내는그래프이다(도 34b). 또한 프로토스페이서 서열이 포함된다. MSPbeam37 프로토스페이서는 서열 번호 508에 상응하고, MSPbeam37-PLC 프로토스페이서(서열 번호 10833)는 서열 번호 508에 비해 단일 핵염기 변화를 포함한다.
도 35는 라미부딘(LAM)으로 전처리를 하거나 하지 않고 시험관내에서 HepG2.2.15 세포에서의 염기 편집을 평가하기 위한 실험 설계를 보여주는 개략도를 제공한다. 도 35에서, 'D0', 'D1' 등은 실험 시작 후 0일 , 1일 등을 나타내고, 'SN'은 '상청액'을 가리키며, '6dpt'는 '형질도입 후 6일'을 가리킨다.
도 36a 및 36b는 가이드 gRNA37(g37) 또는 gRNA12(g12)와 조합하여 (HBsAg의 발현을 감소시키기 위한 염기 편집을 위해) 및/또는 가이드 gRNA40(g40)과 조합하여(HBeAg의 발현을 감소시키기 위한 염기 편집을 위해) BE4 염기 편집기를 사용하여 염기 편집 후 HepG2.2.15 세포에서 HBsAg 및 HBeAg 폴리펩티드 수준을 나타내는 막대 그래프를 제공한다. 대조군으로서, 세포는 PCSK9 유전자를 표적으로 하는 가이드와 조합한 BE4 염기 편집기와 접촉되었다. 세포는 라미부딘(LAM)으로 전처리하거나 전처리하지 않고 염기 편집되었다. 도 36a는 지시된 가이드와 조합한 BE4 염기 편집기를 사용하여 LAM으로 전처리하면서 편집된 및 전처리되지 않고 편집된 HepG2.2.15 세포에서의 HBsAg 발현 수준을 나타낸다. 도 36b는 지시된 가이드와 조합한 BE4 염기 편집기를 사용하여 LAM으로 전처리하면서 편집된 및 전처리되지 않고 편집된 HepG2.2.15 세포에서의 HBeAg 발현 수준을 나타낸다. 발현 수준은 ANOVA/비-모수 분석[non-parametric test]/매칭 쌍 없음/PCSK9에 대한 다중 비교를 사용하여 비교되었다.
본 개시의 발명은 HBV 게놈을 편집하기 위한 조성물 및 방법을 특징으로 한다. 예를 들어, 본원에서 고려되는 조성물은 일부 구현예에서, HBV 유전자에서 특정 뉴클레오티드를 표적으로 하는 가이드 핵산 염기 편집기를 포함할 수 있다. 일부 구현예에서, 편집은 바이러스 단백질 중 하나의 코딩 서열에 조기 종결 코돈을 도입한다. 또 다른 구현예에서, 편집은 하나 이상의 HBV 단백질의 코딩 서열에 하나 이상의 치환(예를 들어, 과오 돌연변이[missense mutation])을 도입한다. 일 구현예에서, 편집은 전사 요소(예를 들어, polyA 부위, 인핸서, 또는 프로모터) 내의 핵염기[nucleobase]를 변경한다.
최근의 연구는 새로운 세대의 ABE(예를 들어, ABE8)가 더 높은 편집 속도를 유도할 수 있다는 것을 나타낸다. 또한, 이들은 초기 세대 시티딘 염기 편집기[cytidine base editors, CBE]에 비해 더 낮은 gRNA-비의존성 표적외[gRNA-independent off-target] 편집을 가지고 있기에 잠재적인 치료 접근법으로서 관심을 끈다. ABE는 종결 코돈의 생성을 가능하게 하지는 않지만, HBV 게놈에서 AT-풍부 영역을 표적으로 할 수 있게 한다.
HBV를 치료하기 위한 염기 편집의 사용은 유리하게는 cccDNA에서 영구 돌연변이를 안전하게 도입함으로써 HBV 반등을 방지하고, DSB 없이 통합된 HBV DNA에서 HBsAg 발현을 비가역적으로 침묵시킨다.
아래에서 더 상세히 설명되는 바와 같이, 본 개시는 시토신 염기 편집기[CBE, C에서 T로의 전환]를 사용하여 확립된 HBV 공유결합폐환형 DNA[covalently closed circular DNA , cccDNA] 풀(pool)을 표적으로 하는 것을 제공한다. 감염된 HepG2-NTCP 세포 및 장기간의 일차 인간 간세포 배양물[primary human hepatocyte culture , PHH]은 선택되는 HBV-표적화 gRNA 및 CBE를 암호화하는 mRNA로 공동 형질감염되었다. 염기 편집 효율은 DNA 앰플리콘 시퀀싱(amplicon sequencing)에 의해 평가되었고 바이러스 복제에 대한 염기 편집의 결과는 상이한 바이러스 매개변수를 분석하여 결정되었다. cccDNA 무결성[integrity]에 영향을 주지 않고, 염기 편집은 HBs 또는 HBe/HBc 오픈 리딩 프레임[open reading frames, ORF)에 비센스[non-sense] 돌연변이를 도입하고, 총 HBV DNA 및 HBs/HBe 항원의 방출을 효율적으로 억제하였다. 또한, 염기 편집률은 뉴클레오시드 유사체[nucleoside analogs, NA]로 전처리의 맥락에서 높게 유지되었고, 이는 HBV DNA 복제 중간체의 수준을 감소시켰으며, 이는 CBE가 cccDNA를 직접 표적화할 수 있음을 가리킨다. 두 개의 gRNA를 CBE와 다중화하면 HBsAg, HBeAg, 총 HBV DNA 및 3.5kb 바이러스 전유전체[pregenomic] RNA가 더 많이 감소했다. 중요하게도, 이중 gRNA/CBE 치료는 HBV 반등을 방지했다. 종합하면, 이러한 결과는 CBE가 cccDNA를 직접 표적화하고 HBV 복제를 방해하는 HBs 및 HBe/HBc ORF에서 비센스 돌연변이를 생성할 수 있음을 나타낸다. 또한, 이러한 효과는 CBE 분해 후에도 지속되며, 이는 HBV cccDNA의 영구적인 기능 변화를 가리킨다.
염기 편집을 사용한 cccDNA 전사 활성 표적화
cccDNA 전사 활성에 관여하는 영역은 AT-풍부 영역이고, HBV 치료를 위한 cccDNA 분해에 대한 대체물[surrogate]은 cccDNA 전사 활성의 영구적인 파괴이며, 이는 현재 달성할 수 없다.
cccDNA 전사 활성에 관여하는 영역의 일례는 폴리아데닐화 신호[polyadenylation signal, PAS]이고, 이는 모든 HBV 바이러스 RNA에 대해 고유하며 조절 요소(TATA 박스)로서의 역할도 한다. cccDNA에서 이 영역을 표적으로 하는 것은 게놈 성분 pgRNA를 비롯한 모든 바이러스 RNA 종[species]을 불안정하게 만들고 cccDNA 침묵을 유도할 수 있다.
본원에 제공된 실시예에 기재된 바와 같이, sgRNA는 cccDNA에서 조절 영역(예를 들어, 인핸서 I, 인핸서 II, 기저 코어 프로모터, 크립틱(Cryptic) 및 표준 폴리아데닐화 신호[PAS], S 및 X 유전자 프로모터)을 표적으로 하는 컴퓨터 모의시험(in silico) 분석을 통해 확인되었다. 250 개 이상의 sgRNA가 확인되었고, 이들 후보들은 큐레이팅되었으며, 컴퓨터 모의시험에서 높은 예측 효율을 갖는 몇몇 후보들이 Hek293-lentiHBV 시스템에서 시험되었다.
본 개시의 일부 양태는, 실시예에 추가로 기재된 바와 같이, HBV 유전자에 과오 돌연변이를 도입할 것으로 예측되는 고도로 보존된 ABE gRNA를 선택하는 단계를 포함한다. 예를 들어, gRNA는 유전자형 D 및 A에 초점을 맞춘 HBV 유전자형에 걸친 높은 보존을 기반으로 선택되었다. 높은 서열 보존은 더 넓은 환자 집단을 표적화할 수 있게 하고 또한 HBV 바이러스가 염기 편집 치료를 피하게 할 수 있는 바이러스 돌연변이의 출현을 방지하는 것이 필요하다. 선택 기준의 또 다른 예는 과오 돌연변이로 이어지는 HBV 게놈에서 편집을 생성하는 gRNA의 능력이었다. 천연 발생 HBV 유전자형에서 거의 검출되지 않는 서열(< 0.05% 빈도 aa 변화)을 갖는 과오 아미노산 변화를 생성하는 염기 편집 시약 gRNA가 선택됨으로써 생성된 아미노산 변화에 대해 컴퓨터 모의시험 분석을 수행하였다. 이 방식으로 gRNA가 HBV 단백질/게놈의 파괴를 유도하는 돌연변이를 도입할 가능성이 증가되었다.
HBV 게놈
HBV 게놈은 약 3.2 kb로 부분적으로 이중 가닥 DNA 및 7 개의 단백질을 암호화하는 오픈 리딩 프레임(ORF)을 포함한다. 도 1을 참조하면, 오픈 리딩 프레임(ORF) P는 바이러스 폴리머라아제를 암호화한다. ORF C/PreC는 캡시드 단백질을 암호화한다. ORF PreS1, ORF PreS2, 및 ORF S는 각각 큰(L), 중간(M) 및 작은(S) 표면 단백질을 암호화한다. ORF X는 분비 X 단백질을 암호화한다.
부분적으로 이중 가닥 HBV 게놈은 숙주 인자에 의해 공유결합폐환형 DNA[cccDNA]로 전환된다. cccDNA는 숙주 RNA 폴리머라아제에 의해 전사되어 프리게놈 RNA(pre-genomic RNA, pgRNA)를 포함한 바이러스 mRNA를 생성한다. pgRNA는 HBV 폴리머라아제에 의해 게놈 HBV DNA 내로 역전사되어 cccDNA로 전환되거나, 비리온으로 패키징되거나, 또는 숙주 세포의 게놈 내로 통합될 수 있다(도 2). HBV 수명 주기의 핵심 구성요소인 cccDNA는 만성 HBV 감염을 담당하는 안정된 분자이다. HBV 게놈의 편집은 cccDNA의 형성을 방해하여, 바이러스의 병원성을 감소시킬 수 있다.
10 개의 상이한 HBV 유전자형(A 내지 J)이 있다(도 3a). '유전자형[genotype]'은 임의의 다른 게놈과 92% 미만의 서열 동일성을 특징으로 하고, 하위 유전자형[sub-genotype]은 96 내지 92% 미만의 서열 동일성을 특징으로 한다. 유전자형 D의 HBV는 미국에서 가장 만연하다(도 3a). 바이러스 스톡[예를 들어, 유전자형 D, 하위유전자형 ayw(Imquest)] 및 마우스 모델[예를 들어, 인간화 마우스 모델(Phoenixbio)]을 포함한 HBV 유전자형 D의 연구 모델이 이용가능하다.
표적 유전자의 편집
본 개시의 발명은 편집을 위해 HBV ORF를 표적으로 하는 방법 및 조성물을 제공한다. 이들 조성물은 Cas9 또는 다른 핵산 프로그래밍 가능한 DNA 결합 단백질 도메인 및 아데노신 또는 시토신 데아미나아제 도메인을 갖는 핵염기 편집기를 포함할 수 있다. 일부 구현예에서, 염기 편집기는 HBV ORF에 하나 이상의 변경을 도입한다. 일부 구현예에서, 변경은 HBV 단백질의 보존된 부분에서 돌연변이를 초래한다. 특정 구현예에서, 변경은 하나 이상의 종결 코돈을 도입한다. 명세서 전반에 걸쳐, 단백질의 조기 종결을 초래하는 종결 코돈의 도입은 아미노산 기호, 아미노산 위치, 및 용어 STOP으로 나타낸다(예를 들어, R87STOP는 아미노산 위치 87에서 아르기닌을 암호화하는 코돈이 종결 코돈으로 대체됨을 가리킨다). 유리하게는, 본 발명의 방법은 HBV 게놈에서 이중 가닥 파손을 도입하지 않는다. 본 발명은 만성 HBV를 치료하기 위해 염기 편집을 사용하기 위한 전략을 제공한다(도 3b). 본원에 기재된 방법 및 조성물을 사용하여 종결 코돈을 바이러스 유전자 내로 도입하는 것은 이중 가닥 파손를 생성하지 않고 달성되어, HBV가 숙주의 게놈 내로 통합된 후 숙주 유전 물질을 절단할 위험을 제거하거나 감소시킬 수 있다. 또한, 조성물은 천연 HBV 항바이러스 제한 인자인 데아미나아제를 이용할 수 있다. 예를 들어, APOBEC 시토딘 데아미나아제를 인터페론 알파 또는 림포톡신 ß 수용체[Lymphotoxin ß receptor, LTBR]로 유도하는 것은 무염기 부위 형성 및 cccDNA 분해를 촉진한다(도 3b). 또한, 우라실 글리코실라제 억제제 도메인 없이 염기 편집기를 사용하는 것은 세포 우라실 글리코실라제를 cccDNA로 표적화하고 이의 분해를 촉진할 수 있다.
구현예에서 HBV ORF는 아데노신 데아미나아제를 포함하는 염기 편집기(즉, 아데노신 염기 편집기[adenosine base editor, ABE])를 사용하여 편집된다. ABE는 제1 세대 rAPOBEC1-기반 CBE에 비해 강력한 표적 편집[on-target editing] 및 낮은 gRNA-비의존성 표적외 편집을 포함하는 몇 가지 이점을 가지고 있다. ABE는 우라실 N-글리코실라제(uracil N-glycosylase, UNG) 반응을 유도하지 않는다. A > I cccDNA 탈아미노화는 HBV에 대해 설명되지 않았다. ABE는 HBV 전사체에 공통적인 RNA 폴리아데닐화 부위 TATAAA를 포함하는 폴리머라아제 활성 부위 및/또는 cccDNA 전사 부위를 편집하는 데 사용될 수 있다. cccDNA 전사 활성에 관여하는 중요한 영역은 AT-풍부 영역 및 cccDNA 분해에 대한 대체물이다.
일부 양태에서, 시티딘 데아미나아제 또는 아데노신 데아미나아제 도메인을 포함하는 염기 편집기로 HBV cccDNA를 편집하기 위한 방법 및 조성물이 제공된다.
예시적인 가이드 RNA는 다음 표 1 제공된다. 추가의 예시적인 가이드 RNA는 표 1, 2A, 2B, 및/또는 2C 중 임의의 것에 제공되거나 서열 목록(예를 들어, 서열 번호 3105-5485 및 8220-10830)에 나열된 스페이서 서열을 함유하는 가이드 RNA를 포함한다. 다양한 구현예에서, 다중 가이드 RNA는 임의로 하나 이상의 핵염기 편집기 폴리펩티드와 조합하여 동시에 대상 또는 세포에 투여될 수 있다. 구현예에서, 다중 가이드 RNA는 2, 3, 4, 5, 6, 7, 8, 9, 10 개 또는 그 이상의 가이드를 포함하고, 여기서 임의로 가이드 RNA는 cas12b-4, cas12b-5, cas12b-11, cas12b-17, cas12b-30, cas12b-42, cas12b-100, cas12b-147, cas12b-154, cas12b-35, cas12b-124, cas12b-127, 및 cas12b-122b 중 두 개 이상으로부터 선택된다(표 1참조). 구현예에서, 대상 또는 세포에 투여되는 다중 가이드 RNA는 두 개의 가이드 RNA(예를 들어, gRNA37 및 gRNA40, 표 1 참조)를 함유한다. 가이드는 동시에 또는 순차적으로, 임의로 하나 이상의 핵염기 편집기 폴리펩티드(들)[예를 들어, mRNA 분자(들)에 의해 암호화되는 염기 편집기(들)]와 함께 투여될 수 있다. 본 개시의 가이드 RNA 분자에 사용하기에 적합한 스페이서 서열의 비제한적인 예는 B형 간염 바이러스 게놈의 임의의 부분을 표적으로 하는 임의의 스페이서 서열을 포함한다. 이러한 스페이서 서열은 숙련된 실무자가 이용가능한 방법을 사용하여 설계되고 선택될 수 있다(예를 들어, 특정 서열을 표적으로 하는 gRNA의 설계는 Invitrogen에서 상업적 서비스로 이용가능하다). 다양한 전략이 gRNA 선택에 사용될 수 있고, 비제한적인 예로서, 1) HBV 전사 요소를 표적으로 하는 것, 및 2) HBV 유전자에서 과오 돌연변이를 도입할 것으로 예측되는 고도로 보존된 ABE gRNA를 선택하는 것을 포함한다. 구현예에서, 가이드 RNA는 HBV 유전자(예를 들어, cas12b-4, cas12b-5, cas12b-11, cas12b-17, cas12b-30, cas12b-42, cas12b-100, cas12b-147, 또는 cas12b-154) 내로의 과오 돌연변이의 도입을 위한 염기 편집기를 표적으로 하는 데 사용될 수 있다. 표 1에 나열된 가이드 RNA, 또는 표 2A, 표 2B, 표 2C에 나열되어 있거나, 서열 번호 3105-5485 및 8220-10830 중 또는 서열 목록의 임의의 어느 곳에든 나열된 스페이서 서열을 포함하는 임의의 가이드 RNA 또한 전사 부위(예를 들어, cas12b-35, cas12b-124, cas12b-127, 또는 cas12b-122b)에서 핵염기를 변경하기 위한 염기 편집기를 표적화하기 위해 사용될 수 있다. 표 1의 가이드 RNA 또는 표 2A 표 2B, 표 2C에 나열되어 있거나, 서열 목록(예를 들어, 서열 번호 3105-5485 및 8220-10830)의 임의의 어느 곳에든 나열되어 있는 스페이서 서열을 포함하는 임의의 가이드 RNA에 의해 염기 편집을 위해 표적화될 수 있는 전사 부위는 인핸서 II 박스 A(예를 들어, cas12b-35), 인핸서 I(예를 들어, cas12b-124 또는 cas12b-127), 및 HBX 프로모터 (예를 들어, cas12b-122b)를 포함한다. 전사 부위의 비제한적인 예는 기저 코어 프로모터 [basal core promoter, BCP], 인핸서 I, 인핸서 II, HBV polyA 부위, HBX 프로모터 및 S 프로모터-CCAATC-영역 II를 포함한다. 본 발명의 가이드 RNA는 임의의 염기 편집기(예를 들어, Cas12b-ABE(ABE-bhCas12b); 서열 번호 418)와 조합하여 사용될 수 있다. 염기 편집기는 아래의 표 2A 또는 표 2B에 나열된 PAM 서열(예를 들어, RTTN 서열)을 표적화 할 수 있다.
구현예에서, 두 개 이상의 가이드 RNA는 임의로 동시에 대상에 도입된다. 일부 구현예에서, 두 개 이상의 가이드 RNA는 cas12b-5 및 cas12b-4; cas12b-11 및 cas12b-4; cas12b-17 및 cas12b-4; cas12b-30 및 cas12b-4; cas12b-42 및 cas12b-4; cas12b-100 및 cas12b-4; cas12b-147 및 cas12b-4; cas12b-154 및 cas12b-4; cas12b-35 및 cas12b-4; cas12b-124 및 cas12b-4; cas12b-127 및 cas12b-4; cas12b-122b 및 cas12b-4; cas12b-11 및 cas12b-5; cas12b-17 및 cas12b-5; cas12b-30 및 cas12b-5; cas12b-42 및 cas12b-5; cas12b-100 및 cas12b-5; cas12b-147 및 cas12b-5; cas12b-154 및 cas12b-5; cas12b-35 및 cas12b-5; cas12b-124 및 cas12b-5; cas12b-127 및 cas12b-5; cas12b-122b 및 cas12b-5; cas12b-17 및 cas12b-11; cas12b-30 및 cas12b-11; cas12b-42 및 cas12b-11; cas12b-100 및 cas12b-11; cas12b-147 및 cas12b-11; cas12b-154 및 cas12b-11; cas12b-35 및 cas12b-11; cas12b-124 및 cas12b-11;
cas12b-127 및 cas12b-11; cas12b-122b 및 cas12b-11; cas12b-30 및 cas12b-17; cas12b-42 및 cas12b-17; cas12b-100 및 cas12b-17; cas12b-147 및 cas12b-17; cas12b-154 및 cas12b-17; cas12b-35 및 cas12b-17; cas12b-124 및 cas12b-17; cas12b-127 및 cas12b-17; cas12b-122b 및 cas12b-17; cas12b-42 및 cas12b-30; cas12b-100 및 cas12b-30; cas12b-147 및 cas12b-30; cas12b-154 및 cas12b-30; cas12b-35 및 cas12b-30; cas12b-124 및 cas12b-30; cas12b-127 및 cas12b-30; cas12b-122b 및 cas12b-30; cas12b-100 및 cas12b-42; cas12b-147 및 cas12b-42; cas12b-154 및 cas12b-42; cas12b-35 및 cas12b-42; cas12b-124 및 cas12b-42; cas12b-127 및 cas12b-42; cas12b-122b 및 cas12b-42; cas12b-147 및 cas12b-100; cas12b-154 및 cas12b-100; cas12b-35 및 cas12b-100; cas12b-124 및 cas12b-100; cas12b-127 및 cas12b-100; cas12b-122b 및 cas12b-100; cas12b-154 및 cas12b-147; cas12b-35 및 cas12b-147; cas12b-124 및 cas12b-147; cas12b-127 및 cas12b-147; cas12b-122b 및 cas12b-147; cas12b-35 및 cas12b-154; cas12b-124 및 cas12b-154; cas12b-127 및 cas12b-154; cas12b-122b 및 cas12b-154; cas12b-124 및 cas12b-35; cas12b-127 및 cas12b-35; cas12b-122b 및 cas12b-35; cas12b-127 및 cas12b-124; cas12b-122b 및 cas12b-124; or cas12b-122b 및 cas12b-127을 포함한다(표 1 참조).
[표 1] 가이드 RNA
gRNA37-HM 및 gRNA40-HM을 제외한 모든 가이드에 대해, mA*, mC*, mG* 및 mU*는 2 '-O-메틸 3'-포스포로티오에이트 변형을 갖는 염기를 나타낸다. gRNA37-HM 및 gRNA-40HM의 경우, a, c, u 또는 g는 2'O-메틸 (M) 변형을 갖는 염기를 나타내고 as, cs, us 또는 gs는 2'-O-메틸 3'-포스포로티오에이트 (MS) 변형을 갖는 염기를 나타낸다.
상술된 유전자 편집을 생성하기 위해, 세포(예를 들어, 간세포)는 두 개 이상의 가이드 RNA 및 핵산 프로그래밍 가능한 DNA 결합 단백질 [nucleic acid programmable DNA binding protein, napDNAbp] 및 시티딘 데아미나아제 또는 아데노신 데아미나아제를 포함하는 핵염기 편집기 폴리펩티드와 접촉된다. 일부 구현예에서, 편집될 세포는 적어도 하나의 핵산과 접촉되되, 적어도 하나의 핵산은 두 개 이상의 가이드 RNA 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 및 시티딘 데아미나아제를 포함하는 핵염기 편집기 폴리펩티드를 암호화한다. 일부 구현예에서, gRNA는 뉴클레오티드 유사체(예를 들어, mA*, mC*, mG*, 및/또는 mU*)를 포함한다. 이러한 뉴클레오티드 유사체는 세포 과정에서 gRNA의 분해를 억제할 수 있다. 표 2A-2C는 gRNA에 사용될 예시적인 표적 및 스페이서 서열을 제공한다. 추가의 예시적인 표적 서열 및 스페이서 서열은 서열 목록에서 각각 서열 번호 724-3104 및 5609-8219, 및 서열 번호 3105-5485 및 8220-10830으로 제공된다. gRNA는 모든 HBV 유전자형(예를 들어, A, B, C, D, E, F, G, 및/또는 H)의 전부 또는 일부를 표적화할 수 있다. gRNA는 특정 유전자형 또는 유전자형 세트의 B형 간염 바이러스의 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 85% 이상 또는 모두를 표적화 할 수 있다.
다양한 구현예에서, 본 개시의 gRNA(예를 들어, gRNA37-HM 또는 gRNA40-HM)는 다음의 '중증 변형된' [heavily modified, HM] 스캐폴드 gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 함유하되, 'a', 'c', 'u' 또는 'g'는 각각 2'O-메틸 (M) 변형을 함유하는 A, C, U, 또는 G 뉴클레오티드를 나타내고, as, cs, us, 또는 gs는 각각 2'-O-메틸 3'-포스포로티오에이트 (MS) 변형을 함유하는 A, C, U, 또는 G 뉴클레오티드를 나타낸다. 구현예에서, 본 개시의 가이드 RNA는 표 2A 내지 표 2C 중 어느 하나에 나열된 HM 스캐폴드 및 스페이서 서열을 함유한다.
[표 2A] 예시적인 표적 서열
'코어'는 HBV 코어 단백질을 지칭하고; 'Pol'은 HBV 폴리머라아제 유전자를 지칭하고; 'S'는 HBV 표면 단백질을 지칭하고; 'X'는 HBV 단백질 X 유전자를 지칭한다.
[표 2B] 예시적인 표적 서열
'코어'는 HBV 코어 단백질을 지칭하고; 'Pol'은 HBV 폴리머라아제 유전자를 지칭하고; 'S'는 HBV 표면 단백질을 지칭하고; 'X'는 HBV 단백질 X 유전자를 지칭한다.
[표 2C] 예시적인 표적 서열
gRNA는 HBV 코어 단백질, HBV 폴리머라아제 유전자, HBV 표면 단백질, 또는 HBV X 단백질을 표적화할 수 있다. 구현예에서, gRNA에 의해 표적화된 서열과 연관된 PAM 서열은 제한되지 않는다. 다른 표적은 cccDNA 전사 활성에 관여하고 모든 필수 RNA에 대해 고유한 폴리아데닐화 신호[PAS]를 포함할 수 있다. PAS는 조절 요소(TATA 박스)의 역할도 수행한다. cccDNA에서 PAS를 표적으로 하는 것은 pgRNA를 포함하는 모든 바이러스 RNA 종을 불안정하게 만들고, ccc DNA 침묵을 유도할 수 있다. sgRNA는 cccDNA에서 주요 조절 영역(예를 들어, 인핸서 I, 인핸서 II, 기저 코어 프로모터, 암호 및 표준 폴리아데닐화 신호[PAS], 및 S 및 X 유전자 프로모터)을 표적화할 수 있다. gRNA는 세포(예를 들어, HEK293-lentiHBV 시스템)에서 시험되기 전에 컴퓨터 모의시험(in silico)으로 설계되고 평가될 수 있다.
구현예에서, 가이드 E1 내지 E24 중 어느 하나는 SaCas9를 포함하는 핵염기 편집기 폴리펩티드와 조합하여 사용되고/거나 NNRRT, NGG, 또는 NGA PAM 서열과 연관된 서열을 표적화한다. 구현예에서, 본원에 제공된 임의의 스페이서 서열(예를 들어, 표 2A-2C 중 임의의 것 또는 서열 목록에 나열된 것), 또는 그의 변이체를 포함하는 가이드 RNA는 본원에 제공된 임의의 염기 편집기 및/또는 핵산 프로그래밍 가능한 DNA 결합 단백질(예를 들어, BE4 또는 Cas12b)과 조합하여 사용된다.
특정 구현예에서, 본원에 제공된 융합 단백질은 융합 단백질의 염기 편집 활성을 개선시키는 하나 이상의 특징을 포함한다. 예를 들어, 본원에 제공된 임의의 융합 단백질은 뉴클레아제 활성이 감소된 Cas9 도메인을 포함할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 뉴클레아제 활성(dCas9)을 갖지 않는 Cas9 도메인, 또는 Cas9 니카아제(nCas9)로 지칭되는 이중체화[duplexed] DNA 분자의 하나의 가닥을 절단하는 Cas9 도메인을 가질 수 있다. 임의의 특정 이론에 결부되지 않고, 촉매 잔기(예를 들어, H840)의 존재는 표적화된 핵염기 반대편의 편집되지 않은(예를 들어, 메틸화되지 않은) 가닥을 절단하는 Cas9의 활성을 유지한다. 촉매 잔기의 돌연변이(예를 들어, D10에서 A10으로)는 표적화된 A 잔기를 함유하는 편집된 가닥의 절단을 방지한다. 이러한 Cas9 변이체는 gRNA-정의된 표적 서열을 기반으로 특이적 위치에서 단일 가닥 DNA 파손(nick)을 생성하고, 편집되지 않은 가닥의 복구를 야기하여, 궁극적으로 편집되지 않은 가닥상에서 핵염기 변화를 초래할 수 있다.
일부 구현예에서, HBV 유전자의 정확한 변형은 바이러스의 병독성을 감소시키고/시키거나 시험관내에서 전파하는 바이러스의 능력을 감소시킨다. 변형은 조기 종결 코돈 또는 HBV 단백질의 활성을 악화시키거나 또는 달리 감소시키는 다른 돌연변이일 수 있다. 일부 구현예에서, 변형을 위해 표적화된 HBV 유전자는 pol, X, S, pre-S1, pre-S2, 또는 프리-코어 유전자의 코어, 전사 부위 또는 이의 조합이다.
핵염기 편집기
폴리뉴클레오티드의 표적 뉴클레오티드 서열을 편집, 변형 또는 변경하는 핵염기 편집기는 본원에 기재된 방법 및 조성물에 유용하다. 본원에는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및 핵염기 편집 도메인(예를 들어, 아데노신 데아미나아제 또는 시티딘 데아미나아제)을 포함하는 핵염기 편집기가 전형적으로 기재되어 있다. 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 결합된 가이드 폴리뉴클레오티드(예를 들어, gRNA)와 함께일 때 표적 폴리뉴클레오티드 서열에 특이적으로 결합하여 편집되기를 원하는 표적 핵산 서열에 염기 편집기를 국소화할 수 있다.
폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인
폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드(예를 들어, RNA, DNA)와 결합한다. 염기 편집기의 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 그 자체로 하나 이상의 도메인(예를 들어, 하나 이상의 뉴클레아제 도메인)을 포함할 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 뉴클레아제 도메인은 엔도뉴클레아제 또는 핵산말단분해효소를 포함할 수 있다. 엔도뉴클레아제는 이중 가닥 핵산의 단일 가닥 또는 이중 가닥 핵산 분자의 두 가닥 모두를 절단할 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 뉴클레아제 도메인은 표적 폴리뉴클레오티드의 0, 1, 또는 2 개의 가닥을 절단할 수 있다.
염기 편집기 내로 혼입될 수 있는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 비제한적인 예는 CRISPR 단백질 유래 도메인, 제한 뉴클레아제, 메가뉴클레아제, TAL 뉴클레아제[TAL nuclease, TALEN], 및 아연 핑거 뉴클레아제[zinc finger nuclease, ZFN]를 포함한다. 일부 구현예에서, 염기 편집기는 결합된 가이드 핵산을 통해 핵산의 CRISPR(즉, 클러스터링된 규칙적 간격의 짧은 회문 반복부[Clustered Regularly Interspaced Short Palindromic Repeats])-매개 변형 동안 핵산 서열에 결합할 수 있는 천연 또는 변형된 단백질 또는 이의 부분을 포함하는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함한다. 이러한 단백질은 본원에서 'CRISPR 단백질'로 지칭된다. 따라서, 본원에는 CRISPR 단백질의 전부 또는 일부를 포함하는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함하는 염기 편집기(즉, 염기 편집기의 'CRISPR 단백질 유래 도메인'으로도 지칭되는 CRISPR 단백질의 전부 또는 일부를 도메인으로 포함하는 염기 편집기)가 개시된다. 염기 편집기 내로 혼입된 CRISPR 단백질 유래 도메인은 CRISPR 단백질의 야생형 또는 천연 버전과 비교하여 변형될 수 있다. 예를 들어, 아래 기재된 바와 같이 CRISPR 단백질 유래 도메인은 CRISPR 단백질의 야생형 또는 천연 버전에 비해 하나 이상의 돌연변이, 삽입, 결실, 재배열 및/또는 재조합을 포함할 수 있다.
본원에 사용될 수 있는 Cas 단백질은 클래스 1 및 클래스 2를 포함한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas9 (Csn1 또는 Csx12로도 알려짐), Cas10, Csy1 , Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, Cas12a/Cpf1, Cas12b/C2c1 (예를 들어, 서열 번호 232), Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦ, CARF, DinG, 이의 상동체, 또는 이의 변형된 버전을 포함한다. CRISPR 효소는 표적 서열 내 및/또는 표적 서열의 상보체 내와 같이 표적 서열에서 하나 또는 두 가닥의 절단을 지시할 수 있다. 예를 들어, CRISPR 효소는 표적 서열의 첫번째 또는 마지막 뉴클레오티드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 개 이상의 염기 쌍 내에서 하나 또는 두 가닥의 절단을 지시할 수 있다.
돌연변이된 CRISPR 효소가 표적 서열을 함유하는 표적 뉴클레오티드의 하나 또는 두 가닥을 절단하는 능력이 결여되도록 상응하는 야생형 효소에 대해 돌연변이된 CRISPR 효소를 암호화하는 벡터가 사용될 수 있다. Cas 단백질(예를 들어, Cas9, Cas12) 또는 Cas 도메인(예를 들어, Cas9, Cas12)은 야생형 예시적인 Cas 폴리펩티드 또는 Cas 도메인에 관해 적어도 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성 및/또는 서열 상동성을 갖는 폴리펩티드 또는 도메인을 지칭할 수있다. Cas(예를 들어, Cas9, Cas12)는 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이의 임의의 조합과 같은 아미노산 변화를 포함할 수 있는 Cas 단백질의 야생형 또는 변형된 형태를 지칭할 수 있다.
일부 구현예에서, 염기 편집기의 CRISPR 단백질 유래 도메인은 코리네박테리움 울세란스(Corynebacterium ulcerans)(NCBI Refs: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아(Corynebacterium diphtheria)(NCBI Refs: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라 (Spiroplasma syrphidicola)(NCBI Ref: NC_021284.1); 프레보텔라 인테르메디아(Prevotella intermedia)(NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨세(Spiroplasma taiwanense)(NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니에(Streptococcus iniae)(NCBI Ref: NC_021314.1); 벨리엘라 발티카(Belliella baltica)(NCBI Ref: NC_018010.1); 사이크로플렉수스 토르퀴스(Psychroflexus torquis )(NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스(Streptococcus thermophilus )(NCBI Ref: YP_820832.1); 리스테리아 이노쿠아(Listeria innocua)(NCBI Ref: NP_472073.1); 캄필로박터 제주니(Campylobacter jejuni)(NCBI Ref: YP_002344900.1); 네이세리아 메닝기티디스(Neisseria meningitidis)(NCBI Ref: YP_002342100.1), 스트렙토코쿠스 파이오게네스(Streptococcus pyogenes), 또는 스타필로코쿠스 아우레우스(Staphylococcus aureus)에서 Cas9의 전부 또는 일부를 포함할 수 있다.
Cas9 뉴클레아제 서열 및 구조는 당업자에게 잘 알려져 있다(예를 들어, 문헌["Complete genome sequence of an Ml strain of Streptococcus pyogenes. Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001)]; 문헌["CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E. et al., Nature 471:602-607(2011)]; 및 문헌["Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M.et al.,Science 337:816-821(2012)]을 참조하고, 각각의 전체 내용은 본원에 참조로 포함된다). Cas9 오솔로그(grtholog)는 에스. 파이오게네스 및 에스. 써모필루스(S. thermophilus)를 포함하나 이에 제한되지 않는 다양한 종에 기재되었다. 추가적인 적합한 Cas9 뉴클레아제 및 서열은 본 개시에 기반하여 당업자에게 명백할 것이고, 이러한 Cas9 뉴클레아제 및 서열은 문헌[Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013)RNA Biology 10:5, 726-737]에 개시된 유기체 및 유전자좌[loci]에서의 Cas9 서열을 포함하며, 이의 전체 내용은 본원에 참조로 포함된다.
고충실도[high fidelity] Cas9 도메인
본 개시의 일부 양태는 고충실도 Cas9 도메인을 제공한다. 고충실도의 Cas9 도메인은 당업자에게 잘 알려져 있고, 예를 들어, 문헌[Kleinstiver, B.P., et.al. "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects." Nature 529, 490-495 (2016)]; 및 문헌[Slaymaker, I.M., et.al. "Rationally engineered Cas9 nucleases with improved specificity." Science 351, 84-88(2015)]에 기재되었으며, 각각의 전체 내용은 본원에 참조로 포함된다. 예시적인 고충실도 Cas9 도메인은 서열 목록에서 서열 번호 233으로 제공된다. 일부 구현예에서, 고충실도 Cas9 도메인은 상응하는 야생형 Cas9 도메인에 비해, Cas9 도메인 및 DNA의 당-인산 골격[sugar-phosphate backbone] 간의 정전기적 상호작용을 감소시키는 하나 이상의 돌연변이를 포함하는 조작된 Cas9 도메인이다. DNA의 당-인산 골격과 정전기적 상호작용이 감소된 고충실도 Cas9 도메인은 적은 표적외 효과를 가질 수 있다. 일부 구현예에서, Cas9 도메인[예를 들어, 야생형 Cas9 도메인(서열 번호 197 및 200)]은 Cas9 도메인 및 DNA의 당-인산 골격 사이의 회합을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, Cas9 도메인은 Cas9 도메인 및 DNA의 당-인산 골격 사이의 회합을 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 또는 적어도 70%까지 감소시키는 하나 이상의 돌연변이를 포함한다.
일부 구현예에서, 본원에 제공된 임의의 Cas9 융합 단백질은 D10A, N497X, R661X, Q695X, 및/또는 Q926X 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하되, X는 임의의 아미노산이다. . 일부 구현예에서, 고충실도 Cas9 효소는 SpCas9(K855A), eSpCas9(1.1), SpCas9-HF1, 또는 높은 정확도의 Cas9 변이체[hyper accurate Cas9 variant, HypaCas9] 일부 구현예에서, 변형된 Cas9 eSpCas9(1.1)는 HNH/RuvC 홈 및 비표적 DNA 가닥 사이의 상호작용이 약해진 알라닌 치환을 함유하고, 가닥 분리 및 표적외 부위에서 절단을 방지한다. 유사하게, SpCas9-HF1은 DNA 인산 골격과 Cas9의 상호작용을 방해하는 알라닌 치환을 통해 표적외 편집을 낮춘다. HypaCas9는 Cas9 교정 및 표적 식별력을 증가시키는 REC3 도메인에서 돌연변이(SpCas9 N692A/M694A/Q695A/H698A)를 함유한다. 모든 세 개의 고충실도 효소는 야생형 Cas9보다 적은 표적외 편집을 생성한다.
배타성이 감소된 Cas9 도메인
전형적으로, 에스. 파이오게네스로부터의 Cas9 단백질(spCas9)과 같은 Cas9 단백질은, CRISPR 박테리아 적응 면역 시스템에서 Cas9 뉴클레아제에 의해 표적화된 DNA 서열 바로 다음에 있는 2 내지 6 개의 염기 쌍 DNA 서열인, '프로토스페이서 인접 모티프[protospacer adjacent motif, PAM]' 또는 PAM-유사 모티프가 필요하다. 특정 핵산 영역에 결합하기 위해 NGG PAM 서열의 존재가 요구되고, 여기서 'NGG'의 'N'은 아데노신(A), 티미딘(T), 또는 시토신(C)이고, G는 구아노신이다. 이는 게놈 내에서 원하는 염기를 편집하는 능력을 제한할 수 있다. 일부 구현예에서, 본원에 제공된 염기 편집 융합 단백질은 정확한 위치, 예를 들어 PAM의 상류에 있는 표적 염기를 포함하는 영역에 배치될 필요가 있을 수 있다. 예를 들어, 문헌[Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533, 420-424 (2016)]을 참조하고, 이의 전체 내용은 본원에 참조로 포함된다. PAM 서열에 결합할 수 있는 spCas9 단백질에 대한 예시적인 폴리펩티드 서열은 서열 목록에서 서열 번호 197, 201 및 234-237로 제공된다. 따라서, 일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 표준(예를 들어, NGG) PAM 서열을 함유하지 않는 뉴클레오티드 서열을 결합할 수있는 Cas9 도메인을 함유할 수 있다. 비표준 PAM 서열에 결합하는 Cas9 도메인은 당업계에 기재되었고 당업자에게 명백할 것이다. 예를 들어, 비표준 PAM 서열에 결합하는 Cas9 도메인은 문헌[Kleinstiver, B. P., et al., "Engineered CRISPR-Cas9 nucleases with altered PAM specificities" Nature 523, 481-485 (2015)]; 및 문헌[Kleinstiver, B. P., et al., "Broadening thetargeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition" Nature Biotechnology 33, 1293-1298 (2015)]에 기재되었고, 이의 전체 내용은 본원에 참조로 포함된다.
니카아제(nickase)
일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 니카아제 도메인을 포함할 수 있다. 본원에서 용어 '니카아제'는 이중체화 핵산 분자(예를 들어, DNA)에서 두 개의 가닥 중 한 개의 가닥만을 절단할 수 있는 뉴클레아제 도메인을 포함하는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 지칭한다. 일부 구현예에서, 니카아제는 하나 이상의 돌연변이를 활성 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 내로 도입함으로써 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 완전한 촉매적 활성(예를 들어, 천연) 형태에서 유래될 수 있다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인이 Cas9에서 유래된 니카아제 도메인을 포함하는 경우, Cas9-유래 니카아제 도메인은 D10A 돌연변이 및 위치 840에 히스티딘을 포함할 수 있다. 이러한 구현예에서, 잔기 H840은 촉매 활성을 유지하여 핵산 이중체의 단일 가닥을 절단할 수 있다. 또 다른 예에서, Cas9-유래 니카아제 도메인은 H840A 돌연변이를 포함할 수 있는 반면, 위치 10에서 아미노산 잔기는 D를 유지한다. 일부 구현예에서, 니카아제는 니카아제 활성에 필요하지 않은 뉴클레아제 도메인의 전부 또는 일부를 제거함으로써 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 완전한 촉매적 활성(예를 들어, 천연) 형태에서 유래될 수 있다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인이 Cas9로부터 유래된 니카아제 도메인을 포함하는 경우, Cas9-유래 니카아제 도메인은 RuvC 도메인 또는 HNH 도메인의 전부 또는 일부의 결실을 포함할 수 있다.
일부 구현예에서, 야생형 Cas9는 다음 뉴클레오티드 및/또는 아미노산 서열에 상응하거나, 또는 포함한다:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열 번호 197)(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인).
일부 구현예에서, 니카아제 도메인(예를 들어, Cas9-유래 니카아제 도메인, Cas12-유래 니카아제 도메인)을 포함하는 염기 편집기에 의해 절단되는 핵산 이중체 표적 폴리뉴클레오티드 서열의 가닥은 염기 편집기에 의해 편집되지 않는 가닥이다(즉, 염기 편집기에 의해 절단되는 가닥은 편집될 염기를 포함하는 가닥과 반대편에 있다). 다른 구현예에서, 니카아제 도메인(예를 들어, Cas9-유래 니카아제 도메인, Cas12-유래 도메인)을 포함하는 염기 편집기는 편집을 위해 표적화되는 DNA 분자의 가닥을 절단할 수 있다. 이러한 구현예에서, 비표적화된 가닥은 절단되지 않는다.
일부 구현예에서, Cas9 뉴클레아제는 불활성(예를 들어, 불활성화된) DNA 절단 도메인을 가지며, 즉, Cas9는 'nCas9' 단백질('니카아제' Cas9의 경우)로 지칭되는 니카아제이다. Cas9 니카아제는 이중체화 핵산 분자(예를 들어, 이중체화 DNA 분자)의 하나의 가닥만을 절단할 수 있는 Cas9 단백질일 수 있다. 일부 구현예에서 Cas9 니카아제는 이중체화 핵산 분자의 표적 가닥을 절단하고, 이는 Cas9 니카아제가 Cas9에 결합된 gRNA(예를 들어, sgRNA)에 염기 쌍을 이루는(상보적인) 가닥을 절단함을 의미한다. 일부 구현예에서, Cas9 니카아제는 D10A 돌연변이를 포함하고 위치 840에서 히스티딘을 갖는다. 일부 구현예에서, Cas9 니카아제는 이중체화 핵산 분자의 비표적, 비염기 편집된 가닥을 절단하며, 이는 Cas9 니카아제가 Cas9에 결합되어 있는 gRNA(예를 들어, sgRNA)에 염기 쌍을 이루지 않는 가닥을 절단함을 의미한다. 일부 구현예에서, Cas9 니카아제는 H840A 돌연변이를 포함하고 위치 10에서 아스파르트산 잔기, 또는 상응하는 돌연변이를 갖는다. 일부 구현예에서, Cas9 니카아제는 본원에 제공된 Cas9 니카아제 중 어느 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 추가적인 적합한 Cas9 니카아제는 본 개시 및 당해 분야의 지식에 기반하여 당업자에게 명백할 것이고, 본 개시의 범위 내에 있다.
예시적인 촉매적 Cas9 니카아제(nCas9)의 아미노산 서열은 다음과 같다:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열 번호 201).
Cas9 뉴클레아제는 두 개의 기능적 엔도뉴클레아제 도메인인 RuvC 및 HNH를 갖는다. Cas9는 표적 결합 시 뉴클레아제 도메인을 표적 DNA의 반대 가닥을 절단하도록 위치시키는 형태 변화를 겪는다. Cas9-매개 DNA 절단의 최종 결과는 표적 DNA 내의 이중 가닥 파손[double-strand break, DSB](PAM 서열의 상류에 있는 약 3 내지 4 개의 뉴클레오티드)이다. 그런 다음 생성된 DSB는 (1) 효율적이지만 오류가 발생하기 쉬운 비상동성 말단 연결[non-homologous end joining , NHEJ] 경로, 또는 (2) 덜 효율적이지만 고충실도 상동성 지정 복구[high-fidelity homology directed repair, HDR] 경로인 두 가지 일반적인 복구 경로 중 하나에 의해 복구된다.
비상동성 말단 연결[NHEJ] 및/또는 상동성 지정 복구[HDR]의 '효율'은 임의의 편리한 방법에 의해 계산될 수 있다. 예를 들어, 일부 구현예에서, 효율은 성공적인 HDR의 백분율 측면으로 표현될 수 있다. 예를 들어, 측량자 뉴클레아제 분석을 사용하여 절단 생산물을 생성할 수 있고 생산물 대 기질[substrate]의 비를 사용하여 백분율을 계산할 수 있다. 예를 들어, 성공적인 HDR의 결과로 새로 통합된 제한 서열을 함유하는 DNA를 직접 절단하는 측량자 뉴클레아제 효소가 사용될 수 있다. 더 많이 절단된 기질은 더 큰 HDR 퍼센트(HDR의 더 큰 효율)를 가리킨다. 실례가 되는 예시로서, HDR의 분율(백분율)은 다음 방정식 [(절단 생산물)/(기질 + 절단 생산물)][예를 들어, (b+c)/(a+b+c), 여기서 'a'는 DNA 기질의 밴드 강도이고 'b' 및 'c'는 절단 생산물임]을 사용하여 계산될 수 있다.
일부 구현예에서, 효율은 성공적인 NHEJ의 백분율 측면으로 표현될 수 있다. 예를 들어, T7 엔도뉴클레아제 I 분석을 사용하여 절단 생산물을 생성할 수 있고 생산물 대 기질의 비를 사용하여 NHEJ 백분율을 계산할 수 있다. T7 엔도뉴클레아제 I은 야생형 및 돌연변이체 DNA 가닥의 혼성화에서 발생하는 불일치 이종이중체[heteroduplex] DNA를 절단한다(NHEJ는 원래 파손 부위에서 작은 무작위 삽입 또는 결실[insertion or deletion, indel]을 생성한다). 더 많은 절단은 더 큰 NHEJ 퍼센트(NHEJ의 더 큰 효율)를 가리킨다. 실례가 되는 예시로서, NHEJ의 분율(백분율)은 다음 방정식(1-(1-(b+c)/(a+b+c))1/2)×100을 사용하여 계산할 수 있다. 여기서 'a'는 DNA 기질의 밴드 강도이고 'b' 및 'c'는 절단 생산물이다(문헌[Ran et. al., Cell. 2013 Sep. 12; 154(6):1380-9]; 및 문헌[Ran et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308)]).
NHEJ 복구 경로는 가장 활성인 복구 기전이고, DSB 부위에서 작은 뉴클레오티드 삽입 또는 결실[indel]을 빈번하게 일으킨다. NHEJ-매개 DSB 복구의 무작위성은 중요한 실용적 암시를 가지고 있는데, Cas9 및 gRNA 또는 가이드 폴리뉴클레오티드를 발현하는 세포의 집단이 돌연변이의 다양한 집합체[array]를 초래할 수 있기 때문이다. 대부분의 구현예에서, NHEJ는 표적 DNA에서 작은 인델을 일으켜 아미노산 결실, 삽입, 또는 프레임시프트 돌연변이를 초래하여 표적화된 유전자의 오픈 리딩 프레임(ORF)내에서 조기 종결 코돈을 야기한다. 이상적인 최종 결과는 표적화된 유전자 내에서 기능 상실 돌연변이[loss-of-function mutation] 이다.
NHEJ-매개 DSB 복구는 종종 유전자의 오픈 리딩 프레임을 방해하는 반면, 상동성 지정 복구[HDR]는 단일 뉴클레오티드 변화에서 형광단 또는 태그의 첨가와 같은 큰 삽입에 이르는 특이적 뉴클레오티드 변화를 생성하는 데 사용될 수 있다.
유전자 편집을 위한 HDR을 활용하기 위해, 원하는 서열을 함유하는 DNA 복구 주형[template]이 gRNA(들) 및 Cas9 또는 Cas9 니카아제를 사용하여 관심 세포 유형으로 전달될 수 있다. 복구 주형은 원하는 편집뿐만 아니라 표적의 바로 상류 및 하류에 추가적인 상동성 서열(좌측 및 우측 상동성 팔[arm]이라 함)을 함유할 수 있다. 각 상동성 팔의 길이는 도입되는 변화의 크기에 따라 달라질 수 있고, 더 큰 삽입은 더 긴 상동성 팔을 필요로 한다. 복구 주형은 단일 가닥 올리고뉴클레오티드, 이중 가닥 올리고뉴클레오티드, 또는 이중 가닥 DNA 플라스미드일 수 있다. HDR의 효율은 일반적으로 Cas9, gRNA 및 외인성 복구 주형을 발현하는 세포에서도 낮다(변형된 대립유전자의 10% 미만). HDR의 효율은 세포를 동기조정[synchronizing]함으로써 향상될 수 있는데, HDR이 세포 주기의 S 및 G2 단계 동안 발생하기 때문이다. NHEJ에 수반되는 유전자를 화학적으로 또는 유전적으로 억제하는 것은 또한 HDR 빈도를 증가시킬 수 있다.
일부 구현예에서, Cas9는 변형된 Cas9이다. 주어진 gRNA 표적화 서열은 부분적 상동성이 존재하는 게놈 전반에 걸쳐 추가적인 부위를 가질 수 있다. 이들 부위는 표적외라 불리며 gRNA를 설계할 때 고려되어야 한다. gRNA 설계를 최적화하는 것 외에도, CRISPR 특이성은 또한 Cas9에 대한 변형을 통해 증가될 수 있다. Cas9는 두 개의 뉴클레아제 도메인인 RuvC 및 HNH의 조합된 활성을 통해 이중 가닥 파손[DSB]를 생성한다. SpCas9의 D10A 돌연변이체인 Cas9 니카아제는 하나의 뉴클레아제 도메인을 유지하고 DSB 보다 DNA 닉을 생성한다. 니카아제 시스템은 또한 특이적 유전자 편집을 위해 HDR-매개 편집과 조합될 수 있다.
촉매적 사멸[dead] 뉴클레아제
또한 본원에는 촉매적 사멸(즉, 표적 폴리뉴클레오티드 서열을 절단할 수 없는) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함하는 염기 편집기가 제공된다. 본원에서 용어 '촉매적으로 사멸된' 및 '뉴클레아제 사멸된'은 핵산의 가닥을 절단할 수 없는 능력을 초래하는 하나 이상의 돌연변이 및/또는 결실을 갖는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 지칭하기 위해 상호교환적으로 사용된다. 일부 구현예에서, 촉매적으로 사멸된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 염기 편집기는 하나 이상의 뉴클레아제 도메인에서 특이적 점[point] 돌연변이의 결과로서 뉴클레아제 활성이 결여될 수 있다. 예를 들어, Cas9 도메인을 포함하는 염기 편집기의 경우, Cas9는 D10A 돌연변이 및 H840A 돌연변이 모두를 포함할 수 있다. 이러한 돌연변이는 두 뉴클레아제 도메인을 불활성화하여, 뉴클레아제 활성의 손실을 초래한다. 다른 구현예에서, 촉매적으로 사멸된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 촉매 도메인(예를 들어, RuvC1 및/또는 HNH 도메인)의 전부 또는 일부의 하나 이상의 결실을 포함할 수 있다. 추가 구현예에서, 촉매적으로 사멸된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 점 돌연변이(예를 들어, D10A 또는 H840A) 뿐만 아니라 뉴클레아제 도메인의 전부 또는 일부의 결실을 포함한다. dCas9 도메인은 당업계에 알려져 있고, 예를 들어, 문헌[Qi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152(5):1173-83]에 기재되었으며, 이의 전체 내용은 본원에 참조로 포함된다.
추가의 적합한 뉴클레아제 불활성 dCas9 도메인은 본 개시 및 당해 분야의 지식에 기반하여 당업자에게 명백할 수 있고, 본 개시의 범위 내에 있다. 이러한 추가의 예시적인 적합한 뉴클레아제 불활성 Cas9 도메인은 D10A/H840A, D10A/D839A/H840A, 및 D10A/D839A/H840A/N863A 돌연변이체 도메인을 포함하나, 이에 제한되지 않는다(예를 들어, 문헌[Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838]을 참조하고, 이의 전체 내용은 본원에 참조로 포함된다).
일부 구현예에서, dCas9는 Cas9 뉴클레아제 활성을 불활성화시키는 하나 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 상응하거나, 또는 부분적 또는 전체적으로 포함한다. 일부 구현예에서, 뉴클레아제 불활성 dCas9 도메인은 본원에 제시된 아미노산 서열의 D10X 돌연변이 및 H840X 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하되, X는 임의의 아미노산 변화이다. 일부 구현예에서, 뉴클레아제 불활성 dCas9 도메인은 본원에 제시된 아미노산 서열의 D10A 돌연변이 및 H840A 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 뉴클레아제 불활성 Cas9 도메인은 클로닝 벡터 pPlatTET-gRNA2(수탁 번호 BAV54124)에 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 변이체 Cas9 단백질은 가이드 표적 서열의 상보적 가닥을 절단할 수 있지만 이중 가닥 가이드 표적 서열의 비상보적 가닥을 절단하는 능력은 감소된다. 예를 들어, 변이체 Cas9 단백질은 RuvC 도메인의 기능을 감소시키는 돌연변이(아미노산 치환)을 가질 수 있다. 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 D10A(아미노산 위치 10에서 아스파르테이트에서 알라닌으로)를 가지 따라서 이중 가닥 가이드 표적 서열의 상보적 가닥을 절단할 수 있지만 이중 가닥 가이드 표적 서열의 비상보적 가닥을 절단하는 능력은 감소된다(따라서 변이체 Cas9 단백질이 이중 가닥 표적 핵산을 절단할 때 이중 가닥 파손(DSB) 대신에 단일 가닥 파손[single strand break, SSB]을 초래한다)(예를 들어, 문헌[Jinek et al., Science. 2012 Aug. 17; 337(6096):816-21] 참조).
일부 구현예에서, 변이체 Cas9 단백질은 이중 가닥 가이드 표적 서열의 비상보적 가닥을 절단할 수 있지만 가이드 표적 서열의 상보적 가닥을 절단하는 능력은 감소된다. 예를 들어, 변이체 Cas9 단백질은 HNH 도메인(RuvC/HNH/RuvC 도메인 모티프)의 기능을 감소시키는 돌연변이(아미노산 치환)를 가질 수 있다 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 H840A(아미노산 위치 840에서 히스티딘에서 알라닌으로) 돌연변이를 가지며 따라서 가이드 표적 서열의 비상보적 가닥을 절단할 수 있지만 가이드 표적 서열의 상보적 가닥을 절단하는 능력은 감소된다(따라서 변이체 Cas9 단백질이 이중 가닥 가이드 표적 서열을 절단할 때 DSB 대신에 SSB를 초래한다). 이러한 Cas9 단백질은 가이드 표적 서열(예를 들어, 단일 가닥 가이드 표적 서열)을 절단하는 능력이 감소되지만 가이드 표적 서열(예를 들어, 단일 가닥 가이드 표적 서열)을 결합하는 능력은 유지한다.
또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 W476A 및 W1126A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다.
또 다른 비제한적인 예로서, 일부 구현예예서, 변이체 Cas9 단백질은 P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다.
또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질 H840A, W476A, 및 W1126A, 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다. 또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 H840A, D10A, W476A, 및 W1126A, 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다. 일부 구현예에서, 변이체 Cas9는 Cas9 HNH 도메인의 위치 840에서 촉매 His 잔기를 복원하였다(A840H).
또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 H840A, P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다. 또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 D10A, H840A, P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다. 일부 구현예에서, 변이체 Cas9 단백질이 W476A 및 W1126A 돌연변이를 보유하거나 또는 변이체 Cas9 단백질이 P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유할 때, 변이체 Cas9 단백질은 PAM 서열에 효율적으로 결합하지 않는다. 따라서, 일부 이러한 구현예에서, 이러한 변이체 Cas9 단백질이 결합 방법에 사용되는 경우, 이 방법에는 PAM 서열이 필요하지 않다. 다시 말해서, 일부 구현예에서, 이러한 변이체 Cas9 단백질이 결합 방법에 사용되는 경우, 방법은 가이드 RNA를 포함할 수 있지만, 방법은 PAM 서열의 부재하에 수행될 수 있다(그리고 결합의 특이성은 따라서 가이드 RNA의 표적화 분절에 의해 제공된다). 다른 잔기가 돌연변이되어 위의 효과를 달성할 수 있다(즉, 하나 또는 다른 뉴클레아제 부분을 불활성화시킨다). 비제한적인 예로서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, 및/또는 A987은 변경(즉, 치환)될 수 있다. 또한, 알라닌 치환 이외의 돌연변이가 적합하다.
일부 구현예에서, 촉매 활성이 감소된 변이체 Cas9 단백질(예를 들어, Cas9 단백질이 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, 및/또는 a A987 돌연변이, 예를 들어, D10A, G12A, G17A, E762A, H840A, N854A, N863A, H982A, H983A, A984A, 및/또는 D986A를 가질 때), 변이체 Cas9 단백질은 가이드 RNA와 상호작용하는 능력을 유지하는 한 여전히 부위 특이적[site-specific] 방식으로 표적 DNA에 결합할 수 있다(이는 여전히 가이드 RNA에 의해 표적 DNA 서열로 가이드되기 때문이다).
일부 구현예에서, 변이체 Cas 단백질은 spCas9, spCas9-VRQR, spCas9-VRER, xCas9(sp), saCas9, saCas9-KKH, spCas9-MQKSER, spCas9-LRKIQK, 또는 spCas9-LRVSQL일 수 있다.
일부 구현예에서, Cas9 도메인은 스타필로코쿠스 아우레우스에서의 Cas9 도메인(SaCas9)이다. 일부 구현예에서, SaCas9 도메인은 뉴클레아제 활성 SaCas9, 뉴클레아제 불활성 SaCas9(SaCas9d), 또는 SaCas9 니카아제(SaCas9n)이다. 일부 구현예에서, SaCas9는 N579A 돌연변이, 또는 본원과 같이 제출된 서열 목록에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, SaCas9 도메인, SaCas9d 도메인, 또는 SaCas9n 도메인은 비표준 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SaCas9 도메인, SaCas9d 도메인, 또는 SaCas9n 도메인은 NNGRRT 또는 NNGRRV PAM 서열을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SaCas9 도메인은 E781X, N967X, 및 R1014X 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하되, X는 임의의 아미노산이다. 일부 구현예에서, SaCas9 도메인은 E781K, N967K, 및 R1014H 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 하나 이상의 상응하는 돌연변이를 포함한다. 일부 구현예에서, SaCas9 도메인은 E781K, N967K, 또는 R1014H 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 융합 단백질에 존재하는 Cas9 도메인 중 하나는 PAM 서열에 대한 요건이 없는 가이드 뉴클레오티드 서열 프로그래밍 가능한 DNA-결합 단백질 도메인으로 대체될 수 있다. 일부 구현예에서, Cas9는 SaCas9이다. SaCas9의 잔기 A579는 N579로부터 돌연변이되어 SaCas9 니카아제를 생성할 수 있다. 잔기 K781, K967, 및 H1014는 E781, N967, 및 R1014 로부터 돌연변이되어 SaKKH Cas9를 생성할 수 있다.
일부 구현예에서, 아미노산 치환 D1135M, S1136Q, G1218K, E1219F, A1322R, D1332A, R1335E, 및 T1337R(SpCas9-MQKFRAER)을 포함하고 변경된 PAM 5'-NGC-3'에 대해 특이성을 갖는 변형된 SpCas9가 사용되었다.
에스. 파이오게네스 Cas9에 대한 대안은 포유류 세포에서 절단 활성을 나타내는 Cpf1 계열에서의 RNA-가이드된 엔도뉴클레아제를 포함할 수 있다. 프레보텔라(Prevotella) 및 프란시셀라(Francisella) 1(CRISPR/Cpf1)에서의 CRISPR는 CRISPR/Cas9 시스템과 유사한 DNA-편집 기술이다. Cpf1은 클래스 II CRISPR/Cas 시스템의 RNA-가이드된 엔도뉴클레아제이다. 이 후천적 면역 기전은 프레보텔라 및 프란시셀라 박테리아에서 발견된다. Cpf1 유전자는 가이드 RNA를 사용하여 바이러스 DNA를 발견하고 절단하는 엔도뉴클레아제를 코딩하는 CRISPR 유전자좌와 연관된다. Cpf1은 Cas9보다 더 작고 더 단순한 엔도뉴클레아제로, 일부 CRISPR/Cas9 시스템 한계를 극복한다. Cas9 뉴클레아제와 달리, Cpf1-매개 DNA 절단의 결과는 짧은 3' 돌출부[overhang]가 있는 이중 가닥 파손이다. Cpf1의 시차를 둔 절단 패턴은 전통적인 제한 효소 복제와 유사한 방향성 유전자 전달의 가능성을 열 수 있고, 이는 유전자 편집의 효율을 증가시킬 수 있다. 상술된 Cas9 변이체 및 오솔로그와 마찬가지로, Cpf1은 또한 CRISPR에 의해 표적화될 수 있는 부위의 수를 SpCas9에 의해 선호되는 NGG PAM 부위가 결여되어 있는 AT-풍부 영역 또는 AT-풍부 게놈으로 확장할 수 있다. Cpf1 유전자좌는 혼합된 알파/베타 도메인, RuvC-I, 이어서 나선[helical] 영역, RuvC-II 및 아연 핑거 유사 도메인을 함유한다. Cpf1 단백질은 Cas9의 RuvC 도메인과 유사한 RuvC-유사 엔도뉴클레아제 도메인을 갖는다.
또한, Cpf1은, Cas9과 다르게, HNH 엔도뉴클레아제 도메인을 갖지 않고, Cpf1의 N-말단은 Cas9의 알파-나선 인식 로브[alpha-helical recognition lobe]를 갖지 않는다. Cpf1 CRISPR-Cas 도메인 구조는 Cpf1이 기능적으로 고유하고, 클래스 2, 유형 V CRISPR 시스템으로 분류되고 있다는 것을 나타낸다. Cpf1 유전자좌는 유형 II 시스템보다 유형 I 및 III과 더 유사한 Cas1, Cas2 및 Cas4 단백질을 암호화한다. 기능적 Cpf1은 트랜스 활성화 CRISPR RNA[trans-activating CRISPR RNA, tracrRNA]가 필요하지 않고, 따라서 CRISPR(crRNA)만이 필요하다. 이는 게놈 편집에 유리한데, Cpf1이 Cas9보다 작을뿐만 아니라, 더 작은 sgRNA 분자(Cas9만큼 많은 뉴클레오티드의 대략 절반)를 갖기 때문이다. Cpf1-crRNA 복합체는 Cas9에 의해 표적화된 G-풍부 PAM과 대조적으로 프로토스페이서 인접 모티프 5'-YTN-3' 또는 5'-TTN-3' 식별에 의해 표적 DNA 또는 RNA를 절단한다. PAM의 식별 후, Cpf1은 4 또는 5 개의 뉴클레오티드 돌출부를 가진 점착 단부 유사[sticky-end-like] DNA 이중 가닥 파손를 도입한다.
일부 구현예에서, Cas9는 변경된 PAM 서열에 대한 특이성을 갖는 Cas9 변이체이다. 일부 구현예에서, 추가 Cas9 변이체 및 PAM 서열은 문헌[Miller, S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020)]에 기재되어 있고, 이의 전체는 본원에 참조로 포함된다. 일부 구현예에서, Cas9 변이체는 특정한 PAM 요건이 없다. 일부 구현예에서, Cas9 변이체, 예를 들어, SpCas9 변이체는 NRNH PAM에 대해 특이성을 갖고, 여기서 R은 A 또는 G이고, H는 A, C 또는 T이다.일부 구현예에서 SpCas9 변이체는 PAM 서열 AAA, TAA, CAA, GAA, TAT, GAT 또는 CAC에 대한 특이성을 갖는다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1134, 1135, 1137, 1139, 1151, 1180, 1188, 1211, 1218, 1219, 1221, 1249, 1256, 1264, 1290, 1318, 1317, 1320, 1321, 1323, 1332, 1333, 1335, 1337, 또는 1339 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1135, 1218, 1219, 1221, 1249, 1320, 1321, 1323, 1332, 1333, 1335, 또는 1337 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1134, 1135, 1137, 1139, 1151, 1180, 1188, 1211, 1219, 1221, 1256, 1264, 1290, 1318, 1317, 1320, 1323, 1333 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1131, 1135, 1150, 1156, 1180, 1191, 1218, 1219, 1221, 1227, 1249, 1253, 1286, 1293, 1320, 1321, 1332, 1335, 1339 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1127, 1135, 1180, 1207, 1219, 1234, 1286, 1301, 1332, 1335, 1337, 1338, 1349 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. SpCas9 변이체의 예시적인 아미노산 치환 및 PAM 특이성은 표 3A-3D에 나타나 있다.
[표 3A] SpCas9 변이체
[표 3B]
[표 3C]
[표 3D]
일부 구현예에서, 핵산 프로그래밍 가능한 DNA 결합 단백질[nucleic acid programmable DNA binding protein, napDNAbp]은 미생물 CRISPR-Cas 시스템의 단일 효과기[single effector]이다. 미생물 CRISPR-Cas 시스템의 단일 효과기는 Cas9, Cpf1, Cas12b/C2c1, 및 Cas12c/C2c3을 포함하나 이에 제한되지 않는다. 전형적으로, 미생물 CRISPR-Cas 시스템은 클래스 1 및 클래스 2 시스템으로 나누어진다. 클래스 1 시스템은 다중 하위단위 효과기 복합체를 갖는 반면, 클래스 2 시스템은 단일 단백질 효과기를 갖는다. 예를 들어, Cas9 및 Cpf1은 클래스 2 효과기이다. Cas9 및 Cpf1 외에도, 세 개의 별도의 클래스 2 CRISPR-Cas 시스템(Cas12b/C2c1, 및 Cas12c/C2c3)이 문헌[Shmakov et. al., "Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems" Mol.Cell, 2015 Nov.5; 60(3): 385-397]에 기재되었으며, 이의 전체 내용은 본원에 참조로 포함된다. 두 개의 시스템인 Cas12b/C2c1, 및 Cas12c/C2c3의 효과기는 Cpf1과 관련된 RuvC-유사 엔도뉴클레아제 도메인을 함유한다. 제3 시스템은 두 개의 예측된 HEPN RNase 도메인을 갖는 효과기를 함유한다. 성숙 CRISPR RNA의 생산은 Cas12b/C2c1에 의한 CRISPR RNA의 생산과 달리 tracrRNA-독립적이다. Cas12b/C2c1은 DNA 절단을 위해 CRISPR RNA 및 tracrRNA 모두에 따라 달라진다.
일부 구현예에서, napDNAbp는 원형 순열[permutant](예를 들어, 서열 번호 238)이다.
알리시클로바실루스 아시도테라스트리스(Alicyclobaccillus acidoterrastris) Cas12b/C2c1(AacC2c1)의 결정 구조는 키메라 단일 분자 가이드 RNA[single-molecule guide RNA, sgRNA]와의 복합체로 보고되었다. 예를 들어, 문헌[Liu et al.., "C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism" Mol.Cell, 2017 Jan.19; 65(2):310-322]을 참조하고, 이의 전체 내용은 본원에 참조로 포함된다. 결정 구조는 또한 삼원 복합체로서 표적 DNA에 결합된 알리시클로바실루스 아시도테레스트리스( Alicyclobacillus acidoterrestris ) C2c1에서 보고되었다. 예를 들어, 문헌[Yang et al., "PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease", Cell, 2016 Dec. 15; 167(7):1814-1828]을 참조하고, 이의 전체 내용은 본원에 참조로 포함된다. 표적 및 비표적 DNA 가닥 모두를 갖는 AacC2c1의 촉매적으로 적격한 형태는 독립적으로 단일 RuvC 촉매 포켓 내에 위치하도록 포획되었으며, Cas12b/C2c1-매개 절단은 표적 DNA의 시차를 둔 7-뉴클레오티드 파손을 초래한다. Cas12b/C2c1 삼원 복합체 및 이전에 식별된 Cas9 및 Cpf1 대응물 사이의 구조적 비교는 CRISPR-Cas9 시스템에 의해 사용되는 기전의 다양성을 입증한다.
일부 구현예에서, 본원에 제공된 임의의 융합 단백질의 핵산 프로그래밍 가능한 DNA 결합 단백질[napDNAbp]은 Cas12b/C2c1, 또는 Cas12c/C2c3 단백질일 수 있다. 일부 구현예에서, napDNAbp는 Cas12b/C2c1 단백질이다. 일부 구현예에서, napDNAbp는 Cas12c/C2c3 단백질이다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12b/C2c1 또는 Cas12c/C2c3 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12b/C2c1 또는 Cas12c/C2c3 단백질이다. 일부 구현예에서, napDNAbp는 본원에 제공된 napDNAbp 서열 중 임의의 하나와 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 다른 박테리아 종에서의 Cas12b/C2c1 또는 Cas12c/C2c3 또한 본 개시에 따라 사용될 수 있음이 이해되어야 한다.
일부 구현예에서, napDNAbp는 Cas12c를 지칭한다. 일부 구현예에서, Cas12c 단백질은 Cas12c1(서열 번호 239) 또는 Cas12c1의 변이체이다. 일부 구현예에서, Cas12 단백질은 Cas12c2(서열 번호 240) 또는 Cas12c2의 변이체이다. 일부 구현예에서, Cas12 단백질은 올레이필루스 속(Oleiphilus sp.) HI0009 (즉, OspCas12c; 서열 번호 241)에서의 Cas12c 단백질 또는 OspCas12c의 변이체이다. 이들 Cas12c 분자는 문헌 [Yan et al., "Functionally Diverse Type V CRISPR-Cas Systems," Science, 2019 Jan. 4; 363: 88-91]에 기재되어 있고, 그 전체 내용은 본원에 참조로 포함된다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12c1, Cas12c2, 또는 OspCas12c 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12c1, Cas12c2, 또는 OspCas12c 단백질이다. 일부 구현예에서, napDNAbp는 본원에 기재된 임의의 Cas12c1, Cas12c2, 또는 OspCas12c 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 다른 박테리아 종에서의 Cas12c1, Cas12c2, 또는 OspCas12c는 또한 본 개시에 따라 사용될 수 있음이 이해되어야 한다.
일부 구현예에서, napDNAbp는 예를 들어, 문헌[Yan et al., "Functionally Diverse Type V CRISPR-Cas Systems," Science, 2019 Jan. 4; 363: 88-91]에 기재된 Cas12g, Cas12h, 또는 Cas12i를 지칭하고; 각각의 전체 내용은 본원에 참조로 포함된다. 예시적인 Cas12g, Cas12h, 및 Cas12i 폴리펩티드 서열은 서열 목록에서 서열 번호 242-245로 제공된다. 10 테라바이트 이상의 서열 데이터를 집계함으로써 Cas12g, Cas12h 및 Cas12i를 포함하여 이전에 특성화된 클래스 V 단백질과 약한 유사성을 나타내는 유형 V Cas 단백질의 새로운 분류가 확인되었다. 일부 구현예에서, Cas12 단백질은 Cas12g 또는 Cas12g의 변이체이다. 일부 구현예에서, Cas12 단백질은 Cas12h 또는 Cas12h의 변이체이다. 일부 구현예에서, Cas12 단백질은 Cas12i 또는 Cas12i의 변이체이다. 다른 RNA-가이드된 DNA 결합 단백질은 napDNAbp로서 사용될 수 있고, 본 개시의 범위 내에 있음이 이해되어야 한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12g, Cas12h, 또는 Cas12i 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12g, Cas12h, 또는 Cas12i 단백질이다. 일부 구현예에서, napDNAbp는 본원에 기재된 임의의 Cas12g, Cas12h, 또는 Cas12i 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 다른 박테리아 종에서의 Cas12g, Cas12h, 또는 Cas12i 또한 본 개시에 따라 사용될 수 있음이 이해되어야 한다. 일부 구현예에서, Cas12i는 Cas12i1 또는 Cas12i2이다.
일부 구현예에서, 본원에 제공된 임의의 융합 단백질의 핵산 프로그래밍 가능한 DNA 결합 단백질[napDNAbp]은 Cas12j/CasΦ 단백질일 수 있다. Cas12j/CasΦ는 문헌[Pausch et al., "CRISPR-CasΦ from huge phages is a hypercompact genome editor," Science, 17 July 2020, Vol. 369, Issue 6501, pp. 333-337]에 기재되어 있고, 그 전체는 본원에 참조로 포함된다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12j/CasΦ 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12j/CasΦ 단백질이다. 일부 구현예에서, napDNAbp는 뉴클레아제 불활성 ('사멸') Cas12j/CasΦ 단백질이다. 다른 박테리아 종에서의 Cas12j/CasΦ 또한 본 개시에 따라 사용될 수 있음이 이해되어야 한다.
내부 삽입이 있는 융합 단백질
본원에는 핵산 프로그래밍 가능한 핵산 결합 단백질, 예를 들어, napDNAbp에 융합된 이종[heterologous] 폴리펩티드를 포함하는 융합 단백질이 제공된다. 이종 폴리펩티드는 천연 또는 야생형 napDNAbp 폴리펩티드 서열에서 발견되지 않는 폴리펩티드일 수 있다. 이종 폴리펩티드는 napDNAbp의 C-말단 단부, napDNAbp의 N-말단 단부에서 napDNAbp에 융합되거나, 또는 napDNAbp의 내부 위치에 삽입될 수 있다. 일부 구현예에서, 이종 폴리펩티드는 데아미나아제(예를 들어, 아데노신 데아미나아제의 시티딘) 또는 기능적인 이의 단편이다. 예를 들어, 융합 단백질은 Cas9 또는 Cas12(예를 들어, Cas12b/C2c1), 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된[flanked] 데아미나아제를 포함할 수 있다. 일부 구현예에서, 시티딘 데아미나아제는 APOBEC(예를 들어, APOBEC1) 데아미나아제이다. 일부 구현예에서, 아데노신 데아미나아제는 TadA(예를 들어, TadA*7.10 또는 TadA*8)이다. 일부 구현예에서, TadA는 TadA*8 또는 TadA*9이다. 본원에 기재된 바와 같은 TadA 서열(예를 들어, TadA7.10 또는 TadA*8)은 상술된 융합 단백질에 적합한 데아미나아제이다.
일부 구현예에서, 융합 단백질은
NH2-[napDNAbp의 N-말단 단편]-[데아미나아제]-[napDNAbp의 C-말단 단편]-COOH;
NH2-[Cas9의 N-말단 단편]-[아데노신 데아미나아제]-[Cas9의 C-말단 단편]-COOH;
NH2-[Cas12의 N-말단 단편]-[아데노신 데아미나아제]-[Cas12의 C-말단 단편]-COOH;
NH2-[Cas9의 N-말단 단편]-[시티딘 데아미나아제]-[Cas9의 C-말단 단편]-COOH;
NH2-[Cas12의 N-말단 단편]-[시티딘 데아미나아제]-[Cas12의 C-말단 단편]-COOH;
의 구조를 포함하되, ']-['의 각 예시는 임의의 링커이다.
데아미나아제는 원형 순열 데아미나아제일 수 있다. 예를 들어, 데아미나아제는 원형 순열 아데노신 데아미나아제일 수 있다. 일부 구현예에서, 데아미나아제는 TadA 참조 서열에서 넘버링된 바와 같이 아미노산 잔기 116, 136, 또는 65에서 원형으로 순열된 원형 순열 TadA이다.
융합 단백질은 하나 초과의 데아미나아제를 포함할 수 있다. 융합 단백질은 예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 데아미나아제를 포함할 수 있다. 일부 구현예에서, 융합 단백질은 한 개 또는 두 개의 데아미나아제를 포함한다. 융합 단백질에서 두 개 이상의 데아미나아제는 아데노신 데아미나아제. 시티딘 데아미나아제, 또는 이의 조합일 수 있다. 두 개 이상의 데아미나아제는 동종이량체[homodimer] 또는 이종이량체[heterodimer]일 수 있다. 두 개 이상의 데아미나아제는 napDNAbp에서 나란히 삽입될 수 있다. 일부 구현예에서, 두 개 이상의 데아미나아제는 napDNAbp에서 나란히 있지 않을 수 있다.
일부 구현예에서, 융합 단백질에서 napDNAbp는 Cas9 폴리펩티드 또는 이의 단편이다. Cas9 폴리펩티드는 변이체 Cas9 폴리펩티드일 수 있다. 일부 구현예에서, Cas9 폴리펩티드는 Cas9 니카아제(nCas9) 폴리펩티드 또는 이의 단편이다. 일부 구현예에서, Cas9 폴리펩티드는 뉴클레아제 사멸된 Cas9(dCas9) 폴리펩티드 또는 이의 단편이다. 융합 단백질에서 Cas9 폴리펩티드는 전장[full-length] Cas9 폴리펩티드일 수 있다. 일부 경우에, 융합 단백질에서 Cas9 폴리펩티드는 전장 Cas9 폴리펩티드가 아닐 수 있다. Cas9 폴리펩티드는 자연 발생 Cas9 단백질에 비해, 예를 들어, N-말단 또는 C-말단 단부에서 절두될 수 있다. Cas9 폴리펩티드는 원형으로 치환된 Cas9 단백질일 수 있다. Cas9 폴리펩티드는 여전히 표적 폴리뉴클레오티드 및 가이드 핵산 서열에 결합할 수 있는 Cas9 폴리펩티드의 단편, 일부, 또는 도메인일 수 있다.
일부 구현예에서, Cas9 폴리펩티드는 스트렙토코쿠스 파이오게네스 Cas9(SpCas9), 스타필로코쿠스 아우레우스 Cas9(SaCas9), 스트렙토코쿠스 써모필루스 1 Cas9(St1Cas9), 또는 본원에 기재된 Cas9 폴리펩티드의 임의의 단편 또는 변이체이다.
일부 구현예에서, 융합 단백질은 Cas9 내에 삽입된 아데노신 데아미나아제 도메인 및 시티딘 데아미나아제 도메인을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 Cas9 내에서 융합되고 시티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 아데노신 데아미나아제는 Cas9 내에서 융합되고 시티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas9 내에서 융합되고 아데노신 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas9 내에서 융합되고 아데노신 데아미나아제는 N-말단에 융합된다.
아데노신 데아미나아제 및 시티딘 데아미나아제 및 Cas9를 갖는 융합 단백질의 예시적인 구조는 다음과 같이 제공된다:
NH2-[Cas9(아데노신 데아미나아제)]-[시티딘 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[Cas9(아데노신 데아미나아제)]-COOH;
NH2-[Cas9(시티딘 데아미나아제)]-[아데노신 데아미나아제]-COOH; 또는
NH2-[아데노신 데아미나아제]-[Cas9(시티딘 데아미나아제)]-COOH.
일부 구현예에서, 위 일반적인 구조에 사용되는 '-'는 임의의 링커의 존재를 가리킨다.
다양한 구현예에서, 촉매 도메인은 DNA 변형 활성(예를 들어, 데아미나아제 활성), 예컨대 아데노신 데아미나아제 활성을 갖는다. 일부 구현예에서, 아데노신 데아미나아제는 TadA(예를 들어, TadA*7.10)이다. 일부 구현예에서, TadA는 TadA*8이다. 일부 구현예에서, TadA*8은 Cas9 내에서 융합되고 시티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, TadA*8은 Cas9 내에서 융합되고 시티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas9 내에서 융합되고 TadA*8은 C-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas9 내에서 융합되고 TadA*8은 N-말단에 융합된다. TadA*8 및 시티딘 데아미나아제 및 Cas9를 갖는 융합 단백질의 예시적인 구조는 아래와 같이 제공된다:
NH2-[Cas9(TadA*8)]-[시티딘 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[Cas9(TadA*8)]-COOH;
NH2-[Cas9(시티딘 데아미나아제)]-[TadA*8]-COOH; 또는
NH2-[TadA*8]-[Cas9(시티딘 데아미나아제)]-COOH.
일부 구현예에서, 위의 일반적인 구조에 사용되는 '-'는 임의의 링커의 존재를 가리킨다.
이종 폴리펩티드(예를 들어, 데아미나아제)는 예를 들어 적합한 위치에서 napDNAbp[예를 들어, Cas9 또는Cas12(예를 들어, Cas12b/C2c1)]에 삽입될 수 있어서, napDNAbp가 표적 폴리뉴클레오티드 및 가이드 핵산에 결합하는 능력을 유지하도록 한다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 데아미나아제의 기능(예를 들어, 염기 편집 활성) 또는 napDNAbp(예를 들어, 표적 핵산 및 가이드 핵산에 결합하는 능력)를 손상시키지 않고 napDNAbp 내로 삽입될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 예를 들어, 무질서한 영역 또는 결정학[crystallographic] 연구에 의해 나타난 바와 같이 고온 인자 또는 B-인자를 포함하는 영역에서 napDNAbp에 삽입될 수 있다. 질서가 적거나, 무질서하거나, 또는 구조화되지 않은 단백질의 영역, 예를 들어 용매 노출된 영역 및 루프는 구조 또는 기능을 손상시키지 않고 삽입에 사용될 수 있다.
데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 유연한 루프 영역 또는 용매 노출된 영역에서 napDNAbp에 삽입될 수 있다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 Cas9 또는 Cas12b/C2c1 폴리펩티드의 유연한 루프에 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)의 삽입 위치는 Cas9 폴리펩티드의 결정 구조의 B-인자 분석에 의해 결정된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 평균보다 더 높은 B-인자(예를 들어, 총 단백질 또는 무질서한 영역을 포함하는 단백질 도메인과 비교하여 더 높은 B 인자)를 포함하는 Cas9 폴리펩티드의 영역에 삽입된다. B-인자 또는 온도 인자는 평균 위치에서 원자의 변동을 가리킬 수 있다(예를 들어, 온도 의존적 원자 진동 또는 결정 격자에서 정적 무질서의 결과). 골격 원자에 대한 높은 B-인자(예를 들어, 평균보다 더 높은 B-인자)는 비교적 높은 국소 이동성을 갖는 영역을 나타낼 수 있다. 이러한 영역은 구조 또는 기능을 손상시키지 않으면서 데아미나아제를 삽입하는 데 사용될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 총 단백질에 대한 평균 B-인자보다 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 또는 200% 초과인 B-인자를 갖는 Cα 원자를 갖는 잔기가 있는 위치에 삽입될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 잔기를 포함하는 Cas9 단백질 도메인에 대한 평균 B-원자보다 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 130 %, 140%, 150%, 160%, 170%, 180%, 190%, 200% 또는 200% 초과인 B-원자를 갖는 Cα 원자를 갖는 잔기가 있는 위치에 삽입될 수 있다. 평균보다 더 큰 B-원자를 포함하는 Cas9 폴리펩티드 위치는 예를 들어, 위 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 768, 792, 1052, 1015, 1022, 1026, 1029, 1067, 1040, 1054, 1068, 1246, 1247, 및 1248을 포함할 수 있다. 평균보다 더 큰 B-인자를 포함하는 Cas9 폴리펩티드 영역은 위 Cas9 참조 서열에서 넘버링된 바와 같이 예를 들어, 잔기 792-872, 792-906, 및 2-791을 포함할 수 있다.
이종 폴리펩티드(예를 들어, 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 768, 791, 792, 1015, 1016, 1022, 1023, 1026, 1029, 1040, 1052, 1054, 1067, 1068, 1069, 1246, 1247, 및 1248로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 일부 구현예에서, 이종 폴리펩티드는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 768-769, 791-792, 792-793, 1015-1016, 1022-1023, 1026-1027, 1029-1030, 1040-1041, 1052-1053, 1054-1055, 1067-1068, 1068-1069, 1247-1248, 또는 1248-1249 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종 폴리펩티드는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 769-770, 792-793, 793-794, 1016-1017, 1023-1024, 1027-1028, 1030-1031, 1041-1042, 1053-1054, 1055-1056, 1068-1069, 1069-1070, 1248-1249, 또는 1249-1250 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종 폴리펩티드는 위 Cas9 참조 서열에서 넘버링된 바와 같은 768, 791, 792, 1015, 1016, 1022, 1023, 1026, 1029, 1040, 1052, 1054, 1067, 1068, 1069, 1246, 1247, 및 1248로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체한다. 삽입 위치와 관련하여 위 Cas9 참조 서열에 대한 언급은 예시적인 목적을 위한 것임이 이해되어야 한다. 본원에 논의된 바와 같은 삽입은 위 Cas9 참조 서열의 Cas9 폴리펩티드 서열로 제한되지 않지만, 변이체 Cas9 폴리펩티드, 예를 들어 Cas9 니카아제(nCas9), 뉴클레아제 사멸된 Cas9(dCas9), 뉴클레아제 도메인이 결여되어 있는 Cas9 변이체, 절두된 Cas9, 또는 부분적 또는 완전한 HNH 도메인이 결여되어 있는 Cas9 도메인에서 상응하는 위치에 삽입을 포함한다.
이종 폴리펩티드(예를 들어, 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 768, 792, 1022, 1026, 1040, 1068, 및 1247로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 일부 구현예에서, 이종 폴리펩티드는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 768-769, 792-793, 1022-1023, 1026-1027, 1029-1030, 1040-1041, 1068-1069, 또는 1247-1248 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종 폴리펩티드는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 769-770, 793-794, 1023-1024, 1027-1028, 1030-1031, 1041-1042, 1069-1070, 또는 1248-1249 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종 폴리펩티드는 위 Cas9 참조 서열에서 넘버링된 바와 같은 768, 792, 1022, 1026, 1040, 1068, 및 1247로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체한다.
이종 폴리펩티드(예를 들어, 데아미나아제)는 본원에 기재된 바와 같은 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 일 구현예에서, 이종 폴리펩티드(예를 들어, 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1002, 1003, 1025, 1052-1056, 1242-1247, 1061-1077, 943-947, 686-691, 569-578, 530-539, 및 1060-1077로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 데아미나아제 (예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 잔기의 N-말단 또는 C-말단에 삽입되거나 또는 잔기를 대체할 수 있다. 일부 구현예에서, 데아미나아제 (예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제) 는 잔기의 C-말단에 삽입된다.
일부 구현예에서, 아데노신 데아미나아제(예를 들어, TadA)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제(예를 들어, TadA)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 792-872, 792-906, 또는 2-791, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기 대신에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군에서 선택되는 아미노산의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군에서 선택되는 아미노산의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군에서 선택되는 아미노산, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 시티딘 데아미나아제(예를 들어, APOBEC1)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1016, 1023, 1029, 1040, 1069, 및 1247로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 시티딘 데아미나아제는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1016, 1023, 1029, 1040, 1069, 및 1247로 이루어진 군에서 선택되는 아미노산의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 시티딘 데아미나아제는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1016, 1023, 1029, 1040, 1069, 및 1247로 이루어진 군에서 선택되는 아미노산의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 시티딘 데아미나아제는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1016, 1023, 1029, 1040, 1069, 및 1247로 이루어진 군에서 선택되는 아미노산, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 791 또는 아미노산 잔기 792, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 791의 N-말단 또는 아미노산 792 의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 791의 C-말단 또는 아미노산 792의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 791, 또는 아미노산 792, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제) 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022, 또는 아미노산 잔기 1023, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022의 N-말단 또는 아미노산 잔기 1023의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022의 C-말단 또는 아미노산 잔기 1023의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022, 또는 아미노산 잔기 1023, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026, 또는 아미노산 잔기 1029, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026의 N-말단 또는 아미노산 잔기 1029의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026의 C-말단 또는 아미노산 잔기 1029의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026, 또는 아미노산 잔기 1029, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052, 또는 아미노산 잔기 1054, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052의 N-말단 또는 아미노산 잔기 1054의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052의 C-말단 또는 아미노산 잔기 1054의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052, 또는 아미노산 잔기 1054, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1067, 또는 아미노산 잔기 1068, 또는 아미노산 잔기 1069, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1067의 N-말단 또는 아미노산 잔기 1068의 N-말단 또는 아미노산 잔기 1069의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1067의 C-말단 또는 아미노산 잔기 1068의 C-말단 또는 아미노산 잔기 1069의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1067, 또는 아미노산 잔기 1068, 또는 아미노산 잔 기 1069, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1246, 또는 아미노산 잔기 1247, 또는 아미노산 잔기 1248, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1246의 N-말단 또는 아미노산 잔기 1247의 N-말단 또는 아미노산 잔기 1248의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1246의 C-말단, 또는 아미노산 잔기 1247의 C-말단, 또는 아미노산 잔기 1248의 C-말단, 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1246, 또는 아미노산 잔기 1247, 또는 아미노산 잔기 1248, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 이종 폴리펩티드(예를 들어, 데아미나아제)는 Cas9 폴리펩티드의 유연한 루프에 삽입된다. 유연한 루프 부분은 위 Cas9 참조 서열에서 넘버링된 바와 같은 530-537, 569-570, 686-691, 943-947, 1002-1025, 1052-1077, 1232-1247, 또는 1298-1300, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기로 이루어진 군에서 선택될 수 있다. 유연한 루프 부분은 위 Cas9 참조 서열에서 넘버링된 바와 같은 1-529, 538-568, 580-685, 692-942, 948-1001, 1026-1051, 1078-1231, 또는 1248-1297, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기로 이루어진 군에서 선택될 수 있다.
이종 폴리펩티드(예를 들어, 아데닌 데아미나아제)는 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기: 1017-1069, 1242-1247, 1052-1056, 1060-1077, 1002-1003, 943-947, 530-537, 568-579, 686-691, 1242-1247, 1298-1300, 1066-1077, 1052-1056, 또는 1060-1077, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응하는 Cas9 폴리펩티드 영역 내로 삽입될 수 있다.
이종 폴리펩티드(예를 들어, 아데닌 데아미나아제)는 Cas9 폴리펩티드의 결실된 영역 대신에 삽입될 수 있다. 결실된 영역은 Cas9 폴리펩티드의 N-말단 또는 C-말단 부분에 상응할 수 있다. 일부 구현예에서, 결실된 영역은 위 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 792-872, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응한다. 일부 구현예에서, 결실된 영역은 위 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 792-906, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응한다. 일부 구현예에서, 결실된 영역은 위 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 2-791, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응한다. 일부 구현예에서, 결실된 영역은 위 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 1017-1069, 또는 이의 상응하는 아미노산 잔기에 상응한다.
예시적인 내부 융합 염기 편집기는 아래 표 4에 제공된다:
[표 4] Cas9 단백질의 삽입 유전자좌
이종 폴리펩티드(예를 들어, 데아미나아제)는 Cas9 폴리펩티드의 구조적 또는 기능적 도메인 내에 삽입될 수 있다. 이종 폴리펩티드(예를 들어, 데아미나아제)는 Cas9 폴리펩티드의 두 개의 구조적 또는 기능적 도메인 사이에 삽입될 수 있다. 이종 폴리펩티드(예를 들어, 데아미나아제)는 예를 들어, Cas9 폴리펩티드에서 도메인을 결실시킨 후, Cas9 폴리펩티드의 구조적 또는 기능적 도메인 대신에 삽입될 수 있다. Cas9 폴리펩티드의 구조적 또는 기능적 도메인은 예를 들어, RuvC I, RuvC II, RuvC III, Rec1, Rec2, PI, 또는 HNH를 포함할 수 있다.
일부 구현예에서, Cas9 폴리펩티드는 RuvC I, RuvC II, RuvC III, Rec1, Rec2, PI, 또는 HNH 도메인으로 이루어진 군에서 선택되는 하나 이상의 도메인이 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 뉴클레아제 도메인이 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 HNH 도메인이 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 Cas9 폴리펩티드가 HNH 활성을 감소시키거나 또는 폐지하도록 HNH 도메인의 일부가 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 뉴클레아제 도메인의 결실을 포함하고, 데아미나아제는 뉴클레아제 도메인을 대체하기 위해 삽입된다. 일부 구현예에서, HNH 도메인은 결실되고 데아미나아제가 그 자리에 삽입된다. 일부 구현예에서, RuvC 도메인 중 하나 이상은 결실되고 데아미나아제가 그 자리에 삽입된다.
이종 폴리펩티드를 포함하는 융합 단백질은 napDNAbp의 N-말단 및 C-말단 단편에 의해 플랭킹될 수 있다. 일부 구현예에서, 융합 단백질은 Cas9 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 데아미나아제를 포함한다. N-말단 단편 또는 C-말단 단편은 표적 폴리뉴클레오티드 서열에 결합할 수 있다. N-말단 단편의 C-말단 또는 C-말단 단편의 N-말단은 Cas9 폴리펩티드의 유연한 루프의 일부를 포함할 수 있다. N-말단 단편의 C-말단 또는 C-말단 단편의 N-말단은 Cas9 폴리펩티드의 알파-나선 구조의 일부를 포함할 수 있다. N-말단 단편 또는 C-말단 단편은 DNA 결합 도메인을 포함할 수 있다. N-말단 단편 또는 C-말단 단편은 RuvC 도메인을 포함할 수 있다. N-말단 단편 또는 C-말단 단편은 HNH 도메인을 포함할 수 있다. 일부 구현예에서, N-말단 단편 및 C-말단 단편 중 어느 것도 HNH 도메인을 포함하지 않는다.
일부 구현예에서, N-말단 Cas9 단편의 C-말단은 융합 단백질이 표적 핵염기를 탈아미노화하는 경우 표적 핵염기에 근접한 아미노산을 포함한다. 일부 구현예에서, C-말단 Cas9 단편의 N-말단은 융합 단백질이 표적 핵염기를 탈아미노화하는 경우 표적 핵염기에 근접한 아미노산을 포함한다. 상이한 데아미나아제의 삽입 위치는 표적 핵염기 및 N-말단 Cas9 단편의 C-말단 또는 C-말단 Cas9 단편의 N-말단에서의 아미노산 사이에 근접성을 갖기 위해 상이할 수 있다. 예를 들어, 데아미나아제의 삽입 위치는 위 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군에서 선택되는 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 있을 수 있다.
융합 단백질의 N-말단 Cas9 단편(즉, 융합 단백질에서 데아미나아제를 플랭킹하는 N-말단 Cas9 단편)은 Cas9 폴리펩티드의 N-말단을 포함할 수 있다. 융합 단백질의 N-말단 Cas9 단편은 적어도 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 또는 1300 개 아미노산의 길이를 포함할 수 있다. 융합 단백질의 N-말단 Cas9 단편은 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기: 1-56, 1-95, 1-200, 1-300, 1-400, 1-500, 1-600, 1-700, 1-718, 1-765, 1-780, 1-906, 1-918, 또는 1-1100, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응하는 서열을 포함할 수 있다. N-말단 Cas9 단편은 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기: 1-56, 1-95, 1-200, 1-300, 1-400, 1-500, 1-600, 1-700, 1-718, 1-765, 1-780, 1-906, 1-918, 또는 1-1100, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 서열 동일성을 포함하는 서열을 포함할 수 있다.
융합 단백질의 C-말단 Cas9 단편(즉, 융합 단백질에서 데아미나아제를 플랭킹하는 C-말단 Cas9 단편)은 Cas9 폴리펩티드의 C-말단을 포함할 수 있다. 융합 단백질의 C-말단 Cas9 단편은 적어도 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 또는 1300 개 아미노산의 길이를 포함할 수 있다. 융합 단백질의 C-말단 Cas9 단편은 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기: 1099-1368, 918-1368, 906-1368, 780-1368, 765-1368, 718-1368, 94-1368, 또는 56-1368, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응하는 서열을 포함할 수 있다. N-말단 Cas9 단편은 위 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기: 1099-1368, 918-1368, 906-1368, 780-1368, 765-1368, 718-1368, 94-1368, 또는 56-1368, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도99.5% 서열 동일성을 포함하는 서열을 포함할 수 있다.
함께 취해진 융합 단백질의 N-말단 Cas9 단편 및 C-말단 Cas9 단편은 예를 들어, 위 Cas9 참조 서열에 제시된 바와 같은 전장 자연 발생 Cas9 폴리펩티드 서열에 상응하지 않을 수 있다.
본원에 기재된 융합 단백질은 감소된 게놈 와이드 허위 탈아미노화[spurious deamination]와 같은, 비표적 부위(예를 들어, 표적외 부위)에서 감소된 탈아미노화로 표적이 된 탈아미노화에 영향을 미칠 수 있다. 본원에 기재된 융합 단백질은 비표적 부위에서 감소된 방관자 탈아미노화로 표적이 된 탈아미노화에 영향을 미칠 수 있다. 원하지 않는 탈아미노화 또는 표적외 탈아미노화는 예를 들어, Cas9 폴리펩티드의 N-말단 또는 C-말단에 융합된 데아미나아제를 포함하는 단부 말단 융합 단백질과 비교하여 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 적어도 99%까지 감소될 수 있다. 원하지 않는 탈아미노화 또는 표적외 탈아미노화는 예를 들어, Cas9 폴리펩티드의 N-말단 또는 C-말단에 융합된 데아미나아제를 포함하는 단부 말단 융합 단백질과 비교하여, 적어도 1 배, 적어도 2 배, 적어도 3 배, 적어도 4 배, 적어도 5 배, 적어도 10 배, 적어도 15 배, 적어도 20 배, 적어도 30 배, 적어도 40 배, 적어도 50 배, 적어도 60 배, 적어도 70 배, 적어도 80 배, 적어도 90 배, 또는 적어도 100 배까지 감소될 수 있다.
일부 구현예에서, 융합 단백질의 데아미나아제(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)는 R-루프의 범위 내에서 두 개 이하의 핵염기를 탈아미노화한다. 일부 구현예에서, 융합 단백질의 데아미나아제는 R-루프의 범위 내에서 세 개 이하의 핵염기를 탈아미노화한다. 일부 구현예에서, 융합 단백질의 데아미나아제는 R-루프의 범위 내에서 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 이하의 핵염기를 탈아미노화한다. R-루프는 DNA:RNA 하이브리드, DNA:DNA 또는 RNA: RNA 상보적 구조를 포함하는 세 가닥 핵산 구조이며 단일 가닥 DNA와 회합된다. 본원에 사용된 바와 같이, R-루프는 표적 폴리뉴클레오티드가 CRISPR 복합체 또는 염기 편집 복합체와 접촉될 때 형성될 수 있되, 가이드 폴리뉴클레오티드의 일부, 예를 들어 가이드 RNA는 표적 폴리뉴클레오티드, 예를 들어, 표적 DNA의 일부와 혼성화하고 대체한다. 일부 구현예에서, R-루프는 스페이서 서열 및 표적 DNA 상보적 서열의 혼성화된 영역을 포함한다. R-루프 영역은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 개의 핵염기 쌍 길이일 수 있다. 일부 구현예에서, R-루프 영역은 약 20 개의 핵염기 쌍 길이이다. 본원에 사용된 바와 같이, R-루프 영역은 가이드 폴리뉴클레오티드와 혼성화하는 표적 DNA 가닥으로 제한되지 않음이 이해되어야 한다. 예를 들어, R-루프 영역 내에서 표적 핵염기의 편집은 가이드 RNA에 대한 상보적 가닥을 포함하는 DNA 가닥에 대한 것일 수 있거나, 가이드 RNA에 상보적인 가닥의 반대 가닥인 DNA 가닥에 대한 것일 수 있다. 일부 구현예에서, R-루프의 영역에서 편집은 표적 DNA 서열에서 비상보적 가닥(프로토스페이서 가닥)상의 핵염기를 가이드 RNA로 편집하는 것을 포함한다.
본원에 기재된 융합 단백질은 표준 염기 편집과 상이한 편집 창에서 표적 탈아미노화에 영향을 미칠 수 있다. 일부 구현예에서, 표적 핵염기는 표적 폴리뉴클레오티드 서열에서 PAM 서열의 상류에 있는 약 1 내지 약 20 개의 염기이다. 일부 구현예에서, 표적 핵염기는 표적 폴리뉴클레오티드 서열에서 PAM 서열의 상류에 있는 약 2 내지 약 12 개의 염기이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있거나 떨어져 있는 약 1 내지 9 개의 염기 쌍, 약 2 내지 10 개의 염기 쌍, 약 3 내지 11 개의 염기 쌍, 약 4 내지 12 개의 염기 쌍, 약 5 내지 13 개의 염기 쌍, 약 6 내지 14 개의 염기 쌍, 약 7 내지 15 개의 염기 쌍, 약 8 내지 16 개의 염기 쌍, 약 9 내지 17 개의 염기 쌍, 약 10 내지 18 개의 염기 쌍, 약 11 내지 19 개의 염기 쌍, 약 12 내지 20 개의 염기 쌍, 약 1 내지 7 개의 염기 쌍, 약 2 내지 8 개의 염기 쌍, 약 3 내지 9 개의 염기 쌍, 약 4 내지 10 개의 염기 쌍, 약 5 내지 11 개의 염기 쌍, 약 6 내지 12 개의 염기 쌍, 약 7 내지 13 개의 염기 쌍, 약 8 내지 14 개의 염기 쌍, 약 9 내지 15 개의 염기 쌍, 약 10 내지 16 개의 염기 쌍, 약 11 내지 17 개의 염기 쌍, 약 12 내지 18 개의 염기 쌍, 약 13 내지 19 개의 염기 쌍, 약 14 내지 20 개의 염기 쌍, 약 1 내지 5 개의 염기 쌍, 약 2 내지 6 개의 염기 쌍, 약 3 내지 7 개의 염기 쌍, 약 4 내지 8 개의 염기 쌍, 약 5 내지 9 개의 염기 쌍, 약 6 내지 10 개의 염기 쌍, 약 7 내지 11 개의 염기 쌍, 약 8 내지 12 개의 염기 쌍, 약 9 내지 13 개의 염기 쌍, 약 10 내지 14 개의 염기 쌍, 약 11 내지 15 개의 염기 쌍, 약 12 내지 16 개의 염기 쌍, 약 13 내지 17 개의 염기 쌍, 약 14 내지 18 개의 염기 쌍, 약 15 내지 19 개의 염기 쌍, 약 16 내지 20 개의 염기 쌍, 약 1 내지 3 개의 염기 쌍, 약 2 내지 4 개의 염기 쌍, 약 3 내지 5 개의 염기 쌍, 약 4 내지 6 개의 염기 쌍, 약 5 내지 7 개의 염기 쌍, 약 6 내지 8 개의 염기 쌍, 약 7 내지 9 개의 염기 쌍, 약 8 내지 10 개의 염기 쌍, 약 9 내지 11 개의 염기 쌍, 약 10 내지 12 개의 염기 쌍, 약 11 내지 13 개의 염기 쌍, 약 12 내지 14 개의 염기 쌍, 약 13 내지 15 개의 염기 쌍, 약 14 내지 16 개의 염기 쌍, 약 15 내지 17 개의 염기 쌍, 약 16 내지 18 개의 염기 쌍, 약 17 내지 19 개의 염기 쌍, 약 18 내지 20 개의 염기 쌍이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있거나 또는 떨어져 있는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 개 이상의 염기 쌍이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있는 약 1, 2, 3, 4, 5, 6, 7, 8, 또는 9 개의 염기 쌍이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있는 약 2, 3, 4, 또는 6 개의 염기 쌍이다.
융합 단백질은 하나 초과의 이종 폴리펩티드를 포함할 수 있다. 예를 들어, 융합 단백질은 하나 이상의 UGI 도메인 및/또는 하나 이상의 핵 국소화 신호를 추가로 포함할 수 있다. 두 개 이상의 이종 도메인은 나란히 삽입될 수 있다. 두 개 이상의 이종 도메인은 NapDNAbp에서 나란히 있지 않도록 하는 위치에 삽입될 수 있다.
융합 단백질은 데아미나아제 및 napDNAbp 폴리펩티드 사이에 링커를 포함할 수 있다. 링커는 펩티드 또는 비펩티드 링커일 수 있다. 예를 들어, 링커는 XTEN, (GGGS)n(서열 번호 246), (GGGGS)n(서열 번호 247), (G)n, (EAAAK)n(서열 번호 248), (GGS)n, SGSETPGTSESATPES(서열 번호 249)일 수 있다. 일부 구현예에서, 융합 단백질은 N-말단 Cas9 단편 및 데아미나아제 사이에 링커를 포함한다. 일부 구현예에서, 융합 단백질은 C-말단 Cas9 단편 및 데아미나아제 사이에 링커를 포함한다. 일부 구현예에서, napDNAbp의 N-말단 및 C-말단 단편은 링커를 사용하여 데아미나아제에 연결된다. 일부 구현예에서, N-말단 및 C-말단 단편은 링커 없이 데아미나아제 도메인에 연결된다. 일부 구현예에서, 융합 단백질은 N-말단 Cas9 단편 및 데아미나아제 사이에 링커를 포함하지만, C-말단 Cas9 단편 및 데아미나아제 사이에 링커를 포함하지 않는다. 일부 구현예에서, 융합 단백질은 C-말단 Cas9 단편 및 데아미나아제 사이에 링커를 포함하지만, N-말단 Cas9 단편 및 데아미나아제 사이에 링커를 포함하지 않는다.
일부 구현예에서, 융합 단백질에서 napDNAbp는 Cas12 폴리펩티드, 예를들어, Cas12b/C2c1, 또는 이의 단편이다. Cas12 폴리펩티드는 변이체 Cas12 폴리펩티드일 수 있다. 다른 구현예에서, Cas12 폴리펩티드의 N- 또는 C-말단 단편은 핵산 프로그래밍 가능한 DNA 결합 도메인 또는 RuvC 도메인을 포함한다. 다른 구현예에서, 융합 단백질은 Cas12 폴리펩티드 및 촉매 도메인 사이에 링커를 함유한다. 다른 구현예에서, 링커의 아미노산 서열은 GGSGGS(서열 번호 250) 또는 GSSGSETPGTSESATPESSG(서열 번호 251)이다. 다른 구현예에서, 링커는 강성[rigid] 링커이다. 위 양태의 다른 구현예에서, 링커는 GGAGGCTCTGGAGGAAGC(서열 번호 252) 또는 GGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGC(서열 번호 253)에 의해 암호화된다.
Cas12 폴리펩티드의 N- 및 C-말단 단편에 의해 플랭킹된 이종 촉매 도메인을 포함하는 융합 단백질은 또한 본원에 기재된 바와 같은 방법에서 염기 편집에 유용하다. Cas12 및 하나 이상의 데아미나아제 도메인, 예를 들어, 아데노신 데아미나아제를 포함하거나, 또는 Cas12 서열에 의해 플랭킹된 아데노신 데아미나아제 도메인을 포함하는 융합 단백질은 또한 표적 서열의 고도로 특이적이고 효율적인 염기 편집에 유용하다. 일 구현예에서, 키메라 Cas12 융합 단백질은 Cas12 폴리펩티드 내에 삽입된 이종 촉매 도메인(예를 들어, 아데노신 데아미나아제, 시티딘 데아미나아제, 또는 아데노신 데아미나아제 및 시티딘 데아미나아제)을 함유한다. 일부 구현예에서, 융합 단백질은 Cas12 내에 삽입된 아데노신 데아미나아제 도메인 및 시티딘 데아미나아제 도메인을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 Cas12 내에서 융합되고 시티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 아데노신 데아미나아제는 Cas12 내에서 융합되고 시티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas12 내에서 융합되고 아데노신 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas12 내에서 융합되고 아데노신 데아미나아제는 N-말단에 융합된다. 아데노신 데아미나아제 및 시티딘 데아미나아제 및 Cas12를 갖는 융합 단백질의 예시적인 구조는 다음과 같이 제공된다:
NH2-[Cas12(아데노신 데아미나아제)]-[시티딘 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[Cas12(아데노신 데아미나아제)]-COOH;
NH2-[Cas12(시티딘 데아미나아제)]-[아데노신 데아미나아제]-COOH; 또는
NH2-[아데노신 데아미나아제]-[Cas12(시티딘 데아미나아제)]-COOH;
일부 구현예에서, 위 일반적인 구조에 사용되는 '-'는 임의의 링커의 존재를 가리킨다.
다양한 구현예에서, 촉매 도메인은 DNA 변형 활성(예를 들어, 데아미나아제 활성), 예컨대 아데노신 데아미나아제 활성을 갖는다. 일부 구현예에서, 아데노신 데아미나아제는 TadA(예를 들어, TadA*7.10)이다. 일부 구현예에서, TadA는 TadA*8이다. 일부 구현예에서, TadA*8은 Cas12 내에서 융합되고 시티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, TadA*8은 Cas12 내에서 융합되고 시티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas12 내에서 융합되고 TadA*8은 C-말단에 융합된다. 일부 구현예에서, 시티딘 데아미나아제는 Cas12 내에서 융합되고 TadA*8은 N-말단에 융합된다. TadA*8 및 시티딘 데아미나아제 및 Cas12가 있는 융합 단백질의 예시적인 구조는 다음과 같이 제공된다:
N-[Cas12(TadA*8)]-[시티딘 데아미나제]-C;
N-[시티딘 데아미나아제]-[Cas12(TadA*8)]-C;
N-[Cas12(시티딘 데아미나아제)]-[TadA*8]-C; 또는
N-[TadA*8]-[Cas12(시티딘 데아미나아제)]-C.
일부 구현예에서, 위 일반적인 구조에 사용되는 '-'는 임의의 링커의 존재를 가리킨다.
다른 구현예에서, 융합 단백질은 하나 이상의 촉매 도메인을 함유한다. 다른 구현예에서, 하나 이상의 촉매 도메인 중 적어도 하나는 Cas12 폴리펩티드 내에 삽입되거나 또는 Cas12 N-말단 또는 C-말단에서 융합된다. 다른 구현예에서, 하나 이상의 촉매 도메인 중 적어도 하나는 Cas12 폴리펩티드의 루프, 알파 나선 영역, 비구조화 부분, 또는 용매 허용 가능한 부분 내에 삽입된다. 다른 구현예에서, Cas12 폴리펩티드는 Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i, 또는 Cas12j/CasΦ이다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이(Bacillus hisashii) Cas12b, 바실루스 써모아밀로보란스(Bacillus thermoamylovorans ) Cas12b, 바실루스 속(Bacillus sp.) 알리시클로바실루스 아시디필루스(Alicyclobacillus acidiphilus) Cas12b(서열 번호 254)에 대해 적어도 약 85%의 아미노산 서열 동일성을 가진다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이 Cas12b(서열 번호 255), 바실루스 써모아밀로보란스 Cas12b, 바실루스 속 V3-13 Cas12b, 또는 알리시클로바실루스 아시디필루스 Cas12b에 대해 적어도 약 90%의 아미노산 서열 동일성을 가진다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이 Cas12b, 바실루스 써모아밀로보란스 Cas12b(서열 번호 256), 바실루스 속 V3-13 Cas12b(서열 번호 257), 또는 알리시클로바실루스 아시디필루스 Cas12b에 대해 적어도 약 95%의 아미노산 서열 동일성을 가진다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이 Cas12b, 바실루스 써모아밀로보란스 Cas12b, 바실루스 속 V3-13 Cas12b, 또는 알리시클로바실루스 아시디필루스 Cas12b의 단편을 함유하거나 필수적으로 구성된다. 구현예에서, Cas12 폴리펩티드는 BvCas12b (V4)를 함유하고, 이는 일부 구현예에서 5' mRNA Cap---5' UTR---bhCas12b---종결 서열 --- 3' UTR --- 120polyA 꼬리(서열 번호 258-260)로 표현된다.
다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 위치 153-154, 255-256, 306-307, 980-981, 1019-1020, 534-535, 604-605, 또는 344-345 또는 Cas12a, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i, 또는 Cas12j/CasΦ의 상응하는 아미노산 잔기 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 P153 및 S154 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 K255 및 E256 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 D980 및 G981 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 K1019 및 L1020 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 F534 및 P535 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 K604 및 G605 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 H344 및 F345 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 위치 147 및 148, 248 및 249, 299 및 300, 991 및 992, 또는 1031 및 1032 또는 Cas12a, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i, 또는 Cas12j/CasΦ의 상응하는 잔기 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 P147 및 D148 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 G248 및 G249 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 P299 및 E300 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 G991 및 E992 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 K1031 및 M1032 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 위치 157 및 158, 258 및 259, 310 및 311, 1008 및 1009, 또는 1044 및 1045 또는 Cas12a, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i, 또는Cas12j/CasΦ의 상응하는 아미노산 잔기 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 P157 및 G158 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 V258 및 G259 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 D310 및 P311 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 G1008 및 E1009 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 G1044 및 K1045 사이에 삽입된다.
다른 구현예에서, 융합 단백질은 핵 국소화 신호(예를 들어, 이분핵[bipartite nuclear] 국소화 신호)를 함유한다. 다른 구현예에서, 핵 국소화 신호의 아미노산 서열은 MAPKKKRKVGIHGVPAA(서열 번호 261)이다. 위 양태의 다른 구현예에서, 핵 국소화 신호는 서열
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC(서열 번호 262) 에 의해 암호화된다. 다른 구현예에서, Cas12b 폴리펩티드는 RuvC 도메인의 촉매 활성을 침묵시키는 돌연변이를 함유한다. 다른 구현예에서, Cas12b 폴리펩티드는 D574A, D829A 및/또는 D952A 돌연변이를 함유한다. 다른 구현예에서, 융합 단백질은 태그(예를 들어,인플루엔자 헤마글루티닌 태그)를 더 함유한다.
일부 구현예에서, 융합 단백질은 내부로 융합된 핵염기 편집 도메인(예를 들어, 데아미나아제 도메인, 예를 들어, 아데노신 데아미나아제 도메인의 전부 또는 일부)을 갖는 napDNAbp 도메인(예를 들어, Cas12-유래 도메인)을 포함한다. 일부 구현예에서, napDNAbp는 Cas12b이다. 일부 구현예에서, 염기 편집기는 아래 표 5에 제공된 유전자좌에 삽입된 내부로 융합된 TadA*8 도메인을 갖는 BhCas12b 도메인을 포함한다.
[표 5] Cas12b 단백질의 삽입 유전자좌
비제한적인 예로서, 아데노신 데아미나아제(예를 들어, TadA*8.13)는 BhCas12b 내로 삽입되어 핵산 서열을 효과적으로 편집하는 융합 단백질(예를 들어, TadA*8.13-BhCas12b)을 생성할 수 있다.
일부 구현예에서, 본원에 기재된 염기 편집 시스템은 Cas9 내로 삽입된 TadA를 갖는 ABE이다. Cas9에 삽입된 TadA를 갖는 관련 ABE의 폴리펩티드 서열은 첨부된 서열 목록에 서열 번호 263-308로 제공된다.
일부 구현예에서, TadA 또는 이의 변이체를 식별된 위치에서 Cas9 폴리펩티드 내로 삽입하기 위한 아데노신 데아미나아제 염기 편집기가 생성되었다.
예시적이지만, 비제한적인 융합 단백질은 국제 PCT 출원 PCT/US2020/016285 및 미국 가출원 제62/852,228호 및 제62/852,224호에 기재되어 있고, 이들의 내용은 그 전체가 본원에 참조로 포함된다.
A에서 G로의 편집
일부 구현예에서, 본원에 기재된 염기 편집기는 아데노신 데아미나아제 도메인을 포함한다. 염기 편집기의 이러한 아데노신 데아미나아제 도메인은 A를 탈아미노화하여 G의 염기 쌍 결합 특성을 나타내는 이노신(I)을 형성함으로써 아데닌(A) 핵염기의 구아닌(G) 핵염기로의 편집을 용이하게 할 수 있다. 아데노신 데아미나아제는 데옥시리보핵산[DNA]에서 데옥시아데노신 잔기의 아데닌을 탈아미노화(즉, 아민기를 제거)할 수 있다. 일부 구현예에서, A에서 G로의 염기 편집기는 이노신 염기 절제 복구의 억제제, 예를 들어, 우라실 글리코실라제 억제제[UGI] 도메인 또는 촉매적으로 불활성 이노신 특이적 뉴클레아제를 추가로 포함한다. 임의의 특정 이론에 결부되지 않고, UGI 도메인 또는 촉매적으로 불활성 이노신 특이적 뉴클레아제는 탈아미노화된 아데노신 잔기(예를 들어, 이노신)의 염기 절제 복구를 억제하거나 또는 방지할 수 있고, 이는 염기 편집기의 활성 또는 효율을 개선시킬 수 있다.
아데노신 데아미나아제를 포함하는 염기 편집기는 DNA, RNA 및 DNA-RNA 하이브리드를 포함한 임의의 폴리뉴클레오티드에서 작용할 수 있다. 특정 구현예에서, 아데노신 데아미나아제를 포함하는 염기 편집기는 RNA를 포함하는 폴리뉴클레오티드의 표적 A를 탈아미노화할 수 있다. 예를 들어, 염기 편집기는 RNA 폴리뉴클레오티드 및/또는 DNA-RNA 하이브리드 폴리뉴클레오티드의 표적 A를 탈아미노화할 수 있는 아데노신 데아미나아제 도메인을 포함할 수 있다. 일 구현예에서, 염기 편집기 내로 혼입된 아데노신 데아미나아제는 RNA에서 작용하는 아데노신 데아미나아제[adenosine deaminase acting on RNA, ADAR](예를 들어, ADAR1 또는 ADAR2) 또는 tRNA(ADAT)의 전부 또는 일부를 포함한다. 아데노신 데아미나아제 도메인을 포함하는 염기 편집기는 또한 DNA 폴리뉴클레오티드의 A 핵염기를 탈아미노화할 수 있다. 일 구현예에서 염기 편집기의 아데노신 데아미나아제 도메인은 ADAT가 DNA에서 표적 A를 탈아미노화하도록 허용하는 하나 이상의 돌연변이를 포함하는 ADAT의 전부 또는 일부를 포함한다. 예를 들어, 염기 편집기는 다음 돌연변이 중 하나 이상: D108N, A106V, D147Y, E155V, L84F, H123Y, I156F, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하는 에세리키아 콜라이(Escherichia coli)에서의 ADAT(EcTadA)의 전부 또는 일부를 포함할 수 있다. 예시적인 ADAT 동족체 폴리펩티드 서열은 서열 목록에서 서열 번호 1 및 309-315로 제공된다.
아데노신 데아미나아제는 임의의 적합한 유기체(예를 들어, 대장균[E.Coli])에서 유래될수 있다. 일부 구현예에서, 아데노신 데아미나아제는 원핵생물에서 유래된다. 일부 구현예에서, 아데노신 데아미나아제는 박테리아에서 유래된다. 일부 구현예에서, 아데노신 데아미나아제는 에세리키아 콜라이, 스타필로코쿠스 아우레우스, 살모넬라 티피(Salmonella typhi), 슈와넬라 푸트레파시엔스(Shewanella putrefaciens), 헤모필루스 인플루엔자(Haemophilus influenzae), 카울로박터 크레센투스(Caulobacter crescentus), 또는 바실루스 서브틸리스(Bacillus subtilis)에서 유래된다. 일부 구현예에서, 아데노신 데아미나아제는 대장균에서 유래된다. 일부 구현예에서, 아데닌 데아미나아제는 본원에 제공된 임의의 돌연변이(예를 들어, ecTadA에서의 돌연변이)에 상응하는 하나 이상의 돌연변이를 포함하는 자연발생 아데노신 데아미나아제이다. 임의의 상동성 단백질에서 상응하는 잔기는 예를 들어, 서열 정렬 및 상동성 잔기의 결정에 의해 식별될 수 있다. 따라서 본원에 기재된 임의의 돌연변이(예를 들어, ecTadA에서 식별된 임의의 돌연변이)에 상응하는 임의의 자연 발생 아데노신 데아미나아제(예를 들어, ecTadA에 대한 상동성을 가짐)에서 돌연변이가 생성될 수 있다.
일부 구현예에서, 아데노신 데아미나아제는 본원에 제공된 임의의 아데노신 데아미나아제에 제시된 아미노산 서열 중 임의의 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 본원에 제공된 아데노신 데아미나아제는 하나 이상의 돌연변이(예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있음이 이해되어야 한다. 본 개시는 특정 퍼센트 동일성을 갖는 임의의 데아미나아제 도메인 및 본원에 기재된 임의의 돌연변이 또는 이의 조합을 제공한다. 일부 구현예에서, 아데노신 데아미나아제는 참조 서열, 또는 본원에 제공된 임의의 아데노신 데아미나아제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 개 이상의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 당업계에 알려져 있거나 또는 본원에 기재된 아미노산 서열 중 임의의 하나와 비교하여 적어도 5 개, 적어도 10 개, 적어도 15 개, 적어도 20 개, 적어도 25 개, 적어도 30 개, 적어도 35 개, 적어도 40 개, 적어도 45 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 또는 적어도 170 개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
본원에 제공된 임의의 돌연변이(예를 들어, TadA 참조 서열에 기반함)는 대장균 TadA[ecTadA], 에스. 아우레우스(S. aureus) TadA(saTadA), 또는 다른 아데노신 데아미나제(예를 들어, 박테리아 아데노신 데아미나아제)와 같은 다른 아데노신 데아미나아제 내로 도입될 수 있음이 이해되어야 한다. 추가적인 데아미나아제는 본원에 제공된 바와 같이 돌연변이될 수 있는 상동성 아미노산 잔기를 식별하도록 정렬될 수 있음이 당업자에게 명백할 것이다. 따라서, TadA 참조 서열에서 식별된 임의의 돌연변이는 상동성 아미노산 잔기를 갖는 다른 아데노신 데아미나아제(예를 들어, ecTada)에서 만들어질 수 있다. 또한 본원에 제공된 임의의 돌연변이는 개별적으로 또는 TadA 참조 서열 또는 또 다른 아데노신 데아미나아제와의 임의의 조합으로 만들어질 수 있음이 이해되어야 한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D108X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 D108G, D108N, D108V, D108A, 또는 TadA 참조 서열에서의 돌연변이 D108Y,또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 추가적인 데아미나아제는 본원에 제공된 바와 같이 돌연변이될 수 있는 상동성 아미노산 잔기를 식별하도록 정렬될 수 있음이 당업자에게 이해될 것이다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106V 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E155X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E155D, E155G, 또는 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D147X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D147Y, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106X, E155X, 또는 D147X, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 E155D, E155G, 또는 E155V 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 D147Y를 포함한다.
또한 본원에 제공된 임의의 돌연변이는 개별적으로 또는 ecTadA 또는 또 다른 아데노신 데아미나아제와의 임의의 조합으로 만들어질 수 있음이 이해되어야 한다. 예를 들어, 아데노신 데아미나아제는 TadA 참조 서열에서 D108N, A106V, E155V, 및/또는 D147Y 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 함유할 수 있다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 다음 돌연변이의 군(돌연변이의 군은 ';'에 의해 구분됨), 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다: D108N 및 A106V; D108N 및 E155V; D108N 및 D147Y; A106V 및 E155V; A106V 및 D147Y; E155V 및 D147Y; D108N, A106V, 및 E155V; D108N, A106V, 및 D147Y; D108N, E155V, 및 D147Y; A106V, E155V, 및 D147Y; 및 D108N, A106V, E155V, 및 D147Y. 그러나, 본원에 제공된 상응하는 돌연변이의 임의의 조합은 아데노신 데아미나아제(예를 들어, ecTadA)에서 만들어질 수 있음이 이해되어야 한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, T17X, L18X, W23X, L34X, W45X, R51X, A56X, E59X, E85X, M94X, I95X, V102X, F104X, A106X, R107X, D108X, K110X, M118X, N127X, A138X, F149X, M151X, R153X, Q154X, I156X, 및/또는 K157X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하고, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, T17S, L18E, W23L, L34S, W45L, R51H, A56E, 또는 A56S, E59G, E85K, 또는 E85G, M94L, I95L, V102A, F104L, A106V, R107C, 또는 R107H, 또는 R107P, D108G, 또는 D108N, 또는 D108V, 또는 D108A, 또는 D108Y, K110I, M118K, N127S, A138V, F149Y, M151V, R153C, Q154L, I156D, 및/또는 K157R 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, 및/또는 N127X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하고, 여기서 X는 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, 및/또는 N127S 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, R26X, M61X, L68X, M70X, A106X, D108X, A109X, N127X, D147X, R152X, Q154X, E155X, K161X, Q163X, 및/또는 T166X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, R26W, M61I, L68Q, M70V, A106T, D108N, A109T, N127S, D147Y, R152C, Q154H 또는 Q154R, E155G 또는 E155V 또는 E155D, K161Q, Q163H, 및/또는 T166P 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, N127X, D147X, R152X, 및 Q154X로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, M61X, M70X, D108X, N127X, Q154X, E155X, 및 Q163X로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 6, 7, 또는 8 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, N127X, E155X, 및 T166X로 이루어진 군에서 선택되는 1, 2, 3, 4, 또는 5 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 가리킨다.
일부 구현예에서, 아데노신 데아미나아제는 H8X, A106X, 및 D108X, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 또는 6 개의 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 H8X, R26X, L68X, D108X, N127X, D147X, 및 E155X로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 6, 7, 또는 8 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, R126X, L68X, D108X, N127X, D147X, 및 E155X로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 6, 또는 7 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, A109X, N127X, 및 E155X로 이루어진 군에서 선택되는 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, D147Y, R152C, 및 Q154H로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, M61I, M70V, D108N, N127S, Q154R, E155G 및 Q163H로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 6, 7, 또는 8 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, E155V, 및 T166P로 이루어진 군에서 선택되는 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, A106T, D108N, N127S, E155D, 및 K161Q로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, R26W, L68Q, D108N, N127S, D147Y, 및 E155V로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 6, 7, 또는 8 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, A109T, N127S, 및 E155G로 이루어진 군에서 선택되는 1, 2, 3, 4, 또는 5 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D108N, D108G, 또는 D108V 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106V 및 D108N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R107C 및 D108N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, D147Y, 및 Q154H 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, D147Y, 및 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D108N, D147Y, 및 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, 및 N127S 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106V, D108N, D147Y, 및 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2X, H8X, I49X, L84X, H123X, N127X, I156X, 및/또는 K160X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하고, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2A, H8Y, I49F, L84F, H123Y, N127S, I156F 및/또는 K160S 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 L84X 돌연변이 아데노신 데아미나아제를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 L84F 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H123X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H123Y 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 I156X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 I156F 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 L84X, A106X, D108X, H123X, D147X, E155X, 및 I156X로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 6, 또는 7 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하되, X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2X, I49X, A106X, D108X, D147X, 및 E155X로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, A106X, D108X, N127X, 및 K160X로 이루어진 군에서 선택되는 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 가리킨다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 L84F, A106V, D108N, H123Y, D147Y, E155V, 및 I156F로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 6, 또는 7 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2A, I49F, A106V, D108N, D147Y, 및 E155V로 이루어진 군에서 선택되는 1, 2, 3, 4, 5, 또는 6 개의 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, A106T, D108N, N127S, 및 K160S로 이루어진 군에서 선택되는 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E25X, R26X, R107X, A142X, 및/또는 A143X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하고, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서E25M, E25D, E25A, E25R, E25V, E25S, E25Y, R26G, R26N, R26Q, R26C, R26L, R26K, R107P, R107K, R107A, R107N, R107W, R107H, R107S, A142N, A142D, A142G, A143D, A143G, A143E, A143L, A143W, A143M, A143S, A143Q, 및/또는 A143R 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에 상응하는 본원에 기재된 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E25X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E25M, E25D, E25A, E25R, E25V, E25S, 또는 E25Y 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R26X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R26G, R26N, R26Q, R26C, R26L, 또는 R26K 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R107X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R107P, R107K, R107A, R107N, R107W, R107H, 또는 R107S 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142N, A142D, A142G, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A143X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A143D, A143G, A143E, A143L, A143W, A143M, A143S, A143Q 및/또는 A143R 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36X, N37X, P48X, I49X, R51X, M70X, N72X, D77X, E134X, S146X, Q154X, K157X, 및/또는 K161X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서하나 이상의 상응하는 돌연변이를 포함하고, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36L, N37T, N37S, P48T, P48L, I49V, R51H, R51L, M70L, N72S, D77G, E134G, S146R, S146C, Q154H, K157N, 및/또는 K161T 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 N37X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 N37T 또는 N37S 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48T 또는 P48L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R51X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R51H, 또는 R51L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S146X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S146R 또는 S146C 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 K157X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 K157N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48S, P48T, 또는 P48A 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 W23X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 W23R 또는 W23L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R152X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하고, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 가리킨다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R152P 또는 R52H 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일 구현예에서, 아데노신 데아미나아제는 돌연변이 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F, 및 K157N을 포함할 수 있다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에 비해 다음 돌연변이 조합을 포함하고, 여기서 조합의 각각의 돌연변이는 '_'에 의해 구분되고 각각의 돌연변이 조합은 괄호 사이에 있다:
(A106V_D108N),
(R107C_D108N),
(H8Y_D108N_N127S_D147Y_Q154H),
(H8Y _D108N_N127S_D147Y_E155V),
(D108N_D147Y_E155V),
(H8Y_D108N_N127S),
(H8Y_D108N_N127S_D147Y_Q154H),
(A106V_D108N_D147Y_E155V),
(D108Q_D147Y_E155V),
(D108M_D147Y_E155V),
(D108L_D147Y_E155V),
(D108K_D147Y_E155V),
(D108I_D147Y_E155V),
(D108F_D147Y_E155V),
(A106V_D108N_D147Y),
(A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V),
(E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D103A_D104N),
(G22P_D103A_D104N),
(D103A_D104N_S138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F),(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F),(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F),(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N) (H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N),(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E),(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F (H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_ I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F _K157N),(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P _E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155 V_I156F _K157N).
일부 구현예에서, TadA데아미나아제는 TadA 변이체이다. 일부 구현예에서, TadA의 변이체는 TadA*7.10이다. 특정 구현예에서, 융합 단백질은 단일 TadA*7.10 도메인(예를 들어, 단량체로 제공됨)을 포함한다. 다른 구현예에서, 융합 단백질은 이종이량체를 형성할 수 있는 TadA*7.10 및 TadA(wt)를 포함한다. 일 구현예에서, 본 발명의 융합 단백질은 Cas9 니카아제에 연결된 TadA*7.10에 연결된 야생형 TadA를 포함한다.
일부 구현예에서, TadA*7.10은 적어도 하나의 변경을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 다음 서열
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열 번호 1)에서 변경을 포함한다.
일부 구현예에서, TadA*7.10은 아미노산 82 및/또는 166에서 변경을 포함한다. 특정 구현예에서, TadA*7.10은 다음 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상을 포함한다. 다른 구현예에서, TadA*7.10의 변이체는 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군에서 선택되는 변경의 조합을 포함한다.
일부 구현예에서, 아데노신 데아미나아제 변이체(예를 들어, TadA*8)는 결실을 포함한다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 C-말단의 결실을 포함한다. 특정 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 잔기 149, 150, 151, 152, 153, 154, 155, 156, 및 157에서 시작하는 C-말단의 결실을 포함한다.
다른 구현예에서, 아데노신 데아미나아제 변이체(예를 들어, TadA*8)는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 다음 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상을 포함하는 단량체이다. 다른 구현예에서, 아데노신 데아미나제 변이체(TadA*8)는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된 변경의 조합을 포함하는 단량체이다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 각각이 다음 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상을 갖는 두 개의 아데노신 데아미나아제 도메인(예를 들어, TadA*8)을 포함하는 동종이량체이다. 다른 구현예에서, 아데노신 데아미나제 변이체는 각각이 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된 변경의 조합을 갖는 두 개의 아데노신 데아미나제 도메인(예를 들어, TadA*8)을 포함하는 동종이량체이다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 다음 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상을 포함하는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체이다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군에서 선택되는 변경의 조합을 포함하는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어 TadA*8)의 이종이량체이다.
다른 구현예에서, 아데노신 데아미나아제 변이체는TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 다음 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상을 포함하는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체이다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군에서 선택되는 변경의 조합을 포함하는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어 TadA*8)의 이종이량체이다.
특정 구현예에서, 아데노신 데아미나아제 이종이량체는 스타필로코쿠스 아우레우스(S. aureus) TadA, 바실루스 서브틸리스(B.subtilis) TadA, 살모넬라 티피뮤리움(S. typhimurium) TadA, 슈와넬라푸트레파시엔스(S. putrefaciens) TadA, 헤모필루스 인플루엔자 F3031(H. influenzae) TadA, 카울로박터 크레센투스(C. crescentus) TadA, 지오박터 설퍼리듀센스(G. sulfurreducens) TadA, 또는 TadA*7.10에서 선택되는 TadA*8 도메인 및 아데노신 데아미나아제 도메인을 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA*8이다. 일 구현예에서, 아데노신 데아미나아제는 다음 서열
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD(서열 번호 316) 또는 아데노신 데아미나아제의 활성을 갖는 이의 단편을 포함하거나 필수적으로 구성된 TadA*8이다.
일부 구현예에서, TadA*8은 절두된다. 일부 구현예에서, 절두된 TadA*8은 전장 TadA*8에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20 개의 N-말단 아미노산 잔기가 누락되어 있다. 일부 구현예에서, 절두된 TadA*8은 전장 TadA*8에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20 개의 C-말단 아미노산 잔기가 누락되어 있다. 일부 구현예에서 아데노신 데아미나아제 변이체는 전장 TadA*8이다.
일부 구현예에서 TadA*8은 TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24이다.
다른 구현예에서, 본 개시의 염기 편집기는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 다음 변경 R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및, 또는 D167N 중 하나 이상을 포함하는 아데노신 데아미나아제 변이체(예를 들어, TadA*8)를 포함하는 단량체이다. 다른 구현예에서, 아데노신 데아미나아제 변이체 (TadA*8) 단량체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA의 상응하는 돌연변이에 비해, R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N의 군에서 선택되는 변경의 조합을 포함한다.
다른 구현예에서, 염기 편집기는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 다음 변경 R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N 중 하나 이상을 포함하는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체를 포함한다. 다른 구현예에서, 염기 편집기는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N의 군에서 선택되는 변경의 조합을 포함하는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 (TadA*8)의 이종이량체를 포함한다.
다른 구현예에서, 염기 편집기는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 다음 변경 R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N 중 하나 이상을 포함하는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체를 포함한다. 다른 구현예에서, 염기 편집기는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N의 군에서 선택되는 변경의 조합을 포함하는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체(예를 들어, TadA*8)의 이종이량체를 포함한다.
일부 구현예에서, TadA*8은 표 6에 나타낸 변이체이다. 표 6은 TadA 아미노산 서열 내의 특정 아미노산 위치 번호 및 TadA-7.10 아데노신 데아미나아제 내의 이들 위치에 존재하는 아미노산을 나타낸다. 표 6은 또한 문헌[M. Richter et al., 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-z]에 기재된 바와 같이 파지 보조된 비연속 진화[phage-assisted non-continuous evolution ,PANCE] 및 파지 보조된 연속 진화[phage-assisted continuous evolution, PACE] 후 TadA-7.10에 비한 TadA 변이체에서의 아미노산 변화를 나타내고, 그 전체 내용은 본원에 참조로 포함된다. 일부 구현예에서, TadA*8은 TadA*8a, TadA*8b, TadA*8c, TadA*8d 또는 TadA*8e이다. 일부 구현예에서, TadA*8은 TadA*8e이다.
[표 6] TadA*8 변이체 선택
일 구현예에서, 본 발명의 융합 단백질은 Cas9 니카아제에 연결된 본원에 기재된 아데노신 데아미나아제 변이체(예를 들어, TadA*8)에 연결된 야생형 TadA를 포함한다.특정 구현예에서, 융합 단백질은 단일 TadA*8 도메인(예를 들어, 단량체로 제공됨)을 포함한다. 다른 구현예에서, 융합 단백질은 이종이량체를 형성할 수 있는 TadA*8 및 TadA(wt)를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 본원에 제공된 임의의 아데노신 데아미나아제에 제시된 아미노산 서열 중 임의의 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 본원에 제공된 아데노신 데아미나아제는 하나 이상의 돌연변이(예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있음이 이해되어야 한다. 본 개시는 특정 퍼센트 동일성을 가진 임의의 데아미나아제 도메인 및 본원에 기재된 임의의 돌연변이 또는 이의 조합을 제공한다. 일부 구현예에서, 아데노신 데아미나아제는 참조 서열, 또는 본원에 제공된 임의의 아데노신 데아미나아제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 개 이상의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 당업계에 알려져 있거나 또는 본원에 기재된 아미노산 서열 중 임의의 하나와 비교하여 적어도 5 개, 적어도 10 개, 적어도 15 개, 적어도 20 개, 적어도 25 개, 적어도 30 개, 적어도 35 개, 적어도 40 개, 적어도 45 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 또는 적어도 170 개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
특정 구현예에서, TadA*8은 굵은 글씨로 나타낸 임의의 다음 위치에서 하나 이상의 돌연변이를 포함한다. 다른 구현예에서, TadA*8은 밑줄로 나타낸 임의의 위치에서 하나 이상의 돌연변이를 포함한다:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG 50 LHDPTAHAEI MALRQGGLVM QNYRLIDATL Y V TFEPCVMC AGAMIHSRIG 100 RVVFGVRNAK TGAAGSLMDV LH Y PGMNHRV EITEGILADE CAALLC Y FFR 150 MPR Q VFNAQK KAQSS T D(서열 번호 1)
예를 들어, TadA*8 은 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, 아미노산 위치 82 및/또는 166(예를 들어, V82S, T166R)에서 단독으로 또는 다음 Y147T, Y147R, Q154S, Y123H, 및/또는 Q154R 중 임의의 하나 이상과 조합에서의 변경을 포함한다. 특정 구현예에서, 변경의 조합은 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이에 비해, Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군에서 선택된다.
일부 구현예에서, TadA*8은 절두된다. 일부 구현예에서, 절두된 TadA*8은 전장 TadA*8에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20 개의 N-말단 아미노산 잔기가 누락되어 있다. 일부 구현예에서, 절두된 TadA*8은 전장 TadA*8에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20 개의 C-말단 아미노산 잔기가 누락되어 있다. 일부 구현예에서 아데노신 데아미나아제 변이체는 전장 TadA*8이다.
일 구현예에서, 본 발명의 융합 단백질은 Cas9 니카아제에 연결된 본원에 기재된 아데노신 데아미나아제 변이체(예를 들어, TadA*8)에 연결된 야생형 TadA를 포함한다. 특정 구현예에서, 융합 단백질은 단일 TadA*8 도메인(예를 들어, 단량체로서 제공됨)을 포함한다. 다른 구현예에서, 염기 편집기는 이종이량체를 형성할 수 있는 TadA*8 및 TadA(wt)를 포함한다.
특정 구현예에서, 융합 단백질은 단일 TadA*8(예를 들어, 단량체로서 제공됨)을 포함한다. 일부 구현예에서, TadA*8은 Cas9 니카아제에 연결된다. 일부 구현예에서, 본 발명의 융합 단백질은 TadA*8에 연결된 야생형 TadA (TadA(wt))의 이종이량체로서 포함한다. 다른 구현예에서, 본 발명의 융합 단백질은 TadA*8에 연결된 TadA*7.10의 이종이량체로서 포함한다. 일부 구현예에서, 염기 편집기는 TadA*8 변이체 단량체를 포함하는 ABE8이다. 일부 구현예에서, 염기 편집기는 TadA*8 및 TadA(wt)의 이종이량체를 포함하는 ABE8이다. 일부 구현예에서, 염기 편집기는 TadA*8 및 TadA*7.10의 이종이량체를 포함하는 ABE8이다. 일부 구현예에서, 염기 편집기는 TadA*8의 이종이량체를 포함하는 ABE8이다. 일부 구현예에서, TadA*8은 표 6, 12, 또는 13에서 선택된다. 일부 구현예에서, ABE8은 표 12, 13, 또는 15에서 선택된다.
일부 구현예에서, 아데노신 데아미나아제는 TadA*9 변이체이다. 일부 구현예에서, 아데노신 데아미나아제는 다음 서열(TadA*7.10으로 지칭됨)
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG
LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR
MPRQVFNAQK KAQSSTD(서열 번호 1)을 참조하여 아래 기재된 변이체에서 선택되는 TadA*9 변이체이다.
일부 구현예에서, 아데노신 데아미나아제는 다음 변경 R21N, R23H, E25F, N38G, L51W, P54C, M70V, Q71M, N72K, Y73S, V82T, M94V, P124W, T133K, D139L, D139M, C146R, 및 A158K 중 하나 이상을 포함한다. 하나 이상의 변경은 위 서열에서 밑줄 및 굵은 글씨체로 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 다음 변경의 조합 중 하나 이상을 포함한다: V82S + Q154R + Y147R; V82S + Q154R + Y123H; V82S + Q154R + Y147R+ Y123H; Q154R + Y147R + Y123H + I76Y+ V82S; V82S + I76Y; V82S + Y147R; V82S + Y147R + Y123H; V82S + Q154R + Y123H; Q154R + Y147R + Y123H + I76Y; V82S + Y147R; V82S + Y147R + Y123H; V82S + Q154R + Y123H; V82S + Q154R + Y147R; V82S + Q154R + Y147R; Q154R + Y147R + Y123H + I76Y; Q154R + Y147R + Y123H + I76Y + V82S; I76Y_V82S_Y123H_Y147R_Q154R; Y147R + Q154R + H123H; 및 V82S + Q154R.
일부 구현예에서, 아데노신 데아미나아제는 다음 변경의 조합 중 하나 이상을 포함한다: E25F + V82S + Y123H, T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; Q71M + V82S + Y123H + Y147R + Q154R; E25F + V82S + Y123H + T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; V82S + Y123H + P124W + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; R23H + V82S + Y123H + Y147R + Q154R; R21N + V82S + Y123H + Y147R + Q154R; V82S + Y123H + Y147R + Q154R + A158K; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; 및 M70V + V82S + M94V + Y123H + Y147R + Q154R
일부 구현예에서, 아데노신 데아미나아제는 다음 변경의 조합 중 하나 이상을 포함한다: Q71M + V82S + Y123H + Y147R + Q154R; E25F + I76Y+ V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D139M + Y147R + Q154R; Y73S + I76Y + V82S + Y123H + Y147R + Q154R; E25F + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D139M + Y147R + Q154R; Y73S + I76Y + V82S + Y123H + Y147R + Q154R; and V82S + Q154R; N72K_V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; M70V +Q71M +N72K +V82S + Y123H + Y147R + Q154R; N72K_V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; M70V +V82S + M94V + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; 및 M70V +Q71M +N72K +V82S + Y123H + Y147R + Q154R. 일부 구현예에서, 아데노신 데아미나아제는 단량체로서 발현된다. 다른 구현예에서, 아데노신 데아미나아제는 이종이량체로서 발현된다. 일부 구현예에서, 데아미나아제 또는 다른 폴리펩타이드 서열은, 예를 들어 융합 단백질의 구성요소로서 포함되는 경우, 메티오닌이 결여된다. 이는 위치의 넘버링을 변경할 수 있다. 그러나, 당업자는 이러한 상응하는 돌연변이가 동일한 돌연변이, 예를 들어, Y73S 및 Y72S 및 D139M 및 D138M을 지칭함을 이해할 것이다.
일부 구현예에서, TadA*9 변이체는 본원에 기재된 표 16에 기재된 변경을 포함한다. 일부 구현예에서, TadA*9 변이체는 단량체이다. 일부 구현예에서, TadA*9 변이체는 야생형 TadA 아데노신 데아미나아제를 갖는 이종이량체이다. 일부 구현예에서, TadA*9 변이체는 또 다른 TadA 변이체(예를 들어, TadA*8, TadA*9)를 갖는 이종이량체이다. TadA*9 아데노신 데아미나아제의 추가 세부 사항은 국제 PCT 출원 PCT/2020/049975에 기재되어 있고, 이는 그 전체가 본원에 참조로 포함된다.
본원에 제공된 임의의 돌연변이 및 임의의 추가적인 돌연변이(예를 들어, ecTadA 아미노산 서열에 기반함)는 임의의 다른 아데노신 데아미나아제 내로 도입될 수 있다. 본원에 제공된 임의의 돌연변이는 개별적으로 또는 TadA 참조 서열 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)와 임의의 조합으로 만들어질 수 있다.
A에서 G 핵염기 편집 단백질의 상세한 내용은 국제 PCT 출원 PCT/2017/045381(WO2018/027078) 및 문헌[Gaudelli, N.M., et al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature, 551, 464-471(2017])에 기재되어 있고, 이의 전체 내용이 본원에 참조로 포함된다.
C에서 T로의 편집
일부 구현예에서, 본원에 개시된 염기 편집기는 폴리뉴클레오티드의 표적 시티딘(C) 염기를 탈아미노화하여 티민의 염기 쌍 결합 특성을 갖는 우리딘(U)을 생성할 수 있는 시티딘 데아미나아제를 포함하는 융합 단백질을 포함한다. 일부 구현예에서, 예를 들어 폴리뉴클레오티드가 이중 가닥(예를 들어, DNA)인 경우, 우리딘 염기는 티미딘 염기로(예를 들어, 세포 복구 기구에 의해) 치환되어 C:G에서 T:A로의 전이를 일으킬 수 있다. 다른 구현예에서, 염기 편집기에 의한 핵산에서의 C에서 U로의 탈아미노화는 U에서 T로의 치환에 의해 동반될 수 없다.
U를 생성하기 위한 폴리뉴클레오티드에서의 표적 C의 탈아미노화는 본원에 기재된 염기 편집기에 의해 실행될 수 있는 염기 편집 유형의 비제한적인 예이다. 또 다른 예에서, 시티딘 데아미나아제 도메인을 포함하는 염기 편집기는 시토신(C) 염기의 구아닌(G) 염기로의 전환을 매개할 수 있다. 예를 들어, 염기 편집기의 시티딘 데아미나아제 도메인에 의한 시티딘의 탈아미노화에 의해 생성된 폴리뉴클레오티드의 U는 염기 절제 복구 기전[예를 들어, 우라실 DNA 글리코실라제(uracil DNA glycosylase , UDG) 도메인]에 의해 폴리뉴클레오티드에서 절제되어, 무염기 부위를 생성할 수 있다. 그 다음, 무염기 부위의 반대편에 있는 핵염기는 예를 들어, 이후 손상통과 폴리머라아제[translesion polymerase]에 의해 C와 같은 또 다른 염기로(예를 들어, 염기 쌍 기구에 의해) 치환될 수 있다. 무염기 부위의 반대편에 있는 핵염기가 C로 대체되는 것이 일반적이지만, 다른 치환(예를 들어, A, G 또는 T) 또한 발생할 수 있다.
따라서, 일부 구현예에서 본원에 기재된 염기 편집기는 폴리뉴클레오티드에서 표적 C를 U로 탈아미노화할 수 있는 탈아미노화 도메인(예를 들어, 시티딘 데아미나아제 도메인)을 포함한다. 또한, 아래에 기재된 바와 같이, 염기 편집기는 일부 구현예에서, 탈아미노화로부터 생성된 U의 T 또는 G로의 전환을 용이하게 하는 추가 도메인을 포함할 수 있다. 예를 들어, 시티딘 데아미나아제 도메인을 포함하는 염기 편집기는 T에 의한 U로의 치환을 매개하는 우라실 글리코실라제 억제제[UGI] 도메인을 추가로 포함하여, C에서 T로의 염기 편집 이벤트를 완료할 수 있다. 또 다른 예에서, 염기 편집기는 손상통과 폴리머라아제를 혼입하여 C에서 G로의 염기 편집의 효율을 개선할 수 있는데, 손상통과 폴리머라아제가 무염기 부위의 반대편에 있는 C의 혼입을 용이하게 할수 있기 때문이다(즉, 무염기 부위에서 G의 혼입을 초래하여, C에서 G로의 염기 편집 이벤트를 완료함).
도메인으로서 시티딘 데아미나아제를 포함하는 염기 편집기는 DNA, RNA 및 DNA-RNA 하이브리드를 포함한 임의의 폴리뉴클레오티드에서 표적 C를 탈아미노화할 수 있다. 전형적으로, 시티딘 데아미나아제는 폴리뉴클레오티드의 단일 가닥 부분의 맥락에서 위치하는 C 핵염기를 촉매화한다. 일부 구현예에서, 표적 C를 포함하는 전체 폴리뉴클레오티드는 단일 가닥일 수 있다. 예를 들어, 염기 편집기 내로 혼입된 시티딘 데아미나아제는 단일 가닥 RNA 폴리뉴클레오티드에서 표적 C를 탈아미노화할 수 있다. 다른 구현예에서, 시티딘 데아미나아제 도메인을 포함하는 염기 편집기는 이중 가닥 폴리뉴클레오티드에서 작용할 수 있지만, 표적 C는 탈아미노화 반응 시 단일 가닥 상태로 있는 폴리뉴클레오티드의 일부에 위치할 수 있다. 예를 들어, NAGPB 도메인이 Cas9 도메인을 포함하는 구현예에서, 여러 뉴클레오티드는 Cas9-gRNA-표적 DNA 복합체의 형성 동안 쌍을 이루지 않은 상태로 남아, Cas9 'R-루프 복합체'가 형성될 수 있다. 이러한 쌍을 이루지 않은 않은 뉴클레오티드는 단일 가닥 특이적 뉴클레오티드 데아미나아제 효소(예를 들어, 시티딘 데아미나아제)에 대한 기질로서 역할을 할 수 있는 단일 가닥 DNA의 기포를 형성할 수 있다.
일부 구현예에서, 염기 편집기의 시티딘 데아미나아제는 아포지단백질 B mRNA 편집 복합체[apolipoprotein B mRNA editing complex, APOBEC] 계열 데아미나아제의 전부 또는 일부를 포함할 수 있다. APOBEC는 진화적으로 보존된 시티딘 데아미나아제 계열이다. 이 계열의 구성원은 C에서 U로의 편집 효소이다 APOBEC 유사 단백질의 N-말단 도메인 은 촉매 도메인인 반면, C-말단 도메인은 가성촉매 도메인이다. 보다 구체적으로, 촉매 도메인은 아연 의존적 시티딘 데아미나아제 도메인이고 시티딘 탈아미노화에 중요하다. APOBEC 계열 구성원은 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D('APOBEC3E'는 이제 이로 지칭됨),APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, 및 활성화 유도(시티딘) 데아미나아제를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입되는 데아미나아제는 APOBEC1 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC2 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3A 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3B 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3C 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3D 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3E 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3F 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3G 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC3H 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 APOBEC4 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 데아미나아제는 활성화 유도 데아미나아제[activation-induced deaminase, AID]의 전부 또는 일부를 포함한다. 일부 구현예에서 염기 편집기 내로 혼입된 데아미나아제는 시티딘 데아미나아제 1(cytidine deaminase 1, CDA1)의 전부 또는 일부를 포함한다. 염기 편집기는 임의의 적합한 유기체(예를 들어, 인간 또는 래트)에서 데아미나아제를 포함할 수 있음이 이해되어야 한다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트, 또는 마우스로부터 유래된다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 래트(예를 들어, 래트 APOBEC1)에서 유래된다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 인간 APOBEC1이다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 pmCDA1이다.
본 개시의 양태에 따라 Cas9에 융합될 수 있는 다른 예시적인 데아미나아제는 아래에 제공되어 있다. 구현예에서, 데아미나아제는 활성화 유도 데아미나아제[AID]이다. 일부 구현예에서, 각각의 서열의 활성 도메인, 예를 들어, 국소화 신호(핵 국소화 서열, 핵 방출 신호가 없는 핵 국소화 서열, 세포질 국소화 신호)가 없는 도메인이 사용될 수 있음이 이해되어야 한다.
본 개시의 일부 양태는 예를 들어 데아미나아제 도메인에서 점 돌연변이를 생성함으로써 본원에 기재된 임의의 융합 단백질의 데아미나아제 도메인 촉매 활성을 조절하는 것이 융합 단백질(예를 들어, 염기 편집기)의 진행성에 영향을 미친다는 인식에 기반한다. 예를 들어, 염기 편집 융합 단백질 내에서 데아미나제 도메인의 촉매 활성을 감소시키지만, 제거하지 않는 돌연변이는 데아미나아제 도메인이 표적 잔기에 인접한 잔기의 탈아미노화를 촉매화하여, 탈아미노화 창을 좁힐 가능성을 낮출 수 있다. 탈아미노화 창을 좁히는 능력은 특정 표적 잔기에 인접한 잔기의 원치 않는 탈아미노화를 방지할 수 있고, 이는 표적외 효과를 감소시키거나 또는 방지할 수 있다.
예를 들어, 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 H121X, H122X, R126X, R126X, R118X, W90X, W90X, 및 R132X로 이루어진 군에서 선택되는 하나 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함할 수 있되, X는 임의의 아미노산이다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 H121R, H122R, R126A, R126E, R118A, W90A, W90Y, 및 R132E로 이루어진 군에서 선택되는 하나 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함할 수 있다.
일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 D316X, D317X, R320X, R320X, R313X, W285X, W285X, R326X로 이루어진 군에서 선택되는 하나 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함할 수 있되, X는 임의의 아미노산이다. 일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 hAPOBEC3G의 D316R, D317R, R320A, R320E, R313A, W285A, W285Y, R326E로 이루어진 군에서 선택되는 하나 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함한다.
일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 H121R 및 H122R 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함할 수 있다. 일부 구현예에서 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R126A 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R126E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R118A 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90A 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y 및 R126E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R126E 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y, R126E, 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다.
일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 D316R 및 D317R 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 hAPOBEC3G의 R320A 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R320E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R313A 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285A 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y 및 R320E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R320E 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y, R320E, 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다.
SaBE3, SaKKH-BE3, VQR-BE3, EQR-BE3, VRER-BE3, YE1-BE3, EE-BE3, YE2-BE3, 및 YEE-BE3을 포함하나 이에 제한되지 않는 다수의 변형된 시티딘 데아미나아제가 상업적으로 이용가능하고, 애드진(Addgene)에서 구입 가능하다(플라스미드 85169, 85170, 85171, 85172, 85173, 85174, 85175, 85176, 85177). 일부 구현예에서, 염기 편집기 내로 혼입되는 데아미나아제는 APOBEC1 데아미나아제의 전부 또는 일부를 포함한다.
일부 구현예에서, 본 발명의 융합 단백질은 하나 이상의 시티딘 데아미나아제 도메인을 포함한다. 일부 구현예에서, 본원에 제공된 시티딘 데아미나아제는 시토신 또는 5-메틸시토신을 우라실 또는 티민으로 탈아미노화할 수 있다. 일부 구현예에서, 본원에 제공된 시티딘 데아미나아제는 DNA에서 시토신을 탈아미노화할 수 있다. 시티딘 데아미나아제는 임의의 적합한 유기체에서 유래될 수 있다. 일부 구현예에서, 시티딘 데아미나아제는 본원에 제공된 임의의 돌연변이에 상응하는 하나 이상의 돌연변이를 포함하는 자연 발생 시티딘 데아미나아제이다. 당업자는 예를 들어, 서열 정렬 및 상동성 잔기의 결정에 의해 임의의 상동성 단백질에서 상응하는 잔기를 식별할 수 있을 것이다. 따라서, 당업자는 본원에 기재된 임의의 돌연변이에 상응하는 임의의 자연 발생 시티딘 데아미나아제에서 돌연변이를 생성할 수 있을 것이다. 일부 구현예에서, 시티딘 데아미나아제는 원핵생물에서 유래된다. 일부 구현예에서, 시티딘 데아미나아제는 박테리아에서 유래된다. 일부 구현예에서, 시티딘 데아미나아제는 포유동물(예를 들어, 인간)에서 유래된다.
일부 구현예에서, 시티딘 데아미나아제는 본원에 제시된 시티딘 데아미나아제 아미노산 서열 중 임의의 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 본원에 제공된 시티딘 데아미나아제는 하나 이상의 돌연변이(예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있음이 이해되어야 한다. 일부 구현예는 임의의 이전 양태의 시티딘 데아미나아제 핵염기 편집기 폴리펩티드 또는 본원에 기재된 바와 같은 폴리펩티드를 암호화하는 폴리뉴클레오티드 분자를 제공한다. 일부 구현예에서, 폴리뉴클레오티드는 코돈 최적화된다.
본 개시는 특정 퍼센트 동일성을 가진 임의의 데아미나아제 도메인 및 본원에 기재된 임의의 돌연변이 또는 이의 조합을 제공한다. 일부 구현예에서, 시티딘 데아미나아제는 참조 서열, 또는 본원에 제공된 임의의 시티딘 데아미나아제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 개, 또는 그 이상의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 시티딘 데아미나아제는 당업계에 알려져 있거나 본원에 기재된 아미노산 서열 중 임의의 하나와 비교하여 적어도 5 개, 적어도 10 개, 적어도 15 개, 적어도 20 개, 적어도 25 개, 적어도 30 개, 적어도 35 개, 적어도 40 개, 적어도 45 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 또는 적어도 170 개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
본 발명의 제2 단백질의 융합 단백질은 두 개 이상의 핵산 편집 도메인을 포함한다.
C에서 T로의 핵염기 편집 단백질의 상세한 내용은 국제 PCT 출원 PCT/US2016/058344(WO2017/070632) 및 문헌[Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424(2016)]에 기재되어 있으며, 이의 전체 내용이 본원에 참조로 포함된다.
가이드 폴리뉴클레오티드
폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 결합된 가이드 폴리뉴클레오티드(예를 들어, gRNA)와 결합하는 경우 표적 폴리뉴클레오티드 서열에 특이적으로 결합할 수 있고(즉, 결합된 가이드 핵산의 염기 및 표적 폴리뉴클레오티드 서열의 염기 사이의 상보적 염기쌍 형성을 통해),이에 의해 편집되기를 원하는 표적 핵산 서열에 염기 편집기를 국소화할 수 있다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 단일 가닥 DNA 또는 이중 가닥 DNA를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 RNA를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 DNA-RNA 하이브리드를 포함한다.
CRISPR은 이동성 유전 요소(바이러스, 전이 요소 및 접합 플라스미드)로부터 보호하는 적응 면역 시스템이다. CRISPR 클러스터는 스페이서, 선행 이동 요소에 상보적인 서열 및 표적 침입 핵산을 포함한다. CRISPR 클러스터는 CRISPR RNA(crRNA) 내로 전사되고 처리된다. 유형 II CRISPR 시스템에서, 프리(pre)-crRNA의 정확한 처리는 트랜스 암호화된 작은 RNA[tracrRNA], 내인성 리보뉴클레아제 3(rnc) 및 Cas9 단백질이 필요하다. tracrRNA는 프리-crRNA의 리보뉴클레아제 3-보조 처리를 위한 가이드 역할을 한다. 이어서, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 내핵용해적으로[endonucleolytically] 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 내핵용해적으로 절단된 다음, 3'에서 5' 외핵용해적으로[exonucleolytically] 다듬어진다. 자연에서, DNA-결합 및 절단은 전형적으로 단백질 및 두 RNA가 모두 필요하다. 그러나, 단일 가이드 RNA('sgRNA', 또는 간단히 'gRNA')는 crRNA 및 tracrRNA 둘 다의 양태를 단일 RNA 종 내로 혼입하도록 조작될 수 있다. 예를 들어, 문헌[Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337:816-821(2012)]을 참조하고, 이의 전체 내용은 본원에 참조로 포함된다. Cas9는 CRISPR 반복 서열에서 짧은 모티프(PAM 또는 프로토스페이서 인접 모티프)를 인식하여 자기-대-비자기[self versus non-self]를 구별하는 데 도움이 된다. 예를 들어, 문헌[“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III."] 문헌[Deltcheva E. et al., Nature 471:602-607(2011); and "Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity."] 문헌[Jinek M.et al, Science 337:816-821(2012)]을 참조하고, 각각의 전체 내용은 본원에 참조로 포함된다.
PAM 서열은 당업계에 알려진 임의의 PAM 서열일 수 있다. 적합한 PAM 서열은 NGG, NGA, NGC, NGN, NGT, NGCG, NGAG, NGAN, NGNG, NGCN, NGCG, NGTN, NNGRRT, NNNRRT, NNGRR(N),TTTV, TYCV, TYCV, TATV, NNNNGATT, NNAGAAW, 또는 NAAAAC를 포함하나, 이에 제한되지 않는다. Y는 피리미딘이고; N은 임의의 뉴클레오티드 염기이고; W는 A 또는 T이다.
일 구현예에서, 본원에 기재된 가이드 폴리뉴클레오티드는 RNA 또는 DNA일 수 있다. 일 구현예에서, 가이드 폴리뉴클레오티드는 gRNA이다. RNA/Cas 복합체는 Cas 단백질을 표적 DNA로 '가이드'하는 데 도움이 될 수 있다. Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 내핵용해적으로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 내핵용해적으로 절단된 다음, 3'에서 5' 외핵용해적으로 다듬어진다. 자연에서, DNA-결합 및 절단은 전형적으로 단백질 및 두 RNA가 모두 필요하다. 그러나, 단일 가이드 RNA('sgRNA', 또는 간단히 'gRNA')는 crRNA 및 tracrRNA 둘 다의 양태를 단일 RNA 종 내로 혼입하도록 조작될 수 있다. 예를 들어, 문헌[Jinek M. et al., Science 337:816-821(2012)]을 참조하고, 이의 전체 내용이 본원에 참조로 포함된다.
일부 구현예에서, 가이드 폴리뉴클레오티드는 적어도 하나의 단일 가이드 RNA('sgRNA' 또는 'gRNA')이다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 두 개 이상의 개별 폴리뉴클레오티드를 포함하고, 이는 예를 들어 상보적 염기쌍 형성(예를 들어, 이중 가이드 폴리뉴클레오티드, 이중 gRNA)을 통해 서로 상호작용할 수 있다. 예를 들어, 가이드 폴리뉴클레오티드는 CRISPR RNA(crRNA) 및 트랜스 활성화 CRISPR RNA(tracrRNA)를 포함할 수 있거나 하나 이상의 트랜스 활성화 CRISPR RNA(tracrRNA)를 포함할 수 있다.
일부 구현예에서, 가이드 폴리뉴클레오티드는 적어도 하나의 tracrRNA이다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 폴리뉴클레오티드프로그래밍 가능한 DNA-결합 도메인(예를 들어, Cas9 또는Cpf1)을표적 뉴클레오티드 서열로 가이드하기 위해 PAM 서열을 필요로 하지 않는다.
가이드 폴리뉴클레오티드는 천연 또는 비-천연(또는 비천연) 뉴클레오티드(예를 들어, 펩티드 핵산 또는 뉴클레오티드 유사체)를 포함할 수 있다. 일부 경우에, 가이드 핵산 서열의 표적화 영역은 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30 개의 뉴클레오티드 길이일 수 있다. 가이드 핵산의 표적화 영역은 10 내지 30 개의 뉴클레오티드 길이, 또는 15 내지 25 개의 뉴클레오티드 길이, 또는 15 내지 20 개의 뉴클레오티드 길이일 수 있다.
일부 구현예에서, 본원에 제공된 염기 편집기는 하나 이상의 가이드 폴리뉴클레오티드(예를 들어, 다중 gRNA)를 활용한다. 일부 구현예에서, 단일 가이드 폴리뉴클레오티드는 본원에 기재된 상이한 염기 편집기에 활용된다. 예를 들어, 단일 가이드 폴리뉴클레오티드는 시티딘 염기 편집기 및 아데노신 염기 편집기에 활용될 수 있다.
일부 구현예에서, 본원에 기재된 방법은 조작된 Cas 단백질을 활용할 수 있다. 가이드 RNA(gRNA)는 Cas-결합에 필요한 스캐폴드 서열 및 변형될 게놈 표적을 정의하는 사용자 정의된 약 20 개의 뉴클레오티드 스페이서로 구성된 짧은 통합 RNA이다. 예시적인 gRNA 스캐폴드 서열은 서열 목록에서 서열 번호 317-327로 제공된다. 따라서, 숙련된 당업자는 gRNA를 표적으로 하는 서열이 게놈의 나머지 부분과 비교하여 게놈 표적에 대해 얼마나 특이적인가에 의해 부분적으로 결정되는 Cas 단백질의 특이성의 게놈 표적을 변경할 수 있다.
다른 구현예에서, 가이드 폴리뉴클레오티드는 핵산의 폴리뉴클레오티드 표적화 부분 및 단일 분자에서 핵산(즉, 단일 분자 가이드 핵산)의 스캐폴드 부분 모두를 포함할 수 있다. 예를 들어, 단일 분자 가이드 폴리뉴클레오티드는 단일 가이드 RNA(sgRNA 또는 gRNA)일 수 있다. 본원에서 용어 가이드 폴리뉴클레오티드 서열은 염기 편집기를 표적 폴리뉴클레오티드 서열로 상호작용하고 지시할 수 있는 임의의 단일, 이중, 또는 다중 분자 핵산을 고려한다.
전형적으로, 가이드 폴리뉴클레오티드(예를 들어, crRNA/trRNA 복합체 또는 gRNA)는 표적 폴리뉴클레오티드 서열을 인식하고 결합할 수 있는 서열을 포함하는 '폴리뉴클레오티드 표적화 분절', 및 염기 편집기의 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 구성요소 내에서 가이드 폴리뉴클레오티드를 안정화시키는 '단백질 결합 분절'을 포함한다. 일부 구현예에서, 가이드 폴리뉴클레오티드의 폴리뉴클레오티드 표적화 분절은 DNA 폴리뉴클레오티드를 인식하고 결합하여, DNA에서 염기의 편집을 용이하게 한다. 다른 경우에, 가이드 폴리뉴클레오티드의 폴리뉴클레오티드 표적화 분절은 RNA 폴리뉴클레오티드를 인식하고 결합하여, RNA에서 염기의 편집을 용이하게 한다. 본원에서 '분절'은 분자의 섹션 또는 영역, 예를 들어, 가이드폴리뉴클레오티드에서 인접 뉴클레오티드 스트레치를 지칭한다. 또한 분절이 하나 초과의 분자의 영역을 포함할 수 있도록 분절은 복합체의 영역/섹션을 지칭할 수 있다. 예를 들어, 가이드 폴리뉴클레오티드가 다중 핵산 분자를 포함하는 경우, 단백질 결합 분절은 예를 들어 상보성 영역을 따라 혼성화되는 다중 개별 분자의 전부 또는 일부를 포함할 수 있다. 일부 구현예에서, 두 개의 개별 분자를 포함하는 DNA-표적화 RNA의 단백질 결합 분절은(i) 100 개의 염기쌍 길이인 제1 RNA 분자의 염기쌍 40 내지 75 개; 및(ii) 50 개의 염기쌍 길이인 제2 RNA 분자의 염기쌍 10 내지 25 개를 포함할 수 있다. '분절'의 정의는, 특정 문맥에서 달리 구체적으로 정의되지 않는 한, 총 염기쌍의 특정 수로 제한되지 않고, 주어진 RNA 분자로부터의 염기쌍의 임의의 특정 수로 제한되지 않고, 복합체 내에서 개별 분자의 특정 수로 제한되지 않으며, 임의의 총 길이의 것이고 다른 분자에 상보성을 갖는 영역을 포함할 수 있는 RNA 분자의 영역을 포함할 수 있다.
가이드 폴리뉴클레오티드는 화학적으로 합성되거나, 효소적으로 합성되거나 이들의 조합으로 합성될 수 있다. 예를 들어, gRNA는 표준 포스포르아미다이트 기반 고체상 통합 방법을 사용하여 합성될 수 있다. 또한, gRNA는 gRNA를 암호화하는 DNA를 파아지 RNA 중합효소에 의해 인식되는 프로모터 제어 서열에 작동가능하게 연결함으로써 시험관내에서 합성될 수 있다. 적합한 파지 프로모터 서열의 예는 T7, T3, SP6 프로모터 서열, 또는 이의 변이를 포함한다. gRNA가 두 개의 별도의 분자(예를 들어, crRNA 및 tracrRNA)를 포함하는 구현예에서, crRNA는 화학적으로 합성될 수 있고 tracrRNA는 효소적으로 합성될 수 있다.
gRNA 분자는 시험관내에서 전사될 수 있다.
가이드 폴리뉴클레오티드는 예를 들어, gRNA를 암호화하는 DNA, 예를 들어, gRNA를 암호화하는 서열을 포함하는 DNA 벡터에 의해 발현될 수 있다. gRNA는 단독 또는 암호화된 염기 편집기와 함께 암호화될 수 있다. 이러한 DNA 서열은 함께 또는 별도로 발현 시스템, 예를 들어, 세포 내로 도입될 수 있다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 gRNA를 암호화하는 DNA 서열은 세포 내로 도입될 수 있으며, 각각의 DNA 서열은 별개의 분자의 일부일 수 있거나(예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 코딩 서열을 함유하는 하나 벡터 및 gRNA 코딩 서열을 함유하는 제2 벡터)일 수 있거나 둘 다 동일한 분자의 일부일 수 있다(예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및 gRNA 둘 다에 대한 코딩(및 조절) 서열을 함유하는 하나의 벡터). RNA는 합성 DNA 분자, 예를 들어, gBlocks® 유전자단편에서 전사될 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 세 개의 영역을 포함할 수 있다: 염색체 서열에서 표적 부위에 상보적일 수 있는 5' 단부의 제1 영역, 줄기 루프 구조를 형성할 수 있는 제2 내부 영역, 및 단일 가닥일 수 있는 제3 3' 영역. 각각의 gRNA의 제1 영역은 또한 각각의 gRNA가 융합 단백질을 특이적 표적 부위로 가이드하도록 상이할 수 있다. 또한, 각 gRNA의 제2 및 제3 영역은 모든 gRNA에서 동일할 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드의 제1 영역은 gRNA의 제1 영역이 표적 부위와 염기쌍을 이룰 수 있도록 염색체 서열에서 표적 부위의 서열에 상보적일 수 있다. 일부 경우에, gRNA의 제1 영역은 약 10 개의 뉴클레오티드 내지 25 개의 뉴클레오티드(즉, 10 개의 뉴클레오티드 내지 뉴클레오티드; 또는 약 10 개의 뉴클레오티드 내지 약 25 개의 뉴클레오티드; 또는 10 개의 뉴클레오티드 내지 약 25 개의 뉴클레오티드; 또는 약 10 개의 뉴클레오티드 내지 25 개의 뉴클레오티드) 또는 그 이상을 포함할 수 있다. 예를 들어, gRNA의 제1 영역 및 염색체 서열에서 표적 부위 사이의 염기쌍 형성의 영역은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25 개 이상의 뉴클레오티드 길이일 수 있거나 약 그 길이일 수 있다. 때때로, gRNA의 제1 영역은 19, 20, 또는 21 개의 뉴클레오티드 길이일 수 있거나 약 그 길이일 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 또한 2차 구조를 형성하는 제2 영역을 포함할 수 있다. 예를 들어, gRNA에 의해 형성된 2차 구조는 줄기(또는 헤어핀) 및 루프를 포함할 수 있다. 루프와 스템의 길이는 다양할 수 있다. 예를 들어, 루프는 약 3 내지 10 개의 뉴클레오티드 길이에 이를 수 있고, 줄기는 약 6 내지 20 개의 염기쌍 길이에 이를 수 있다. 줄기는 1 내지 10 개 또는 약 10 개 뉴클레오티드의 하나 이상의 융기[bulge]를 포함할 수 있다. 제2 영역의 전체 길이는 약 16 내지 60 개의 뉴클레오티드 길이 범위일 수 있다. 예를 들어, 루프는 4 개의 뉴클레오티드 길이일 수 있거나 약 그 길이일 수 있고 줄기는 12 개의 염기쌍일 수 있거나 약 그 갯수일 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 또한 본질적으로 단일 가닥일 수 있는 3' 단부에 제3 영역을 포함할 수 있다. 예를 들어, 제3 영역은 관심 세포에서 임의의 염색체 서열에 상보성일 때도 있고 나머지 gRNA에 상보성이 아닐 때도 있다. 또한, 제3 영역의 길이는 달라질 수 있다. 제3 영역은 약 4 개 초과 또는 초과의 뉴클레오티드 길이일 수 있다. 예를 들어, 제3 영역의 길이는 약 5 내지 60 개의 뉴클레오티드 길이에 이를 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 유전자 표적의 임의의 엑손 또는 인트론을 표적으로 할 수 있다. 일부 경우에, 가이드는 유전자의 엑손 1 또는 2를 표적으로 할 수 있고, 다른 경우에, 가이드는 유전자의 엑손 3 또는 4를 표적으로 할 수 있다. 일부 구현예에서, 조성물은 동일한 엑손을 모두 표적으로 하는 다중 gRNA 또는 상이한 엑손을 표적으로 하는 다중 gRNA를 포함한다. 유전자의 엑손 및 인트론은 표적이 될 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 약 20 개 뉴클레오티드 또는 약 20 개 미만 뉴클레오티드(예를 들어, 적어도 약 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30 개 뉴클레오티드),또는 약 1 내지 100 개 뉴클레오티드(예를 들어, 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 40, 50, 60, 70, 80, 90, 100 개) 사이의 임의의 곳의 핵산 서열을 표적으로 할 수 있다. 표적 핵산 서열은 PAM의 제1 뉴클레오티드의 5' 바로 옆의 20 개 염기이거나 약 그 정도일 수 있다. gRNA는 핵산 서열을 표적으로 할 수 있다. 표적 핵산은 적어도 또는 적어도 약 1-10, 1-20, 1-30, 1-40, 1-50, 1-60, 1-70, 1-80, 1-90, 또는 1-100 개의 뉴클레오티드일 수 있다.
가이드 폴리뉴클레오티드, 예를 들어, gRNA 및 표적화 서열을 선택, 설계, 및 검증하기 위한 방법은 본원에 기재되어 있고 당업자에게 알려져 있다. 예를 들어, 핵염기 편집기 시스템에서 데아미나아제 도메인(예를 들어, AID 도메인)의 잠재적 기질 혼란의 영향을 최소화하기 위해, 탈아미노화에 대해 의도하지 않게 표적이 될 수 있는 다수의 잔기(예를 들어, 표적 핵산 유전자좌 내에서 단일 가닥 DNA에 잠재적으로 존재할 수 있는 표적외 C 잔기)는 최소화될 수 있다. 또한, 소프트웨어 도구를 사용하여 표적 핵산 서열에 상응하는 gRNA를 최적화할 수 있고, 예를 들어, 게놈 전반에 걸쳐 총 표적외 활성을 최소화할 수 있다. 예를 들어, 에스. 파이오게네스 Cas9를 사용한 각각의 가능한 표적화 도메인 선택을 위해, 모든 표적외 서열(선택되는 PAM, 예를 들어, NAG 또는 NGG에 선행)은 불일치 염기쌍의 특정 수(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개)까지를 함유하는 게놈에 걸쳐 식별될 수 있다. 표적 부위에 상보적인 gRNA의 제1 영역이 식별될 수 있고, 모든 제1 영역(예를 들어, crRNA)은 이의 총 예측된 표적외 점수에 따라 순위가 매겨질 수 있으며, 상위 순위의 표적화 도메인은 가장 큰 표적 내 및 가장 적은 표적외 활성을 가질 가능성을 나타낸다. 후보 표적화 gRNA는 당업계에 알려지고/지거나 본원에 제시된 바와 같은 방법을 사용하여 기능적으로 평가될 수 있다.
비제한적인 예로서, Cas9s와 함께 사용하기 위한 gRNA의 crRNA에서 표적 DNA 하이브리드화 서열은 DNA 서열 검색 알고리즘을 사용하여 식별될 수 있다. gRNA 설계는 문헌[Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475(2014)]에 기재된 바와 같은 공개 도구 cas-offinder를 기반으로 하는 맞춤형 gRNA 설계 소프트웨어를 사용하여 수행된다. 이 소프트웨어는 게놈 전체의 표적외 경향을 계산한 후 가이드를 점수화한다. 일반적으로 17 내지 24 길이 범위의 가이드에 대해 완벽한 일치부터 7 개의 불일치에 이르는 일치가 고려된다. 표적외 부위가 컴퓨터를 사용하여 결정되면, 각 가이드에 대해 누계 점수가 계산되고 웹 인터페이스를 사용하여 표 형식 출력으로 요약된다. PAM 서열에 인접한 잠재적인 표적 부위를 식별하는 것 이외에도, 소프트웨어는 또한 선택되는 표적 부위와 1, 2, 3 개 또는 3 개 초과의 뉴클레오티드가 상이한 모든 PAM 인접 서열을 식별한다. 표적 핵산 서열, 예를 들어, 표적 유전자에 대한 게놈 DNA 서열이 수득될 수 있고 반복 요소는 공개적으로 이용가능한 도구, 예를 들어, RepeatMasker 프로그램을 사용하여 스크리닝될 수 있다. RepeatMasker는 반복된 요소 및 복잡성이 낮은 영역에 대한 입력 DNA 서열을 검색한다. 출력은 주어진 쿼리 서열에 존재하는 반복의 상세한 주석이다.
식별 후, gRNA의 제1 영역, 예를 들어, crRNA는 표적 부위까지의 거리, 직교성[orthogonality] 및 관련 PAM 서열과 밀접하게 일치하는 5' 뉴클레오티드(예를 들어, 관련 PAM 예를 들어, 에스. 파이오게네스의 경우 NGG PAM, 에스. 아우레우스의 경우 NNGRRT 또는 NNGRRV PAM을 함유하는 인간 게놈에서 근접한 일치의 식별에 기반한 5' G)의 존재에 기반하여 계단식으로 점수가 매겨진다. 본원에 사용된 바와 같이, 직교성은 표적 서열에 대한 최소 수의 불일치를 함유하는 인간 게놈의 서열 수를 지칭한다. '높은 수준의 직교성' 또는 '우수한 직교성'은 예를 들어, 의도된 표적외에 인간 게놈에 동일한 서열이 없거나 표적 서열에서 하나 또는 두 개의 불일치를 함유하는 임의의 서열이 없는 20량체 표적 도메인을 지칭할 수 있다. 우수한 직교성을 갖는 표적화 도메인은 표적외 DNA 절단을 최소화하도록 선택될 수 있다.
그 후 gRNA는 RNA 분자 또는 비-RNA 핵산 분자, 예를 들어, DNA 분자로서 세포 또는 배아내로 도입될 수 있다. 일 구현예에서, gRNA를 암호화하는 DNA는 관심 세포 또는 배아에서 gRNA의 발현을 위한 프로모터 제어 서열에 작동가능하게 연결된다. RNA 코딩 서열은 RNA 폴리머라아제 III(Pol III)에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. gRNA를 발현하도록 사용될 수 있는 플라스미드 벡터는 px330 벡터 및 px333 벡터를 포함하나 이에 제한되지 않는다. 일부 경우에, 플라스미드 벡터(예를 들어, px333 벡터)는 적어도 두 개의 gRNA-암호화 DNA 서열을 포함할 수 있다. 또한, 벡터는 추가적인 발현 제어 서열(예를 들어, 인핸서 서열, 코작 서열, 폴리아데닐화 서열, 전사 종결 서열 등),선택 가능한 마커 서열(예를 들어, GFP 또는 퓨로마이신과 같은 항생제 내성 유전자),복제 기점 등을 포함할 수 있다. gRNA를 암호화하는 DNA 분자는 선형일 수도 있다. gRNA 또는 가이드 폴리뉴클레오티드를 암호화하는 DNA 분자는 또한 원형일 수 있다.
일부 구현예에서, 염기 편집 활성을 검출하고 후보 가이드 폴리뉴클레오티드를 테스트하기 위해 리포터 시스템이 사용된다. 일부 구현예에서, 리포터 시스템은 염기 편집 활성이 리포터 유전자의 발현을 유도하는 리포터 유전자 기반 분석을 포함한다. 예를 들어, 리포터 시스템은 불활성화된 시작 코돈, 예컨대, 주형 가닥의 3'-TAC-5'에서 3'-CAC-5'로의 돌연변이를 포함하는 리포터 유전자를 포함할 수 있다. 표적 C가 성공적으로 탈아미노화되면, 상응하는 mRNA는 5'-GUG-3' 대신에 5'-AUG-3'으로 전사되어, 리포터 유전자의 번역을 가능하게 할 것이다. 적합한 리포터 유전자는 당업자에게 명백할 것이다. 리포터 유전자의 비제한적인 예는 녹색 형광 단백질[green fluorescence protein, GFP], 적색 형광 단백질[red fluorescence protein, RFP], 루시퍼라제, 분비된 알칼리성 포스페이트[secreted alkaline phosphatase, SEAP], 또는 발현이 검출 가능하고 당업자에게 명백한 임의의 다른 유전자를 암호화하는 유전자를 포함한다. 리포터 시스템은 예를 들어, 각각의 데아미나아제가 표적으로 할 표적 DNA 서열과 관련하여 잔기(들)를 결정하기 위해 많은 상이한 gRNA를 테스트하는 데 사용될 수 있다. 비주형 가닥을 표적으로 하는 sgRNA는 또한 특이적 염기 편집 단백질, 예를 들어, Cas9 데아미나아제 융합 단백질의 표적외 효과를 평가하기 위해 테스트될 수도 있다 일부 구현예에서, 이러한 gRNA는 돌연변이된 시작 코돈이 gRNA와 염기쌍을 이루지 않도록 설계될 수 있다. 가이드 폴리뉴클레오티드는 표준 리보뉴클레오티드, 변형된 리보뉴클레오티드(예를 들어, 슈도우리딘),리보뉴클레오티드 이성질체, 및/또는 리보뉴클레오티드 유사체를 포함할 수 있다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 적어도 하나의 검출 가능한 표지를 포함할 수 있다. 검출 가능한 표지는 형광단(예를 들어, FAM, TMR, Cy3, Cy5, Texas Red, Oregon Green, Alexa Fluors, Halo 태그, 또는 적합한 형광 염료),검출 태그(예를 들어, 비오틴, 디곡시게닌 등), 양자점, 또는 금 입자일 수 있다.
일부 구현예에서, 염기 편집기 시스템은 다중 가이드 폴리뉴클레오티드, 예를 들어, gRNA를 포함할 수 있다. 예를 들어, gRNA는 염기 편집기 시스템에 포함된 하나 이상의 표적 유전자좌(예를 들어, 적어도 1 개의 gRNA, 적어도 2 개의 gRNA, 적어도 5 개의 gRNA, 적어도 10 개의 gRNA, 적어도 20 개의 gRNA, 적어도 30 개의 g RNA, 적어도 50 개의 gRNA)를 표적화할 수 있다. 다중 gRNA 서열은 나란히 배열될 수 있고 바람직하게는 직접 반복에 의해 분리된다.
가이드 폴리뉴클레오티드는 새롭거나 또는 향상된 특징을 갖는 핵산을 제공하도록 하나 이상의 변형을 포함할 수 있다. 가이드 폴리뉴클레오티드는 핵산 친화성 태그를 포함할 수 있다. 가이드 폴리뉴클레오티드는 통합 뉴클레오티드, 통합 뉴클레오티드 유사체, 뉴클레오티드 유도체, 및/또는 변형된 뉴클레오티드를 포함할 수 있다.
일부 경우에, gRNA 또는 가이드 폴리뉴클레오티드는 변형을 포함할 수 있다. 변형은 gRNA 또는 가이드 폴리뉴클레오티드의 임의의 위치에서 이루어질 수 있다. 하나 초과의 변형은 단일 gRNA 또는 가이드 폴리뉴클레오티드로 이루어질 수 있다. gRNA 또는 가이드 폴리뉴클레오티드는 변형 후 품질 관리를 받을 수 있다. 일부 경우에, 품질 관리는 PAGE, HPLC, MS, 또는 이의 임의의 조합을 포함할 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드의 변형은 치환, 삽입, 결실, 화학적 변형, 물리적 변형, 안정화, 정제, 또는 이의 임의의 조합일 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 또한 5'아데닐레이트, 5' 구아노신-트리포스페이트 캡, 5'N7-메틸구아노신-트리포스페이트 캡, 5'트리포스페이트 캡, 3'포스페이트, 3'티오포스페이트, 5'포스페이트, 5'티오포스페이트, Cis-Syn 티미딘 이량체, 삼량체, C12 스페이서, C3 스페이서, C6 스페이서, d스페이서, PC 스페이서, r스페이서, 스페이서 18, 스페이서 9, 3'-3' 변형, 5'-5' 변형, 무염기성, 아크리딘, 아조벤젠, 비오틴, 비오틴 BB, 비오틴 TEG, 콜레스테릴 TEG, 데스티오비오틴 TEG, DNP TEG, DNP-X, DOTA, dT-비오틴, 이중 비오틴, PC 비오틴, 소랄렌 C2, 소랄렌 C6, TINA, 3'DABCYL, 블랙 홀 퀀처 1, 블랙 홀 퀀서 2, DABCYL SE, dT-DABCYL, IRDye QC-1, QSY-21, QSY-35, QSY-7, QSY-9, 카르복실 링커, 티올 링커, 2'-데옥시리보뉴클레오시드 유사체 퓨린, 2'-데옥시리보뉴클레오시드 유사체 피리미딘, 리보뉴클레오시드 유사체, 2'-O-메틸 리보뉴클레오시드 유사체, 당 변형된 유사체, 워블(wobble)/보편적 염기, 형광 염료 라벨, 2'-플루오로 RNA, 2'-O-메틸 RNA, 메틸포스포네이트, 포스포디에스테르 DNA, 포스포디에스테르 RNA, 포스포티오에이트 DNA, 포스포로티오에이트 RNA, UNA, 슈도우리딘-5'-트리포스페이트, 5'-메틸시티딘-5'-트리포스페이트, 또는 이의 임의의 조합에 의해 변형될 수 있다.
일부 경우에, 변형은 영구적이다. 다른 경우에, 변형은 일시적이다. 일부 경우에, 다중 변형은 gRNA 또는 가이드 폴리뉴클레오티드로 이루어질 수 있다. gRNA 또는 가이드 폴리뉴클레오티드 변형은 형태, 극성, 소수성, 화학적 반응성, 염기쌍 형성 상호작용, 또는 이의 임의의 조합과 같은 뉴클레오티드의 물리화학적 특성을 변경시킬 수 있다.
가이드 폴리뉴클레오티드는 가이드 RNA 및 프로모터를 코딩하는 서열을 포함하는 단리된 gRNA 또는 플라스미드 DNA로 세포를 형질감염시킴으로써 세포 내로 전달될 수 있다. gRNA 또는 가이드 폴리뉴클레오티드는 또한 바이러스 매개 유전자 전달을 사용하는 것과 같이, 다른 방식으로 세포 내로 전달될 수 있다. gRNA 또는 가이드 폴리뉴클레오티드는 단리될 수 있다. 예를 들어, gRNA는 단리된 RNA의 형태로 세포 또는 유기체 내로 형질감염될 수 있다. gRNA는 당업계에 알려진 임의의 시험관내 전사 시스템을 사용하여 시험관내 전사에 의해 제조될 수 있다.gRNA는 gRNA에 대한 암호화된 서열을 포함하는 플라스미드의 형태보다는 단리된 RNA의 형태로 세포에 전달될 수 있다.
변형은 또한 포스포로티오에이트 대체물일 수 있다. 일부 경우에, 천연 포스포디에스테르 결합은 세포 뉴클레아제에 의한 빠른 분해에 민감할 수 있고, 포스포로티오에이트(PS) 결합 대체물을 사용한 뉴클레오티드간 연결의 변형은 세포 분해에 의한 가수분해에 대해 보다 안정될 수 있다. 변형은 gRNA 또는 가이드 폴리뉴클레오티드에서 안정성을 증가시킬 수 있다. 변형은 또한 생물학적 활성을 향상시킬 수 있다. 일부 경우에, 포스포로티오에이트 향상된 RNA gRNA는 RNase A, RNase T1, 송아지 혈청 뉴클레아제, 또는 이의 임의의 조합을 억제할 수 있다. 이러한 특성은 뉴클레아제에 대한 노출이 생체내 또는 시험관내에서 높은 확률로 이루어지는 적용에서 사용되도록 PS-RNA gRNA를 사용하도 할 수 있다. 예를 들어, 포스포로티오에이트(PS) 결합은 엑소뉴클레아제 분해를 억제할 수 있는 gRNA의 5' 또는 3' 단부에서 마지막 3 내지 5 개의 뉴클레오티드 사이에 도입될 수 있다. 일부 경우에, 포스포로티오에이트 결합은 엔도뉴클레아제에 의한 공격을 감소시키기 위해 전체 gRNA 전반에 걸쳐 첨가될 수 있다.
일부 구현예에서, 가이드 RNA는 스플라이스 부위(즉, 스플라이스 수용체[SA] 또는 스플라이스 공여체[SD])를 파괴하도록 설계된다. 일부 구현예에서, 가이드 RNA는 염기 편집이 조기 종결 코돈을 초래하도록 설계된다.
프로토스페이서 인접 모티프
용어 '프로토스페이서 인접 모티프[PAM]' 또는 PAM-유사 모티프는 CRISPR 박테리아 적응 면역 시스템에서 Cas9 뉴클레아제에 의해 표적화된 DNA 서열 바로 다음에 있는 2 내지 6 개의 염기쌍 DNA 서열을 지칭한다. 일부 구현예에서, PAM은 5' PAM(즉, 프로토스페이서의 5' 단부의 상류에 위치)일 수 있다. 다른 구현예에서, PAM은 3' PAM(즉, 프로토스페이서의 5' 단부의 하류에 위치)일 수 있다. PAM 서열은 표적 결합에 필수적이지만, 정확한 서열은 Cas 단백질의 유형에 따라 달라진다. PAM 서열은 당업계에 알려진 임의의 PAM 서열일 수 있다. 적합한 PAM 서열은 NGG, NGA, NGC, NGN, NGT, NGTT, NGCG, NGAG, NGAN, NGNG, NGCN, NGCG, NGTN, NNGRRT, NNNRRT, NNGRR(N),TTTV, TYCV, TYCV, TATV, NNNNGATT, NNAGAAW, 또는 NAAAAC을 포함하나, 이에 제한되지 않는다. Y는 피리미딘이고; N은 임의의 뉴클레오티드 염기이고; W는 A 또는 T이다.
본원에 제공된 염기 편집기는 표준 또는 비표준 프로토스페이서 인접 모티프[PAM] 서열을 함유하는 뉴클레오티드 서열을 결합할 수 있는 CRISPR 단백질 유래 도메인을 포함할 수 있다. PAM 부위는 표적 폴리뉴클레오티드 서열에 근접한 뉴클레오티드 서열이다. 본 개시의 일부 양태는 상이한 PAM 특이성을 갖는 CRISPR 단백질의 전부 또는 일부를 포함하는 염기 편집기를 제공한다.
예를 들어, 일반적으로 에스. 파이오게네스로부터의 Cas9(spCas9)와 같은 Cas9 단백질은 특정 핵산 영역에 결합하기 위해 표준 NGG PAM 서열이 필요하고, 여기서 'NGG'의 'N'은 아데닌(A),티민(T),구아닌(G),또는 시토신(C)이고, G는 구아닌이다. PAM은 CRISPR 단백질 특이적일 수 있고 상이한 CRISPR 단백질 유래 도메인을 포함하는 상이한 염기 편집기 간에 다를 수 있다. PAM은 표적 서열의 5' 또는 3'일 수 있다. PAM은 표적 서열의 상류 또는 하류에 있을 수 있다. PAM은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 뉴클레오티드 길이일 수 있다. 종종, PAM은 2 내지 6 개의 뉴클레오티드 길이이다.
일부 구현예에서, 'NRN'에서의 'N'은 아데닌(A),티민(T),구아닌(G),또는 시토신(C)이고, R이 아데닌(A) 또는 구아닌(G)인 'NRN' PAM; 또는 PAM은 'NYN' PAM이되, NYN에서의 'N'은 아데닌(A),티민(T),구아닌(G),또는 시토신(C)이고, Y는 시티딘(C) 또는 티민(T)이며, 예를 들어 문헌 [R.T. Walton et al., 2020, Science, 10.1126/science.aba8853(2020)]에 기재되어 있고, 이의 전체 내용은 본원에 참조로 포함된다.
여러 PAM 변이체는 아래 표 7에 기재되어 있다.
[표 7] Cas9 단백질 및 상응하는 PAM 서열
일부 구현예에서, PAM은 NGC이다. 일부 구현예에서, NGC PAM은 Cas9 변이체에 의해 인식된다. 일부 구현예에서, NGC PAM 변이체는 D1135M, S1136Q, G1218K, E1219F, A1322R, D1332A, R1335E, 및 T1337R(집합적으로 "MQKFRAER"이라고 불림)에서 선택되는 하나 이상의 아미노산 치환을 포함한다.
일부 구현예에서, PAM은 NGT이다. 일부 구현예에서, NGT PAM은 Cas9 변이체에 의해 인식된다. 일부 구현예에서, NGT PAM 변이체는 하나 이상의 잔기 1335, 1337, 1135, 1136, 1218, 및/또는 1219에서 표적화된 돌연변이를 통해 생성된다. 일부 구현예에서, NGT PAM 변이체는 하나 이상의 잔기 1219, 1335, 1337, 1218에서 표적화된 돌연변이를 통해 생성된다. 일부 구현예에서, NGT PAM 변이체는 하나 이상의 잔기 1135, 1136, 1218, 1219, 및 1335에서 표적화된 돌연변이를 통해 생성된다. 일부 구현예에서, NGT PAM 변이체는 아래 표 8A 8B에 제공된 표적화된 돌연변이 세트에서 선택된다.
[표 8A] 잔기 1219, 1335, 1337, 1218에서의 NGT PAM 변이체 돌연변이
[표 8B] 잔기 1135, 1136, 1218, 1219, 및 1335에서의 NGT PAM 변이체 돌연변이
일부 구현예에서, NGT PAM 변이체는 표 8A표 8B의 변이체 5, 7, 28, 31, 또는 36 중에서 선택된다. 일부 구현예에서, 변이체는 개선된 NGT PAM 인식을 갖는다.
일부 구현예에서, NGT PAM 변이체는 잔기 1219, 1335, 1337, 및/또는 1218에서 돌연변이를 갖는다. 일부 구현예에서, NGT PAM 변이체는 아래 표 9에 제공된 변이체로부터 개선된 인식을 위한 돌연변이로 선택된다.
[표 9] 잔기 1219, 1335, 1337, 및 1218에서의 NGT PAM 변이체 돌연변이
일부 구현예에서, NGT PAM은 아래 표 10에 제공된 변이체에서 선택된다.
[표 10] NGT PAM 변이체
일부 구현예에서 NGTN 변이체는 변이체 1이다. 일부 구현예에서, NGTN 변이체는 변이체 2이다. 일부 구현예에서, NGTN 변이체는 변이체 3이다. 일부 구현예에서, NGTN 변이체는 변이체 4이다. 일부 구현예에서, NGTN 변이체는 변이체 5이다. 일부 구현예에서, NGTN 변이체는 변이체 6이다.
일부 구현예에서, Cas9 도메인은 스트렙토코쿠스 파이오게네스에서의 Cas9 도메인(SpCas9)이다. 일부 구현예에서, SpCas9 도메인은 뉴클레아제 활성 SpCas9, 뉴클레아제 불활성 SpCas9(SpCas9d),또는 SpCas9 니카아제(SpCas9n)이다. 일부 구현예에서, SpCas9는 D9X 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하되, X는 D를 제외한 임의의 아미노산이다. 일부 구현예에서, SpCas9는 D9A 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인, SpCas9d 도메인, 또는 SpCas9n 도메인은 비표준 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SpCas9 도메인, SpCas9d 도메인, 또는 SpCas9n 도메인은 NGG, NGA, 또는 NGCG PAM 서열을 갖는 핵산 서열에 결합할 수 있다.
일부 구현예에서, SpCas9 도메인은 D1135X, R1335X, 및 T1337X 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하고, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, SpCas9 도메인은 D1135E, R1335Q, 및 T1337R 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135E, R1335Q, 및 T1337R 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135X, R1335X, 및 T1337X 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하고, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, SpCas9 도메인은 D1135V, R1335Q, 및 T1337R 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135V, R1335Q, 및 T1337R 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135X, G1218X, R1335X, 및 T1337X 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, SpCas9 도메인은 D1135V, G1218R, R1335Q, 및 T1337R 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135V, G1218R, R1335Q, 및 T1337R 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다.
일부 예에서, 본원에 개시된 염기 편집기의 CRISPR 단백질 유래 도메인에 의해 인식된 PAM은 염기 편집기를 암호화하는 삽입물(예를 들어, AAV 삽입물)에 대한 별도의 올리고뉴클레오티드 상의 세포에 제공될 수 있다. 이러한 구현예에서, 별도의 올리고뉴클레오티드 상에 PAM을 제공하면 표적 서열과 동일한 폴리뉴클레오티드 상에 인접한 PAM이 존재하지 않기 때문에 달리 절단될 수 없는 표적 서열이 절단되게 할 수 있다.
일 구현예에서, 에스. 피오게네스 Cas9(SpCas9)는 게놈 조작을 위한 CRISPR 엔도뉴클레아제로 사용될 수 있다. 그러나, 다른 것이 사용될 수 있다. 일부 구현예에서, 특정 게놈 표적을 표적으로 하기 위해 다른 엔도뉴클레아제가 사용될 수 있다. 일부 구현예에서, 비-NGG PAM 서열을 갖는 합성 SpCas9-유래 변이체가 사용될 수 있다. 추가로, 다양한 종으로부터의 다른 Cas9 오솔로그가 식별되었고 이러한 '비-SpCas9s'는 또한 본 개시에 유용할 수 있는 다양한 PAM 서열에 결합할 수 있다. 예를 들어, SpCas9의 비교적 큰 크기(대략 4kb 코딩 서열)는 세포에서 효율적으로 발현될 수 없는 SpCas9 cDNA를 운반하는 플라스미드로 이어질 수 있다 반대로, 스타필로코쿠스 아우레우스 Cas9(SaCas9)에 대한 코딩 서열은 SpCas9보다 대략 1 킬로베이스 더 짧기 때문에, 세포에서 효율적으로 발현될 수 있다. SpCas9와 유사하게, SaCas9 엔도뉴클레아제는 시험관내 포유류 세포 및 생체내 마우스의 표적 유전자를 변형할 수 있다. 일부 구현예에서, Cas 단백질은 상이한 PAM 서열을 표적으로 할 수 있다. 일부 구현예에서, 표적 유전자는 예를 들어 Cas9 PAM, 5'-NGG에 인접할 수 있다. 다른 구현예에서, 다른 Cas9 오솔로그는 상이한 PAM 요건을 가질 수 있다. 예를 들어, 에스. 써모필루스(CRISPR1의 경우 5'-NNAGAA 및 CRISPR3의 경우 5'-NGGNG) 네이세리아 메닌자이티디스(Neisseria meningiditis)(5'-NNNNGATT)의 PAM과 같은 다른 PAM 또한 표적 유전자 근처에서 발견될 수 있다.
일부 구현예에서, 에스. 피오게네스 시스템의 경우, 표적 유전자 서열은 5'-NGG PAM에 선행할 수 있고(즉, 5'에 대해),20-nt 가이드 RNA 서열은 반대 가닥과 염기쌍을 이루어 PAM에 인접한 Cas9 절단을 매개할 수 있다. 일부 구현예에서, 인접한 절단은 PAM의 상류에 있는 약 3 개의 염기쌍일 수 있거나 그 갯수일 수 있다. 일부 구현예에서, 인접한 절단은 PAM의 상류에 있는 약 10 개의 염기쌍일 수 있거나 그 갯수일 수 있다. 일부 구현예에서, 인접한 절단은 PAM의 상류에 있는 약 0 내지 20 개의 염기쌍일 수 있거나 그 갯수일 수 있다. 예를 들어, 인접한 절단은 PAM의 상류에 있는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30 개의 염기쌍 옆에 있을 수 있다. 인접한 절단은 또한 1 내지 30 개의 염기쌍에 의해 PAM의 하류에 있을 수 있다. PAM 서열을 결합할 수 있는 예시적인 SpCas9 단백질의 서열은 다음과 같다:
일부 구현예에서, 조작된 SpCas9 변이체는 3' H(비-G PAM)에 의해 플랭킹된 프로토스페이서 인접 모티프(PAM) 서열을 인식할 수 있다(표 3A-3D 참조). 일부 구현예에서, SpCas9 변이체는 NRNH PAM(여기서, R은 A 또는 G이고, H는 A, C 또는 T임)을 인식한다. 일부 구현예에서, 비-G PAM은 NRRH, NRTH 또는 NRCH이다(예를 들어, 문헌[Miller, S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol.(2020)]을 참조하고, 이는 전체 내용이 본원에 참조로 포함된다).
일부 구현예에서, Cas9 도메인은 재조합 Cas9 도메인이다. 일부 구현예에서, 재조합 Cas9 도메인은 SpyMacCas9 도메인이다. 일부 구현예에서, SpyMacCas9 도메인은 뉴클레아제 활성 SpyMacCas9, 뉴클레아제 불활성 SpyMacCas9(SpyMacCas9d),또는 SpyMacCas9 니카아제(SpyMacCas9n)이다. 일부 구현예에서, SaCas9 도메인, SaCas9d 도메인, 또는 SaCas9n 도메인은 비표준 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SpyMacCas9 도메인, SpCas9d 도메인, 또는 SpCas9n 도메인은 NAA PAM 서열을 갖는 핵산 서열에 결합할 수 있다.
천연 5'NAAN-3' PAM 특이성을 갖는 스트렙토코쿠스 마카카에(Streptococcus macacae)에서 Spy Cas9의 예시적인 Cas9 A 상동체의 서열은 당업계에 알려져 있고, 예를 들어, Jakimo et.al.,에 의한(문헌[Chatterjee, et al., “A Cas9 with PAM recognition for adenine dinucleotides”, Nature Communications, vol. 11, article no. 2474(2020)])에 기재되어 있으며, 서열 목록에 서열 번호 237로 존재한다.
일부 구현예에서, 변이체 Cas9 단백질은 H840A, P475A, W476A, N477A, D1125A, W1126A, 및 D1218A 돌연변이를 보유하여 폴리펩티드가 표적 DNA 또는 RNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다. 또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 D10A, H840A, P475A, W476A, N477A, D1125A, W1126A, 및 D1218A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 유지한다. 일부 구현예에서, 변이체 Cas9 단백질이 W476A 및 W1126A 돌연변이를 보유하거나 또는 변이체 Cas9 단백질이 P475A, W476A, N477A, D1125A, W1126A, 및 D1218A 돌연변이를 보유하는 경우, 변이체 Cas9 단백질은 PAM 서열에 효율적으로 결합하지 않는다. 따라서, 일부 이러한 경우에, 이러한 변이체 Cas9 단백질이 결합 방법에 사용되는 경우, 이 방법에는 PAM 서열이 필요하지 않다. 다시 말해서, 일부 구현예에서, 이러한 변이체 Cas9 단백질이 결합 방법에 사용되는 경우, 방법은 가이드 RNA를 포함할 수 있지만, 이 방법은 PAM 서열의 부재하에 수행될 수 있다(그리고 결합의 특이성은 따라서 가이드 RNA의 표적화 분절에 의해 제공된다). 다른 잔기가 돌연변이되어 위의 효과를 달성할 수 있다(즉, 하나 또는 다른 뉴클레아제 부분을 불활성화시킨다). 비제한적인 예로서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, 및/또는 A987은 변경(즉, 치환)될 수 있다. 또한, 알라닌 치환 이외의 돌연변이가 적합하다.
일부 구현예에서, 염기 편집기의 CRISPR 단백질 유래 도메인은 표준 PAM 서열[NGG]을 갖는 Cas9 단백질의 전부 또는 일부를 포함할 수 있다. 다른 구현예에서, 염기 편집기의 Cas9-유래 도메인은 비표준 PAM 서열을 이용할 수 있다. 이러한 서열은 당업계에 기재되어 있고 숙련된 당업자에게 명백할 것이다. 예를 들어, 비표준 PAM 서열에 결합하는 Cas9 도메인은 문헌[Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485(2015)]; 및 문헌[Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298(2015)]; 문헌[R.T. Walton et al. “Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants” Science 10.1126/science.aba8853(2020)]; 문헌[Hu et al. “Evolved Cas9 variants with broad PAM compatibility and high DNA specificity,” Nature, 2018 Apr. 5, 556(7699),57-63]; 문헌[Miller et al., “Continuous evolution of SpCas9 variants compatible with non-G PAMs” Nat. Biotechnol., 2020 Apr;38(4):471-481];에 기재되어 있고, 각각의 전체 내용은 본원에 참조로 포함된다.
NapDNAbp 및 시티딘 데아미나아제 및/또는 아데노신 데아미나아제를 포함하는 융합 단백질
본 개시의 일부 양태는 Cas9 도메인 또는 다른 핵산 프로그래밍 가능한 DNA 결합 단백질(예를 들어, Cas12) 및 하나 이상의 시티딘 데아미나아제 또는 아데노신 데아미나아제 도메인을 포함하는 융합 단백질을 제공한다. Cas9 도메인은 본원에 제공된 Cas9 도메인 또는 Cas9 단백질(예를 들어, dCas9 또는 nCas9)중임의의 것일 수 있음이 이해되어야 한다. 일부 구현예에서, 본원에 제공된 Cas9 도메인 또는 Cas9 단백질(예를 들어, dCas9 또는 nCas9) 중 임의의 것은 본원에 제공된 시티딘 데아미나아제 및/또는 아데노신 데아미나아제 중 임의의 것과 융합될 수 있다. 본원에 개시된 염기 편집기의 도메인은 임의의 순서로 배열될 수 있다.
일부 구현예에서, 융합 단백질은 아래 도메인 A-C, A-D ,또는 A-E를 포함한다:
NH2-[A-B-C]-COOH;
NH2-[A-B-C-D]-COOH; 또는
NH2-[A-B-C-D-E]-COOH;
여기서, A 및 C 또는 A, C 및 E는 각각 다음 중 하나 이상을 포함한다:
아데노신 데아미나아제 도메인 또는 이의 활성 단편,
시티딘 데아미나아제 도메인 또는 이의 활성 단편, 및
위에서, B 또는 B 및 D는 각각 핵산 서열 특이적 결합 활성을 갖는 하나 이상의 도메인을 포함한다.
일부 구현예에서, 융합 단백질은 다음 구조를 포함한다:
NH2-[An-Bo-Cn]-COOH;
NH2-[An-Bo-Cn-Do]-COOH; 또는
NH2-[An-Bo-Cp-Do-Eq]-COOH;
여기서, A 및 C 또는 A, C 및 E는 각각 다음 중 하나 이상을 포함한다:
아데노신 데아미나아제 도메인 또는 이의 활성 단편,
시티딘 데아미나아제 도메인 또는 이의 활성 단편, 및
위에서, n은 1, 2, 3, 4 또는 5의 정수이고: p는 0, 1, 2, 3, 4 또는 5의 정수이고;q는 0, 1, 2, 3, 4 또는 5의 정수이고;B 또는 B 및 D는 각각 핵산 서열 특이적 결합 활성을 갖는 도메인을 포함하며;o는 1, 2, 3, 4 또는 5의 정수이다.
예를 들어, 그리고 제한 없이, 일부 구현예에서, 융합 단백질은 다음 구조를 포함한다:
NH2-[아데노신 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[ 아데노신 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[시티딘 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[Cas9 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas9 도메인]-[시티딘 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[시티딘 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[시티딘 데아미나아제]-[아데노신 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[아데노신 데아미나아제]-[시티딘 데아미나아제]-COOH;또는
NH2-[Cas9 도메인]-[시티딘 데아미나아제]-[아데노신 데아미나아제]-COOH.
일부 구현예에서, 본원에 제공된 Cas12 도메인 또는 Cas12 단백질 중 임의의 것은 본원에 제공된 시티딘 데아미나아제 및 아데노신 데아미나아제 중 임의의 것과 융합될 수 있다. 예를 들어, 그리고 제한 없이, 일부 구현예에서, 융합 단백질은 다음 구조를 포함한다:
NH2-[아데노신 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[Cas12 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[Cas12 도메인]-[시티딘 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[Cas12 도메인-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas12 도메인]-[시티딘 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[시티딘 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[시티딘 데아미나아제]-[아데노신 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[Cas12 도메인]-[아데노신 데아미나아제]-[시티딘 데아미나아제]-COOH;또는
NH2-[Cas12 도메인]-[시티딘 데아미나아제]-[아데노신 데아미나아제]-COOH.
일부 구현예에서, 아데노신 데아미나아제는 TadA*8이다. 예시적인 융합 단백질 구조는 다음을 포함한다:
NH2-[TadA*8]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[TadA*8]-COOH;
NH2-[TadA*8]-[Cas12 도메인]-COOH;또는
NH2-[Cas12 도메인]-[TadA*8]-COOH.
일부 구현예에서, 융합 단백질의 아데노신 데아미나아제는 TadA*8 및 시티딘 데아미나아제 및/또는 아데노신 데아미나아제를 포함한다. 일부 구현예예서, TadA*8는 TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24이다.
예시적인 융합 단백질 구조는 다음을 포함한다:
NH2-[TadA*8]-[Cas9/Cas12]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas9/Cas12]-[TadA*8]-COOH;
NH2-[TadA*8]-[Cas9/Cas12]-[시티딘 데아미나아제]-COOH;또는
NH2-[시티딘 데아미나아제]-[Cas9/Cas12]-[TadA*8]-COOH.
일부 구현예에서, 융합 단백질의 아데노신 데아미나아제는 TadA*9 및 시티딘 데아미나아제 및/또는 아데노신 데아미나아제를 포함한다. 예시적인 융합 단백질 구조는 다음을 포함한다:
NH2-[TadA*9]-[Cas9/Cas12]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas9/Cas12]-[TadA*9]-COOH;
NH2-[TadA*9]-[Cas9/Cas12]-[시티딘 데아미나아제]-COOH;또는
NH2-[시티딘 데아미나아제]-[Cas9/Cas12]-[TadA*9]-COOH.
일부 구현예에서, 융합 단백질은 Cas9 또는 Cas12 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 데아미나아제를 포함할 수 있다. 일부 구현예에서, 융합 단백질은 Cas9 또는 Cas12 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 시티딘 데아미나아제를 포함한다. 일부 구현예에서, 융합 단백질은 Cas9 또는 Cas12 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 아데노신 데아미나아제를 포함한다.
일부 구현예에서, 시티딘 데아미나아제 또는 아데노신 데아미나아제 및 napDNAbp(예를 들어, Cas9 또는 Cas12도메인)를 포함하는 융합 단백질은 링커 서열을 포함하지 않는다. 일부 구현예에서, 링커는 시티딘 또는 아데노신 데아미나아제 및 napDNAbp 사이에 존재한다. 일부 구현예에서, 위 일반적인 구조에 사용되는 '-'는 임의의 링커의 존재를 가리킨다. 일부 구현예에서, 시티딘 또는 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다. 예를 들어, 일부 구현예에서, 시티딘 데아미나아제 및 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다.
본 개시의 융합 단백질은 하나 이상의 추가 특성을 포함할 수 있음이 이해되어야 한다. 예를 들어, 일부 구현예에서, 융합 단백질은 억제제, 세포질 국소화 서열, 핵 외수송 서열과 같은 외수송 서열, 또는 다른 국소화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제, 또는 검출에 유용한 서열 태그를 포함할 수 있다. 본원에 제공된 적합한 단백질 태그는 비오틴 카르복실라제 담체 단백질[biotin carboxylase carrier protein, BCCP] 태그, myc-태그, 칼모듈린-태그, FLAG-태그, 헤마글루티닌(hemagglutinin, HA)-태그, 히스티딘 태그 또는 His-태그로도 지칭되는 폴리히스티딘 태그, 말토스 결합 단백질[maltose binding protein, MBP]-태그, nus-태그, 글루타티온-S-트랜스퍼라제(glutathione-S-transferase, GST)-태그, 녹색 형광 단백질[GFP]-태그, 티오레독신-태그, S-태그, Softag(예를 들어, Softag 1, Softag 3),strep-태그, 비오틴 리가제 태그, FlAsH 태그, V5 태그, 및 SBP-태그를 포함하나 이에 제한되지 않는다. 추가적인 적합한 서열은 당업자에게 명백할 것이다. 일부 구현예에서, 융합 단백질은 하나 이상의 His 태그를 포함한다.
예시적이지만, 비제한적인 융합 단백질은 국제 PCT 출원 PCT/2017/044935, PCT/US2019/044935, 및 PCT/US2020/016288에 기재되어 있으며, 이들 각각은 그 전체가 본원에 참조로 포함된다.
핵 국소화 서열[Nuclear Localization Sequence , NLS]을 포함하는 융합 단백질
일부 구현예에서, 본원에 제공된 융합 단백질은 하나 이상(예를 들어, 2, 3, 4, 5 개)의 핵 표적화 서열, 예를 들어 핵 국소화 서열[NLS]을 더 포함한다. 일 구현예에서, 이분 NLS가 사용된다. 일부 구현예에서, NLS는 NLS를 포함하는 단백질의 세포 핵 내로의 유입(예를 들어, 핵 수송체에 의함)을 용이하게 하는 아미노산 서열을 포함한다. 일부 구현예에서, NLS는 융합 단백질의 N-말단 또는 C-말단에 융합된다. 일부 구현예에서, NLS는 nCas9 도메인 또는 dCas9 도메인의 C-말단 또는 N-말단에 융합된다. 일부 구현예에서, NLS는 Cas12 도메인의 N-말단 또는 C-말단에 융합된다. 일부 구현예에서, NLS는 시티딘 또는 아데노신 데아미나아제의 N-말단 또는 C-말단에 융합된다. 일부 구현예에서, NLS는 하나 이상의 링커를 통해 융합 단백질에 융합된다. 일부 구현예에서, NLS는 링커 없이 융합 단백질에 융합된다. 일부 구현예에서, NLS는 본원에 제공되거나 또는 참조된 NLS 서열 중 임의의 하나의 아미노산 서열을 포함한다. 추가의 핵 국소화 서열은 당업계에 알려져 있고 숙련된 당업자에게 명백할 것이다. 예를 들어, NLS 서열은 Plank et al., PCT/EP2000/011690에 기재되어 있으며, 이의 내용은 예시적인 핵 국소화 서열의 개시에 대해 본원에 참조로 포함된다. 일부 구현예에서, NLS는 아미노산 서열 PKKKRKVEGADKRTADGSEFESPKKKRKV(서열 번호328),KRTADGSEFESPKKKRKV(서열 번호190),KRPAATKKAGQAKKKK(서열 번호191),KKTELQTTNAENKTKKL(서열 번호192),KRGINDRNFWRGENGRKTR(서열 번호 193),RKSGKIAAIVVKRPRKPKKKRKV(서열 번호329),또는 MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(서열 번호196)을 포함한다.
일부 구현예에서, 시티딘 또는 아데노신 데아미나아제, Cas9 도메인, 및 NLS를 포함하는 융합 단백질은 링커 서열을 포함하지 않는다. 일부 구현예에서, 도메인 또는 단백질(예를 들어, 시티딘 또는 아데노신 데아미나아제, Cas9 도메인 또는 NLS) 중 하나 이상 사이에 링커 서열이 존재한다. 일부 구현예에서, 링커는 시티딘 데아미나아제 및 아데노신 데아미나아제 도메인 및 napDNAbp 사이에 존재한다. 일부 구현예에서, 아래 일반적인 구조에 사용되는 '-'는 임의의 링커의 존재를 나타낸다. 일부 구현예에서, 시티딘 데아미나아제 및 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다. 예를 들어, 일부 구현예에서, 시티딘 데아미나아제 및 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다.
일부 구현예에서, 시티딘 또는 아데노신 데아미나아제 및 napDNAbp(예를 들어, Cas9 또는 Cas12) 도메인을 갖는 예시적인 napDNAbp(예를 들어, Cas9 또는 Cas12) 융합 단백질의 일반적인 구조는 다음 구조 중 어느 하나를 포함하고, 여기서 NLS는 핵 국소화 서열(예를 들어, 본원에 제공된 임의의 NLS)이고, NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다:
NH2-NLS-[시티딘 데아미나아제]-[napDNAbp도메인]-COOH;
NH2-NLS [napDNAbp 도메인]-[시티딘 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[napDNAbp 도메인]-[시티딘 데아미나아제]-NLS-COOH;
NH2-NLS-[아데노신 데아미나아제]-[napDNAbp 도메인]-COOH;
NH2-NLS [napDNAbp 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[napDNAbp 도메인]-[아데노신 데아미나아제]-NLS-COOH;
NH2-NLS-[시티딘 데아미나아제]-[napDNAbp 도메인]-[아데노신 데아미나아제]-COOH;
NH2-NLS-[아데노신 데아미나아제]-[napDNAbp 도메인]-[시티딘 데아미나아제]-COOH;
NH2-NLS-[아데노신 데아미나아제] [시티딘 데아미나아제]-[napDNAbp 도메인]-COOH;
NH2-NLS-[시티딘 데아미나아제]-[아데노신 데아미나아제]-[napDNAbp 도메인]-COOH;
NH2-NLS-[napDNAbp 도메인]-[아데노신 데아미나아제]-[시티딘데아미나아제]-COOH;
NH2-NLS-[napDNAbp 도메인]-[시티딘 데아미나아제]-[아데노신 데아미나아제]-COOH;
NH2-[시티딘 데아미나아제]-[napDNAbp 도메인]-[아데노신 데아미나아제]-NLS-COOH;
NH2-[아데노신 데아미나아제]-[napDNAbp 도메인]-[시티딘 데아미나아제]-NLS-COOH;
NH2-[아데노신 데아미나아제] [시티딘 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[시티딘 데아미나아제]-[아데노신 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[napDNAbp 도메인]-[아데노신 데아미나아제]-[시티딘 데아미나아제]-NLS-COOH;또는
NH2-[napDNAbp 도메인]-[시티딘 데아미나아제]-[아데노신 데아미나아제]-NLS-COOH. 일부 구현예에서, NLS는 링커에 존재하거나 또는 NLS는 예를 들어 본원에 기재된 링커에 의해 플랭킹된다. 이분 NLS는 비교적 짧은 스페이서 서열에 의해 분리된 두 개의 염기성 아미노산 클러스터를 포함한다(따라서 이분 - 2 부분, 반면에 일분[monopartite] NLS는 아니다).뉴클레오플라스민의 NLS인 KR[PAATKKAGQA]KKKK(서열 번호 191)는 보편적인 이분 신호의 원형이다: 약 열 개의 아미노산의 스페이서에 의해 분리된 염기성 아미노산의 두 개의 클러스터. 예시적인 이분 NLS의 서열은 다음과 같다:
PKKKRKVEGADKRTADGSEFESPKKKRKV(서열 번호 328)
하나 이상의 핵 국소화 서열[NLS]을 포함하는 CRISPR 효소를 암호화하는 벡터가 사용될 수 있다. 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개의 NLS가 사용될 수 있거나 사용된다. CRISPR 효소는 아미노-말단에서 또는 근처에서 NLS, 카르복시-말단에서 또는 그 근처에서 약 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 초과의 NLS, 또는 이들의 임의의 조합(예를 들어, 아미노-말단에서 하나 이상의 NLS 및 카르복시 말단에서 하나 이상의 NLS)을 포함할 수 있다. 하나 초과의 NLS가 존재하는 경우, 각각은 서로 독립적으로 선택될 수 있어서, 단일 NLS가 하나 초과의 카피에 및/또는 하나 이상의 카피에 존재하는 하나 이상의 다른 NLS와 조합하여 존재할 수 있도록 한다.
방법에 사용되는 CRISPR 효소는 약 여섯 개의 NLS를 포함할 수 있다. NLS에 가장 가까운 아미노산이 N- 또는 C-말단에서 폴리펩티드 쇄를 따라 약 50 개 아미노산 이내, 예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 또는 50 개 아미노산 이내에 있을 때 NLS는 N- 또는 C-말단 근처에 있는 것으로 간주된다.
추가 도메인
본원에 기재된 염기 편집기는 폴리뉴클레오티드의 핵염기의 핵염기 편집, 변형 또는 변경을 용이하게 하는 데 도움이 되는 임의의 도메인을 포함할 수 있다. 일부 구현예에서, 염기 편집기는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9),핵염기 편집 도메인(예를 들어, 데아미나아제 도메인),및 하나 이상의 추가 도메인을 포함한다. 일부 구현예에서, 추가적인 도메인은 염기 편집기의 효소적 또는 촉매적 기능, 염기 편집기의 결합 기능을 용이하게 하거나, 또는 원하는 염기 편집 결과를 방해할 수 있는 세포 기구(예를 들어, 효소)의 억제제일 수 있다. 일부 구현예에서, 염기 편집기는 뉴클레아제, 니카아제, 재조합효소, 데아미나아제, 메틸트랜스퍼라제, 메틸라제, 아세틸라제, 아세틸트랜스퍼라제, 전사 활성인자, 또는 전사 억제인자 도메인을 포함할 수 있다.
일부 구현예에서, 염기 편집기는 우라실 글리코실라제 억제제[UGI] 도메인을 포함할 수 있다. 일부 구현예에서, U:G 이종이중체 DNA의 존재에 대한 세포 DNA 복구 반응은 세포에서 핵염기 편집 효율의 감소를 담당할 수 있다. 이러한 구현예에서, 우라실 DNA 글리코실라제(UDG)는 세포의 DNA에서 U의 제거를 촉매화할 수 있고, 이는 염기 절제 복구[base excision repair, BER]를 개시하여, 대부분 U:G 쌍에서 C:G 쌍으로 복귀를 초래할 수 있다. 이러한 구현예에서, BER은 단일 가닥에 결합하고, 편집된 염기를 차단하며, UGI를 억제하고, BER을 억제하며, 편집된 염기를 보호하고/하거나, 편집되지 않은 가닥의 복구를 촉진하는 하나 이상의 도메인을 포함하는 염기 편집기에서 억제될 수 있다. 따라서, 본 개시는 UGI 도메인을 포함하는 염기 편집기 융합 단백질을 고려한다.
일부 구현예에서, 염기 편집기는 도메인으로서 이중 가닥 파손[DSB] 결합 단백질의 전부 또는 일부를 포함한다. 예를 들어, DSB 결합 단백질은 DSB의 단부에 결합할 수 있고 분해로부터 이들을 보호할 수 있는 박테리오파지 Mu의 Gam 단백질을 포함할 수 있다. 문헌[Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774(2017)]을 참조하고, 이의 전체 내용이 본원에 참조로 포함된다.
추가적으로, 일부 구현예에서, Gam 단백질은 염기 편집기의 N-말단에 융합될 수 있다. 일부 구현예에서, Gam 단백질은 염기 편집기의 C-말단에 융합될 수 있다. 박테리오파지 Mu의 Gam 단백질은 이중 가닥 파손[DSB]의 단부에 결합하고 분해로부터 이들을 보호할 수 있다. 일부 구현예에서, DSB의 자유 단부를 결합하기 위해 Gam을 사용하는 것은 염기 편집 과정 동안 인델 형성을 감소시킬 수 있다. 일부 구현예에서, 174-잔기 Gam 단백질은 염기 편집기의 N-말단에 융합된다. 문헌[Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774(2017)]을 참조한다. 일부 구현예에서, 돌연변이 또는 돌연변이들은 야생형 도메인에 비해 염기 편집기 도메인의 길이를 변경할 수 있다. 예를 들어, 적어도 하나의 도메인에서 적어도 하나의 아미노산의 결실은 염기 편집기의 길이를 감소시킬 수 있다. 또 다른 경우에, 돌연변이 또는 돌연변이들은 야생형 도메인에 비해 도메인의 길이를 변경하지 않는다. 예를 들어, 임의의 도메인에서 치환은 염기 편집기의 길이를 변경하지 않는다.
모든 도메인의 길이가 야생형 도메인과 동일한 이러한 염기 편집기의 비제한적인 예는 다음을 포함할 수 있다:
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-링커2-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-링커2-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[UGI]-[핵염기 편집 도메인]-링커1-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[UGI]-[핵염기 편집 도메인]-링커1-[APOBEC1]-[핵염기 편집 도메인]-COOH;
NH2-[UGI]-[핵염기 편집 도메인]-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH;또는
NH2-[UGI]-[핵염기 편집 도메인]-[APOBEC1]-[핵염기 편집 도메인]-COOH.
염기 편집기 시스템
염기 편집기 시스템을 사용하여 핵염기를 편집하기 위한 시스템, 조성물, 및 방법이 본원에 제공된다. 일부 구현예에서, 염기 편집기 시스템은(1) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및 핵염기를 편집하기 위한 핵염기 편집 도메인(예를 들어,데아미나아제 도메인)을 포함하는 염기 편집기[BE], 및(2) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인과 함께 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)를 포함한다. 일부 구현예에서, 염기 편집기 시스템은 시티딘 염기 편집기[CBE] 또는 아데노신 염기 편집기[ABE]이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 DNA 또는 RNA 결합 도메인이다. 일부 구현예에서, 핵염기 편집 도메인은 데아미나아제 도메인을 포함한다. 일부 구현예에서, 데아미나아제 도메인은 시티딘 데아미나아제 또는 시토신 데아미나아제일 수 있다. 일부 구현예에서, 데아미나아제 도메인은 아데닌 데아미나아제 또는 아데노신 데아미나아제일 수 있다. 일부 구현예에서, 아데노신 염기 편집기는 DNA에서 아데닌을 탈아미노화할 수 있다. 일부 구현예에서, 염기 편집기는 DNA 내에서 시티딘을 탈아미노화할 수 있다.
일부 구현예에서, 본원에 제공된 바와 같은 염기 편집 시스템은 이중 가닥 DNA 파손을 생성하지 않고, 공여자 DNA 주형을 필요로 하지 않으며, 과도한 확률적 삽입 및 결실을 유도하지 않으면서 DNA에서 프로그래밍 가능한, 단일 뉴클레오티드(C→T 또는 A→G) 변화를 유도하기 위해 촉매적으로 결함이 있는 스트렙토코쿠스 파이오게네스 Cas9, 데아미나아제(시티딘 또는 아데노신 데아미나아제),및 염기 절제 복구의 억제제를 함유하는 융합 단백질을 사용하는 게놈 편집에 대한 새로운 접근법을 제공한다.
핵염기 편집 단백질의 세부 사항은 국제 PCT 출원 PCT/2017/045381(WO2018/027078) 및 PCT/US2016/058344(WO2017/070632)에 기재되어 있으며, 각각의 그 전체는 본원에 참조로 포함된다. 또한 문헌[Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424(2016);Gaudelli, N.M., et al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471(2017)];및 문헌[Komor, A.C., et al., "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774(2017)]을 참조하고, 이의 전체 내용이 본원에 참조로 포함된다.
본원에 제공된 염기 편집기 시스템의 사용은 다음 단계를 포함한다:(a) 대상의 폴리뉴클레오티드(예를 들어, 이중 또는 단일 가닥 DNA 또는 RNA)의 표적 뉴클레오티드 서열을 핵염기 편집기(예를 들어, 아데노신 염기 편집기 또는 시티딘 염기 편집기) 및 가이드 폴리핵산(예를 들어 gRNA)을 포함하는 염기 편집기 시스템과 접촉시키는 단계이되, 표적 뉴클레오티드 서열은 표적화된 핵염기 쌍을 포함하는, 단계;(b) 상기 표적 영역의 가닥 분리를 유도하는 단계;(c) 표적 영역의 단일 가닥에서 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계;및(d) 표적 영역의 하나 이하의 가닥을 절단하는 단계이되, 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기로 대체되는, 단계. 일부 구현예에서, 단계(b)는 생략됨이 이해되어야 한다. 일부 구현예에서, 상기 표적화된 핵염기 쌍은 하나 이상의 유전자에서 복수의 핵염기 쌍이다. 일부 구현예에서, 본원에 제공된 염기 편집기 시스템은 하나 이상의 유전자에서 복수의 핵염기 쌍의 다중 편집을 할 수 있다. 일부 구현예에서, 복수의 핵염기 쌍은 동일한 유전자에 위치한다. 일부 구현예에서, 복수의 핵염기 쌍은 하나 이상의 유전자에 위치하되, 적어도 하나의 유전자는 상이한 유전자좌에 위치한다.
일부 구현예에서, 절단된 단일 가닥(닉 가닥)은 가이드 핵산에 혼성화된다. 일부 구현예에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥과 반대이다. 일부 구현예에서, 염기 편집기는 Cas9 도메인을 포함한다. 일부 구현예에서, 제1 염기는 아데닌이고, 제2 염기는 G, C, A, 또는 T가 아니다. 일부 구현예에서, 제2 염기는 이노신이다.
일부 구현예에서, 단일 가이드 폴리뉴클레오티드는 데아미나아제를 표적 핵산 서열에 표적화하기 위해 활용될 수 있다. 일부 구현예에서, 단일 쌍의 가이드 폴리뉴클레오티드를 활용하여 상이한 데아미나아제를 표적 핵산 서열에 표적화할 수 있다.
염기 편집기 시스템의 핵염기 구성요소 및 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 구성요소는 서로 공유적 또는 비공유적으로 연관될 수 있다. 예를 들어, 일부 구현예에서, 데아미나아제 도메인은 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인에 의해 표적 뉴클레오티드 서열에 표적화될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그램가능한 뉴클레오티드 결합 도메인은 데아미나제 도메인에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 데아미나아제 도메인과 비공유적으로 상호작용하거나 또는 회합함으로써 데아미나아제 도메인을 표적 뉴클레오티드 서열에 표적화할 수 있다. 예를 들어, 일부 구현예에서, 핵염기 편집 구성요소, 예를 들어, 데아미나아제 구성요소는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 일부인 추가적인 이종성 부분 또는 도메인과 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인을 포함할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드에 결합하거나, 이와 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드에 결합하거나, 이와 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 가이드 폴리뉴클레오티드에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드 링커에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드 링커에 결합할 수 있다. 추가적인 이종성 부분은 단백질 도메인일 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 K 상동성[K Homology, KH] 도메인, MS2 코트 단백질 도메인, PP7 코트 단백질 도메인, SfMu Com 코트 단백질 도메인, 멸균 알파 모티프, 텔로머라제 Ku 결합 모티프 및 Ku 단백질, 텔로머라제 Sm7 결합 모티프 및 Sm7 단백질, 또는 RNA 인식 모티프일 수 있다.
염기 편집기 시스템은 가이드 폴리뉴클레오티드 구성요소를 추가로 포함할 수 있다. 염기 편집기 시스템의 구성요소는 공유 결합, 비공유 상호작용, 또는 이의 회합 및 상호작용의 임의의 조합을 통해 서로 회합될 수 있음이 이해되어야 한다. 일부 구현예에서, 데아미나아제 도메인은 가이드 폴리뉴클레오티드에 의해 표적 뉴클레오티드 서열에 표적화될 수 있다. 예를 들어, 일부 구현예에서, 염기 편집기 시스템의 핵염기 편집 구성요소, 예를 들어, 데아미나아제 구성요소는 가이드 폴리뉴클레오티드의 일부 또는 분절(예를 들어, 폴리뉴클레오티드 모티프)와 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)을 포함할 수 있다. 일부 구현예에서, 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)은 데아미나아제 도메인에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드에 결합하거나, 이와 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드에 결합하거나, 이와 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 가이드 폴리뉴클레오티드에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드 링커에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드 링커에 결합할 수 있다. 추가적인 이종성 부분은 단백질 도메인일 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 K 상동성[KH] 도메인, MS2 코트 단백질 도메인, PP7 코트 단백질 도메인, SfMu Com 코트 단백질 도메인, 멸균 알파 모티프, 텔로머라제 Ku 결합 모티프 및 Ku 단백질, 텔로머라제 Sm7 결합 모티프 및 Sm7 단백질, 또는 RNA 인식 모티프일 수 있다.
일부 구현예에서, 염기 편집기 시스템은 염기 절제 복구[BER] 구성요소의 억제제를 더 포함할 수 있다. 염기 편집기 시스템의 구성요소는 공유 결합, 비공유 상호작용, 또는 이의 회합 및 상호작용의 임의의 조합을 통해 서로 회합될 수 있음이 이해되어야 한다. BER 구성요소의 억제제는 염기 절제 복구 억제제를 포함할 수 있다. 일부 구현예에서, 염기 절제 복구의 억제제는 우라실 DNA 글리코실라제 억제제[UGI]일 수 있다. 일부 구현예에서, 염기 절제 복구의 억제제는 이노신 염기 절제 복구 억제제일 수 있다. 일부 구현예에서, 염기 절제 복구의 억제제는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인에 의해 표적 뉴클레오티드 서열에 표적화될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 염기 절제 복구의 억제제에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 데아미나아제 도메인 및 염기 절제 복구의 억제제에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 염기 절제 복구의 억제제와 비공유적으로 상호작용하거나 또는 회합함으로써 염기 절제 복구의 억제제를 표적 뉴클레오티드 서열에 표적화할 수 있다. 예를 들어, 일부 구현예에서, 염기 절제 복구의 억제제 구성요소는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 일부인 추가적인 이종성 부분 또는 도메인과 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인을 포함할 수 있다. 일부 구현예에서, 염기 절제 복구의 억제제는 가이드 폴리뉴클레오티드에 의해 표적 뉴클레오티드 서열에 표적화될 수 있다. 예를 들어, 일부 구현예에서, 염기 절제 복구의 억제제는 가이드 폴리뉴클레오티드의 일부 또는 분절(예를 들어, 폴리뉴클레오티드 모티프)과 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)을 포함할 수 있다. 일부 구현예에서, 가이드 폴리뉴클레오티드의 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)은 염기 절제 복구의 억제제에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드에 결합하거나, 이와 상호작용하거나, 회합하거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 가이드 폴리뉴클레오티드에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드 링커에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드 링커에 결합할 수 있다. 추가적인 이종성 부분은 단백질 도메인일 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 K 상동성[KH] 도메인, MS2 코트 단백질 도메인, PP7 코트 단백질 도메인, SfMu Com 코트 단백질 도메인, 멸균 알파 모티프, 텔로머라제 Ku 결합 모티프 및 Ku 단백질, 텔로머라제 Sm7 결합 모티프 및 Sm7 단백질, 또는 RNA 인식 모티프일 수 있다.
일부 구현예에서, 염기 편집기는 편집된 가닥의 염기 절제 복구[BER]를 억제한다. 일부 구현예에서, 염기 편집기는 편집되지 않은 가닥을 보호하거나 또는 결합한다. 일부 구현예에서, 염기 편집기는 UGI 활성을 포함한다. 일부 구현예에서, 염기 편집기는 촉매적으로 불활성 이노신 특이적 뉴클레아제를 포함한다. 일부 구현예에서, 염기 편집기는 니카아제 활성을 포함한다. 일부 구현예에서, 염기 쌍의 의도된 편집은 PAM 부위의 상류에 있다. 일부 구현예에서, 염기 쌍의 의도된 편집은 PAM 부위의 상류에 있는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 뉴클레오티드이다. 일부 구현예에서, 염기-쌍의 의도된 편집은 PAM 부위의 하류에 있다. 일부 구현예에서, 의도된 편집된 염기 쌍은 PAM 부위의 하류 스트림에 있는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 뉴클레오티드이다.
일부 구현예에서, 방법은 표준(예를 들어, NGG) PAM부위를 필요로 하지 않는다. 일부 구현예에서, 핵염기 편집기는 링커 또는 스페이서를 포함한다. 일부 구현예에서, 링커 또는 스페이서는 1 내지 25 개의 아미노산 길이이다. 일부 구현예에서, 링커 또는 스페이서는 5 내지 20 개의 아미노산 길이이다. 일부 구현예에서, 링커 또는 스페이서는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 아미노산 길이이다.
일부 구현예에서, 본원에 제공되는 염기 편집 융합 단백질은 예를 들어, 표적 염기가 정의된 영역(예를 들어, '탈아미노화 창') 내에 배치되는 정확한 위치에 위치할 필요가 있다. 일부 구현예에서, 표적은 네 개의 염기 영역 내에 있을 수 있다. 일부 구현예에서, 이러한 정의된 표적 영역은 PAM의 상류에 있는 대략 15 개의 염기일 수 있다. 문헌[Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424(2016);Gaudelli, N.M., et al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471(2017)];및 문헌[Komor, A.C., et al., "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774(2017)]을 참조하고, 이의 전체 내용이 본원에 참조로 포함된다.
일부 구현예에서, 표적 영역은 표적 창을 포함하되, 표적 창은 표적 핵염기 쌍을 포함한다. 일부 구현예에서, 표적 창은 1 내지 10 개의 뉴클레오티드를 포함한다. 일부 구현예에서, 표적 창은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 뉴클레오티드 길이이다. 일부 구현예에서, 염기 쌍의 의도된 편집은 표적 창 내에 있다. 일부 구현예에서, 표적 창은 염기 쌍의 의도된 편집을 포함한다. 일부 구현예에서, 방법은 본원에 제공된 임의의 염기 편집기를 사용하여 수행된다. 일부 구현예에서, 표적 창은 탈아미노화 창이다. 탈아미노화 창은 염기 편집기가 표적 뉴클레오티드에 작용하고 탈아미노화하는 정의된 영역일 수 있다. 일부 구현예에서, 탈아미노화 창은 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 염기 영역 내에 있다. 일부 구현예에서, 탈아미노화 창은 PAM의 상류에 있는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 개의 염기이다.
본 개시의 염기 편집기는 표적 폴리뉴클레오티드 서열의 편집을 용이하게 하는 임의의 도메인, 특징 또는 아미노산 서열을 포함할 수 있다. 예를 들어, 일부 구현예에서, 염기 편집기는 핵 국소화 서열[NLS]을 포함한다. 일부 구현예에서, 염기 편집기의 NLS는 데아미나아제 도메인 및 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 사이에 국소화된다. 일부 구현예에서, 염기 편집기의 NLS는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인에 C-말단에 국소화된다.
본원에 개시된 바와 같은 염기 편집기에 존재할 수 있는 다른 예시적인 특징은 세포질 국소화 서열과 같은 국소화 서열, 핵 외수송 서열과 같은 외수송 서열, 또는 다른 국소화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제, 또는 검출에 유용한 서열 태그이다. 본원에 제공된 적합한 단백질 태그는 비오틴 카르복실라제 담체 단백질[BCCP] 태그, myc-태그, 칼모듈린-태그, FLAG-태그, 헤마글루티닌(HA)-태그, 히스티딘 태그 또는 His-태그로도 지칭되는 폴리히스티딘 태그, 말토스 결합 단백질[MBP]-태그, nus-태그, 글루타니온-S-트랜스퍼라제(GST)-태그, 녹색 형광 단백질[GFP]-태그, 티오레독신-태그, S-태그, Softag(예를 들어,Softag 1, Softag 3),strep-태그, 비오틴 리가제 태그, FlAsH 태그, V5 태그, 및 SBP-태그를 포함하나 이에 제한되지 않는다. 추가적인 적합한 서열은 당업자에게 명백할 것이다. 일부 구현예에서, 융합 단백질은 하나 이상의 His 태그를 포함한다.
일부 구현예에서, 비제한적인 예시적인 시티딘 염기 편집기[CBE]는 BE1(APOBEC1-XTEN-dCas9),BE2(APOBEC1-XTEN-dCas9-UGI),BE3(APOBEC1-XTEN-dCas9(A840H)-UGI),BE3-Gam, saBE3, saBE4-Gam, BE4, BE4-Gam, saBE4, 또는 saB4E-Gam을 포함한다. BE4는 APOBEC1-Cas9n(D10A) 링커를 32 개의 아미노산으로 확장하고 Cas9n-UGI 링커를 9 개의 아미노산으로 확장하며, 또 다른 9-아미노산 링커가 있는 작제물의 C-말단에 대한 UGI의 제2 카피를 단일 염기 편집기 작제물에 덧붙인다. 염기 편집기 saBE3 및 saBE4는 더 작은 에스. 아우레우스 Cas9n(D10A)로 대체된 에스. 파이오게네스 Cas9n(D10A)을 갖는다. BE3-Gam, saBE3-Gam, BE4-Gam, 및 saBE4-Gam은 16 개의 아미노산 XTEN 링커를 통해 BE3, saBE3, BE4, 및 saBE4의 N-말단에 융합된 Gam 단백질의 174 개의 잔기를 갖는다.
일부 구현예에서, 아데노신 염기 편집기[ABE]는 DNA에서 아데닌을 탈아미노화할 수 있다. 일부 구현예에서, ABE는 BE3의 APOBEC1 구성요소를 천연 또는 조작된 대장균, TadA, 인간 ADAR2, 마우스 ADA, 또는 인간 ADAT2로 대체함으로써 생성된다. 일부 구현예에서, ABE는 진화된 TadA 변이체를 포함한다. 일부 구현예에서, ABE는 ABE 1.2(TadA*-XTEN-nCas9-NLS)이다. 일부 구현예에서, TadA*는 A106V 및 D108N 돌연변이를 포함한다.
일부 구현예에서, ABE는 제2 세대 ABE이다. 일부 구현예에서, ABE는 TadA*(TadA*2.1)에서 추가 돌연변이 D147Y 및 E155V를 포함하는 ABE2.1이다. 일부 구현예에서, ABE는 인간 알킬 아데닌 DNA 글리코실라제의 촉매적으로 불활성화 버전(E125Q 돌연변이가 있는 AAG)에 융합된 ABE2.1인 ABE2.2이다. 일부 구현예에서, ABE는 대장 Endo V의 촉매적으로 불활성화 버전(D35A 돌연변이로 불활성화)에 융합된 ABE2. 1인 ABE2.3이다. 일부 구현예에서, ABE는 ABE2.1에서의 링커보다 두 배 긴 링커[32 개의 아미노산,(SGGS)2(서열 번호 330)-XTEN-(SGGS)2(서열 번호 330)]를 갖는 ABE2.6이다. 일부 구현예에서, ABE는 추가적인 야생형 TadA 단량체로 테더링된 ABE2.1인 ABE2.7이다. 일부 구현예에서, ABE는 추가적인 TadA*2.1 단량체로 테더링된 ABE2.1인 ABE2.8이다. 일부 구현예에서, ABE는 진화된 TadA(TadA*2.1)가 ABE2.1의 N-말단에 직접 융합된 ABE2.9이다. 일부 구현예에서, ABE는 야생형 TadA가 ABE2.1의 N-말단에 직접 융합된 ABE2.10이다. 일부 구현예에서, ABE는 TadA* 단량체의 N-말단에서 불활성화 E59A 돌연변이가 있는 ABE2.9인 ABE2.11이다. 일부 구현예에서, ABE는 내부 TadA* 단량체에 불활성화 E59A 돌연변이가 있는 ABE2.9인 ABE2.12이다.
일부 구현예에서, ABE는 제3 세대 ABE이다. 일부 구현예에서, ABE는 세 개의 추가적인 TadA 돌연변이(L84F, H123Y, 및 I156F)가 있는 ABE2.3인 ABE3.1이다.
일부 구현예에서, ABE는 제4 세대 ABE이다. 일부 구현예에서, ABE는 추가 TadA 돌연변이 A142N(TadA*4.3)이 있는 ABE3.1인 ABE4.3이다.
일부 구현예에서, ABE는 제5 세대 ABE이다. 일부 구현예에서, ABE는 생존 클론(H36L, R51L, S146C, 및 K157N)에서 ABE3.1 내로 돌연변이의 컨센서스 세트를 유입함으로써 생성된 ABE5.1이다. 일부 구현예에서, ABE는 내부 진화된 TadA*에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물을 갖는 ABE5.3이다. 일부 구현예에서, ABE는 아래 표 11에 제시된 바와 같이, ABE5.2, ABE5.4, ABE5.5, ABE5.6, ABE5.7, ABE5.8, ABE5.9, ABE5.10, ABE5.11, ABE5.12, ABE5.13, 또는 ABE5.14이다. 일부 구현예에서, ABE는 제6 세대 ABE이다. 일부 구현예에서, ABE는 아래 표 11에 나타낸 바와 같이, ABE6.1, ABE6.2, ABE6.3, ABE6.4, ABE6.5, 또는 ABE6.6이다. 일부 구현예에서, ABE는 제7 세대 ABE이다. 일부 구현예에서, ABE는 아래 표 11에 나타낸 바와 같이, ABE7.1, ABE7.2, ABE7.3, ABE7.4, ABE7.5, ABE7.6, ABE7.7, ABE7.8, ABE 7.9, 또는 ABE7.10이다.
[표 11] ABE의 유전자형
일부 구현예에서, 염기 편집기는 제8 세대 ABE(ABE8)이다. 일부 구현예에서, ABE8은 TadA*8 변이체를 함유한다. 일부 구현예에서, ABE8은 TadA*8 변이체를 함유하는 단량체성 작제물을 갖는다('ABE8.x-m'). 일부 구현예에서, ABE8은 Y147T 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.1)을 갖는 ABE8.1-m이다. 일부 구현예에서, ABE8은 Y147R 돌연변이가 있는 TadA*7.10을 함유하는 단랑체성 작제물(TadA*8.2)을 갖는 ABE8.2-m이다. 일부 구현예에서, ABE8은 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.3)을 갖는 ABE8.3-m이다. 일부 구현예에서, ABE8은 Y123H 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.4)을 갖는 ABE8.4-m이다. 일부 구현예에서, ABE8은 V82S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.5)을 갖는 ABE8.5-m이다. 일부 구현예에서, ABE8은 T166R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.6)을 갖는 ABE8.6-m이다. 일부 구현예에서, ABE8은 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.7)을 갖는 ABE8.7-m이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 Y123H 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.8)을 갖는 ABE8.8-m이다. 일부 구현예에서, ABE8은 Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.9)을 갖는 ABE8.9-m이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 T166R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.10)을 갖는 ABE8.10-m이다. 일부 구현예에서, ABE8은 Y147T 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.11)을 갖는 ABE8.11-m이다. 일부 구현예에서, ABE8은 Y147T 및 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.12)을 갖는 ABE8.12-m이다.
일부 구현예에서, ABE8은 Y123H(Y123H는 H123Y로부터 복귀됨),Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.13)을 갖는 ABE8.13-m이다. 일부 구현예에서, ABE8은 I76Y 및 V82S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.14)을 갖는 ABE8.14-m이다. 일부 구현예에서, ABE8은 V82S 및 Y147R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.15)을 갖는 ABE8.15-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Y147R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.16)을 갖는 ABE8.16-m이다. 일부 구현예에서, ABE8은 V82S 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.17)을 갖는 ABE8.17-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.18)을 갖는 ABE8.18-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨),Y147R 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.19)을 갖는 ABE8.19-m이다. 일부 구현예에서, ABE8은 I76Y, V82S, Y123H(Y123H는 H123Y로부터 복귀됨),Y147R 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.20)을 갖는 ABE8.20-m이다. 일부 구현예에서, ABE8은 Y147R 및 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.21)을 갖는 ABE8.21-m이다. 일부 구현예에서, ABE8은 V82S 및 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.22)을 갖는 ABE8.22-m이다. 일부 구현예에서, ABE8은 V82S 및 Y123H(Y123H는 H123Y로부터 복귀됨) 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.23)을 갖는 ABE8.23-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨),및 Y147T 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.24)을 갖는 ABE8.24-m이다.
일부 구현예에서, ABE8은 TadA*8 변이체에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물을 갖는다('ABE8.x-d'). 일부 구현예에서, ABE8은 Y147T 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.1)을 갖는 ABE8.1-d이다. 일부 구현예에서, ABE8은 Y147R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균TadA를 함유하는 이종이량체성 작제물(TadA*8.2)을 갖는 ABE8.2-d이다. 일부 구현예에서, ABE8은 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.3)을 갖는 ABE8.3-d이다. 일부 구현예에서, ABE8은 Y123H 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.4)을 갖는 ABE8.4-d이다. 일부 구현예에서, ABE8은 V82S 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.5)을 갖는 ABE8.5-d이다. 일부 구현예에서, ABE8은 T166R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.6)을 갖는 ABE8.6-d이다. 일부 구현예에서, ABE8은 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.7)을 갖는 ABE8.7-d이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 Y123H 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.8)을 갖는 ABE8.8-d이다. 일부 구현예에서, ABE8은 Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.9)을 갖는 ABE8.9-d이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 T166R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.10)을 갖는 ABE8.10-d이다. 일부 구현예에서, ABE8은 Y147T 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.11)을 갖는 ABE8.11-d이다. 일부 구현예에서, ABE8은 Y147T 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.12)을 갖는 ABE8.12-d이다. 일부 구현예에서, ABE8은 Y123H(Y123H는 H123Y로부터 복귀됨),Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.13)을 갖는 ABE8.13-d이다. 일부 구현예에서, ABE8은 I76Y 및 V82S 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.14)을 갖는 ABE8.14-d이다. 일부 구현예에서, ABE8은 V82S 및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.15)을 갖는 ABE8.15-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨)및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.16)을 갖는 ABE8.16-d이다. 일부 구현예에서, ABE8은 V82S 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.17)을 갖는 ABE8.17-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.18)을 갖는 ABE8.18-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨),Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.19)을 갖는 ABE8.19-d이다. 일부 구현예에서, ABE8은 I76Y, V82S, Y123H(Y123H는 H123Y로부터 복귀됨),Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.20)을 갖는 ABE8.20-d이다. 일부 구현예에서, ABE8은 Y147R 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.21)을 갖는 ABE8.21-d이다. 일부 구현예에서, ABE8은 V82S 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.22)을 갖는 ABE8.22-d이다. 일부 구현예에서, ABE8은 V82S 및 Y123H(Y123H는 H123Y로부터 복귀됨) 돌연변이가 있는 TadA*7. 10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.23)을 갖는 ABE8.23-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨),및 Y147T 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체성 작제물(TadA*8.24)을 갖는 ABE8.24-d이다.
일부 구현예에서, ABE8은 TadA*8 변이체에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물을 갖는다('ABE8.x-7'). 일부 구현예에서, ABE8은 Y147T 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.1)을 갖는 ABE8.1-7이다. 일부 구현예에서, ABE8은 Y147R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.2)을 갖는 ABE8.2-7이다. 일부 구현예에서, ABE8은 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.3)을 갖는 ABE8.3-7이다. 일부 구현예에서, ABE8은 Y123H 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.4)을 갖는 ABE8.4-7이다. 일부 구현예에서, ABE8은 V82S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.5)을 갖는 ABE8.5-7이다. 일부 구현예에서, ABE8은 T166R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.6)을 갖는 ABE8.6-7이다. 일부 구현예에서, ABE8은 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.7)을 갖는 ABE8.7-7이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 Y123H 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.8)을 갖는 ABE8.8-7이다. 일부 구현예에서, ABE8은 Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.9)을 갖는 ABE8.9-7이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 T166R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.10)을 갖는 ABE8.10-7이다. 일부 구현예에서, ABE8은 Y147T 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.11)을 갖는 ABE8.11-7이다. 일부 구현예에서, ABE8은 Y147T 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.12)을 갖는 ABE8.12-7이다. 일부 구현예에서, ABE8은 Y123H(Y123H는 H123Y로부터 복귀됨),Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.13)을 갖는 ABE8.13-7이다. 일부 구현예에서, ABE8은 I76Y 및 V82S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.14)을 갖는 ABE8.14-7이다. 일부 구현예에서, ABE8은 V82S 및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.15)을 갖는 ABE8.15-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.16)을 갖는 ABE8.16-7이다. 일부 구현예에서, ABE8은 V82S 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.17)을 갖는 ABE8.17-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.18)을 갖는 ABE8.18-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨),Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.19)을 갖는 ABE8.19-7이다. 일부 구현예에서, ABE8은 I76Y, V82S, Y123H(Y123H는 H123Y로부터 복귀됨),Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.20)을 갖는 ABE8.20-7이다. 일부 구현예에서, ABE8은 Y147R 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.21)을 갖는 ABE8.21-7이다. 일부 구현예에서, ABE8은 V82S 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.22)을 갖는 ABE8.22-7이다. 일부 구현예에서, ABE8은 V82S 및 Y123H(Y123H는 H123Y로부터 복귀됨) 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.23)을 갖는 ABE8.23-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨),및 Y147T 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.24)을 갖는 ABE8.24-7이다.
[1] 일부 구현예에서, ABE는 아래 표 12에 나타낸 바와 같은 ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, 또는 ABE8.24-d이다.
[2]
[표 12] 아데노신 데아미나아제 염기 편집기 8[ABE8] 변이체
일부 구현예에서, ABE8은 R26C, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10을 함유하는 단량체 작제물(TadA*8a)을 갖는 ABE8a-m이다. 일부 구현예에서, ABE8은 V88A, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이가 있는TadA*7.10을 함유하는 단량체 작제물(TadA*8b)을 갖는 ABE8b-m이다. 일부 구현예에서, ABE8은 R26C, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10을 함유하는 단량체 작제물(TadA*8c)을 갖는 ABE8c-m이다. 일부 구현예에서, ABE8은 V88A, T111R, D119N, 및 F149Y 돌연변이가 있는 TadA*7.10을 함유하는 단량체 작제물(TadA*8d)을 갖는 ABE8d-m이다. 일부 구현예에서, ABE8은 A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10을 함유하는 단량체 작제물(TadA*8e)을 갖는 ABE8e-m이다.
일부 구현예에서, ABE8은 R26C, A109S, T111R, D119, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체 작제물(TadA*8a)을 갖는 ABE8a-d이다. 일부 구현예에서, ABE8은 V88A, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체 작제물(TadA*8b)을 갖는 ABE8b-d이다. 일부 구현예에서, ABE8은R26C, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체 작제물(TadA*8c)을 갖는 ABE8c-d이다. 일부 구현예에서, ABE8은 V88A, T111R, D119N, 및 F149Y 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체 작제물(TadA*8d)을 갖는 ABE8d-d이다. 일부 구현예에서, ABE8은 A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 야생형 대장균 TadA를 함유하는 이종이량체 작제물(TadA*8e)을 갖는 ABE8e-d이다.
일부 구현예에서, ABE8은 R26C, A109S, T111R, D119, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물(TadA*8a)을 갖는 ABE8a-7이다. 일부 구현예에서, ABE8은 V88A, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물(TadA*8b)을 갖는 ABE8b-7이다. 일부 구현예에서, ABE8은 R26C, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물(TadA*8c)을 갖는 ABE8c-7이다. 일부 구현예에서, ABE8은 V88A, T111R, D119N, 및 F149Y 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물(TadA*8d)을 갖는 ABE8d-7이다. 일부 구현예에서, ABE8은 A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물(TadA*8e)을 갖는 ABE8e-7이다.
일부 구현예에서, ABE는 아래 표 13에 나타낸 바와 같이, ABE8a-m, ABE8b-m, ABE8c-m, ABE8d-m, ABE8e-m, ABE8a-d, ABE8b-d, ABE8c-d, ABE8d-d, 또는 ABE8e-d이다. 일부 구현예에서, ABE는 ABE8e-m 또는 ABE8e-d이다. ABE8e는 SpCas9 이외의 Cas 상동체, 예를 들어, SaCas9, SaCas9-KKH, Cas12a 상동체, 예컨대, LbCas12a, enAs-Cas12a, SpCas9-NG 및 원형으로 순열된 CP1028-SpCas9 및 CP1041-SpCas9와 함께 사용되는 경우 효율적인 아데닌 염기 편집 활성 및 낮은 인델 형성을 나타낸다. 표 13에서 ABE8e에 대해 나타낸 돌연변이 이외에, 표적외 RNA 및 DNA 편집은 TadA 도메인 내로 V106W 치환을 도입함으로써 감소되었다(문헌 [M. Richter et al., 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-z]에 기재된 바와 같고, 이의 전체 내용은 본원에 참조로 포함된다).
[표 13] 추가의 아데노신 데아미나아제 염기 편집기 8 변이체. 표에서, '단량체'는 표시된 변경을 포함하는 단일 TadA*7.10을 포함하는 ABE를 가리키고, '이종이량체'는 대장균 TadA 아데노신 데아미나아제에 융합된 표시된 변경을 포함하는 TadA*7.10을 포함하는 ABE를 가리킨다.
일부 구현예에서, 염기 편집기(예를 들어, ABE8)는 아데노신 데아미나아제 변이체(예를 들어, TadA*8)를 원형 순열체 Cas9(예를 들어, CP5 또는 CP6)및 이분핵 국소화 서열을 포함하는 스캐폴드 내로 클로닝함으로써 생성된다. 일부 구현예에서, 염기 편집기(예를 들어, ABE7.9, ABE7.10, 또는 ABE8)는 NGC PAM CP5 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다. 일부 구현예에서, 염기 편집기(예를 들어, ABE7.9, ABE7.10, 또는 ABE8)는 AGA PAM CP5 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다. 일부 구현예에서, 염기 편집기(예를 들어, ABE7.9, ABE7.10, 또는 ABE8)는 NGC PAM CP6 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다. 일부 구현예에서, 염기 편집기(예를 들어 ABE7.9, ABE7.10, 또는 ABE8)는 AGA PAM CP6 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다.
일부 구현예에서, ABE는 아래 표 14에 나타낸 바와 같은 유전자형을 갖는다.
[표 14] ABE의 유전자형
아래 표 15에 나타낸 바와 같이, 40 개의 ABE8의 유전자형이 기재되어 있다. ABE의 진화된 대장균 TadA 부분에서의 잔기 위치가 표시된다. ABE7.10 돌연변이와 구별되는 경우 ABE8의 돌연변이 변화가 제시된다. 일부 구현예에서, ABE는 아래 표15에 나타낸 바와 같이 ABE 중 하나의 유전자형을 갖는다.
[표 15] 진화된 TadA의 잔기 식별
일부 구현예에서, 염기 편집기는 아데노신 데아미나아제 활성을 갖는 다음 서열 또는 이의 단편을 포함하거나 또는 이로 본질적으로 이루어진 ABE8.1이다:
ABE8.1_Y147T_CP5_NGC PAM_단량체
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD SGGSSGGSSGSETPGTSESATPESSGGSSGGS EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFMQPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAKFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPRAFKYFDTTIARKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD GGSGGSGGSGGSGGSGGSGGM DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ EGADKRTADGSEFESPKKKRKV(서열 번호 331)
위 서열에서, 일반 글씨체는 아데노신 데아미나아제 서열을 나타내고, 굵은 글씨체 서열은 Cas9에서 유래된 서열을 나타내고, 이탤릭체 서열은 링커 서열을 나타내고, 밑줄 친 서열은 이분핵 국소화 서열을 나타낸다. 다른 ABE8 서열은 첨부된 서열 목록(서열 번호 332-354)에 제공된다.
일부 구현예에서, 염기 편집기는 제9 세대 ABE(ABE9)이다. 일부 구현예에서, ABE9는 TadA*9 변이체를 함유한다. ABE9 염기 편집기는 아미노산 서열을 포함하는 아데노신 데아미나아제 변이체를 포함하고, 이는 본원에 기재된 바와 같이 ABE 7*10 참조 서열에 대한 변경을 함유한다. 예시적인 ABE9 변이체는 표 16에 나열되어 있다. ABE9 염기 편집기의 상세 사항은 국제 PCT 출원 PCT/2020/049975에 기재되어 있고, 이는 그 전체가 본원에 참조로 포함된다.
[표 16] 아데노신 데아미나아제 염기 편집기 9(ABE9) 변이체. 표에서, '단량체'는 표시된 변경을 포함하는 단일 TadA*7.10을 포함하는 ABE를 가리키고, '이종이량체'는 대장균 TadA 아데노신 데아미나아제에 융합된 표시된 변경을 포함하는 TadA*7.10을 포함하는 ABE를 가리킨다.
일부 구현예에서, 염기 편집기는 우라실 글리코실라제 억제제(UGI)의 전부 또는 일부를 포함하는 도메인을 추가로 포함한다. 일부 구현예에서, 염기 편집기는 핵산 폴리머라아제의 전부 또는 일부를 포함하는 도메인을 포함한다. 일부 구현예에서, 염기 편집기는 도메인으로서 핵산 폴리머라아제[nucleic acid polymerase, NAP]의 전부 또는 일부를 포함할 수 있다. 예를 들어, 염기 편집기는 진핵생물 NAP의 전부 또는 일부를 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 DNA 폴리머라아제이다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 손상통과 폴리머라아제 활성을 갖는다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 손상통과 DNA 폴리머라아제이다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 Rev7, Rev1 복합체, 폴리머라아제 이오타, 폴리머라아제 카파, 또는 폴리머라아제 에타이다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 진핵생물 폴리머라아제 알파, 베타, 감마, 델타, 엡실론, 감마, 에타, 이오타, 카파, 람다, 뮤, 또는 누 구성요소이다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 핵산 폴리머라아제(예를 들어, 손상통과 DNA 폴리머라아제)에 대해 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%,또는 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, 염기 편집기 내로 혼입된 핵산 폴리머라아제 또는 이의 부분은 손상통과 DNA 폴리머라아제이다.
일부 구현예에서, 염기 편집기의 도메인은 다중 도메인을 포함할 수 있다. 예를 들어, Cas9에서 유래된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함하는 염기 편집기는 야생형 또는 천연 Cas9의 REC 로브 및 NUC 로브에 상응하는 REC 로브 및 NUC 로브를 포함할 수 있다. 또 다른 예에서, 염기 편집기는 RuvCI 도메인, BH 도메인, REC1 도메인, REC2 도메인, RuvCII 도메인, L1 도메인, HNH 도메인, L2 도메인, RuvCIII 도메인, WED 도메인, TOPO 도메인 또는 CTD 도메인 중 하나 이상을 포함할 수 있다. 일부 구현예에서, 염기 편집기의 하나 이상의 도메인은 도메인을 포함하는 폴리펩티드의 야생형 버전에 비해 돌연변이(예를 들어, 치환, 삽입, 결실)를 포함한다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인의 HNH 도메인은 H840A 치환을 포함할 수 있다.
또 다른 예에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인의 RuvCI 도메인은 D10A 치환을 포함할 수 있다.
본원에 개시된 염기 편집기의 상이한 도메인(예를 들어, 인접한 도메인)은 하나 이상의 링커 도메인(예를 들어, XTEN 링커 도메인)을 사용하거나 또는 사용하지 않고 서로 연결될 수 있다. 일부 구현예에서, 링커 도메인은 결합(예를 들어, 공유 결합),화학 기, 또는 두 개의 분자 또는 모이어티를 연결하는 분자, 예를 들어, 융합 단백질의 두 개의 도메인, 예컨대, 예를 들어, 제1 도메인(예를 들어, Cas9-유래 도메인) 및 제2 도메인(예를 들어, 아데노신 데아미나아제 도메인 또는 시티딘 데아미나아제 도메인)일 수 있다. 일부 구현예에서, 링커는 공유 결합(예를 들어, 탄소-탄소 결합, 디술피드 결합, 탄소-헤테로 원자 결합 등)이다. 특정 구현예에서, 링커는 아미드 결합의 탄소 질소 결합이다. 특정 구현예에서, 링커는 환형 또는 비환형, 치환 또는 비치환, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커이다. 특정 구현예에서, 링커는 중합체성(예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르 등)이다. 특정 구현예에서, 링커는 아미노알칸산의 단량체, 이량체, 또는 중합체를 포함한다. 일부 구현예에서, 링커는 아미노알칸산(예를 들어, 글리신, 에탄산, 알라닌, 베타-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산 등)을 포함한다. 일부 구현예에서, 링커는 아미노헥산산[aminohexanoic acid, Ahx]의 단량체, 이량체, 또는 중합체를 포함한다. 특정 구현예에서, 링커는 탄소환형 모이어티(예를 들어, 사이클로펜탄, 사이클로헥산)를 기반으로 한다. 다른 구현예에서, 링커는 폴리에틸렌 글리콜 모이어티(polyethylene glycol moiety, PEG)를 포함한다. 특정 구현예에서, 링커는 아릴 또는 헤테로아릴 모이어티를 포함한다. 특정 구현예에서, 링커는 페닐 고리를 기반으로 한다. 링커는 펩티드에서 링커까지 친핵체(예를 들어, 티올, 아미노)의 부착을 용이하게 하는 기능화된 모이어티를 포함할 수 있다. 임의의 친전자체가 링커의 일부로 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클(Michael) 수용체, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함하나 이에 제한되지 않는다. 일부 구현예에서, 링커는 Cas9 뉴클레아제 도메인을 포함하는 RNA-프로그래밍 가능한 뉴클레아제의 gRNA 결합 도메인, 및 핵산 편집 단백질의 촉매 도메인을 연결한다. 일부 구현예에서, 링커는 dCas9 및 제2 도메인(예를 들어, UGI 등)을 연결한다.
링커
특정 구현예에서, 링커는 본 발명의 임의의 펩티드 또는 펩티드 도메인을 연결하는 데 사용될 수 있다.링커는 공유 결합만큼 단순할 수 있거나, 많은 원자 길이의 중합체성 링커일 수 있다. 특정 구현예에서, 링커는 폴리펩티드이거나 아미노산을 기반으로 한다.다른 구현예에서, 링커는 펩티드와 유사하지 않다.특정 구현예에서, 링커는 공유 결합(예를 들어, 탄소-탄소 결합, 디술피드 결합, 탄소-헤테로원자 결합 등)이다.특정 구현예에서, 링커는 아미드 결합의 탄소-질소 결합이다.특정 구현예에서, 링커는 환형 또는 비환형, 치환 또는 비치환, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커이다. 특정 구현예에서, 링커는 중합체성(예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르 등)이다.특정 구현예에서, 링커는 아미노알칸산의 단량체, 이량체, 또는 중합체를 포함한다.특정 구현예에서, 링커는 아미노알칸산(예를 들어, 글리신, 에탄산, 알라닌, 베타-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산 등)을 포함한다.특정 구현예에서, 링커는 아미노헥산산[Ahx]의 단량체, 이량체, 또는 중합체를 포함한다. 특정 구현예에서, 링커는 탄소환형 모이어티(예를 들어, 사이클로펜탄, 사이클로헥산)를 기반으로 한다.다른 구현예에서, 링커는 폴리에틸렌 글리콜 모이어티(PEG)를 포함한다. 다른 구현예에서, 링커는 아미노산을 포함한다.특정 구현예에서, 링커는 펩티드를 포함한다.특정 구현예에서, 링커는 아릴 또는 헤테로아릴 모이어티를 포함한다.특정 구현예에서, 링커는 페닐 고리를 기반으로 한다.링커는 펩티드에서 링커까지 친핵체(예를 들어, 티올,아미노)의 부착을 용이하게 하는 작용화된 모이어티를 포함할 수 있다.임의의 친전자체는 링커의 일부로 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클 수용체, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함하나 이에 제한되지 않는다.
일반적으로, 링커는 두 개의 기, 분자, 또는 다른 모이어티 사이에 위치하거나, 또는 이에 의해 플랭킹되고 공유 결합을 통해 서로 연결되어, 두 개를 연결한다. 일부 구현예에서, 링커는 아미노산 또는 복수의 아미노산(예를 들어, 펩티드 또는 단백질)이다. 일부 구현예에서, 링커는 유기 분자, 기, 중합체, 또는 화학 모이어티이다. 일부 구현예에서, 링커는 2 내지 100 개의 아미노산 길이, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, 또는 150-200 개의 아미노산 길이이다. 일부 구현예에서, 링커는 약 3 내지 약 104 개(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100 개)의 아미노산 길이이다. 더 길거나 또는 더 짧은 링커 또한 고려된다.
일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 링커를 통해 서로 융합된 시티딘, 아데노신 데아미나아제 및 Cas9 도메인을 포함한다. 시티딘 또는 아데노신 데아미나아제 핵염기 편집기의 활성을 위한 최적의 길이를 달성하기 위해 시티딘 또는 아데노신 데아미나아제와 Cas9 도메인 사이의 다양한 링커 길이 및 유연성이 이용될 수 있다(예를 들어, 형태(GGGS)n(서열 번호 246),(GGGGS)n(서열 번호 247),및(G)n의 매우 유연한 링커에서 형태(EAAAK)n(서열 번호 248),(SGGS)n(서열 번호 355),SGSETPGTSESATPES(서열 번호 249)의 보다 강성인 링커까지의 범위)(예를 들어, 문헌[Guilinger JP, et al. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014;32(6): 577-82]을 참조하고, 그 전체 내용이 본원에 참조로 포함됨) 및(XP)n) 일부 구현예에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15이다. 일부 구현예에서, 링커는(GGS)n 모티프를 포함하되, n은 1, 3, 또는 7이다. 일부 구현예에서, 본원에 제공된 임의의 융합 단백질의 시티딘 데아미나아제 또는 아데노신 데아미나아제 및 Cas9 도메인은 아미노산 서열 SGSETPGTSESATPES(서열 번호 249)를 포함하는 링커를 통해 융합되고, 이는 또한 XTEN 링커로 지칭될 수 있다.
일부 구현예에서, 염기 편집기의 도메인은 아미노산 서열
SGGSSGSETPGTSESATPESSGGS(서열 번호 356),
SGGSSGGSSGSETPGTSESATPESSGGSSGGS(서열 번호 357),또는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS(서열 번호 358)을 포함하는 링커를 통해 융합된다.
일부 구현예에서, 염기 편집기의 도메인은 아미노산 서열 SGSETPGTSESATPES(서열 번호 249)를 포함하는 링커를 통해 융합되고, 이는 또한 XTEN 링커로 지칭될 수 있다. 일부 구현예에서, 링커는 아미노산 서열 SGGS를 포함한다. 일부 구현예에서, 링커는 24 개의 아미노산 길이이다. 일부 구현예에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES(서열 번호 359)를 포함한다. 일부 구현예에서, 링커는 40 개의 아미노산 길이이다. 일부 구현예에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS(서열 번호 360)를 포함한다. 일부 구현예에서, 링커는 64 개의 아미노산 길이이다. 일부 구현예에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS(서열 번호 361)를 포함한다. 일부 구현예에서, 링커는 92 개 아미노산 길이이다. 일부 구현예에서, 링커는 아미노산 서열 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS(서열 번호 362)을 포함한다.
일부 구현예에서, 링커는 복수의 프롤린 잔기를 포함하고 5-21, 5-14, 5-9, 5-7 개의 아미노산 길이, 예를 들어, PAPAP(서열 번호 363),PAPAPA(서열 번호 364),PAPAPAP(서열 번호 365),PAPAPAPA(서열 번호 366),P(AP)4(서열 번호 367),P(AP)7(서열 번호 368),P(AP)10(서열 번호 369)(예를 들어, 문헌[Tan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacemen Nat Commun. 2019 Jan 25;10(1):439]을 참조하고, 그 전체 내용이 본원에 참조로 포함된다). 이러한 프롤린-풍부 링커는 또한 '강성' 링커로 불린다.
또 다른 구현예에서, 염기 편집기 시스템은 데아미나아제(DNA 데아미나아제),예를 들어, 아데노신 또는 시티딘 데아미나아제와 비공유적으로 상호작용하고, 최소의 또는 감소된 방관자 또는 표적 인접 효과로, 특이적 편집을 위해 표적 폴리뉴클레오티드 서열 내 표적 핵염기로 아데노신 또는 시티딘 데아미나아제를 일시적으로 유인하는 구성요소(단백질)를 포함한다. 데아미나아제-상호작용 단백질을 포함하는 이러한 비공유 시스템 및 방법은 DNA 데아미나아제를 특정 게놈 표적 핵염기로 유인하고, 표적 상 및 표적 인접 편집의 이벤트를 분리하도록 작용하여, 보다 정밀한 단일 염기 치환 돌연변이의 달성을 향상시키는 역할을 한다. 일 구현예에서, 데아미나아제-상호작용 단백질은 데아미나아제의 활성(촉매적) 부위가 표적 핵염기(예를 들어, 각각 아데노신 또는 시티딘)와 결합하는 것을 차단하거나 방해하지 않으면서 데아미나아제(예를 들어, 아데노신 데아미나아제 또는 시티딘 데아미나아제)에 결합한다. 'MagnEdit'로 지칭되는 시스템과 같은 시스템은 Cas9 및 gRNA 복합체에 연결된 상호작용 단백질을 포함하고, 특정 게놈 표적 부위를 편집하기 위해 공동 발현된 아데노신 또는 시티딘 데아미나아제(외인성 또는 내인성)를 유인할 수 있으며, 문헌[McCann, J. et al., 2020, "MagnEdit - interacting factors that recruit DNA-editing enzymes to single base targets," Life-Science-Alliance, Vol. 3, No. 4(e201900606),(doi 10.26508/Isa.201900606]에 기재되어 있고, 그 전체 내용은 본원에 참조로 포함된다. 일 구현예에서, DNA 데아미나아제는 본원에 기재된 바와 같은 아데노신 데아미나아제 변이체(예를 들어, TadA*8)이다.
또 다른 구현예에서, '선태그(Suntag)'로 불리는 시스템은 예를 들어 문헌[Tanenbaum, M.E. et al., "A protein tagging system for signal amplification in gene expression and fluorescence imaging," Cell. 2014 October 23;159(3): 635-646. doi:10.1016/j.cell.2014.09.039];및 문헌(Huang, Y.-H. et al., 2017, "DNA epigenome editing using CRISPR-Cas SunTag-directed DNMT3A," Genome Biol 18: 176. doi:10.1186/s13059-017-1306-z)에 기재된 바와 같이 감소된 인접 표적 편집을 갖는 부위에서의 염기 편집을 수행하기 위해 폴리뉴클레오티드 표적 부위에 대한 염기 편집기의 단백질(예를 들어 아데노신 데아미나아제 또는 시티딘 데아미나아제) 구성요소, 또는 이의 다중 카피를 모집하기 위해 사용되는 비공유적 상호작용 성분을 포함하고, 이들 각각의 내용은 그의 전체가 본원에 참조로 포함된다. 일 구현예에서, DNA 데아미나아제는 본원에 기재된 바와 같은 아데노신 데아미나아제 변이체(예를 들어, TadA*8)이다.
가이드 RNA를 갖는 핵산 프로그래밍 가능한 DNA 결합 단백질
세포에서 염기 편집을 위한 조성물 및 방법이 본원에 제공된다. 가이드 폴리핵산 서열, 예를 들어 가이드 RNA 서열, 또는 본원에 제공된 바와 같은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 개 이상의 가이드 RNA의 조합을 포함하는 조성물이 본원에 더 제공된다. 일부 구현예에서, 본원에 제공된 바와 같은 염기 편집을 위한 조성물은 염기 편집기, 예를 들어 C-염기 편집기 또는 A-염기 편집기를 암호화하는 폴리뉴클레오티드를 더 포함한다. 예를 들어, 염기 편집을 위한 조성물은 BE, BE4, ABE, 및 제공된 바와 같은 하나 이상의 가이드 RNA의 조합을 암호화하는 mRNA 서열을 포함할 수 있다. 염기 편집을 위한 조성물은 염기 편집기 폴리펩티드 및 본원에 제공된 임의의 가이드 RNA 중 하나 이상의 조합을 포함할 수 있다. 이러한 조성물은 상이한 전달 접근법, 예를 들어, 전기천공[electroporation], 뉴클레오펙션(nucleofection),바이러스 형질도입[viral transduction] 또는 형질감염을 통해 세포에서의 염기 편집을 수행하는데 사용될 수 있다. 일부 구현예에서, 염기 편집을 위한 조성물은 염기 편집기를 암호화하는 mRNA 서열, 및 전기천공에 대해 본원에 제공된 하나 이상의 가이드 RNA 서열의 조합을 포함한다.
본 개시의 일부 양태는 본원에 제공된 임의의 융합 단백질, 및 융합 단백질의 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인[예를 들어, Cas9(예를 들어, dCas9, 뉴클레아제 활성 Cas9, 또는 Cas9 니카아제) 또는 Cas12]에 결합된 가이드 RNA를 포함하는 복합체를 제공한다. 이러한 복합체는 리보핵단백질[ribonucleoproteins, RNP]이라고도 한다. 일부 구현예에서, 가이드 핵산(예를 들어, 가이드 RNA)은 15 내지 100 개의 뉴클레오티드 길이이고 표적 서열에 상보적인 적어도 열 개의 인접 뉴클레오티드의 서열을 포함한다. 일부 구현예에서, 가이드 RNA는 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 개의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 RNA는 표적 서열에 상보적인 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 개의 인접한 뉴클레오티드의 서열을 포함한다. 일부 구현예에서, 표적 서열은 DNA 서열이다. 일부 구현예에서, 표적 서열은 RNA 서열이다. 일부 구현예에서, 표적 서열은 박테리아, 효모, 진균, 곤충, 식물, 또는 동물의 게놈 내의 서열이다. 일부 구현예에서, 표적 서열은 인간의 게놈 내의 서열이다. 일부 구현예에서, 표적 서열의 3' 단부는 표준 PAM 서열(NGG)에 바로 인접해 있다. 일부 구현예에서, 표적 서열의 3' 단부는 비표준 PAM 서열(예를 들어, 표 7 또는 5'-NAA-3'에 나열된 서열)에 바로 인접한다. 일부 구현예에서, 가이드 핵산(예를 들어, 가이드 RNA)은 관심 유전자(예를 들어, 질환 또는 장애와 연관된 유전자) 내의 서열에 상보적이다.
본 개시의 일부 양태는 본원에 제공된 융합 단백질, 또는 복합체의 사용 방법을 제공한다. 예를 들어, 본 개시의 일부 양태는 DNA 분자를 본원에 제공된 임의의 융합 단백질, 및 적어도 하나의 가이드 RNA와 접촉시키는 단계를 포함하는 방법을 제공하되, 가이드 RNA는 약 15 내지 100 개의 뉴클레오티드 길이이며 표적 서열에 상보적인 적어도 열 개의 인접한 뉴클레오티드의 서열을 포함한다. 일부 구현예에서, 표적 서열의 3' 단부는 AGC, GAG, TTT, GTG, 또는 CAA 서열에 바로 인접해 있다 일부 구현예에서, 표적 서열의 3' 단부는 NGA, NGCG, NGN, NNGRRT, NNNRRT, NGCG, NGCN, NGTN, NGTN, NGTN, 또는 5'(TTTV) 서열에 바로 인접해 있다. 일부 구현예에서, 표적 서열의 3'의 단부는 예를 들어, TTN, DTTN, GTTN, ATTN, ATTC, DTTNT, WTTN, HATY, TTTN, TTTV, TTTC, TG, RTR, 또는 YTN PAM 부위에 바로 인접해 있다.
각각의 서열에서 특이적 위치 및 잔기의 넘버링은 사용되는 특정 단백질 및 넘버링 방식에 따라 달라짐이 이해될 것이다. 넘버링은 예를 들어, 성숙 단백질의 전구체 및 성숙 단백질 자체에서 상이할 수 있고, 종 간의 서열 차이는 넘버링에 영향을 미칠 수 있다. 당업자는 당업계에 잘 알려진 방법, 예를 들어, 서열 정렬 및 상동성 잔기의 결정에 의해 임의의 상동성 단백질 및 각각의 암호화 핵산에서 각각의 잔기를 식별할 수 있을 것이다.
표적 부위, 예를 들어, 편집될 돌연변이를 포함하는 부위에 본원에 개시된 임의의 융합 단백질을 표적으로 하기 위해, 전형적으로 가이드 RNA와 함께 융합 단백질을 공발현하는 것이 필요함이 당업자에게 명백할 것이다. 본원의 다른 곳에서 보다 상세히 설명된 바와 같이, 가이드 RNA는 전형적으로 napDNAbp(예를 들어, Cas9 또는 Cas12) 결합을 허용하는 tracrRNA 프레임워크, 및 napDNAbp;핵산 편집 효소/도메인 융합 단백질에 서열 특이성을 부여하는 가이드 서열을 포함한다. 또한, 가이드 RNA 및 tracrRNA는 두 개의 핵산 분자로서 개별적으로 제공될 수 있다. 일부 구현예에서, 가이드 RNA는 구조를 포함하되, 가이드 서열은 표적 서열에 상보적인 서열을 포함한다. 가이드 서열은 전형적으로 20 개의 뉴클레오티드 길이이다. napDNAbp: 핵산 편집 효소/도메인 융합 단백질을 특이적 게놈 표적 부위로 표적화하기에 적합한 가이드 RNA의 서열은 본 개시에 기반하여 당업자에게 명백할 것이다. 이러한 적합한 가이드 RNA 서열은 전형적으로 편집될 표적 뉴클레오티드의 상류 또는 하류에 있는 50 개의 뉴클레오티드 내에서 핵산 서열에 상보적인 가이드 서열을 포함한다. 임의의 제공된 융합 단백질을 특이적 표적 서열에 표적화하기에 적합한 일부 예시적인 가이드 RNA 서열이 본원에 제공된다.
sgRNA의 별개의 부분은 Cas9(예를 들어, SpyCas9) 및/또는 DNA 표적과 상호작용하는 다양한 특징을 형성할 것으로 예측된다. 여섯 개의 보존된 모듈이 천연 crRNA:tracrRNA 듀플렉스 및 Cas9 엔도뉴클레아제 활성을 지시하는 단일 가이드 RNA(sgRNA) 내에서 식별되었다(문헌[Briner et al., Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell. 2014 Oct 23;56(2):333-339] 참조). 여섯 개의 모듈에는 DNA 표적화를 담당하는 스페이서, CRISPR 반복체:tracrRNA 듀플렉스에 의해 형성된 상부 줄기, 융기, 하부 줄기, 넥서스 및 tracrRNA의 3' 단부에서의 헤어핀이 포함된다. 상부 및 하부 줄기는 주로 포스페이트 백본과의 서열 독립적 상호작용을 통해 Cas9와 상호작용한다. 일부 구현예에서, 상부 줄기는 분배가능하다. 일부 구현예에서, 하부 줄기의 염기에서의 보존된 우라실 뉴클레오티드 서열은 분배가능하다. 융기는 Cas9의 Rec1 도메인과의 특정 측쇄 상호작용에 참여한다. U44의 핵염기는 Tyr 325 및 His 328의 측쇄와 상호작용하는 반면, G43은 Tyr 329와 상호작용한다. 넥서스는 sgRNA:Cas9 상호작용의 코어를 형성하고 sgRNA와 Cas9 및 표적 DNA 둘 모두 사이의 교차점에 위치한다. A51 및 A52의 핵염기는 Phe 1105의 측쇄와 상호작용하고;U56은 Arg 457 및 Asn 459와 상호작용하고;U59의 핵염기는 Arg 74, Asn 77, Pro 475, Leu 455, Phe 446, 및 Ile 448의 측쇄에 의해 한정된 소수성 포켓 내로 삽입되고;C60은 Leu 455, Ala 456, 및 Asn 459와 상호작용하고, C61은 Arg 70의 측쇄와 상호작용하고, 이는 이어서 C15와 상호작용한다. 일부 구현예에서, sgRNA:Cas9 상호작용을 최적화하기 위해 Cas9(예를 들어, spyCas9)에 대한 sgRNA의 융기 및/또는 넥서스에서 이들 돌연변이 중 하나 이상이 만들어진다.
더욱이, tracrRNA 넥서스 및 헤어핀은 Cas9 쌍형성에 중요하고, 이종 Cas9 단백질을 분리하는 교차 직교성 장벽으로 교환될 수 있으며, 이는 직교 Cas9 단백질의 추가 이용에 중요하다. 일부 구현예에서, 넥서스 및 헤어핀은 표적 직교 Cas9 단백질로 교환된다. 일부 구현예에서, sgRNA는 보다 간결하고 입체형태적으로 안정한 가이드 RNA를 설계하기 위해 상부 줄기, 헤어핀 1, 및/또는 하부 줄기의 서열 유연성이 분배된다. 일부 구현예에서, 모듈은 다양한 키메라 가이드를 갖는 단일 Cas9를 사용하거나 키메라 sgRNA의 상이한 조합을 갖는 직교 시스템을 동시에 사용하여 다중 편집을 최적화하도록 변형된다. 가이드 기능 모듈 및 이의 방법에 관한 상세 사항은, 예를 들어, 문헌[Briner et al., Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell. 2014 Oct 23;56(2):333-339]에 기재되어 있고, 그 내용은 본원에 그 전체가 참조로 포함된다.
본원에 개시된 염기 편집기의 도메인은 임의의 순서로 배열될 수 있다. 폴리뉴클레오티드-프로그래밍 가능한 뉴클레오티드-결합 도메인(예를 들어, Cas9 또는 Cas12) 및 데아미나아제 도메인(예를 들어, 시티딘 또는 아데노신 데아미나아제)을 포함하는 융합 단백질을 포함하는 염기 편집기의 비제한적인 예는 다음과 같이 배열될 수 있다:
NH2-[핵염기 편집 도메인]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[데아미나아제]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[데아미나아제]-링커1-[핵염기 편집 도메인]-링커2-[UGI]-COOH;
NH2-[데아미나아제]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[아데노신 데아미나아제]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-COOH;
NH2-[데아미나아제]-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[데아미나아제]-[이노신 BER 억제제]-[핵염기 편집 도메인]-COOH;
NH2-[이노신 BER 억제제-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-[이노신 BER 억제제]-[데아미나아제]-COOH;
NH2-[이노신 BER 억제제-[핵염기 편집 도메인]-[데아미나아제]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-링커2-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-링커2-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[이노신 BER 억제제]-[핵염기 편집 도메인]-링커1-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[이노신 BER 억제제]-[핵염기 편집 도메인]-링커1-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[이노신 BER 억제제]-[핵염기 편집 도메인]-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH;또는
NH2-[이노신 BER 억제제]-NH2-[핵염기 편집 도메인]-[데아미나아제]-[핵염기 편집 도메인]-COOH.
일부 구현예에서, 본원에 제공되는 염기 편집 융합 단백질은 예를 들어, 표적 염기가 정의된 영역(예를 들어, '탈아미노화 창') 내에 배치되는 정확한 위치에 위치할 필요가 있다. 일부 구현예에서, 표적은 네 개의 염기 영역 내에 있을 수 있다. 일부 구현예에서, 이러한 정의된 표적 영역은 PAM의 상류에 있는 대략 15 개의 염기일 수 있다. 문헌[Komor, A.C., et.al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424(2016);Gaudelli, N.M., et.al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471(2017)];및 문헌[Komor, A.C., et.al., "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774(2017)]을 참조하고, 이의 전체 내용이 본원에 참조로 포함된다.
정의된 표적 영역은 탈아미노화 창일 수 있다. 탈아미노화 창은 염기 편집기가 표적 뉴클레오티드에 작용하고 탈아미노화하는 정의된 영역일 수 있다. 일부 구현예에서, 탈아미노화 창은 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 염기 영역 내에 있다. 일부 구현예에서, 탈아미노화 창은 PAM의 상류에 있는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 개의 염기이다.
본 개시의 염기 편집기는 표적 폴리뉴클레오티드 서열의 편집을 용이하게 하는 임의의 도메인, 특징 또는 아미노산 서열을 포함할 수 있다. 예를 들어, 일부 구현예에서, 염기 편집기는 핵 국소화 서열[NLS]을 포함한다. 일부 구현예에서, 염기 편집기의 NLS는 데아미나아제 도메인 및 napDNAbp 도메인 사이에 국소화된다. 일부 구현예에서, 염기 편집기의 NLS는 napDNAbp 도메인에 대해 C-말단에 국소화된다.
융합 단백질에 포함될 수 있는 단백질 도메인의 비제한적인 예는 데아미나아제 도메인(예를 들어, 아데노신 데아미나아제 또는 시티딘 데아미나아제),우라실 글리코실라제 억제제[UGI] 도메인, 항원 결정기 태그, 및 리포터 유전자 서열, 및/또는 본원에 기재된 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다.
도메인은 항원 결정기 태그, 리포터 단백질, 다른 결합 도메인으로 검출되거나 표지될 수 있다. 항원 결정기 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그, 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는 글루타티온-5-트랜스퍼라제(GST),서양고추냉이 퍼옥시다제[horseradish peroxidase, HRP], 클로람페니콜 아세틸트랜스퍼라제(chloramphenicol acetyltransferase, CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질[GFP], HcRed, DsRed, 청록색 형광 단백질[CFP], 황색 형광 단백질[YFP], 및 청색 형광 단백질[BFP]을 포함한 자가형광 단백질을 포함하나 이에 제한되지 않는다. 추가적인 단백질 서열은 DNA 분자에 결합하거나 또는 말토스 결합 단백질[MBP], S-태그, Lex A DNA 결합 도메인[DNA binding domain, DBD] 융합, GAL4 DNA 결합 도메인 융합, 및 단순 포진 바이러스[herpes simplex virus, HSV] BP16 단백질 융합을 포함하나 이에 제한되지 않는 다른 세포 분자에 결합하는 아미노산 서열을 포함할 수 있다.
시티딘 또는 아데노신 데아미나아제 및 Cas9 도메인을 포함하는 융합 단백질의 사용 방법
본 개시의 일부 양태는 본원에 제공된 융합 단백질, 또는 복합체의 사용 방법을 제공한다. 예를 들어, 본 개시의 일부 양태는 DNA 분자를 본원에 제공된 임의의 융합 단백질 및 본원에 기재된 적어도 하나의 가이드 RNA와 접촉시키는 것을 포함하는 방법을 제공한다.
일부 구현예에서, 본 발명의 융합 단백질은 관심 표적 유전자를 편집하기 위해 사용된다. 특히, 본원에 기재된 시티딘 데아미나아제 또는 아데노신 데아미나아제 핵염기 편집기는 표적 서열내에서 다수의 돌연변이를 만들 수 있다. 이러한 돌연변이는 표적의 기능에 영향을 미칠 수 있다. 예를 들어, 시티딘 데아미나아제 또는 아데노신 데아미나아제 핵염기 편집기가 조절 영역을 표적화하기 위해 사용되는 경우, 조절 영역의 기능은 변경되고 하류 단백질의 발현은 감소되거나 제거된다.
각각의 서열에서 특이적 위치 및 잔기의 넘버링은 사용되는 특정 단백질 및 넘버링 방식에 따라 달라짐이 이해될 것이다. 넘버링은 예를 들어, 성숙 단백질의 전구체 및 성숙 단백질 자체에서 상이할 수 있고, 종[species] 간의 서열 차이는 넘버링에 영향을 미칠 수 있다. 당업자는 당업계에 잘 알려진 방법, 예를 들어, 서열 정렬 및 상동성 잔기의 결정에 의해 임의의 상동성 단백질 및 각각의 암호화 핵산에서 각각의 잔기를 식별할 수 있을 것이다.
표적 부위, 예를 들어, 편집될 돌연변이를 포함하는 부위에, 본원에 개시된 바와 같이, Cas9 도메인 및 시티딘 또는 아데노신 데아미나아제를 포함하는 임의의 융합 단백질을 표적화하기 위해서는, 전형적으로 가이드 RNA, 예를 들어, sgRNA와 함께 융합 단백질을 공발현하는 것이 필요함이 당업자에게 명백할 것이다. 본원의 다른 곳에서 보다 상세히 설명된 바와 같이, 가이드 RNA는 전형적으로 Cas9 결합을 허용하는 tracrRNA 프레임워크, 및 Cas9:핵산 편집 효소/도메인 융합 단백질에 서열 특이성을 부여하는 가이드 서열을 포함한다. 또한, 가이드 RNA 및 tracrRNA는 두 개의 핵산 분자로서 개별적으로 제공될 수 있다. 일부 구현예에서, 가이드 RNA는 구조를 포함하되, 가이드 서열은 표적 서열에 상보적인 서열을 포함한다. 가이드 서열은 전형적으로 20 개의 뉴클레오티드 길이이다. Cas9: 핵산 편집 효소/도메인 융합 단백질을 특이적 게놈 표적 부위로 표적화하기에 적합한 가이드 RNA의 서열은 본 개시에 기반하여 당업자에게 명백할 것이다. 이러한 적합한 가이드 RNA 서열은 전형적으로 편집될 표적 뉴클레오티드의 상류 또는 하류에 있는 50 개의 뉴클레오티드 내에서 핵산 서열에 상보적인 가이드 서열을 포함한다. 임의의 제공된 융합 단백질을 특이적 표적 서열에 표적화하기에 적합한 일부 예시적인 가이드 RNA 서열이 본원에 제공된다.
염기 편집기 효율
일부 구현예에서, 본원에 제공된 방법의 목적은 유전자 편집을 통해 유전자 및/또는 유전자 생산물을 변경하는 것이다. 본원에 제공된 핵염기 편집 단백질은 시험관내 또는 생체내에서 유전자 편집 기반 인간 치료제에 사용될 수 있다. 본원에 제공된 핵염기 편집 단백질, 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9) 및 핵염기 편집 도메인(예를 들어, 아데노신 데아미나아제 도메인 또는 시티딘 데아미나아제 도메인)을 포함하는 융합 단백질은 A에서 G로 또는 C에서 T로의 뉴클레오티드를 편집하는 데 사용될 수 있음이 당업자에 의해 이해될 것이다.
유리하게, 본원에 제공된 바와 같은 염기 편집 시스템은 CRISPR가 할 수 있듯이 이중 가닥 DNA 파손을 생성하지 않고, 공여자 DNA 주형을 필요로 하지 않으며, 과도한 확률적 삽입 및 결실을 유도하지 않고, 게놈 편집을 제공한다. 일부 구현예에서, 본 개시는 유의한 수의 의도되지 않은 돌연변이, 예컨대 의도되지 않은 점 돌연변이를 생성하지 않으면서, 의도된 돌연변이, 예컨대 핵산(예를 들어, 대상의 게놈 내 핵산) 내의 종결 코돈을 효율적으로 생성하는 염기 편집기를 제공한다. 일부 구현예에서, 의도된 돌연변이는 의도된 돌연변이를 생성하도록 특이적으로 설계된 가이드 폴리뉴클레오티드(예를 들어, gRNA)에 결합된 특이적 염기 편집기(예를 들어, 아데노신 염기 편집기 또는 시티딘 염기 편집기)에 의해 생성된 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 질환 또는 장애와 연관된 표적 항원과 연관된 유전자이다. 예를 들어, HBV 감염, 뿐만 아니라 간경변, 간세포 암종[HCC], 및 HBV 감염과 연관되거나 또는 이로 인한 임의의 다른 질환을 포함한 관련 질환 또는 장애를 포함한다. 일부 구현예에서, 의도된 돌연변이는 예를 들어, 질환 또는 장애와 연관된 표적 항원과 연관된 유전자에서 아데닌(A)에서 구아닌(G)으로의 점 돌연변이(예를 들어, SNP)이다. 예를 들어, HBV 감염, 뿐만 아니라 간경변, 간세포 암종[HCC], 및 HBV 감염과 연관되거나 또는 이로 인한 임의의 다른 질환을 포함한 관련 질환 또는 장애를 포함한다. 일부 구현예에서, 의도된 돌연변이는 유전자의 코딩 영역 또는 비-코딩 영역(예를 들어, 조절 영역 또는 요소) 내에서 아데닌(A)에서 구아닌(G)으로의 점 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 예를 들어, 질환 또는 장애와 연관된 표적 항원과 연관된 유전자에서 시토신(C)에서 티민(T)으로의 점 돌연변이(예를 들어, SNP)이다. 예를 들어, HBV 감염, 뿐만 아니라 간경변, 간세포 암종[HCC], 및 HBV 감염과 연관되거나 또는 이로 인한 임의의 다른 질환을 포함한 관련 질환 또는 장애를 포함한다. 일부 구현예에서, 의도된 돌연변이는 유전자의 코딩 영역 또는 비코딩 영역(예를 들어, 조절 영역 또는 요소) 내에서 시토신(C)에서 티민(T)으로의 점 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈, 예를 들어, 유전자의 코딩 영역 내에서 조기 종결 코돈을 생성하는 점 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈을 제거하는 돌연변이이다.
본 발명의 염기 편집기는 유리하게도 유의한 비율의 인델을 생성하지 않고 단백질을 암호화하는 특이적 뉴클레오티드 염기를 변형시킨다. 본원에 사용된 바와 같은 용어 '인델'은 핵산 내 뉴클레오티드 염기의 삽입 또는 결실을 지칭한다. 이러한 삽입 또는 결실은 유전자의 코딩 영역 내에서 프레임 시프트 돌연변이로 이어질 수 있다. 일부 구현예에서, 핵산에서 다수의 삽입 또는 결실(즉, 인델)을 생성하지 않고, 핵산 내특이적 뉴클레오티드를 효율적으로 변형(예를 들어, 돌연변이화)시키는 염기 편집기를 생성하는 것이 바람직하다. 일부 구현예에서, 핵산에서 다수의 삽입 또는 결실(즉, 인델)을 생성하지 않고, 핵산 내 특이적 뉴클레오티드를 효율적으로 변형(예를 들어, 돌연변이화 또는 메틸화)시키는 염기 편집기를 생성하는 것이 바람직하다. 특정 구현예에서, 본원에 제공된 임의의 염기 편집기는 인델에 비해 더 큰 비율의 의도된 변형(예를 들어, 메틸화)을 생성할 수 있다. 특정 구현예에서, 본원에 제공된 임의의 염기 편집기는 인델에 비해 더 큰 비율의 의도된 변형(예를 들어, 돌연변이)를 생성할 수 있다.
일부 구현예에서, 본원에 제공된 염기 편집기는 1:1 초과의 의도된 돌연변이 대 인델의 비(즉, 의도된 점 돌연변이:의도되지 않은 점 돌연변이)를 생성할 수 있다. 일부 구현예에서, 본원에 제공된 염기 편집기는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 200:1, 적어도 300:1, 적어도 400:1, 적어도 500:1, 적어도 600:1, 적어도 700:1, 적어도 800:1, 적어도 900:1, 또는 적어도 1000:1, 또는 그 이상인 의도된 점 돌연변이 대 인델의 비를 생성할 수 있다. 의도된 돌연변이 및 인델의 수는 임의의 적합한 방법을 사용하여 결정될 수 있다.
일부 구현예에서, 본원에 제공된 염기 편집기는 핵산 영역에서 인델의 형성을 제한할 수 있다. 일부 구현예에서, 영역은 염기 편집기에 의해 표적화된 뉴클레오티드 또는 염기 편집기에 의해 표적화된 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 뉴클레오티드 내의 영역에 있다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 핵산 영역에서 인델의 형성을 1% 미만, 1.5% 미만, 2% 미만, 2.5% 미만, 3% 미만, 3.5% 미만, 4% 미만, 4.5% 미만, 5% 미만, 6% 미만, 7% 미만, 8% 미만, 9% 미만, 10% 미만, 12% 미만, 15% 미만, 또는 20% 미만으로 제한할 수 있다. 핵산 영역에서 형성된 인델의 수는 핵산(예를 들어, 세포의 게놈 내 핵산)이 염기 편집기에 노출된 시간의 양에 따라 달라질 수 있다. 일부 구현예에서, 인델의 수 또는 비율은 핵산(예를 들어, 세포의 게놈 내 핵산)을 염기 편집기에 노출시키고 적어도 1 시간, 적어도 2 시간, 적어도 6 시간, 적어도 12 시간, 적어도 24 시간, 적어도 36 시간, 적어도 48 시간, 적어도 3 일, 적어도 4 일, 적어도 5 일, 적어도 7 일, 적어도 10 일, 또는 적어도 14 일 후에 결정된다.
본 개시의 일부 양태는 본원에 제공된 임의의 염기 편집기가 상당한 수의 의도되지 않은 돌연변이(예를 들어, 허위의 표적외 편집 또는 방관자 편집)를 생성하지 않고 핵산(예를 들어 대상의 게놈 내 핵산)에서 의도된 돌연변이를 효율적으로 생성할 수 있다는 인식에 기반한다. 일부 구현예에서, 의도된 돌연변이는 의도된 돌연변이를 생성하도록 특이적으로 설계된 gRNA에 결합된 특이적 염기 편집기에 의해 생성된 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈, 예를 들어, 유전자의 코딩 영역 내에서 조기 종결 코돈을 생성하는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈을 제거하는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 유전자의 스플라이싱을 변경하는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 유전자의 조절 서열(예를 들어, 유전자 프로모터 또는 유전자 억제인자)을 변경하는 돌연변이이다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 1:1 초과의 의도된 돌연변이 대 의도되지 않은 돌연변이(예를 들어, 의도된 돌연변이: 의도되지 않은 돌연변이)의 비를 생성할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 150:1, 적어도 200:1, 적어도 250:1, 적어도 500:1, 또는 적어도 1000:1, 또는 그 이상인 의도된 돌연변이 대 의도되지 않은 돌연변이의 비를 생성할 수 있다. 본원에 기재된 염기 편집기의 특성은 임의의 융합 단백질, 또는 본원에 제공된 융합 단백질의 사용 방법에 적용될 수 있음이 이해되어야 한다.
염기 편집은 종종 유전적 변형, 유전자 변형 및 핵산 서열의 변형과 같은 '변형'으로 지칭되고, 변형이 염기 편집 변형이라는 문맥에 기반하여 명확하게 이해될 수 있다. 따라서, 염기 편집 변형은 예를 들어 본 개시 전반에 걸쳐 논의된 데아미나아제 활성의 결과로서 뉴클레오티드 염기 수준에서의 변형이며, 이는 이어서 유전자 서열의 변화를 초래하고, 유전자 생산물에 영향을 미칠 수 있다. 따라서 본질적으로, 본원에 기재된 유전자 편집 변형은 구조적 및/또는 기능적으로 유전자의 변형을 초래할 수 있되, 유전자 산물의 발현은 변형될 수 있고, 예를 들어, 유전자의 발현은 녹아웃되거나, 또는 반대로, 향상되거나, 또는 일부 상황에서는 유전자 기능 또는 활성이 변형될 수 있다. 본원에 개시된 방법을 사용하여, 염기 편집 효율은 염기 편집이 수행되는 유전자의 녹다운 효율로서 결정될 수 있되, 염기 편집은 유전자의 발현을 녹다운하도록 의도된다. 녹다운 수준은 임의의 검출 분석, 예컨대 단백질 발현 수준에 대한 분석, 예를 들어 유세포 분석에 의한 분석;RNA 발현 검출 분석, 예컨대 정량적 RT-PCR, 노던 블롯(northern blot) 분석, 또는 임의의 다른 적합한 분석, 예컨대 파이로시퀀싱(pyrosequencing)에 의해 발현 수준을 결정함으로써 정량적으로 검증될 수 있고, 뉴클레오티드 시퀀싱 반응에 의해 정성적으로 검증될 수 있다.
일부 구현예에서, 변형, 예를 들어, 단일 염기 편집은 유전자 표적화된 발현의 적어도 10% 감소를 초래한다, 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 10% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 20% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 30% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 40% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 50% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 60% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 70% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 80% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 90% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 91% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 92% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 93% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 94% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 95% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 96% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 97% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 98% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화된 발현의 적어도 99% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적화된 유전자의 녹아웃(유전자 발현의 100% 녹다운)을 초래할 수 있다.
일부 구현예에서, 본원에 제공된 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만, 또는 0.01% 미만의 인델 형성을 초래한다.
일부 구현예에서, 표적화된 변형, 예를 들어, 단일 염기 편집은 상이한 가이드 RNA로 염기를 편집하기 위해 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50 개의 상이한 내인성 서열을 표적화하는 데 동시에 사용된다. 일부 구현예에서, 표적화된 변형, 예를 들어 단일 염기 편집은 상이한 가이드 RNA로 염기를 편집하기 위해 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 , 50 개, 또는 그 이상의 상이한 내인성 서열을 순차적으로 표적화하는 데 사용된다.
본 개시의 일부 양태는 본원에 제공된 임의의 염기 편집기가 상당한 수의 의도되지 않은 돌연변이, 예컨대 의도되지 않은 점 돌연변이(즉, 방관자의 돌연변이)를 생성하지 않고 핵산(예를 들어, 대상의 게놈 내 핵산)에서 점 돌연변이와 같은 의도된 돌연변이를 효율적으로 생성할 수있다는 인식에 기반한다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 의도된 돌연변이의 적어도 0.01%(즉, 적어도 0.01% 염기 편집 효율)를 생성할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 의도된 돌연변이의 적어도 0.01%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 99%를 생성할 수 있다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만, 또는 0.01% 미만의 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 0.8% 미만의 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 최대 0.8% 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 0.3% 미만의 인델 형성을 초래한다. 일부 구현예에서, 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 염기 편집기 시스템에 비해 표적 폴리뉴클레오티드 서열에서 더 낮은 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 표적 폴리뉴클레오티드 서열에서 더 낮은 인델 형성을 초래한다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 염기 편집기 시스템과 비교하여 인델 빈도가 감소한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 염기 편집기 시스템과 비교하여 인델 빈도가 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 감소한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 염기 편집기 시스템은 ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 인델 빈도가 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 감소한다.
본 발명은 효율 및 특이성이 증가된 아데노신 데아미나아제 변이체(예를 들어, ABE8 변이체)를 제공한다. 특히, 본원에 기재된 아데노신 데아미나아제 변이체는 폴리뉴클레오티드 내에서 원하는 염기를 편집할 가능성이 높고, 변경되도록 의도되지 않은 염기(예를 들어, '방관자')를 편집할 가능성이 적다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 방관자 편집 또는 돌연변이가 감소된다. 일부 구현예에서, 의도되지 않은 편집 또는 돌연변이는 방관자 돌연변이 또는 방관자 편집, 예를 들어, 표적 뉴클레오티드 서열의 표적 창에서 의도되지 않은 또는 비표적 위치의 표적 염기(예를 들어, A 또는 C)의 염기 편집이다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 방관자 편집 또는 돌연변이가 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 방관자 편집 또는 돌연변이가 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%까지 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 방관자 편집 또는 돌연변이가 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 또는 적어도 3.0 배까지 감소된다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 허위 편집이 감소된다. 일부 구현예에서, 의도되지 않은 편집 또는 돌연변이는 허위 돌연변이 또는 허위 편집, 예를 들어, 게놈의 의도되지 않은 또는 비표적 영역에서 표적 염기(예를 들어, A 또는 C)의 비특이적 편집 또는 가이드 독립적 편집이다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템에 비해 허위 편집이 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 허위 편집이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 허위 편집이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 또는 적어도 3.0 배 감소된다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 염기 편집 효율을 갖는다. 일부 구현예에서, 염기 편집 효율은 세포의 집단에서 편집된 핵염기의 백분율을 계산함으로서 측정될 수 있다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 세포의 집단에서 편집된 핵염기에 의해 측정된 바와 같이 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 염기 편집 효율을 갖는다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기와 비교하여 염기 편집 효율이 더 높다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 염기 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300%, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500% 더 높다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 염기 편집 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 3.1 배, 적어도 3.2, 적어도 3.3 배, 적어도 3.4 배, 적어도 3.5 배, 적어도 3.6 배, 적어도 3.7 배, 적어도 3.8 배, 적어도 3.9 배, 적어도 4.0 배, 적어도 4.1 배, 적어도 4.2 배, 적어도 4.3 배, 적어도 4.4 배, 적어도 4.5 배, 적어도 4.6 배, 적어도 4.7 배, 적어도 4.8 배, 적어도 4.9 배, 또는 적어도 5.0 배 더 높다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 표적 내 염기 편집 효율을 갖는다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 세포의 집단에서 편집된 표적 핵염기에 의해 측정된 바와 같이 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 표적 내 염기 편집 효율을 갖는다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기와 비교하여 표적 내 염기 편집 효율이 더 높다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 표적 내 염기 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300%, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500% 더 높다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 표적내 염기 편집 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 3.1 배, 적어도 3.2 배, 적어도 3.3 배, 적어도 3.4 배, 적어도 3.5 배, 적어도 3.6 배, 적어도 3.7 배, 적어도 3.8 배, 적어도 3.9 배, 적어도 4.0 배, 적어도 4.1 배, 적어도 4.2 배, 적어도 4.3 배, 적어도 4.4 배, 적어도 4.5 배, 적어도 4.6 배, 적어도 4.7 배, 적어도 4.8 배, 적어도 4.9 배, 또는 적어도 5.0 배 더 높다.
본원에 기재된 ABE8 염기 편집기 변이체는 플라스미드, 벡터, LNP 복합체, 또는 mRNA를 통해 숙주 세포로 전달될 수 있다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 mRNA로서 숙주 세포로 전달된다. 일부 구현예에서, 핵산 기반 전달 시스템, 예를 들어, mRNA를 통해 전달된 ABE8 염기 편집기는 편집된 핵염기에 의해 측정된 바와 같이 적어도 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 표적 내 편집 효율을 갖는다. 일부 구현예에서, mRNA 시스템에 의해 전달된 ABE8 염기 편집기는 플라스미드 또는 벡터 시스템에 의해 전달된 ABE8 염기 편집기와 비교하여 염기 편집 효율이 더 높다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300% 이상, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500%의 표적 내 편집 효율을 갖는다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 3.1 배, 적어도 3.2 배, 적어도 3.3 배, 적어도 3.4 배, 적어도 3.5 배, 적어도 3.6 배, 적어도 3.7 배, 적어도 3.8 배, 적어도 3.9 배, 적어도 4.0 배, 적어도 4.1 배, 적어도 4.2 배, 적어도 4.3 배, 적어도 4.4 배, 적어도 4.5 배, 적어도 4.6 배, 적어도 4.7 배, 적어도 4.8 배, 적어도 4.9 배, 또는 적어도 5.0 배 더 높은 표적 내 편집 효율을 갖는다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만, 또는 0.01% 미만의 표적외 편집을 초래한다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 표적외 편집 효율이 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 표적외 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 표적외 편집 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 또는 적어도 3.0 배 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 표적외 편집 효율이 적어도 약 2.2 배 감소한다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드 독립적 표적외 편집 효율이 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드 독립적 표적외 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드 독립적 표적외 편집 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 5.0 배, 적어도 10.0 배, 적어도 20.0 배, 적어도 50.0 배, 적어도 70.0 배, 적어도 100.0 배, 적어도 120.0 배, 적어도 130.0 배, 또는 적어도 150.0 배 더 낮다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드 독립적 표적외 편집 효율(예를 들어, 허위 RNA 탈아미노화)이 134.0 배 감소한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체는 게놈에 걸쳐 가이드 독립적 돌연변이율을 증가시키지 않는다.
일부 구현예에서, 단일 유전자 전달 이벤트(예를 들어, 형질도입, 형질감염, 전기천공 또는 임의의 다른 방법에 의해)는 세포의 게놈 내의 다섯 개의 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 6 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 7 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 전기천공 이벤트를 사용하여 세포의 게놈 내의 8 개 서열의 염기 편집을 표적화할 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 9 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 10 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 20 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 30 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 40 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 50 개 서열의 염기 편집을 표적으로 하는 데 사용될 수 있다.
일부 구현예에서, 본원에 기재된 방법은, 예를 들어, 염기 편집 방법들은 목표 외 효과가 최소이거나 없다.
일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 50%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단의 적어도 55%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 60%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 65%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 70%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 75%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 80%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 85%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 90%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 95%를 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)의 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%를 초래한다.
일부 구현예에서, 염기 편집 개입 후의 살아있는 세포 회수율은 염기 편집 이벤트 시에 출발 세포 집단의 적어도 60%, 70%, 80%, 90%보다 더 크다. 일부 구현예에서, 위에 기재된 바와 같은 살아있는 세포 회수율은 약 70%이다. 일부 구현예에서, 위에 기재된 바와 같은 살아있는 세포 회수율은 약 75%이다. 일부 구현예에서, 위에 기재된 바와 같은 살아있는 세포 회수율은 약 80%이다. 일부 구현예에서, 위에 기재된 바와 같은 살아있는 세포 회수율은 약 85%이다. 일부 구현예에서, 위에 기재된 바와 같은 살아있는 세포 회수율은 염기 편집 이벤트 시에 집단 내의 세포의 약 90%, 또는 약 91%, 92%, 93%, 94% 95%, 96%, 97%, 98%, 또는 99%, 또는 100%이다.
일부 구현예에서, 조작된 세포 집단은 시험관내에서 약 2 배, 약 3 배, 약 4 배, 약 5 배, 약 6 배, 약 7 배, 약 8 배, 약 9 배, 약 10 배, 약 15 배, 약 20 배, 약 25 배, 약 30 배, 약 35 배, 약 40 배, 약 45 배, 약 50 배 또는 약 100 배만큼 추가로 확장될 수 있다.
의도된 돌연변이 및 인델의 수는 예를 들어, 국제 PCT 출원 PCT/2017/045381(WO 2018/027078) 및 PCT/US2016/058344(WO 2017/070632);문헌[Komor, A.C., et.al., "Programmable editingof a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424(2016);Gaudelli, N.M., et.al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471(2017)];및 문헌[Komor, A.C., et.al., "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774(2017)]에 기재된 바와 같이, 임의의 적합한 방법을 사용하여 결정될 수 있고, 이의 전체 내용이 본원에 참조로 포함된다.
일부 구현예에서, 인델 빈도를 계산하기 위해, 인델이 발생할 수 있는 창의 양쪽 측면을 플랭킹하는 두 개의 10-bp 서열에 대한 정확한 일치에 대해 서열분석 판독물이 스캐닝된다. 정확한 일치가 위치하지 않는 경우, 판독물은 분석에서 제외된다. 이 인델 창의 길이가 참조 서열과 정확히 일치하는 경우 판독물은 인델을 함유하지 않는 것으로 분류된다. 인델 창이 참조 서열 보다 더 길거나 또는 더 짧은 두 개 이상의 염기인 경우, 서열분석 판독물은 각각 삽입 또는 결실로 분류된다. 일부 구현예에서, 본원에 제공된 염기 편집기는 핵산 영역에서 인델의 형성을 제한할 수 있다. 일부 구현예에서, 영역은 염기 편집기에 의해 표적화된 뉴클레오티드 또는 염기 편집기에 의해 표적화된 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 뉴클레오티드 내의 영역에 있다.
표적 뉴클레오티드 영역에서 형성된 인델의 수는 핵산(예를 들어, 세포의 게놈 내 핵산)이 염기 편집기에 노출된 시간의 양에 따라 달라질 수 있다. 일부 구현예에서, 인델의 수 또는 비율은 표적 뉴클레오티드 서열(예를 들어, 세포의 게놈 내 핵산)을 염기 편집기에 노출시키고 적어도 1 시간, 적어도 2 시간, 적어도 6 시간, 적어도 12 시간, 적어도 24 시간, 적어도 36 시간, 적어도 48 시간, 적어도 3 일, 적어도 4 일, 적어도 5 일, 적어도 7 일, 적어도 10 일, 또는 적어도 14 일 후에 결정된다. 본원에 기재된 바와 같은 염기 편집기의 특성은 임의의 융합 단백질, 또는 본원에 제공된 융합 단백질의 사용 방법에 적용될 수 있음이 이해되어야 한다.
염기 편집기 효율의 세부 사항은 국제 PCT 출원 PCT/2017/045381(WO2018/027078) 및 PCT/US2016/058344(WO2017/070632)에 기재되어 있고, 각각은 그 전체가 본원에 참조로 포함된다. 또한 문헌[Komor, A.C., et.al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424(2016)];문헌[Gaudelli, N.M., et.al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471(2017)];및 문헌[Komor, A.C., et.al., "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774(2017)]을 참조하고, 이의 전체 내용이 본원에 참조로 포함된다. 일부 구현예에서, 본원에 제공된 방법을 사용하여 하나 이상의 유전자에서 복수의 핵염기 쌍을 편집하는 것은 적어도 하나의 의도된 돌연변이의 형성을 초래한다. 일부 구현예에서, 상기 적어도 하나의 의도된 돌연변이의 상기 형성은 유전자의 정상 기능 파괴를 초래한다. 일부 구현예에서, 상기 적어도 하나의 의도된 돌연변이 결과의 상기 형성은 유전자에 의해 암호화된 단백질의 발현을 감소시키거나 제거한다. 다중 편집은 본원에 제공된 임의의 방법 또는 방법들의 조합을 사용하여 수행될 수 있다는 것이 이해되어야 한다.
다중 편집
일부 구현예에서, 본원에 제공된 염기 편집기 시스템은 하나 이상의 유전자에서 복수의 핵염기 쌍의 다중 편집을 할 수 있다. 구현예에서, 다중 편집은 세포 및/또는 대상에게 하나 이상의 염기 편집기를 두 개 이상의 별개의 gRNA(예를 들어, gRNA37 및 gRNA40)와 조합하여 투여하는 단계를 포함한다. 표 1에 나열된 가이드 RNA, 또는 표 2A-2C 또는 서열 목록(예를 들어, 서열 번호 3105-5485 및 8220-10830)에 나열된 스페이서 서열(들)을 포함하는 gRNA 중 임의의 둘 이상이 다중 편집을 위해 대상 또는 세포에 동시에 투여될 수 있다. 일부 구현예에서, 복수의 핵염기 쌍은 동일한 유전자 또는 하나 이상의 유전자에 위치하되, 적어도 하나의 유전자는 상이한 유전자좌에 위치한다. 일부 구현예에서, 다중 편집은 하나 이상의 가이드 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 다중 편집은 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 다중 편집은 단일 가이드 폴리뉴클레오티드 또는 복수의 가이드 폴리뉴클레오티드가 있는 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 다중 편집은 단일 염기 편집기 시스템이 있는 하나 이상의 가이드 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 다중 편집은 표적 폴리뉴클레오티드 서열에 대한 결합을 표적으로 하기 위해 PAM 서열을 필요로 하거나 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 다중 편집은 표적 폴리뉴클레오티드 서열에 대한 결합을 표적으로 하기 위해 PAM 서열을 필요로 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드 및 표적 폴리뉴클레오티드 서열에 대한 결합을 표적으로 하기 위해 PAM 서열을 필요로 하는 적어도 하나의 가이드 폴리뉴클레오티드의 혼합체를 포함할 수 있다. 본원에 기재된 바와 같은 임의의 염기 편집기를 사용한 다중 편집의 특징은 본원에 제공된 임의의 염기 편집기를 사용하는 방법의 임의의 조합에 적용될 수 있음이 이해되어야 한다. 또한 본원에 기재된 바와 같은 임의의 염기 편집기를 사용한 다중 편집은 복수의 핵염기 쌍의 순차적 편집을 포함할 수 있음이 이해되어야 한다.
일부 구현예에서, 복수의 핵염기 쌍은 하나 이상의 유전자에 있다. 일부 구현예에서, 복수의 핵염기 쌍은 동일한 유전자에 있다. 일부 구현예에서, 하나 이상의 유전자 중 적어도 하나의 유전자는 상이한 유전자좌에 위치한다.
일부 구현예에서, 편집은 적어도 하나의 단백질 코딩 영역, 적어도 하나의 단백질 비코딩 영역, 또는 적어도 하나의 단백질 코딩 영역 및 적어도 하나의 단백질 비코딩 영역에서 복수의 핵염기 쌍의 편집이다.
일부 구현예에서, 편집은 하나 이상의 가이드 폴리뉴클레오티드와 함께 이루어진다. 일부 구현예에서, 염기 편집기 시스템은 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 염기 편집기 시스템은 단일 가이드 폴리뉴클레오티드 또는 복수의 가이드 폴리뉴클레오티드와 함께 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 편집은 단일 염기 편집기 시스템이 있는 하나 이상의 가이드 폴리뉴클레오티드와 함께 이루어진다. 일부 구현예에서, 편집은 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드 또는 표적 뉴클레오티드 서열에 대한 결합을 표적화하기 위해 또는 PAM 서열을 필요로 하는 적어도 하나의 가이드 폴리뉴클레오티드와 결합하거나, 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드의 및 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하는 적어도 하나의 가이드 폴리뉴클레오티드의 혼합과 결합한다. 본원에 기재된 바와 같은 임의의 염기 편집기를 사용한 다중 편집의 특성은 본원에 제공된 임의의 염기 편집기를 사용하는 방법의 임의의 조합에 적용될 수 있음이 이해되어야 한다. 또한 편집은 복수의 핵염기 쌍의 순차적 편집을 포함할 수 있음이 이해되어야 한다.
일부 구현예에서, 염기 편집기 시스템은 ABE7, ABE8, 및/또는 ABE9 염기 편집기 중 하나를 포함하는 하나 이상의 유전자에서 복수의 핵염기 쌍의 다중 편집을 할 수 있다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 다중 편집이 가능한 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 다중 편집이 가능한 염기 편집기 시스템과 비교하여 더 높은 다중 염기 편집 효율을 갖는다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 다중 편집이 가능한 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 다중 편집이 가능한 염기 편집기 시스템과 비교하여 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300%, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500% 더 높은 염기 편집 효율을 갖는다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 다중 편집이 가능한 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 다중 편집이 가능한 염기 편집기 시스템과 비교하여 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 3.1 배, 적어도 3.2, 적어도 3.3 배, 적어도 3.4 배, 적어도 3.5 배, 적어도 4.0 배, 적어도 4.5 배, 적어도 5.0 배, 적어도 5.5 배, 또는 적어도 6.0 배 더 높은 다중 편집 효율을 갖는다.
전달 시스템
유전자[예를 들어, HBV 코어 단백질(코어), HBV 폴리머라아제 유전자(Pol), HBV 표면 단백질(S), 또는 HBV 단백질 X 유전자(X)]에서 하나 이상의 뉴클레오티드를 표적으로 하는 핵염기 편집기의 적합성은 본원에 기재된 바와 같이 평가된다. 일 구현예에서, 관심 단일 세포는 리포터(예를 들어, GFP)를 암호화하는 소량의 벡터와 함께 본원에 기재된 핵염기 편집기 시스템을 암호화하는 핵산 분자 또는 분자로 형질감염되거나, 형질도입되거나, 달리 변형된다. 이들 세포는 간세포 및 HEK293 세포를 포함하는 당업계에 알려진 임의의 세포주일 수 있다. 또한, 일차 세포(예를 들어, 인간)가 사용될 수 있다. 세포는 또한 조직 생검, 수술, 혈액, 혈장, 혈청, 또는 다른 생물학적 유체와 같은 대상 또는 개체에서 얻어질 수 있다. 이러한 세포는 궁극적인 세포 표적과 관련될 수 있다.
전달은 바이러스 벡터를 사용하여 수행될 수 있다. 일 구현예에서, 형질감염은 지질 형질감염[예컨대 리포펙타민(Lipofectamine) 또는 퓨진(Fugene)]을 사용하거나 또는 전기천공에 의해 수행될 수 있다. 형질감염 후, 리포터(예를 들어, GFP)의 발현은 형광 현미경 또는 유세포 분석에 의해 결정되어 일정하고 높은 수준의 형질감염을 확인할 수 있다. 이러한 예비 형질감염은 가장 큰 활성을 제공하는 편집기의 조합을 결정하기 위해 상이한 핵염기 편집기를 포함할 수 있다. 시스템은 하나 이상의 상이한 벡터를 포함할 수 있다. 일 구현예에서, 염기 편집기는 원하는 세포 유형, 우선적으로는 진핵생물 세포, 바람직하게는 포유류 세포 또는 인간 세포를 발현하기에 최적화된 코돈이다.
핵염기 편집기의 활성은 본원에 기재된 바와 같이, 즉, 표적 서열에서 변경을 검출하기 위해 세포의 게놈을 서열분석함으로써 평가된다. Sanger 서열분석의 경우, 정제된 PCR 앰플리콘(amplicon)을 플라스미드 백본 내로 클로닝하고, 형질전환하고, 미니프렙되며 단일 프라이머로 서열분석한다. 서열분석은 또한 차세대 서열분석[next generation sequencing, NGS] 기술을 사용하여 수행될 수 있다. 차세대 서열분석을 사용하는 경우, 앰플리콘은 의도된 절단 부위가 비대칭으로 배치된 300-500 bp일 수 있다. PCR 후, 차세대 서열분석 어댑터 및 바코드(예를 들어 Illumina 멀티플렉스 어댑터 및 인덱스)가 예를 들어, 고처리량 서열분석(예를 들어 Illumina MiSeq)에서 사용하기 위해 앰플리콘의 단부에 첨가될 수 있다. 초기 테스트에서 가장 큰 수준의 표적 특이적 변경을 유도하는 융합 단백질이 추가 평가를 위해 선택될 수 있다.
특정 구현예에서, 핵염기 편집기는 관심 폴리뉴클레오티드를 표적으로 하는 데 사용된다. 일 구현예에서, 본 발명의 핵염기 편집기는 세포의 게놈 내에서 하나 이상의 관심 핵산 서열을 표적으로 하는데 사용되는 하나 이상의 가이드 RNA와 함께 세포(예를 들어, 간세포 또는 HEK293 세포)로 전달되어, 표적 유전자(들)(예를 들어, HBV 코어 단백질(코어), HBV 폴리머라아제 유전자(Pol), HBV 표면 단백질(S), 또는 HBV 단백질 X 유전자(X))를 변화시킨다. 일부 구현예에서, 염기 편집기는 하나 이상의 관심 유전자(예를 들어, HBV 코어 단백질(코어), HBV 폴리머라아제 유전자(Pol), HBV 표면 단백질(S), 또는 HBV 단백질 X 유전자(X))의 서열에 대한 하나 이상의 편집을 도입하기 위해 하나 이상의 가이드 RNA에 의해 표적화된다. 일부 구현예에서, 하나 이상의 관심 유전자의 서열에 대한 하나 이상의 편집은 숙주 세포(예를 들어, 간세포 또는 HEK293 세포)에서 유전자에 의해 암호화된 단백질의 발현을 감소시키거나 제거한다. 일부 구현예에서, 하나 이상의 관심 유전자(예를 들어, HBV 코어 단백질(코어), HBV 폴리머라아제 유전자(Pol), HBV 표면 단백질(S), 또는 HBV 단백질 X 유전자(X))에 의해 암호화되는 하나 이상의 단백질의 발현은 숙주 세포(예를 들어, 간세포 또는 HEK293 세포) 내에서 완전히 녹아웃되거나 제거된다.
일부 구현예에서, 숙주 세포는 포유류 세포이다. 일부 구현예에서, 숙주 세포는 인간 세포이다.
염기 편집기 시스템의 핵산 기반 전달
본 개시에 따른 염기 편집기 시스템을 암호화하는 핵산 분자는 당업계에 알려진 방법에 의해 또는 본원에 기재된 바와 같이 대상에게 투여되거나 시험관내 또는 생체내에서 세포로 전달될 수 있다. 예를 들어, 데아미나아제(예를 들어, 시티딘 또는 아데닌 데아미나아제)를 포함하는 염기 편집기 시스템은 벡터(예를 들어, 바이러스 또는 비-바이러스 벡터)에 의해, 또는 네이키드 DNA, DNA 복합체, 지질 나노입자, 또는 앞서 언급된 조성물의 조합에 의해 전달될 수 있다.
유기 또는 무기일 수 있는 나노입자는 염기 편집기 시스템 또는 그의 구성요소를 전달하는데 유용하다. 나노입자는 당업계에 잘 알려져 있고, 임의의 적합한 나노입자가 염기 편집기 시스템 또는 이의 구성요소, 또는 이러한 구성요소를 암호화하는 핵산 분자를 전달하기 위해 사용될 수 있다. 일 예시에서, 유기(예를 들어 지질 및/또는 중합체) 나노입자는 본 개시의 특정 구현예에서 전달 비히클로서 사용하기에 적합하다. 나노입자 제형, 및/또는 유전자 전달에 사용하기 위한 예시적인 지질은 표 17(아래)에 나타나 있다.
[표 17] 유전자 전달에 사용되는 지질
표 18은 유전자 전달 및/또는 나노입자 제형에 사용하기 위한 예시적인 중합체를 나열한다.
[표 18] 유전자 전달에 사용되는 중합체
표 19는 본원에 기재된 융합 단백질을 암호화하는 폴리뉴클레오티드에 대한 전달 방법을 요약한다.
[표 19] 전달 방법.
또 다른 양태에서, 염기 편집기 시스템 구성요소 또는 이러한 구성요소를 암호화하는 핵산, 예를 들어 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9), 예컨대 Cas9 또는 이의 변이체, 및 관심 핵산 서열을 표적으로 하는 gRNA의 전달은 리보뉴클레오티드 단백질[RNP]을 세포에 전달함으로써 달성될 수 있다. RNP는 표적화 gRNA와 복합된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9)을 포함한다. 본원에 기술된 RNP 또는 폴리뉴클레오타이드는 전기천공법, 뉴클레오펙션(nucleofection), 또는 예를 들어, 문헌[Zuris, J.A. 등, 2015, Nat. Biotechnology, 33(1):73-80]에 보고된 바와 같은 양이온성 지질-매개 방법과 같은 알려진 방법을 사용하여 세포에 전달될 수 있고, 이는 그 전체가 참조로 포함된다.RNP는 CRISPR 염기 편집 시스템, 특히 일차 세포와 같이 형질감염이 어려운 세포에 사용하기에 유리하다.게다가, RNP는 또한 특히 CRISPR 플라스미드에 사용될 수 있는 진핵생물 프로모터, 예를 들어, CMV 또는 EF1A가 잘 발현되지 않을 경우, 세포에서 단백질 발현과 함께 발생할 수 있는 어려움을 완화할 수 있다. 유리하게는, RNP의 사용은 외래 DNA의 세포 내로의 전달을 필요로 하지 않는다. 더욱이, 핵산 결합 단백질 및 gRNA 복합체를 포함하는 RNP는 시간 경과에 따라 분해되기 때문에, RNP의 사용은 표적외 효과를 제한할 가능성이 있다. 플라스미드 기반 기술과 유사한 방식으로, RNP를 사용하여 결합 단백질(예를 들어, Cas9 변이체)을 전달하고 상동성 지정 복구[HDR]를 지시할 수 있다.
염기 편집기 시스템을 암호화하는 핵산 분자는 예를 들어, 형질감염 또는 전기천공에 의해 네이키드 DNA 또는 RNA로서 세포(예를 들어, 간세포)에 직접 전달될 수 있거나, 표적 세포에 의한 흡수를 촉진하는 분자(예를 들어, N-아세틸갈락토사민)에 접합될 수 있다. 염기 편집기 시스템들 및/또는 그들의 구성요소를 암호화하는 벡터 또한 사용될 수 있다 특정 구현예에서, 폴리뉴클레오티드, 예를 들어 염기 편집기 시스템 또는 이의 기능적 구성요소를 암호화하는 mRNA는 본원에 기재된 바와 같은 하나 이상의 가이드 RNA와 공동-전기천공될 수 있다.
핵산 벡터는 본원에 기재된 융합 단백질의 도메인을 암호화하는 하나 이상의 서열을 포함할 수 있다. 벡터는 또한 핵 국소화 신호, 핵상 국소화 신호, 또는 미토콘드리아 국소화 신호에 작동가능하게 연결된 염기 편집기 시스템의 단백질 구성요소를 암호화할 수 있다. 일례로서, 벡터는 하나 이상의 핵 국소화 서열(예를 들어, SV40으로부터의 핵 국소화 서열), 및 하나 이상의 데아미나아제를 포함하는 Cas9 코딩 서열을 포함할 수 있다.
벡터는 또한 임의의 적합한 수의 조절/제어 요소, 예를 들어 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통 서열 또는 내부 리보솜 진입 부위[internal ribosome entry sites, IRES]를 포함할 수 있다. 이들 요소는 당업계에 잘 알려져 있다.
본 개시에 따른 벡터는 재조합 바이러스 벡터를 포함한다. 예시적인 바이러스 벡터는 위 본원에 기재되어 있다. 당업계에 공지된 다른 바이러스 벡터 또한 사용될 수 있다. 또한, 바이러스 입자는 핵산 및/또는 단백질 형태로 염기 편집기 시스템 구성요소를 전달하는데 사용될 수 있다. 예를 들어, '빈' 바이러스 입자를 조립하여 염기 편집기 시스템 또는 구성요소를 화물로 포함할 수 있다. 바이러스 벡터 및 바이러스 입자는 또한 표적 조직 특이성을 변경하기 위해 표적 리간드를 혼입하도록 조작될 수 있다.
본원에 기재된 벡터는 염기 편집기 시스템 또는 그의 구성요소의 발현을 유도하기 위한 조절 요소를 포함할 수 있다. 이러한 벡터는 역위 긴 말단 반복부를 갖는 아데노 연관 바이러스[adeno-associated viruses with inverted long terminal repeats, AAV ITR]를 포함한다. AAV-ITR의 사용은 벡터에서 공간을 차지할 수 있는 추가적인 프로모터 요소에 대한 필요성을 제거하는 데 유리할 수 있다. 확보된 추가적인 공간은 가이드 핵산 또는 선택가능한 마커와 같은 추가적인 요소의 발현을 구동하는 데 사용될 수 있다. ITR 활성은 과발현으로 인한 잠재적인 독성을 감소시키는 데 사용될 수 있다.
임의의 적합한 프로모터는 염기 편집기 시스템 또는 그의 구성요소 및, 적절한 경우, 가이드 핵산의 발현을 구동하는 데 사용될 수 있다. 편재하는 발현을 위해, 프로모터는 CMV, CAG, CBh, PGK, SV40, 페리틴(Ferritin) 중쇄 또는 경쇄를 포함한다. 뇌 또는 다른 CNS 세포 발현의 경우, 적합한 프로모터는 모든 뉴런에 대한 시냅신I, 흥분성 뉴런에 대한 CaMKIIalpha, GABAergic 뉴런에 대한 GAD67 또는 GAD65 또는 VGAT를 포함한다. 간 세포 발현을 위해, 적합한 프로모터는 알부민 프로모터를 포함한다. 폐 세포 발현의 경우, 적합한 프로모터는 SP-B를 포함한다. 내피 세포의 경우, 적합한 프로모터는 ICAM을 포함한다. 조혈 세포의 경우 세포 발현에 적합한 프로모터는 IFN베타 또는 CD45를 포함한다. 골아세포 발현의 경우 적합한 프로모터는 OG-2를 포함한다.
일부 구현예에서, 본 개시의 염기 편집기 시스템은 별도의 프로모터가 동일한 핵산 분자 내에서 염기 편집기 및 호환성 가이드 핵산의 발현을 구동할 수 있도록 충분히 작은 크기의 것이다. 예를 들어, 벡터 또는 바이러스 벡터는 염기 편집기를 암호화하는 핵산에 작동가능하게 연결된 제1 프로모터 및 가이드 핵산에 작동가능하게 연결된 제2 프로모터를 포함할 수 있다.
가이드 핵산의 발현을 구동하는 데 사용되는 프로모터는 Pol II 프로모터의 U6 또는 H1 사용과 같은 Pol III 프로모터 및 gRNA 아데노 연관 바이러스[AAV]를 발현하는 인트론 카세트를 포함할 수 있다.
특정 구현예에서, 본 발명의 융합 단백질은 바이러스 벡터(예를 들어, 아데노 연관 바이러스[AAV], AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh8, AAV10, 및 그의 변이체)에 존재하는 폴리뉴클레오티드, 또는 임의의 바이러스 벡터의 적합한 캡시드 단백질에 의해 암호화된다. 따라서, 일부 양태에서, 본 개시는 융합 단백질의 바이러스 전달에 관한 것이다. 바이러스 벡터의 예는 레트로바이러스 벡터(예를 들어, 말로니 뮤린 백혈병 바이러스, MML-V), 아데노바이러스 벡터(예를 들어, AD100), 렌티바이러스 벡터(HIV 및 FIV-기반 벡터), 헤르페스바이러스 벡터(예를 들어, HSV-2)를 포함한다.
일부 양태에서, 세포 내의 특정 유전자를 편집하기 위한 본원에 기재된 방법은 세포를 유전적으로 변형시키는 데 사용될 수 있다.
바이러스 벡터
본원에 기재된 염기 편집기는 바이러스 벡터를 사용하여 전달될 수 있다. 일부 구현예에서, 본원에 개시된 염기 편집기는 바이러스 벡터에 함유되어 있는 핵산 상에서 암호화될 수 있다. 일부 구현예에서, 염기 편집기 시스템의 하나 이상의 구성요소는 하나 이상의 바이러스 벡터 상에서 암호화될 수 있다. 예를 들어, 염기 편집기 및 가이드 핵산은 단일 바이러스 벡터 상에서 암호화될 수 있다. 다른 구현예에서, 염기 편집기 및 가이드 핵산은 상이한 바이러스 벡터 상에서 암호화된다. 어느 경우에든, 염기 편집기 및 가이드 핵산은 각각 프로모터 및 종결인자에 작동가능하게 연결될 수 있다. 바이러스 벡터 상에서 암호화된 구성요소의 조합은 선택되는 바이러스 벡터의 화물 크기 제한에 의해 결정될 수 있다.
염기 편집기의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 배양물 또는 숙주에서 특이적 세포에 바이러스를 표적화하고 핵 또는 숙주 세포 게놈에 바이러스 페이로드를 수송하는 고도로 진화된 과정의 이점을 취한다. 바이러스 벡터는 배양물, 환자(생체내)에서 세포에 직접적으로 투여될 수 있거나, 또는 시험관내에서 세포를 처리하는 데 사용될 수 있고, 변형된 세포는 임의적으로 환자(생체 외)에게 투여될수 있다. 통상적인 바이러스 기반 시스템은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노 연관 및 단순 포진 바이러스 벡터를 포함할 수 있다. 숙주 게놈에서의 통합은 종종 삽입된 이식유전자의 장기 발현을 초래하는, 레트로바이러스, 렌티바이러스, 및 아데노 연관 바이러스 유전자 전달 방법과 함께 가능하다. 추가적으로, 높은 형질전환 효율은 다수의 상이한 세포 유형 및 표적 조직에서 관찰되었다.
바이러스 벡터는 렌티바이러스(예를 들어, HIV 및 FIV-기반 벡터), 아데노바이러스(예를 들어, AD100), 레트로바이러스(예를 들어, 말로니 뮤린 백혈병 바이러스, MML-V), 헤르페스바이러스 벡터(예를 들어, HSV-2), 및 아데노 연관바이러스[AAV], 또는 다른 플라스미드 또는 바이러스 벡터 유형, 특히, 예를 들어, 미국 특허 제8,454,972호(아데노바이러스에 대한 제형, 용량), 미국 특허 제8,404,658호(AAV에 대한 제형, 용량) 및 미국 특허 제5,846,946호(DNA 플라스미드에 대한 제형, 용량) 및 렌티바이러스, AAV 및 아데노바이러스를 수반하는 임상 시험 및 임상 시험에 관한 간행물로부터의 제형 및 용량을 포함할 수 있다. 예를 들어, AAV의 경우, 투여 경로, 제형 및 용량은 미국 특허 제8,454,972호 및 AAV를 수반하는 임상 시험에서와 같을 수 있다. 아데노바이러스의 경우, 투여 경로, 제형 및 용량은 미국 특허 제8,404,658호 및 아데노바이러스를 수반하는 임상 시험에서와 같을 수 있다. 플라스미드 전달의 경우, 투여 경로, 제형 및 용량은 미국 특허 제5,846,946호 및 플라스미드를 수반하는 임상 연구에서와 같을 수 있다. 용량은 평균 70 kg 개인(예를 들어 인간 성인 남성)을 기준으로 하거나 이에 추정될 수 있고, 상이한 체중 및 종의 환자, 대상, 포유동물에 대해 조정될 수 있다. 투여 빈도는 연령, 성별, 일반적인 건강, 환자 또는 대상의 다른 병태 및 다루어지는 특정 병태 또는 증상을 포함한 일반적 요인에 따라 의사 또는 수의사(예를 들어, 의사, 수의사)의 영역 내에 있다. 바이러스 벡터는 관심 조직 내로 주입될 수 있다. 세포 유형 특이적 염기 편집을 위해, 염기 편집기 및 임의적인 가이드 핵산의 발현은 세포 유형 특이적 프로모터에 의해 구동될 수 있다.
레트로바이러스의 굴성[tropism]은 표적 세포의 잠재적인 표적 집단을 확장시켜, 외래 외피 단백질을 혼입함으로써 변경될 수 있다. 렌티바이러스 벡터는 비분화 세포를 형질도입하거나 감염시킬 수 있고 전형적으로 높은 바이러스 역가를 생성시킬 수 있는 레트로바이러스 벡터이다. 따라서 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 달라질 것이다. 레트로바이러스 벡터는 최대 6 내지 10 kb의 외래 서열에 대한 패키징 용량을 갖는 시스-작용 긴 말단 반복부로 이루어진다. 최소 시스-작용 LTR은 벡터의 복제 및 패키징을 위해 충분하고, 이는 그 다음 치료 유전자를 표적 세포 내로 통합하여 영구적 이식유전자 발현을 제공하는 데 사용된다. 광범위하게 사용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스[murine leukemia virus, MuLV], 긴팔원숭이 백혈병 바이러스[gibbon ape leukemia virus, GaLV], 시미안 면역 결핍 바이러스[Simian Immuno deficiency virus, SIV], 인간 면역 결핍 바이러스[human immuno deficiency virus, HIV], 및 이의 조합에 기반한 것들을 포함한다(예를 들어, 문헌[Buchscher et.al., J. Virol. 66:2731-2739(1992)]; 문헌[Johann et.al., J. Virol. 66:1635-1640(1992); Sommnerfelt et.al., Virol. 176:58-59(1990)]; 문헌[Wilson et.al., J. Virol. 63:2374-2378(1989); Miller et.al., J. Virol. 65:2220-2224(1991)]; PCT/US94/05700 참조).
레트로바이러스 벡터, 특히 렌티바이러스 벡터는 표적 세포 내로의 효율적인 통합을 위해 주어진 길이보다 더 작은 폴리뉴클레오티드 서열을 필요로 할 수 있다. 예를 들어, 9 kb 초과 길이의 레트로바이러스 벡터는 더 작은 크기의 것과 비교하여 낮은 바이러스 역가를 초래할 수 있다. 일부 양태에서, 본 개시의 염기 편집기는 레트로바이러스 벡터를 통해 표적 세포 내로의 효율적인 패키징 및 전달을 가능하게 하기에 충분한 크기이다. 일부 구현예에서, 염기 편집기는 가이드 핵산 및/또는 표적화 가능한 뉴클레아제 시스템의 다른 구성요소와 함께 발현될 때조차 효율적인 패키징 및 전달을 허용하기 위한 크기이다.
패키징 세포는 전형적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 및 레트로바이러스를 패키징하는 psi.2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용되는 바이러스 벡터는 전형적으로 핵산 벡터를 바이러스 입자 내로 패키징하는 세포주를 생산함으로써 생성된다. 벡터는 전형적으로 숙주 내로의 패키징 및 후속 통합에 필요한 최소 바이러스 서열을 함유하고, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 대한 발현 카세트로 대체된다. 누락 바이러스 기능은 전형적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 요법에 사용되는 아데노 연관 바이러스[AAV] 벡터는 전형적으로 숙주 게놈 내로의 패키징 및 통합에 필요한 AAV 게놈에서 ITR 서열만을 보유한다. 바이러스 DNA는 다른 AAV 유전자, 즉 rep 및 cap를 암호화하는 헬퍼 플라스미드를 함유하지만, ITR 서열이 결여되어 있는 세포주에 패키징될 수 있다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진할 수 있다. 헬퍼 플라스미드는 일부 경우에 ITR 서열의 결여로 인해 상당한 양으로 패키징되지 않는다. 아데노바이러스로의 오염은 예를 들어, AAV에 비해 아데노바이러스가 더욱 민감한 열 처리에 의해 감소될 수 있다.
일시적 발현이 바람직한 적용에서, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 다수의 세포 타입에서 매우 높은 형질전환 효율을 가능하게 하고, 세포 분화를 필요로 하지 않는다. 이러한 벡터를 사용하여, 높은 역가 및 발현 수준이 수득되었다. 이러한 벡터는 비교적 단순한 시스템에서 대량으로 생산될 수 있다. 아데노 연관 바이러스['AAV'] 벡터는 또한 예를 들어, 핵산 및 펩티드의 시험관내 생산에서, 그리고 생체내 및 생체외 유전자 요법 절차를 위해 표적 핵산으로 세포를 형질도입하는 데 사용될 수 있다(예를 들어, 문헌[West et.al., Virology 160:38-47(1987)]; 미국 특허 제4,797,368호; WO 93/24641; 문헌[Kotin, Human Gene Therapy 5:793-801(1994); Muzyczka, J. Clin. Invest. 94:1351(1994)] 참조). 재조합 AAV 벡터의 구축은 미국 특허 제5,173,414호; 문헌[Tratschin et.al., Mol. Cell. Biol. 5:3251-3260(1985)]; 문헌[Tratschin, et al., Mol. Cell Biol. 4:2072-2081(1984)]; 문헌[Hermonat & Muzyczka, PNAS 81:6466-6470(1984)]; 및 문헌[Samulski et al., J. Virol. 63:03822-3828(1989)]을 포함하는 다수의 간행물에 기재되어 있다.
AAV는 파보바이러스 계열에 속하는 작은 단일 가닥 DNA 의존적 바이러스이다. 4.7 kb 야생형(wt) AAV 게놈은 각각 네 개의 복제 단백질 및 세 개의 캡시드 단백질을 암호화하는 두 개의 유전자로 구성되고, 145-bp 역 말단 반복부[inverted terminal repeat, ITR]에 의해 어느 한 측면에 플랭킹된다. 비리온은 동일한 오픈 리딩 프레임으로부터, 그러나 차등 스플라이싱(Vp1) 및 대체 번역 시작 부위(각각 Vp2 및 Vp3)에서 1:1:10 비로 생성된 세 개의 캡시드 단백질, Vp1, Vp2, 및 Vp3으로 구성된다. Vp3은 비리온에서 가장 풍부한 서브유닛이며 바이러스의 향성을 정의하는 세포 표면에서 수용체 인식에 참여한다. 바이러스 감염성으로 기능하는 포스포리파제 도메인은 Vp1의 고유한 N-말단에서 식별되었다.
wt AAV와 유사하게, 재조합 AAV[recombinant AAV, rAAV]는 시스- 작용145-bp ITR을 활용하여 벡터 이식유전자 카세트를 플랭킹하여, 외래 DNA의 패키징을 위해 최대 4.5 kb를 제공한다. 감염 후, rAAV는 본 발명의 융합 단백질을 발현하고 원형 머리-대-꼬리 연쇄체[concatemer]에서 에피솜으로 존재함으로써 숙주 게놈 내로의 통합 없이 지속될 수 있다. 시험관내 및 생체내에서 이 시스템을 사용한 rAAV 성공의 많은 예가 있지만, 제한된 패키징 용량은 유전자의 코딩 서열의 길이가 wt AAV 게놈의 크기보다 더 크거나 또는 동일할 때 AAV-매개 유전자 전달의 사용을 제한하였다.
바이러스 벡터는 적용에 기반하여 선택될 수 있다. 예를 들어, 생체내 전달의 경우, AAV는 다른 바이러스 벡터보다 유리할 수 있다. 일부 구현예에서, AAV는 낮은 독성을 허용하며, 이는 면역 반응을 활성화할 수 있는 세포 입자의 초원심분리를 필요로 하지 않는 정제 방법에 기인할 수 있다. 일부 구현예에서, AAV는 숙주 게놈 내로 통합되지 않기 때문에 삽입 돌연변이 생성을 유발할 가능성이 낮다. 아데노바이러스는 통상적으로 이들이 유도하는 강한 면역원성 반응 때문에 백신으로 사용된다. 바이러스 벡터의 패키징 용량은 벡터 내로 패키징될 수 있는 염기 편집기의 크기를 제한할 수 있다.
AAV는 두 개의 145 개의 염기 역 말단 반복부[ITR]를 포함하여 약 4.5 kb 또는 4.75 Kb의 패키징 용량을 갖는다. 이는 개시된 염기 편집기뿐만 아니라 프로모터 및 전사 종결인자가 단일 바이러스 벡터내로 맞춰질 수 있음을 의미한다. 4.5 또는 4.75 Kb 보다 큰 작제물은 유의하게 감소된 바이러스 생산을 유도할 수 있다. 예를 들어, SpCas9는 상당히 크고, 유전자 자체는 4.1 Kb 초과이며, 이는 AAV 내로 패킹하기 어렵다. 따라서, 본 개시의 구현예는 통상적인 염기 편집기보다 더 짧은 길이인 개시된 염기 편집기를 활용하는 것을 포함한다. 일부 예에서, 염기 편집기는 4 kb 미만이다. 개시된 염기 편집기는 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2 kb, 또는 1.5 kb 미만일 수 있다. 일부 구현에에서, 개시된 염기 편집기는 4.5 kb 이하의 길이이다.
AAV는 AAV1, AAV2, AAV5 또는 이의 임의의 조합일 수 있다. 표적이 될 세포와 관련하여 AAV의 유형을 선택할 수 있고, 예를 들어, 뇌 또는 뉴런세포를 표적화하기 위해 AAV 혈청형 1, 2, 5 또는 하이브리드 캡시드 AAV1, AAV2, AAV5 또는 이의 임의의 조합을 선택할 수 있고, 심장 조직을 표적화하기 위해 AAV4를 선택할 수 있다. AAV8은 간으로의 전달에 유용하다. 이들 세포에 관한 특정 AAV 혈청형의 도표는 문헌[Grimm, D. et.al, J. Virol. 82: 5887-5911(2008)]에서 찾을 수 있다.
일부 구현예에서, 렌티바이러스 벡터는 염기 편집기 시스템을 암호화하는 폴리뉴클레오티드로 관심 세포를 형질도입하기 위해 사용된다. 렌티바이러스는 유사분열 및 유사분열후 세포 둘 다에서 유전자를 감염시키고 발현하는 능력을 갖는 복합 레트로바이러스이다. 가장 흔히 알려진 렌티바이러스는 광범위한 세포 유형을 표적으로 하는 다른 바이러스의 외피 당단백질을 사용하는 인간 면역결핍 바이러스[HIV]이다.
렌티바이러스는 다음과 같이 제조될 수 있다. pCasES10(렌티바이러스 전달 플라스미드 백본 함유)을 클로닝한 후, HEK293FT를 낮은 계대(p=5)에서 10% 소 태아 혈청을 함유하고 항생제가 없는 DMEM에서 형질감염 전날 T-75 플라스크에 50% 합류하도록 접종하였다. 20 시간 후, 배지를 OptiMEM(무혈청) 배지로 교체하고 4 시간 후 형질감염을 수행하였다. 세포를 10 ㎍의 렌티바이러스 전달 플라스미드(pCasES10) 및 다음 패키징 플라스미드로 형질감염시켰다: 5 ㎍의 pMD2.G(VSV-g 위형), 및 7.5 ㎍의 psPAX2(gag/pol/rev/tat). 양이온성 지질 전달제(50 ㎕ 리포펙타민 2000 및 100 ㎕ 플러스 시약)를 함유하는 4 mL OptiMEM에서 형질감염을 수행할 수 있다. 6 시간 후, 배지를 10% 소 태아 혈청을 함유하는 무항생제 DMEM으로 교체한다. 이러한 방법은 세포 배양 동안 혈청을 사용하지만, 무혈청 방법이 선호된다.
렌티바이러스는 다음과 같이 정제될 수 있다. 48 시간 후 바이러스 상청액을 채취한다. 상청액에서 먼저 파편을 제거하고 0.45 ㎛ 저단백질 결합(PVDF) 필터를 통해 여과한다. 그런 다음 이들을 초원심분리기에서 2 시간 동안 24,000 rpm으로 회전시킨다. 바이러스 펠릿을 4 ℃에서 밤새 50 ㎕의 DMEM에 재현탁한다. 그런 다음 이들을 분취하고 -80 ℃에서 즉시 동결시킨다.
또 다른 구현예에서, 말 전염성 빈혈 바이러스[equine infectious anemia virus, EIAV]를 기반으로 한 최소 비영장류 렌티바이러스 벡터 또한 고려된다. 또 다른 구현예에서, 혈관형성 억제 단백질 엔도스타틴 및 안지오스타틴을 발현하는 말 전염성 빈혈 바이러스-기반 렌티바이러스 유전자 요법 벡터인 RetinoStat®가 망막하 주사를 통해 전달되는 것으로 고려된다. 또 다른 구현예에서, 자기 불활성화 렌티바이러스 벡터의 사용이 고려된다.
시스템의 임의의 RNA, 예를 들어 가이드 RNA 또는 염기 편집기 암호화 mRNA는 RNA의 형태로 전달될 수 있다. 염기 편집기 암호화 mRNA는 시험관내 전사를 사용하여 생성될 수 있다. 예를 들어, 뉴클레아제 mRNA는 T7 프로모터는 다음 요소를 함유하는 PCR 카세트를 사용하여 합성될 수 있다: 임의의 코작 서열(GCCACC), 뉴클레아제 서열, 및 베타 글로빈-polyA 꼬리에서의 3' UTR과 같은 3' UTR. 카세트는 T7 폴리머라아제에 의한 전사에 사용될 수 있다. 가이드 폴리뉴클레오티드(예를 들어, gRNA)는 또한 T7 프로모터, 이어서 서열 'GG', 및 가이드 폴리뉴클레오티드 서열을 함유하는 카세트에서 시험관내 전사를 사용하여 전사될 수 있다.
발현을 향상시키고 가능한 독성을 감소시키기 위해, 염기 편집기 코딩 서열 및/또는 가이드 핵산은 예를 들어, 슈도-U 또는 5- 메틸-C를 사용하여 하나 이상의 변형된 뉴클레오시드를 포함하도록 변형될 수 있다.
AAV 벡터의 작은 패키징 용량은 이 크기를 초과하는 다수의 유전자의 전달 및/또는 큰 생리학적 조절 요소의 사용을 어렵게 만든다. 이러한 어려움은 예를 들어, 전달될 단백질(들)을 두 개 이상의 단편으로 나눔으로써 해결될 수 있되, N-말단 단편은 스플릿 인테인-N에 융합되고 C-말단 단편은 스플릿 인테인-C에 융합된다. 그런 다음 이들 단편은 두 개 이상의 AAV 벡터로 패키징된다. 본원에 사용된 바와 같이, '인테인'은 플랭킹 N-말단 및 C-말단 엑스테인(예를 들어, 연결될 단편)을 결찰하는 자기 스플라이싱 단백질 인트론(예를 들어, 펩티드)을 지칭한다. 이종 단백질 단편을 연결하기 위한 특정 인테인의 사용은 예를 들어, 문헌[Wood et.al., J.Biol. Chem. 289(21); 14512-9(2014)]에 기재되어 있다. 예를 들어, 별도의 단백질 단편과 융합된 경우, 인테인 IntN 및 IntC는 서로를 인식하고, 스스로를 스플라이싱하고 이들이 융합된 단백질 단편의 플랭킹 N- 및 C-말단 엑스테인을 동시에 결찰시켜, 두 개의 단백질 단편으로부터 전장 단백질을 재구축한다. 다른 적합한 인테인은 당업자에게 명백할 것이다.
본 발명의 융합 단백질의 단편은 길이가 달라질 수 있다. 일부 구현예에서, 단백질 단편은 2 개의 아미노산 내지 약 1000 개의 아미노산 길이 범위이다. 일부 구현예에서, 단백질 단편은 약 5 개의 아미노산 내지 약 500 개의 아미노산 길이 범위이다. 일부 구현예에서, 단백질 단편은 약 20 개의 아미노산 내지 약 200 개의 아미노산 길이 범위이다. 일부 구현예에서, 단백질 단편은 약 10 개의 아미노산 내지 약 100 개의 아미노산 길이 범위이다. 다른 길이의 적합한 단백질 단편은 당업자에게 명백할 것이다.
일 구현예에서, 이중 AAV 벡터는 큰 이식유전자 발현 카세트를 두 개의 별도의 절반(5' 및 3' 단부, 또는 머리 및 꼬리)으로 분할함으로써 생성되고, 여기서 카세트의 각각의 절반은 단일 AAV 벡터(5 kb 미만)에 패키징된다. 그런 다음 다음과 같은 두 이중 AAV 벡터에 의해 동일한 세포의 공동 감염 시 전장 이식유전자 발현 카세트에 의한 재조립이 달성된다:(1) 5' 및 3' 게놈 사이의 상동 재조합[HR](이중 AAV 중첩 벡터);(2) 5' 및 3' 게놈의 ITR-매개 꼬리-대-머리 연쇄체화(이중 AAV 트랜스 스플라이싱 벡터); 또는(3) 이들 두 가지 메커니즘의 조합(이중 AAV 하이브리드 벡터). 생체내에서 이중 AAV 벡터의 사용은 전장 단백질의 발현을 초래한다. 이중 AAV 벡터 플랫폼의 사용은 4.7 kb 초과 크기의 이식유전자에 대한 효율적이고 실행가능한 유전자 전달 전략을 나타낸다.
인테인
인테인(개재 단백질)은 단백질 스플라이싱으로 알려진 과정을 수행하는 다양한 여러 유기체에서 발견되는 자가 처리 도메인이다. 단백질 스플라이싱은 펩티드 결합의 절단 및 형성 둘 다로 이루어진 다단계 생화학 반응이다. 단백질 스플라이싱의 내인성 기질은 인테인 함유 유기체에서 발견되는 단백질이지만, 인테인은 또한 사실상 임의의 폴리펩티드 백본을 화학적으로 조작하는 데 사용될 수 있다.
단백질 스플라이싱에서, 인테인은 두 개의 펩티드 결합을 절단함으로써 전구체 폴리펩티드를 자체적으로 절제하여, 새로운 펩티드 결합의 형성을 통해 플랭킹 엑스테인(외부 단백질) 서열을 결찰시킨다. 이 재배열은 번역후(또는 가능한 동시 번역으로) 발생한다. 인테인-매개 단백질 스플라이싱은 자발적으로 발생하며, 인테인 도메인의 접힘만을 필요로 한다.
인테인의 약 5%는 스플릿 인테인이며, 각각이 하나의 엑스테인에 융합된 N-인테인 및 C-인테인인 두 개의 별도의 폴리펩티드로서 전사 및 번역된다. 번역 시, 인테인 단편은 자발적이고 비공유적으로 표준 인테인 구조내로 조립되어 단백질 스플라이싱을 트랜스로 수행한다. 단백질 스플라이싱의 기전은 인테인-엑스테인 접합부에서 두 개의 펩티드 결합의 절단 및 N- 및 C-엑스테인 사이에 새로운 펩티드 결합의 형성을 초래하는 일련의 아실 전달 반응을 수반한다. 이 과정은 N-엑스테인 및 인테인의 N-말단을 연결하는 펩티드 결합의 활성화로 개시된다. 사실상 모든 인테인은 N-말단에서 C-말단 N-엑스테인 잔기의 카르보닐 탄소를 공격하는 시스테인 또는 세린을 갖는다. 이러한 N에서 O/S로의 아실 이동은 흔히 발견되는 아스파르테이트와 함께 보존된 트레오닌 및 히스티딘(TXXH 모티프로 지칭됨)에 의해 용이하게 되어, 선형(티오)에스테르 중간체의 형성을 초래한다. 다음으로, 이 중간체는 시스테인, 세린, 또는 트레오닌인 제1 C-엑스테인 잔기(+1)의 친핵체 공격에 의해 트랜스-(티오)에스테르화에 적용된다. 생성된 분지형(티오)에스테르 중간체는 고유한 형태인 인테인의 고도로 보존된 C-말단 아스파라긴의 환화[cyclization]를 통해 분해된다. 이 과정은 히스티딘(고도로 보존된 HNF 모티프에서 발견) 및 끝에서 두번째 히스티딘에 의해 용이하게 되고 또한 아스파르테이트를 포함할 수 있다. 이 숙신이미드 형성 반응은 반응성 복합체로부터 인테인을 절제하고 비펩티드성 결합을 통해 부착된 엑스테인을 남겨 둔다. 이 구조는 인테인 독립적 방식으로 안정된 펩티드 결합내로 빠르게 재배열된다.
일부 구현예에서, 뉴클레아제(예를 들어, Cas9)의 일부 또는 단편은 인테인에 융합된다. 뉴클레아제는 인테인의 N-말단 또는 C-말단에 융합될 수 있다. 일부 구현예에서, 융합 단백질의 일부 또는 단편은 인테인에 융합되고 AAV 캡시드 단백질에 융합된다. 인테인, 뉴클레아제 및 캡시드 단백질은 임의의 배열(예를 들어, 뉴클레아제-인테인-캡시드, 인테인-뉴클레아제-캡시드, 캡시드-인테인-뉴클레아제 등)에서 함께 융합될 수 있다. 일부 구현예에서, 염기 편집기(예를 들어, ABE, CBE)의 N-말단 단편은 스플릿 인테인-N에 융합되고 C-말단 단편은 스플릿 인테인-C에 융합된다. 그런 다음 이들 단편은 두 개 이상의 AAV 벡터로 패키징된다. 일부 구현예에서, 인테인의 N-말단은 융합 단백질의 C-말단에 융합되고 인테인의 C-말단은 AAV 캡시드 단백질의 N-말단에 융합된다.
일 구현예에서, 인테인은 AAV 캡시드 단백질 상에 접목된[grafted] 시티딘 또는 아데노신 데아미나아제 염기 편집기 단백질의 단편 또는 부분을 접합하기 위해 사용된다. 이종 단백질 단편을 연결하기 위한 특정 인테인의 사용은 예를 들어, 문헌[Wood et.al., J.Biol. Chem. 289(21); 14512-9(2014)]에 기재되어 있다. 예를 들어, 별도의 단백질 단편과 융합된 경우, 인테인 IntN 및 IntC는 서로를 인식하고, 스스로를 스플라이싱하고 이들이 융합된 단백질 단편의 플랭킹 N- 및 C-말단 엑스테인을 동시에 결찰시켜, 두 개의 단백질 단편으로부터 전장 단백질을 재구축한다. 다른 적합한 인테인은 당업자에게 명백할 것이다.
일부 구현예에서, ABE는 SpCas9의 선택되는 영역 내의 Ala, Ser, Thr, 또는 Cys 잔기에서 N- 및 C-말단 단편으로 스플릿되었다. 이들 영역은 Cas9 결정 구조 분석에 의해 식별된 루프 영역에 상응한다.
각 단편의 N-말단은 인테인-N에 융합되고 각 단편의 C-말단은 아미노산 위치 S303, T310, T313, S355, A456, S460, A463, T466, S469, T472, T474, C574, S577, A589, 및 S590에서 인테인 C에 융합되고, 이는 아래 서열('Cas9 참조 서열'로 불림)에서 대문자로 표시된다.
1 mdkkysigld igtnsvgwav itdeykvpsk kfkvlgntdr hsikknliga llfdsgetae
61 atrlkrtarr rytrrknric ylqeifsnem akvddsffhr leesflveed kkherhpifg
121 nivdevayhe kyptiyhlrk klvdstdkad lrliylalah mikfrghfli egdlnpdnsd
181 vdklfiqlvq tynqlfeenp inasgvdaka ilsarlsksr rlenliaqlp gekknglfgn
241 lialslgltp nfksnfdlae daklqlskdt ydddldnlla qigdqyadlf laaknlsdai
301 llSdilrvnT eiTkaplsas mikrydehhq dltllkalvr qqlpekykei ffdqSkngya
361 gyidggasqe efykfikpil ekmdgteell vklnredllr kqrtfdngsi phqihlgelh
421 ailrrqedfy pflkdnreki ekiltfripy yvgplArgnS rfAwmTrkSe eTiTpwnfee
481 vvdkgasaqs fiermtnfdk nlpnekvlpk hsllyeyftv yneltkvkyv tegmrkpafl
541 sgeqkkaivd llfktnrkvt vkqlkedyfk kieCfdSvei sgvedrfnAS lgtyhdllki
601 ikdkdfldne enedilediv ltltlfedre mieerlktya hlfddkvmkq lkrrrytgwg
661 rlsrklingi rdkqsgktil dflksdgfan rnfmqlihdd sltfkediqk aqvsgqgdsl
721 hehianlags paikkgilqt vkvvdelvkv mgrhkpeniv iemarenqtt qkgqknsrer
781 mkrieegike lgsqilkehp ventqlqnek lylyylqngr dmyvdqeldi nrlsdydvdh
841 ivpqsflkdd sidnkvltrs dknrgksdnv pseevvkkmk nywrqllnak litqrkfdnl
901 tkaergglse ldkagfikrq lvetrqitkh vaqildsrmn tkydendkli revkvitlks
961 klvsdfrkdf qfykvreinn yhhahdayln avvgtalikk ypklesefvy gdykvydvrk
1021 miakseqeig katakyffys nimnffktei tlangeirkr plietngetg eivwdkgrdf
1081 atvrkvlsmp qvnivkktev qtggfskesi lpkrnsdkli arkkdwdpkk yggfdsptva
1141 ysvlvvakve kgkskklksv kellgitime rssfeknpid fleakgykev kkdliiklpk
1201 yslfelengr krmlasagel qkgnelalps kyvnflylas hyeklkgspe dneqkqlfve
1261 qhkhyldeii eqisefskrv iladanldkv lsaynkhrdk pireqaenii hlftltnlga
1321 paafkyfdtt idrkrytstk evldatlihq sitglyetri dlsqlggd(서열 번호 197)
약학적 조성물
일부 양태에서, 본원에 기재된 유전적으로 변형된 세포, 임의의 염기 편집기, 융합 단백질, 또는 융합 단백질-가이드 폴리뉴클레오티드 복합체를 포함하는 약학적 조성물을 제공한다.
구현예에서, 본 개시의 약학적 조성물은 레트로바이러스 감염(예를 들어, HBV 감염)의 치료를 위한 항레트로바이러스 약물(예를 들어, 라미부딘)을 포함한다. 항레트로바이러스 약물의 비제한적 예는 아데포비르, 테노포비르, 텔비부딘, 인터페론 [예를 들어, 인터페론 알파-2b(인트론 A), 페그-인터페론)], 림포톡신 ß수용체 [Lymphotoxin ß receptor, LTBR], 뉴클레오시드/뉴클레오티드 역전사효소 억제제[nucleoside/nucleotide reverse transcriptase inhibitor, NRTI][예를 들어, 아바카비르(Ziagen), 디다노신, 엠트리시타빈(Emtriva), 라미부딘(Epivir), 스타부딘, 테노포비르 디소프록실 푸마레이트(Viread), 테노포비르 알라펜아미드, 및 지도부딘(Retrovir)], 비뉴클레오시드 역전사효소 억제제[non-nucleoside reverse transcriptase inhibitor, NNRTI][예를 들어, 델라비르딘, 도라비린(Pifeltro), 에파비렌즈(Sustiva), 에트라비린(Intelence), 네비라핀(Viramune), 릴피비린(Edurant), 및 델라비르딘], 부착 후 억제제 또는 단클론 항체(예를 들어, 이발리주맙-uiyk), CCR5 길항근(예를 들어, 마라비록), 아타자나비르, 다루나비르, 코비시스트, 로피나비르, 마라비록, 네비라핀, 릴피비린, 엘비테그라비르 + TDF + FTC + 코비시스트, 엘비테그라비르 + TAF + FTC + 코비시스트, 인테그라제 억제제(예를 들어, 비테그라비르, 카보테그라비르, 카보테그라비르 및 릴피비린, 돌루테그라비르, 엘비테그라비르, 포삼프레나비르(Lexiva, Telzir) 및 랄테그라비르), 융합 억제제(예를 들어, 엔푸비르티드), 진입 억제제(예를 들어, 마라비록), 프로테아제 억제제[protease inhibitor, PI][예를 들어, 아타자나비르, 다르우나비르, 로피나비르, 인디나비르(Crixivan), 로피나비르/리토나비르(Kaletra), 리토나비르(Norvir), 사퀴나비르(Invirase) 및 티프라나비르(Aptivus)], 부착 및 부착 후 억제제(예를 들어, 포스템사비르, 이발리주맙), 및 엔테카비르. 일 구현예에서, 항레트로바이러스 약물은 라미부딘, 엔테카비르, 테노포비르, 인터페론, 및 페그-인터페론 중 하나 이상에서 선택된다.
본 발명의 약학적 조성물은 알려진 기술에 따라 제조될 수 있다. 예를 들어, 문헌[Remington, The Science And Practice of Pharmacy(21st ed. 2005)]을 참조한다. 일반적으로, 본 개시의 조성물의 세포, 이의 집단, 염기 편집기, 융합 단백질, 또는 임의의 다른 구성요소 투여 또는 저장 전에 적합한 담체와 혼합되고, 일부 구현예에서, 약학적 조성물은 약학적으로 허용되는 담체를 더 포함한다. 약학상 적합하게 허용되는 담체는 일반적으로 대상에게 약학적 조성물을 투여하는 단계를 보조하거나, 제약 조성물을 전달 가능한 제제로 가공하는 단계를 보조하거나, 투여 전에 약학적 조성물을 저장하는 것을 보조하는 불활성 물질을 포함한다. 약학적으로 허용되는 담체는 제형의 형태, 농도, 점도, pH, 약동학, 용해도를 안정화시키거나, 최적화하거나, 또는 달리 변경할 수 있는 제제를 포함할 수 있다. 이러한 제제는 완충제, 습윤제, 유화제, 희석제, 캡슐화제, 및 피부 침투 증진제를 포함한다. 예를 들어, 담체는 식염수, 완충 식염수, 덱스트로스, 아르기닌, 수크로스, 물, 글리세롤, 에탄올, 소르비톨, 덱스트란, 나트륨 카르복시메틸 셀룰로스, 및 이들의 조합을 포함할 수 있지만, 이에 제한되지는 않는다.
약학적으로 허용되는 담체로서 역할을 할 수 있는 물질의 일부 비제한적인 예는 다음을 포함한다:(1) 당, 예컨대 락토스, 글루코스 및 수크로스;(2) 전분, 예컨대 옥수수 전분 및 감자 전분;(3) 셀룰로스, 및 이의 유도체, 예컨대 나트륨 카르복시메틸 셀룰로스, 메틸셀룰로스, 에틸 셀룰로스, 미세결정질 셀룰로스 및 셀룰로스 아세테이트;(4) 분말화 트라가칸트;(5) 맥아;(6) 젤라틴;(7) 윤활제, 예컨대 마그네슘 스테아레이트, 나트륨 라우릴 술페이트 및 활석;(8) 부형제, 예컨대 코코아 버터 및 좌제 왁스;(9) 오일, 예컨대 땅콩유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유;(10) 글리콜, 예컨대 프로필렌 글리콜;(11) 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜(polyethylene glycol, PEG);(12) 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트;(13) 한천;(14) 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄;(15) 알긴산;(16) 무발열원수;(17) 등장성 염수;(18) 링거(Ringer) 용액;(19) 에틸 알코올;(20) pH 완충 용액;(21) 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물;(22) 증량제, 예컨대 폴리펩티드 및 아미노산(23) 혈청 알코올, 예컨대 에탄올; 및(23) 약학적 제형에서 이용되는 다른 무독성 호환성 물질. 습윤제, 착색제, 방출제, 코팅제, 감미제, 향미제, 방향제, 방부제 및 산화방지제 또한 제형에 존재할 수 있다.
약학적 조성물은 미리 결정된 수준에서 약 5.0 내지 약 8.0의 범위에서와 같은 생리학적 pH를 반영하는 제형의 pH를 유지하기 위해 하나 이상의 pH 완충 화합물을 포함할 수 있다. 수성 액체 제형에 사용되는 pH 완충 화합물은 아미노산 또는 히스티딘과 같은 아미노산의 혼합물 또는 히스티딘 및 글리신과 같은 아미노산의 혼합물일 수 있다. 또는, pH 완충 화합물은 바람직하게는 미리 결정된 수준에서 약 5.0 내지 약 8.0의 범위에서와 같은 제형의 pH를 유지하고, 칼슘 이온을 킬레이트화하지 않는 제제이다. 이러한 pH 완충 화합물의 실례가 되는 예시는 이미다졸 및 아세테이트 이온을 포함하나, 이에 제한되지 않는다. pH 완충 화합물은 미리 결정된 수준에서 제형의 pH를 유지하기에 적합한 임의의 양으로 존재할 수 있다.
약학적 조성물은 또한 하나 이상의 삽투압 조절 제, 즉, 개인 수혜자의 혈류 및 혈액 세포에 허용가능한 수준으로 제형의 삼투압 특성(예를 들어, 등장성, 삼투압, 및/또는 삼투 압력)을 조절하는 화합물을 함유할 수 있다. 삽투압 조절제는 칼슘 이온을 킬레이트화하지 않는 제제일 수 있다. 삽투압 조절제는 제형의 삼투압 특성을 조절하는 당업자에게 알려지거나 또는 이용가능한 임의의 화합물일 수 있다. 당업자는 본 발명의 제형에 사용하기 위한 주어진 삽투압 조절제의 적합성을 경험적으로 결정할 수 있다. 적합한 유형의 삽투압 조절제의 실례가 되는 예시는 다음을 포함하나, 이에 제한되지 않는다: 염, 예컨대 나트륨 클로라이드 및 나트륨 아세테이트; 당, 예컨대 수크로스, 덱스트로스, 및 만니톨; 아미노산, 예컨대 글리신; 및 이러한 제제 및/또는 제제의 유형 중 하나 이상의 혼합물. 삽투압 조절제(들)는 제형의 삼투압 특성을 조절하기에 충분한 임의의 농도로 존재할 수 있다.
본 발명의 약학적 조성물은 질환의 치료에 유용한 적어도 하나의 추가 치료제를 포함할 수 있다. 예를 들어, 본원에 기재된 약학적 조성물의 일부 구현예는 화학요법제를 더 포함한다. 일부 구현예에서, 약학적 조성물은 사이토카인 펩티드 또는 사이토카인 펩티드를 암호화하는 핵산 서열을 추가로 포함한다. 일부 구현예에서, 세포 또는 그의 집단을 포함하는 약학적 조성물은 추가 치료제와 별도로 투여될 수 있다.
본 발명의 조성물의 치료적 용도에 관한 한 가지 고려사항은 최적의 또는 만족스러운 효과를 달성하는 데 필요한 제제의 양이다. 예를 들어, 투여될 변형된 세포의 양은 치료되는 대상에 따라 달라질 수 있다. 일 구현예에서, 본 발명의 유전적으로 변형된 세포가 104내지 1010 사이, 105 내지 109 사이, 또는 106사이, 또는 108사이로 인간 대상에게 투여된다. 일부 구현예에서, 적어도 약 1 x 108, 2 x 108, 3 x 108, 4 x 108, 및 5 x 108 유전자 변형된 본 발명의 세포가 인간 대상에게 투여된다. 정확한 유효 용량을 결정하는 것은 각각의 크기, 연령, 성별, 체중 및 상태를 포함하는 개별 대상의 요인을 기반으로 할 수 있다. 투여량은 본 개시 및 당업계의 지식에서 당업자에 의해 용이하게 확인될 수 있다.
당업자는 본 발명의 방법에서 투여될 조성물 중의 작용제의 양 및 선택적 첨가제, 비히클, 및/또는 담체의 양을 용이하게 결정할 수 있다. 전형적으로, 첨가제는 포스페이트 완충 식염수 중 0.001 내지 50%(중량) 용액의 양으로 존재하고, 활성 성분은 마이크로그램 내지 밀리그램, 예컨대 약 0.0001 내지 약 5 중량%, 바람직하게는 약 0.0001 내지 약 1 중량%, 더욱 바람직하게는 약 0.0001 내지 약 0.05 중량% 또는 약 0.001 내지 약 20 중량%, 바람직하게는 약 0.01 내지 약 10 중량%, 더욱 더 바람직하게는 약 0.05 내지 약 5 중량%의 순서로 존재한다. 물론, 동물 또는 인간에게 투여될 임의의 조성물 및 임의의 특정 투여 방법에 대해, 적합한 동물 모델(예를 들어, 설치류, 예컨대 마우스)에서 치사량[lethal dose, LD] 및 LD50을 결정하는 것과 같은 독성; 및 적합한 반응을 유도하는 조성물(들)의 투여량, 그 내부의 구성요소의 농도, 및 조성물(들)을 투여하는 시기를 결정하는 것이 바람직하다. 이러한 결정은 당업자의 지식, 본 개시 및 본원에 인용된 문서에서 무리한 실험을 필요로 하지 않는ek. 그리고, 무리한 실험 없이 순차 투여 시기를 확인할 수 있다.
일부 구현예에서, 약학적 조성물은 대상에게 전달하기 위해 제형화된다. 본원에 기재된 약학적 조성물을 투여하는 적합한 경로는 다음을 포함하나 이제 제한되지 않는다: 국소, 피하, 경피, 피부내, 병변내, 관절내, 복강내, 방광내, 경점막, 치은, 치간, 와우내, 경고막, 기관내, 경막외, 척추강내, 근육내, 정맥내, 혈관내, 골내, 안구주위, 종양내, 대뇌내, 및 뇌실내 투여.
일부 구현예에서, 본원에 기재된 약학적 조성물은 질환 부위(예를 들어, 간)에 국부적으로 투여된다. 일부 구현예에서, 본원에 기재된 약학적 조성물은 주사에 의해, 카테터에 의해, 좌제에 의해, 또는 이식물에 의해 대상에게 투여되고, 이식물은 시알라스틱 막, 또는 섬유와 같은 막을 포함한 다공성, 비다공성, 또는 젤라틴성 물질이다.
다른 구현예에서, 본원에 기재된 약학적 조성물은 제어 방출 시스템으로 전달된다. 일 구현예에서, 펌프가 사용될 수 있다(예를 들어, 문헌[Langer, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574] 참조). 또 다른 구현예에서, 중합체성 물질이 사용될 수 있다.(예를 들어, 문헌[Medical Applications of Controlled Release(Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974)]; 문헌[Controlled Drug Bioavailability, Drug Product Design and Performance(Smolen and Ball eds., Wiley, New York, 1984)]; 문헌[Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61] 또한 문헌(Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351); 문헌(Howard et al., 1989, J. Neurosurg. 71: 105. 참조). 다른 제어 방출 시스템이 예를 들어, 앞의 Langer에서 논의된다.
일부 구현예에서, 약학적 조성물은 대상, 예를 들어, 인간에게 정맥내 또는 피하 투여에 적합한 조성물로서 보통의 절차에 따라 제형화된다. 일부 구현예에서, 주사에 의해 투여하기 위한 약학적 조성물은 가용화제로서 사용하기 위한 멸균 등장성 용액 및 주사 부위에서 통증을 완화하기 위한 리그노카인과 같은 국소 마취제이다. 일반적으로, 이들 성분은 개별적으로 제공되거나 또는 예를 들어, 활성 성분의 양을 표시하는 앰플 또는 봉지[sachette]와 같은 완전 밀폐 용기에서 건조 동결건조된 분말 또는 무수 농축물로서 단위 투여 형태로 함께 혼합된다. 약제가 주입에 의해 투여되는 경우, 멸균 약학적 등급 물 또는 염수를 함유하는 주입 병으로 분배될 수 있다. 약학적 조성물이 주사에 의해 투여되는 경우, 성분이 투여 전에 혼합될 수 있도록 주사용 멸균수 또는 염수의 앰플이 제공될 수 있다.
전신 투여를 위한 약학적 조성물은 액체, 예를 들어, 멸균 염수, 락테이트화 링거 또는 행크 용액일 수 있다. 또한, 약학적 조성물은 고체 형태이고 사용 직전에 재용해되거나 또는 현탁될 수 있다. 동결건조된 형태 또한 고려된다. 약학적 조성물은 비경구 투여에도 적합한 리소솜 또는 미세결정과 같은 지질 입자 또는 소포 내에 함유될 수 있다. 입자는 조성물이 그 안에 함유되어 있는 한, 단층 또는 다층과 같은 임의의 적합한 구조일 수 있다. 화합물은 낮은 수준(5-10 mol%)의 양이온성 지질인 융해성 지질 디올레오일포스파티딜에탄올아민[dioleoylphosphatidylethanolamine, DOPE]을 함유하는 '안정화된 플라스미드-지질 입자'[stabilized plasmid-lipid particles, SPLP]에 포획되고, 폴리에틸렌글리콜(polyethyleneglycol, PEG) 코팅에 의해 안정화될 수 있다[문헌(Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)]. 이러한 입자 및 소포에 대해 N-[l-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄메틸술페이트, 또는 'DOTAP'와 같은 양으로 하전된 지질이 특히 바람직하다. 이러한 지질 입자의 제조는 잘 알려져 있다. 예를 들어, 미국 특허 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016; 및 4,921,757을 참조하고, 이들 각각은 본원에 참조로 포함된다.
본원에 기재된 약학적 조성물은 예를 들어, 단위 용량으로 투여되거나 또는 패키징될 수 있다. 용어 '단위 용량'은 본 개시의 약학적 조성물과 관련하여 사용되는 경우 대상에 대한 단일 투여량으로 적합한 물리적으로 별개의 단위를 지칭하고, 각각의 단위는 필요한 희석제; 즉, 담체, 또는 비히클과 관련하여 원하는 치료적 효과를 생성하기 위해 계산된 미리 결정된 활성 물질의 양을 함유한다.
또한, 약학적 조성물은(a) 동결건조된 형태의 본 발명의 화합물을 함유하는 용기 및(b) 약학적으로 허용되는 희석제(예를 들어, 본 발명의 동결건조된 화합물의 재구성 및 희석에 사용되는 멸균물을 함유하는 제2 용기를 포함하는 약학적 키트로 제공될 수 있다. 임의로 연관된 이러한 용기(들)는 약학적 또는 생물학적 생산물의 제조, 사용 또는 판매를 규제하는 정부 기관에 의해서 규정된 형태의 설명서를 가질 수 있고, 설명서는 인간 투여를 위한 제조, 사용 또는 판매 기관에 의한 승인을 반영한다.
또 다른 양태에서, 위에 기재된 질환의 치료에 유용한 물질을 함유하는 제조 물품이 포함된다. 일부 구현예에서, 제조 물품은 용기 또는 라벨을 포함한다. 적합한 용기는, 예를 들어, 보틀, 바이알, 주사기 및 시험관을 포함한다. 용기는 유리 또는 플라스틱과 같은 다양한 물질로부터 형성될 수 있다. 일부 구현예에서, 용기는 본원에 기재된 질환을 치료하기에 효과적인 조성물을 보유하고 멸균 접근 포트를 가질 수 있다. 예를 들어, 용기는 정맥 내 용액 백 또는 피하 주사 바늘로 뚫을 수 있는 스토퍼가 있는 바이알일 수 있다. 조성물 내 활성제는 본 발명의 화합물이다. 일부 구현예에서, 용기 상의 또는 연관된 라벨은 조성물이 선택 질환을 치료하는 데 사용됨을 나타낸다. 제조 물품은 약학적으로 허용되는 완충제, 예컨대 포스페이트 완충 염수, 링거 용액, 또는 덱스트로스 용액을 포함하는 제2 용기를 더 포함할 수 있다. 다른 완충제, 희석제, 충전제, 바늘, 주사기, 및 사용 설명서가 있는 패키지 삽입물을 포함한 상업적 및 사용자 관점에서 바람직한 다른 물질을 더 포함할 수 있다.
일부 구현예에서, 본원에 기재된 임의의 융합 단백질, gRNA, 및/또는 복합체는 약학적 조성물의 일부로 제공된다. 일부 구현예에서, 약학적 조성물은 본원에 제공된 임의의 융합 단백질을 포함한다. 일부 구현예에서, 약학적 조성물은 본원에 제공된 임의의 복합체를 포함한다. 일부 구현예에서, 약학적 조성물은 gRNA 및 양이온성 지질과 복합체를 형성하는 RNA-가이드된 뉴클레아제(예를 들어, Cas9)를 포함하는 리보뉴클레오단백질 복합체를 포함한다. 일부 구현예에서 약학적 조성물은 gRNA, 핵산 프로그래밍 가능한 DNA 결합 단백질, 양이온성 지질, 및 약학적으로 허용되는 부형제를 포함한다. 약학적 조성물은 임의로 하나 이상의 추가의 치료적 활성 물질을 포함할 수 있다.
일부 구현예에서, 본원에 제공된 조성물은 대상 내에서 표적화된 게놈 변형을 수행하기 위해 대상, 예를 들어 인간 대상에게 투여된다. 일부 구현예에서, 세포는 대상에서 수득되고, 본원에 제공된 약학적 조성물 중 임의의 것과 접촉된다. 일부 구현예에서, 대상에서 제거되고 생체 외에서 제약 조성물과 접촉된 세포는, 임의로 세포에서 표적으로 하는 게놈 변형이 수행되거나 검출된 후에, 대상 내로 재도입된다. 뉴클레아제를 포함하는 약학적 조성물을 전달하는 방법은 알려져 있고, 예를 들어, 미국 특허 제6,453,242호; 제6,503,717호; 제6,534,261호; 제6,599,692호; 제6,607,882호; 제6,689,558호; 제6,824,978호; 제6,933,113호; 제6,979,539호; 제7,013,219호; 및 제7,163,824호에 기재되어 있으며, 이의 전체 내용은 본원에 참조로 포함된다. 본원에서 제공되는 약학적 조성물의 설명이 주로 인간에게 투여하기에 적합한 약학적 조성물에 관한 것이지만, 당업자는 이러한 조성물이 일반적으로 동물 또는 각종 유기체, 예를 들어, 수의학의 용도에 투여하기에 적합하다는 것을 이해할 것이다.
조성물을 다양한 동물에게 투여하기에 적합하도록 하기 위해 인간에게 투여하기 적합한 약학적 조성물의 변형은 잘 이해되고, 통상적으로 숙련된 수의학 약리학자는 통상적인, 만약 있다면, 실험만으로, 이러한 변형을 설계 및/또는 수행할 수 있다. 약학적 조성물의 투여가 고려되는 대상은, 인간 및 또는 다른 영장류; 포유동물, 가축, 반려동물, 및 소, 돼지, 말, 양, 고양이, 개, 마우스, 및/또는 랫트와 같은 상업적으로 관련된 포유동물; 및/또는 닭, 오리, 거위, 및/또는 칠면조와 같은 상업적으로 관련된 조류를 포함하지만 이에 제한되지 않는다.
본원에 기재된 약학적 조성물의 제형은 약리학의 분야에서 알려지거나 이후에 개발된 임의의 방법에 의해 제조될 수 있다. 일반적으로, 그와 같은 제조 방법은 활성 성분(들)을 부형제 및/또는 1종 이상의 다른 부속 성분과 연관시키는 단계, 및 그 다음, 필요하거나 및/또는 요망하는 경우, 생산물을 원하는 단일 또는 다중 용량 단위로 분할, 형성화 및/또는 포장하는 단계를 포함한다. 약학적 제형은 약학적으로 허용가능한 부형제를 추가로 포함할 수 있고, 이 부형제는, 본원에서 사용된 바와 같이, 원하는 특정한 복용 형태에 적합하도록 임의의 및 모든 용매, 분산 배지, 희석제, 또는 다른 액체 비히클, 분산 또는 서스펜션 조제, 계면 활성제, 등장제, 증점제 또는 유화제, 보존제, 고형 결합제, 윤활제 등을 포함한다. 문헌[Remington's The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro(Lippincott, Williams & Wilkins, Baltimore, MD, 2006; 이는 그 전체가 본원에 참조로 포함됨)]은 약학적 조성물을 제형화하는 데 사용되는 다양한 부형제 및 이의 제조를 위한 알려진 기술을 제공한다. 뉴클레아제를 포함하는 약학적 조성물을 제조하기 위한 추가의 적합한 방법, 시약, 부형제 및 용매에 대해, 본원에 그 전체가 참조로 포함된 PCT 출원 PCT/US2010/055131(공개 번호 WO2011/053982 A8, 2010년 11월 2일 출원)을 또한 참조한다.
임의의 통상적인 부형제 매질이 예컨대 임의의 바람직하지 않는 생물학적 효과를 생성하거나 달리 약학적 조성물의 임의의 다른 구성요소(들)와 유해한 방식으로 상호작용하여 물질 또는 이의 유도체와 양립할 수 없는 것을 제외하고, 이의 사용은 본 개시의 범위 내에 있는 것으로 고려된다.
앞서 기재된 바와 같이 조성물은 유효량으로 투여될 수 있다. 유효량은 투여 방식, 치료되는 특정 상태 및 원하는 결과에 따라 달라질 것이다. 이는 또한 병태의 단계, 대상의 연령 및 신체 상태, 병행 요법의 성질(존재하는 경우), 및 의료인에게 잘 알려진 유사한 인자에 따라 달라질 수 있다. 치료적 적용의 경우, 이는 의학적으로 바람직한 결과를 수행하기에 충분한 양이다.
일부 구현예에서, 본 개시에 따른 조성물은 임의의 다양한 질환, 장애 및/또는 병태의 치료를 위해 사용될 수 있다.
치료 방법
본 발명의 일부 양태는 치료를 필요로 하는 대상을 치료하는 방법을 제공하고, 이 방법은 본원에 기재된 바와 같은 유효 치료량의 약학적 조성물을 치료를 필요로 하는 대상에게 투여하는 단계를 포함한다. 다른 구현예에서, 본 발명의 방법은 염기 편집기 폴리펩티드 및 적어도 하나의 폴리펩티드를 암호화하는 핵산 분자를 표적화할 수 있는 하나 이상의 가이드 RNA를 발현하거나 세포 내로 도입하는 것을 포함한다.
구현예에서, 치료 방법은 레트로바이러스 감염(예를 들어, HBV 감염)의 치료를 위한 항레트로바이러스 약물(들)(예를 들어, 라미부딘)을 사용한 전처리, 공동 처리, 또는 동시 처리를 수반한다. 구현예에서, 치료(예를 들어, 전처리, 공동 처리, 또는 동시 처리)는 약 또는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100일의 기간을 갖는다. 치료는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100일 이하의 기간을 가진다. 구현예에서, 항레트로바이러스 약물의 투여는 전처리가 투여된 대상 또는 세포에 대한 염기 편집 시스템의 투여(즉, '전처리')의 약 또는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 전에 중단된다. 구현예에서, 항레트로바이러스 약물의 투여는 전처리가 투여된 대상 또는 세포에 대한 염기 편집 시스템 투여의 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 이하 전에 중단된다. 구현예에서, 항레트로바이러스 약물의 투여는 전처리가 투여된 대상 또는 세포에 대한 염기 편집 시스템 투여의 약 또는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 전에 시작된다. 구현예에서, 항레트로바이러스 약물의 투여는 전처리가 투여된 대상 또는 세포에 대한 염기 편집 시스템 투여의 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 이하 전에 종료된다. 구현예에서, 항레트로바이러스 약물의 투여는 염기 편집 시스템 및 처리의 투여 후 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 이하 전에 종료된다. 구현예에서, 항레트로바이러스 약물은 대상 또는 세포에 대한 염기 편집 시스템의 투여 약 또는 적어도 약 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 전에 대상 또는 세포에 먼저 투여되고, 염기 편집 시스템의 투여 후 약, 적어도 약 또는 약 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 이하 동안 계속되며, 일부 예에서 염기 편집 시스템의 투여는 염기 편집 시스템의 제1 투여이다.
항레트로바이러스 약물의 비제한적 예는 아데포비르, 테노포비르, 텔비부딘, 인터페론 [예를 들어, 인터페론 알파-2b(인트론 A), 페그-인터페론)] 또는 인터페론 알파-2a;페길화된 인터페론(예를 들어, 페그인터페론 알파-2a 또는 페그인터페론 알파-2b),림포톡신 ß 수용체 [LTBR], 뉴클레오시드/뉴클레오티드 역전사효소 억제제[NRTI][예를 들어, 아바카비르(Ziagen), 디다노신, 엠트리시타빈(Emtriva), 라미부딘(Epivir), 스타부딘, 테노포비르 디소프록실 푸마레이트(Viread), 테노포비르 알라펜아미드, 및 지도부딘(Retrovir)], 비뉴클레오시드 역전사효소 억제제[NNRTI][예를 들어, 델라비르딘, 도라비린(Pifeltro), 에파비렌즈(Sustiva), 에트라비린(Intelence), 네비라핀(Viramune), 릴피비린(Edurant), 및 델라비르딘], 부착 후 억제제 또는 단클론 항체(예를 들어, 이발리주맙-uiyk), CCR5 길항근(예를 들어, 마라비록), 아타자나비르, 다루나비르, 코비시스트, 로피나비르, 마라비록, 네비라핀, 릴피비린, 엘비테그라비르 + TDF + FTC + 코비시스트, 엘비테그라비르 + TAF + FTC + 코비시스트, 인테그라제 억제제(예를 들어, 비테그라비르, 카보테그라비르, 카보테그라비르 및 릴피비린, 돌루테그라비르, 엘비테그라비르, 포삼프레나비르(Lexiva, Telzir) 및 랄테그라비르), 융합 억제제(예를 들어, 엔푸비르티드), 진입 억제제(예를 들어, 마라비록), 프로테아제 억제제[PI][예를 들어, 아타자나비르, 다르우나비르, 로피나비르, 인디나비르(Crixivan), 로피나비르/리토나비르(Kaletra), 리토나비르(Norvir), 사퀴나비르(Invirase) 및 티프라나비르(Aptivus)], 부착 및 부착 후 억제제(예를 들어, 포스템사비르, 이발리주맙), 및 엔테카비르. 일 구현예에서, 항레트로바이러스 약물은 라미부딘, 엔테카비르, 테노포비르, 인터페론, 및 페그-인터페론 중 하나 이상에서 선택된다.
구현예에서, 하나 이상의 항레트로바이러스 약물(들)이 투여된 대상 및/또는 세포의 전처리, 공동 처리, 또는 동시 처리는(예를 들어, 본 개시의 염기 편집기 시스템과 조합하여) 항레트로바이러스 약물을 투여하지 않은 기준 대상 및/또는 세포에 비해 약 또는 적어도 약 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 400%, 500% 또는 그 이상의 폴리뉴클레오티드(예를 들어, cccDNA에서) 내의 표적 서열(들)의 염기 편집 효율의 증가와 연관된다.
당업자는 특정 구현예에서 고려되는 약학적 조성물의 다중 투여가 원하는 요법에 영향을 미치는데 필요할 수 있음을 인식할 것이다. 예를 들어, 조성물은 대상에게 1주, 2주, 3주, 1개월, 2개월, 3 개월, 4개월, 5개월, 6개월, 1년, 2년, 5년, 10년 또는 그 이상의 기간에 걸쳐 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10회 이상 투여될 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포 또는 염기 편집기 시스템 또는 이러한 시스템을 암호화하는 폴리뉴클레오티드의 유효량을 대상에게 투여하는 단계를 포함할 수 있다. 임의의 이러한 방법에서, 방법은 유효량의 하나 이상의 용량을 염기 편집기 시스템으로 투여하는 단계를 포함할 수 있되,용량은 임의로 약 또는 적어도 약 1시간, 12시간, 1일, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일 또는 그 이상의 기간 간격이 있다. 이러한 임의의 방법에서, 방법은 염기 편집기 시스템의 유효량의 둘 이상의 용량을 투여하는 단계를 포함할 수 있다.
본원에서 고려되는 약학적 조성물의 투여는 주입, 수혈, 또는 비경구를 포함하는 통상적인 기술을 사용하여 수행될 수 있으나, 이에 제한되지 않는다. 일부 구현예에서, 비경구 투여는 혈관내, 정맥내, 근육내, 동맥내, 경막내, 종양내, 피부내, 복강내, 경피, 피하, 피하, 관절내, 피막하, 지주하 및 비경내로 주입 또는 주사하는 것을 포함한다.
일부 구현예에서, 본원에 기재된 조성물 및/또는 제제(예를 들어, 편집된 세포, 염기 편집기 시스템, 및/또는 항레트로바이러스 약물)는 인간 대상의 체중 킬로그램 당 약 0.5-30 mg의 투여량으로 투여된다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램당 약 0.5-20 mg이다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 0.5-10 mg이다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 0.04 mg, 약 0.08 mg, 약 0.16 mg, 약 0.32 mg, 약 0.64 mg, 약 1.25 mg, 약 1.28 mg, 약 1.92 mg, 약 2.5 mg, 약 3.56 mg, 약 3.75 mg, 약 5.0 mg, 약 7.12 mg, 약 7.5 mg, 약 10 mg, 약 14.24 mg, 약 15 mg, 약 20 mg, 또는 약 30 mg이다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 1.92 mg, 약 3.75 mg, 약 7.5 mg, 약 15.0 mg, 또는 약 30.0 mg이고, 조성물은 주 2회 투여된다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 1.28 mg, 약 2.56 mg, 약 5.0 mg, 약 10 mg, 또는 약 20 mg이고, 조성물은 주 2회 투여된다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 1.92 mg, 약 3.75 mg, 약 7.5 mg, 약 15.0 mg, 또는 약 30.0 mg이고, 조성물은 주 1회 투여된다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 1.28 mg, 약 2.56 mg, 약 5.0 mg, 약 10 mg, 또는 약 20 mg이고, 조성물은 주 1회 투여된다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 1.92 mg, 약 3.75 mg, 약 7.5 mg, 약 15.0 mg, 또는 약 30.0 mg이고, 조성물은 1일 1회로 7일 기간에 3, 5 또는 7회 투여된다. 다른 구현예에서, 조성물은 1일 1회, 7일 기간에 7회 정맥내 투여된다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상의 체중 킬로그램 당 약 1.28 mg, 약 2.56 mg, 약 5.0 mg, 약 10 mg, 또는 약 20 mg이고, 조성물은 1일 1회로 7일 기간에 3, 5 또는 7회 투여된다. 다른 구현예에서, 조성물은 1일 1회, 7일 기간에 7회 정맥내 투여된다.
일부 구현예에서, 조성물은 약, 적어도 약, 또는 약 미만의 기간에 걸쳐 실질적으로 순간적으로(예를 들어, 조성물이 주사제로서 투여되는 경우일 수 있는 바와 같이, 1초 미만의 기간에 걸쳐) 1초, 10초, 30초, 1분, 0.1시간, 0.25시간, 0.5 시간, 1시간, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 또는 12시간에 걸쳐 투여된다. 또 다른 구현예에서, 조성물은 0.25 내지 2시간의 기간에 걸쳐 투여된다. 또 다른 구현예에서, 조성물은 1시간에 걸쳐 점진적으로 투여된다. 또 다른 구현예에서, 조성물은 2시간에 걸쳐 점진적으로 투여된다.
HBV 감염의 치료 방법
본 발명은 본원에 기재된 염기 편집기 시스템(예를 들어, 염기 편집기 및 gRNA)을 암호화하는 폴리뉴클레오티드를 포함하는 치료 유효량의 약학적 조성물을 대상(예를 들어, 인간과 같은 포유류)에게 투여하는 단계를 포함하는 HBV 감염 또는 이의 증상을 치료하는 방법을 제공한다. 일부 구현예에서, 염기 편집기는 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 도메인 또는 시티딘 데아미나아제 도메인을 포함하는 융합 단백질이다. 대상의 세포는 염기 편집기 및 HBV 폴리펩티드를 암호화하는 핵산 서열의 A·T에서 G·C로의 변경(세포가 아데노신 데아미나아제 도메인으로 형질도입된 경우) 또는 C·G에서 U·A로의 변경(세포가 시티딘 데아미나아제 도메인으로 형질도입된 경우)에 영향을 미치도록 염기 편집기를 표적으로 하는 하나 이상의 가이드 폴리뉴클레오티드로 형질도입된다.
일부 구현예에서, 만성 B형 간염의 치료는 접근법의 조합을 포함한다. 예를 들어, HBV에 감염된 대상에게 HBV cccDNA를 표적화하고 변형시키는 상술된 치료 유효량의 약학적 조합이 투여될 수 있다. 예를 들어, UGI 도메인이 없는 BE4 염기 편집기는 HBV 게놈의 영역을 표적으로 하는 gRNA와 함께 사용될 수 있다. 이론에 얽매이지 않고, 억제제를 생략하면 C->U 탈아미노화는 HBV cccDNA를 손상시키는 우라실 글리코실라제에 민감하게 되어, 이를 불안정하게 만든다. 이 치료는 본원에 기재된 염기 편집기 및 가이드 RNA를 사용하여 HBV 게놈의 S 또는 pol 유전자를 표적으로 하는 것과 같이,(통합된 HBV DNA에서를 포함하는)HBsAg 발현을 감소시키거나 억제하는 치료와 조합될 수 있다. 치료는 또한 면역계를 자극하는 단계를 포함할 수 있다. 일부 구현예에서, 이러한 세 가지 별도의 치료 목표 각각은 본원에 기재된 염기 편집 시약 및 기술을 사용하여 성취될 수 있다.
본원의 방법은 본원에 기재된 유효량의 조성물을(이러한 치료를 필요로 하는 것으로 식별된 대상을 포함하는)대상에게 투여하는 것을 포함한다. 이러한 치료를 필요로 하는 대상을 식별하는 것은 대상 또는 건강 관리 전문가의 판단에 따를 수 있고 주관적(예를 들어 의견) 또는 객관적(예를 들어 테스트 또는 진단 방법에 의해 측정 가능)일 수 있다.
본 발명의 치료 방법은 일반적으로 예를 들어, 이를 필요로 하는 대상(예를 들어, 인간)에게 관심 HBV 유전자를 표적으로 하는 염기 편집기 및 gRNA를 암호화하는 벡터를 포함하는 치료 유효량의 약학적 조성물을 투여하는 것을 포함한다. 이러한 치료는 HBV 감염을 앓고 있거나, 이를 가지고 있거나, 이에 취약하거나, 또는 이에 대한 위험이 있는 대상, 특히 인간에게 적합하게 투여될 것이다. 본원의 조성물은 또한 HBV 감염에 연루될 수 있는 임의의 다른 장애의 치료에 사용될 수 있다.
일 구현예에서, 본 발명은 치료 경과를 모니터링하는 방법을 제공한다. 방법은 HBV 감염과 연관된 장애 또는 이의 증상을 앓고 있거나 또는 취약한 대상에서 진단 마커(Marker)(예를 들어, 바이러스 부하) 또는 진단 측정(예를 들어, 스크린, 분석)의 수준을 결정하는 단계를 포함하며 여기서 대상에게 질환 또는 이의 증상을 치료하기에 충분한 본원의 치료량의 조성물이 투여되었다. 방법에서 결정된 마커의 수준은 건강한 정상 대조군 또는 대상의 질환 상태를 확립하도록 이환된 다른 환자에서 마커의 알려진 수준과 비교될 수 있다. 바람직한 구현예에서, 대상에서 마커의 제2 수준은 제1 수준의 결정보다 나중 시점에 결정되고, 2 개의 수준은 질환 과정 또는 요법의 효능을 모니터링하기 위해 비교된다. 특정 바람직한 구현예에서, 대상체에서 마커의 치료전 수준은 본 발명에 따른 치료를 시작하기 전에 결정된 다음; 마커의 이 치료전 수준은 치료의 효능을 결정하기 위해 치료 시작 후 대상에서 마커의 수준과 비교될 수 있다.
키트
본 발명은 HBV 감염, 뿐만 아니라 대상에서의 간경변, 간세포 암종[HCC], 및 HBV 감염과 연관되거나 또는 이로 인한 임의의 다른 질환을 포함하는 관련 질환 또는 장애를 치료하는 방법을 제공한다. 일부 구현예에서, 키트는 염기 편집기 시스템 또는 염기 편집기 시스템을 암호화하는 폴리뉴클레오티드를 더 포함하되, 염기 편집기 폴리펩티드 시스템은 핵산 프로그래밍 가능한 DNA 결합 단백질[napDNAbp], 데아미나아제, 및 가이드 RNA이다. 일부 구현예에서, napDNAbp는 Cas9 또는 Cas12이다. 일부 구현예에서, 염기 편집기를 암호화하는 폴리뉴클레오티드는 mRNA 서열이다. 일부 구현예에서, 데아미나아제는 시티딘 데아미나아제 또는 아데노신 데아미나아제이다. 일부 구현예에서, 키트는 편집된 세포 및 그러한 세포의 사용에 관한 설명서를 포함한다.
키트는 염기 편집기 시스템 및/또는 편집된 세포를 사용하기 위한 서면 설명서를 더 포함할 수 있다. 다른 구현예에서, 설명서는 다음 중 적어도 하나를 포함한다: 예방책; 경고; 임상 시험; 및/또는 참고 문헌. 설명서는 용기(존재하는 경우)상에 직접 인쇄되거나, 또는 용기에 부착된 라벨로, 또는 용기 내에 또는 용기와 함께 공급되는 별도의 시트, 팜플렛, 카드, 또는 폴더로 인쇄될 수 있다. 추가 구현예에서, 키트는 적합한 작동 매개변수에 대한 라벨 또는 별도의 삽입물(패키지 삽입물) 형태의 설명서를 포함할 수 있다. 또한 또 다른 구현예에서, 키트는 검출, 보정, 또는 정규화를 위한 표준(들)으로 사용될 적절한 양성 및 음성 대조군 또는 대조군 샘플이 있는 하나 이상의 용기를 포함할 수 있다. 키트는 약학적으로 허용되는 완충제, 예컨대(살균된) 포스페이트 완충 염수, 링거 용액, 또는 덱스트로스 용액을 포함하는 제2 용기를 추가로 포함할 수 있다. 다른 완충제, 희석제, 충전제, 바늘, 주사기, 및 사용 설명서가 있는 패키지 삽입물을 포함한 상업적 및 사용자 관점에서 바람직한 다른 물질을 더 포함할 수 있다.
본 발명의 실행은, 달리 명시되지 않는 한, 분자 생물학(예컨대 재조합 기술), 미생물학, 세포 생물학, 생화학 및 면역학의 통상적인 기술을 활용하는데, 이들은 당업자의 영역에 잘 알려져 있다. 이러한 기술은 문헌[“Molecular Cloning: A Laboratory Manual”, second edition(Sambrook, 1989)]; 문헌["Oligonucleotide Synthesis"(Gait, 1984)]; 문헌["Animal Cell Culture"(Freshney, 1987)]; 문헌[“Methods in Enzymology” “Handbook of Experimental Immunology”(Weir, 1996)]; 문헌[“Gene Transfer Vectors for Mammalian Cells”(Miller and Calos, 1987)]; 문헌[“Current Protocols in Molecular Biology”(Ausubel, 1987)]; 문헌[“PCR: The Polymerase Chain Reaction”,(Mullis, 1994)]; 문헌[“Current Protocols in Immunology”(Coligan, 1991)]과 같은 문헌에 충분히 설명되어 있다. 이러한 기술은 본 발명의 폴리뉴클레오티드 및 폴리펩티드의 생산에 적용가능하고, 그럼으로써, 본 발명을 실현 및 실행할 때 고려될 수 있다. 특정 구현예의 경우 특히 유용한 기술이 다음 섹션에서 논의될 것이다.
다음 실시예들은 당업자에게 본 발명의 분석, 스크리닝 및 처리 방법을 실행하고 이용하는 방법에 대한 완전한 개시 및 설명을 제공하기 위해 제시되었고, 본 발명의 발명가들이 그들의 발명으로 간주하는 것의 범위를 제한하기 위한 것이 아니다.
실시예
실시예 1: HBV 게놈의 표적화된 염기 편집은 HBV 게놈에서 전사 개시 부위에서의 과오 돌연변이 또는 변경을 초래하였다.
가이드 RNA(표 1 및 2 참조)는 HBV 유전자의 보존된 영역에서 과오 돌연변이 또는 전사 부위 핵염기 변경을 도입하기 위해 Cas12b-ABE 염기 편집기를 표적화하도록 컴퓨터 모의시험으로 설계하였다(표 20A 참조). HBV 유전자형 D, 하위유전자형 ayw를 Benchling Software에서 이용가능한 CRISPR 설계 도구를 사용하여 분석하여 잠재적인 가이드 RNA를 식별하였고, 모든 HBV 유전자형에 걸친 서열 보존 수준을 각 가이드 RNA에 대해 결정하였다. 13 개의 가이드 RNA를 테스트를 위해 선택하였다(표 1 및 2). 이러한 가이드 RNA는 RTTN PAM 서열에 인접하거나 또는 근접하였다. 비교의 목적을 위해, 도 4에 표시된 추가 염기 편집기 시스템을 평가하였다. 추가 염기 편집기 시스템은 NGG-ABE8.8-m, Cas12b-ABE, VRQR-ABE 또는 NGC-ABE 염기 편집기 및 표 1에 나열된 가이드 RNA를 함유하였다. 이들 추가 염기 편집기 시스템에 의해 표적화된 서열의 HBV 게놈에 걸친 보존뿐만 아니라 추가 염기 편집기에 의해 영향을 받은 염기 편집으로부터 초래되는 기능적 변화를 아래 표 20B 및 20C에 제공한다.
gRNA는 유전자형 D 및 A에 초점을 맞추어, HBV 유전자형에 걸친 높은 보존성을 기반로 선택하였다. 이러한 고도로 보존된 영역을 표적으로 하는 설계 전략은, 보다 넓은 환자 집단을 표적으로 하기에 적합하고 HBV 바이러스가 염기 편집 처리를 회피할 수 있게 하는 바이러스 돌연변이의 출현을 피하는 gRNA가 설계되도록 하였다.
과오 돌연변이를 도입하기 위한 gRNA의 설계에서 사용된 선택 기준은 과오 돌연변이로 이어지는 HBV 게놈에서 편집을 생성하는 능력이었다. 또한, 염기 편집 시약에 의해 생성된 아미노산 변화의 컴퓨터 모의시험 분석, 및 자연 발생 HBV 게놈에서 거의 검출되지 않는 서열을 갖는 과오 아미노산 변화를 생성하는 gRNA를 선택하였다(0.05% 미만의 아미노산 변화 빈도). 이 전략은 gRNA가 HBV 단백질/게놈의 파괴를 초래하는 돌연변이를 도입할 가능성을 증가시켰다.
[표 20A] 가이드 RNA에 의해 표적화된 서열의 HBV 게놈에 걸친 보존.
[표 20B] 가이드 RNA에 의해 표적이 된 서열의 HBV 게놈에 걸친 보존, 가이드 RNA와 연관된 편집 효율, 및 가이드 RNA를 함유하는 염기 편집 시스템에 의해 수행된 게놈 변경과 연관된 기능 변화
[표 20C] 가이드 RNA에 의해 표적화된 서열의 HBV 게놈에 걸친 보존.
유전자 편집 효율을 다음과 같이 평가하였다. 플라스미드 형질감염을 위해, 가이드 RNA를 암호화하는 벡터 및 염기 편집기를 암호화하는 벡터를 HBV 게놈을 포함하는 렌티바이러스 벡터(즉, Hek293-렌티HBV 시스템)로 이전에 형질도입된 HEK293T 세포 내로 일시적으로 형질감염시켰다. 염기 편집기는 Cas12b-ABE(bhCas12b-ABE8.13 D952A,_S893R,_K846R,_E837G)였다.
250 ng의 gRNA 플라스미드 및 750 ng의 염기 편집기 플라스미드를 사용하여 3:1 비율로 Hek293 세포에 대해 최적화된 고효율, 저독성 DNA 형질감염 시약(Mirus TransIT293 또는 리포펙타민 2000)을 사용하여 형질감염을 수행하였다. 플라스미드 형질감염의 경우 4 일 후, 게놈 DNA를 0.05% SDS, 25 ㎍/ml 프로테이나제 K, 및 10 mM Tris pH 8.0의 단순 용해 완충액으로 추출한 후, 85 ℃에서 열 불활성화시켰다. 게놈 부위를 PCR 증폭시키고 MiSeq에서 서열분석하였다. 각 gRNA에 대해 결정된 편집 효율은 아래 표 21도 4에 제시되어 있다.
[표 21] 염기 편집 효율.
가이드 cas12b-4, cas12b-5, cas12b-11, cas12b-17, cas12b-30, cas12b-42, cas12b-100, cas12b-147, 및 cas12b-154는 그들 각각의 표적 서열에 과오 돌연변이를 도입하기 위해 염기 편집기를 표적으로 하였다(표 2A 참조). 가이드 cas12b-35는 인핸서 II 박스 A에 핵염기 변경을 도입하기 위해 염기 편집기를 표적으로 하였다. 가이드 cas12b-124 및 cas12b-127은 각각 인핸서 I에 핵염기 변경을 도입하기 위해 염기 편집기를 표적으로 하였다. 가이드 cas12b-122b는 HBX 프로모터에 핵염기 변경을 도입하기 위해 염기 편집기를 표적으로 하였다.
실시예 2: 염기 편집기 시스템의 항바이러스 및 편집 효능
실시예 1에서 평가된 가이드 RNA를 비교하는 염기 편집기 시스템을 B형 간염 바이러스-일차 인간 간세포[Hepatitis B virus-primary human hepatocyte, HBV-PHH] 시스템을 사용하여 항-바이러스 및 편집 효능에 대해 후속으로 시험하였다. 실시예 1에 기재된 바와 같이 염기 편집기를 암호화하는 가이드 RNA 및 mRNA로 세포를 형질감염시켰다. 이는 비처리 대조군에 비해 모든 HBV 마커가 강력하게 감소된 것으로 나타난 바와 같이, ABE-133, ABE-41, MSPbeam94, ABE-85, PolyA-NGC1, PolyA-NGC2, Cas12b-11, 및/또는 Cas12b-152 가이드 RNA를 포함하는 염기 편집기 시스템이 공유결합폐환형 HBV DNA[cccDNA]을 효과적으로 편집하고/편집하거나 HBV-PHH 시스템에서 바이러스 복제를 감소시켰다는 것을 확인하였다(도 5A-5C표 22). 가이드 RNA ABE-133, MSPbeam94 및 ABE-85는 대조군과 비교하여 HBV DNA의 70-80% 감소와 연관되었다. 가이드 RNA인 PolyA-NGC1 및 PolyA-NGC2는 높은 편집 효과에 이어 HbeAg의 감소에서 90% 효능과 연관되었다.
[표 22] 표시된 가이드 RNA와 연관된 염기 편집 효율
B형 간염 바이러스를 연구하기 위한 HBV-PHH 시스템은, 예를 들어, 문헌[Winer, et al., “Long-term hepatitis B infection in a scalable hepatic co-culture system,” Nat. Commun. 8:125(2017)] 및 문헌[Zhou, et al. “Long-term maintenance of human fetal hepatocytes and prolonged susceptibility to HBV infection by co-culture with non-parenchymal cells,” J. Virol Methods, 195:185-93(2014)]에 기재되고, ImQuest BioSciences(imquestbio.com/programs/virology/hbv/)에 의해 상업적으로 제공된다.
실시예 3: gRNA 다중화는 HepG2-NTCP 세포에서 HBV 바이러스 매개변수를 감소시켰다
HBV 감염 세포를 치료하는 데 효과적인 가이드 RNA의 조합을 확인하기 위해 표 1에 나열된 가이드 RNA를 사용하여 실험을 완료했다. HepG2-NTCP 세포를 BE4를 암호화하는 mRNA 및 gRNA12, gRNA37, gRNA19, gRNA190 및 gRNA40에서 선택된 가이드 RNA(들)로 형질감염시켰다. HepG2-NTCP 세포는 문헌[Sun, et al "NTCP-Reconstituted In Vitro HBV Infection System," Methods Mol. Biol. 1540:1-14(2017), DOI: 10.1007/978-1-4939-6700-1_1]에 기재되어 있고, 이의 개시는 모든 목적을 위해 본원에 전체가 참조로 포함된다. 세포를 0일 차에 HBV로 감염시킨 다음, 4일 차에 mRNA 및 gRNA(들)로 형질감염시켰고, 도 6을 참조한다. HBsAg, HBeAg, 총 HBV DNA, 및 3.5 kb 바이러스 DNA의 측정을 14일 차에 수행하였고, 도 6을 참조한다. 가이드 RNA, gRNA37, 표적화된 HBsAg 및 gRNA40은 HBV 코어 단백질을 표적으로 하였고, 도 7을 참조한다. gRNA37의 사용은 HBsAg 수준의 감소와 연관되었고, gRNA40의 사용은 HBeAg 수준의 감소와 연관되었고, 도 8을 참조한다. 또한, 각각의 gRNA37 및 gRNA40은 총 HBV DNA 및 3.5 kb RNA 수준의 저하와 연관되었다. 도 8에 나타낸 바와 같이, 가이드 RNA gRNA37 및 gRNA40은 특히 효과적인 gRNA로 확인되었다.
효과적인 gRNA로서 gRNA37 및 gRNA40을 확인한 후, BE4, gRNA37 및 gRNA40을 함유하는 염기 편집기 시스템(즉, gRNA 다중화)의 항바이러스 효능을 평가하였다.도 8-10 두 개의 gRNA와 다중화된 염기 편집기 시스템이 HepG2-NTCP 세포에서 HBV 바이러스 매개변수의 감소와 관련이 있다는 것이 확인되었고, 도 9를 참조한다. 도 10에서 보여진 바와 같이, 염기 편집기 시스템은 cccDNA 수준을 감소시키지 않고 cccDNA 편집을 통해 기능하였으며,(gRNA37 및 gRNA40이 함유된)염기 편집기 시스템은 강력한 cccDNA 편집(gRNA37에 대해 약 38% 및 gRNA40에 대해 약 60%)과 연관되었다. cccDNA의 편집을 평가하기 위해, cccDNA를 Hirt 추출 및 ExoI/ExoIII 뉴클레아제 처리를 통해 농축시켜 rcDNA(이완된 원형 DNA[relaxed circular DNA])를 제거하였다. 본원에 제공된 실시예 전반에 걸쳐, cccDNA의 편집은 이러한 방식으로 농축된 cccDNA를 사용하여 완료된 차세대 서열분석을 사용하여 평가하였다. 따라서, HBV 게놈을 변형시키기 위해 염기 편집기(예를 들어, BE4)와 조합하여 다수의 서로 다른 gRNA 분자(예를 들어, gRNA37 및 gRNA40)를 투여하는 것이 관찰된 항바이러스 효과 면에서 유리하다는 것이 입증되었다.
실시예 4: 라미부딘 처리와 조합된 염기 편집의 항바이러스 효능
본원에 기재된 염기 편집기 시스템을 라미부딘과 같은 항바이러스 약물(구체적으로, 항레트로바이러스 약물)과 조합하면 어떤 이점이 있을 수 있는지 확인하기 위한 실험을 수행하였다.
먼저, 실험은 도 11에 제공된 개략도에 설명된 바와 같이 수행되었다. HepG2-NTCP 세포를 0일 차에 HBV로 감염시키고, 4일 차에 라미부딘으로 8일간 처리를 시작하고(총 8일 중 3일간의 전처리 기간을 포함), 7일 차에 BE4를 암호화하는 mRNA 및 gRNA 37 및 40으로 세포를 형질감염시키고, 15일 차에 측정을 수행하였다. 도 12 및 13에 나타낸 바와 같이, 라미부딘을 사용한 3일간의 전처리(총 처리 기간 8일)는 약 20%의 염기 편집에서의 개선과 연관된 것을 발견하였다(도 12). 이론에 얽매이지 않고, 라미부딘으로 전처리하면 중간체 HBV DNA 종이 제거되고 cccDNA만 남는다. 이러한 개선은 HepG2-NTCP 세포에서 높은 항바이러스 효능과 더 관련이 있다. 이론에 얽매이지 않고, 라미부딘 전처리된 조건에서 높은 공유결합폐환형 DNA[cccDNA] 편집은 cccDNA를 직접 표적으로 하는 염기 편집기 시스템과 일치한다. gRNA38 및 gRNA40의 조합으로 처리하는 것은 HBV 바이러스 마커의 강력한 감소를 이끌어낸다(도 13).
실시예 5: 염기 편집기는 항바이러스제보다 효과적이다
HBV 감염이 라미부딘과 같은 항레트로바이러스 약물을 사용하여 치료될 수 있다는 것을 고려할 때, 라미부딘으로 처리하는 것에 비한 염기 편집기 시스템의 효능을 결정하기 위한 실험을 수행하였다.
실험 설계는 도 14에 개략적으로 기재된다. 일차 인간 간세포[PHH] 세포를 0일 차에 HBV로 감염시켰다. 4일 차 및 11일 차에, 세포를 BE4를 암호화하는 mRNA를 gRNA37 및 gRNA40으로 형질감염시켰다. 시간 경과에 따라 HBV DNA의 측정을 수행하였고, HBsAg, HBeAG, HBV 총 DNA, 3.5 kb RNA, 및 cccDNA 편집의 측정은 25일 차에 수행하였다. 실험은 PhoenixBio에서 입수가능한 PHH 공동 배양 시스템을 사용하여 수행하였다. PHH 공동 배양 시스템은 30일 이상 동안 간세포 분화 및 대사 활성을 유지하였다. 세포에서 HBV 감염은 지속적이었고 cccDNA 수준은 유지되었다.
도 16에 나타낸 바와 같이, HBV는 라미부딘의 중단 후 반등하였지만, HBV는 염기 편집 시약을 사용한 2차 형질도입 후 적어도 2주 동안 반등하지 않았다. 또한, 염기 편집기 시스템으로 형질감염된 세포는 모든 HBV 마커에서 25일 차에 약 70% 및 약 80% 사이의 감소를 나타냈고, 도 15를 참조한다. 따라서, BE4 및 두 개의 가이드 RNA(gRNA37 및 gRNA40)를 함유하는 염기 편집기 시스템은 항레트로바이러스 약물로 치료하는 것보다 HBV 감염을 제어하는데 더 효과적이었다.
또한, 염기 편집기 시스템은 S 항원 부위에서 약 30% 및 프리코어 유전자 부위에서 약 60%의 편집 효율과 관련되었고,도 17을 참조한다. 이러한 편집 수준은 높은 항바이러스 효능을 가능하게 하고 일차 인간 간세포[PHH] 세포에서 HBV의 반등을 방지하기에 충분하다.
시토신 염기 편집은 관련 시험관내 시스템에서 HBV 바이러스 마커의 gRNA 특이적 감소를 초래하였다. 다중 편집은 HepG2-NTCP 세포 및 일차 간세포에서 HBsAg, HBeAg, HBV DNA 및 3.5 kb RNA의 동시 감소로 이어졌다. 이론에 얽매이지 않고 바이러스 표지자의 감소는 cccDNA의 염기 편집에 의해 유도되었을 가능성이 있지만 cccDNA 수준의 감소는 아니다. 염기 편집 시약과 표준 항바이러스 라미부딘을 조합하여 세포를 처리하는 것은 더 높은 염기 편집 효율을 초래하였다. 염기 편집은 감염된 일차 간세포에서 HBV 반등의 방지와 연관되었다. 이론에 얽매이지 않고, 시토신 염기 편집은 임상적으로 관련된 시험관내 모델에서 HBV 반등을 방지하는 cccDNA에 영구 돌연변이를 도입했다.
실시예 6: 일차 간세포에서 라미부딘이 염기 편집 효율에 미치는 영향
BE4 및 gRNA 37 및 40을 함유하는 염기 편집 시스템을 사용하여 염기 편집에 대한 항레트로바이러스 약물 라미부딘의 영향을 추가로 조사하기 위한 실험을 수행하였다.
실험 설계는 도 18에 개략적으로 기재하였다. 일차 인간 간세포[PHH] 세포를 0일 차, 4일 차 및 8일 차에 HBV로 감염시켰다. 라미부딘을 사용한 처리를 시작하고(총 8일 중 3일간의 전처리 기간을 포함), 세포를 7일 차및 14일 차에 BE4를 암호화하는 mRNA 및 gRNA gRNA37 및 gRNA40으로 형질감염시켰다. HBV DNA 수준을 시간 경과에 따라 측정하고, 추가 HBV 마커를 21일 차에 측정하였다.
라미부딘 전처리는 일차 간세포에서 편집을 개선했고, 도 19 및 20을 참조한다. 염기 편집기 시스템 및 라미부딘을 조합한 처리는 HBV 반등을 방지했고, 도 19를 참조한다. 도 21에 나타낸 바와 같이, 단독 염기 편집기 시스템의 병용 처리 및 투여는 둘 다 21일 차에 HBV 마커의 약 70% 및 80% 사이의 감소를 초래하였다.
실시예 7: 표적외 활성이 감소된 염기 편집기의 염기 편집 효율 및 항바이러스 효능
편집 효율을 손상시키지 않으면서(예를 들어, BE4에 비해) 표적외 활동을 감소시키고 비특이적 효과를 낮추는 염기 편집기를 사용하는 것이 유리할 수 있다. 따라서, ppApo 또는 rrA3F를 함유하는 염기 편집기 시스템의 항바이러스 효능을 평가하기 위한 실험이 수행되었으며, 이는 문헌[Yu, et al. "Cytoxine base editors with minimized unguided DNA and RNA off-target events and high on-target activity," Nature Communications, 11:2052(2020), DOI: 10.1038/s41467-020-15887-5]에 기재되어 있고, 이의 개시는 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
이는 도 22 및 23에 나타낸 바와 같이, BE4, ppApo, 또는 rrA3F 및 gRNA37 및 gRNA40을 함유하는 염기 편집기 시스템은 비슷한 편집 효율을 가졌고, HBV 마커 HBsAg의 감소와 연관이 있다는 것을 발견하였다.
실시예 8: 시토신 염기 편집은 B형 간염 바이러스 복제를 억제하고 시험관내 및 생체내에서 HBsAg 발현을 감소시켰다.
두 개의 서로 다른 gRNA를 사용하여 HBV 유전자(예를 들어, HBs, 및 프리코어)에서 종결 코돈을 도입하기 위해 염기 편집 전략이 고안되었다. 이러한 접근법의 항바이러스 효능은 두 개의 상이한 HBV-감염 세포 모델인 HepG2-NTCP 및 일차 인간 간세포에서 시험관내에서 평가되었다. HepG2-NTCP 및 일차 인간 간세포를 CBE BE4를 암호화하는 mRNA와 gRNA37 및 gRNA40으로 형질감염시켰다. 이러한 형질감염은 강력한 cccDNA 편집(예를 들어, B형 간염 표면 항원[HBsAg]을 암호화하는 유전자에서 최대 50% 편집 및 프리코어 유전자에서 최대 80% 편집)을 초래하여, 암호화된 바이러스 마커의 감소를 초래하다. CBE mRNA 및 두 gRNA로의 형질감염은 HBsAg, HBV 바이러스 단백질인 HBeAg, 3.5kb 바이러스 RNA, 및 총 세포내 HBV DNA 각각에서 지속적인 감소를 초래하였다. HBsAg, HBeAg, 3.5kb 바이러스 RNA, 및 총 세포내 HBV DNA에서의 이러한 유의한 감소는 CBE 및 gRNA가 단일 처리로서 투여되었을 때 및 이들이 뉴클레오시드 유사체와 조합하여 사용되었을 때 관찰되었다.
시험관내에서 이러한 염기 편집 시약의 효능을 확립한 후, HBV 미니서클 마우스 모델을 사용하여 생체내에서 항바이러스 효능에 대한 이러한 동일한 염기 편집 시약을 평가하기 위한 실험을 수행하였다. 이러한 생체내 모델은 cccDNA-유사 플라스미드를 사용한 유체역학적 주입에서 초래된 지속적인 HBV 복제 및 항원 발현을 나타낸다. HBV 바이러스 복제를 확립한 후, 염기 편집 시약의 간 전달은 다음 염기 편집 시약으로 제형화된 지질 나노입자[LNP]의 전신 투여를 통해 수행하였다: CBE mRNA 및 HBV-표적화 gRNA[예를 들어, gRNA37 및 gRNA40(표 1을 참조한다)]. 마우스에 염기 편집기의 조합물을 투여하였고, 조합물은 gRNA37 및 gRNA40 또는 gRNA37-HM 및 gRNA40-HM이었다. 가이드 gRNA37-HM 및 gRNA40-HM은 각각 중증 변형된[HM] 스캐폴드를 포함하였다(표 1 참조).
염기 편집 시약을 함유하는 지질 나노입자[LNP]의 정맥내 주사는 마우스 혈청 HBV DNA, HBsAg 및 HBeAg의 유의한 감소를 초래하였다. 이러한 감소는 첫 번째 주사를 실행하고 2주 후에 두 번째 주사를 실행했을 경우 더 두드러졌다(도 24a-24c 및 25a-25c). 2mg/kg의 BE4/gRNA(37+40) LNP를 두 번 주사하면 마우스 혈청에서 HBsAg 및 HBV DNA의 대략 2 로그 감소 및 검출할 수 없는 수준의 HBeAg를 초래하였다. 중증 변형된 스캐폴드가 있는 가이드 RNA를 투여하는 것이 유익하다는 것이 또한 밝혀졌다(예를 들어, 도 25a를 참조한다). 1일 차 및 14일 차에 BE4/gRNA(37+40)-HM(Heavy mod. gRNA)을 투여한 마우스는 또한 대조군과 비교하여 HBsAg에서 대략 2 log 감소를 나타냈다. 염기 편집 시약을 이용한 모든 단일 용량(즉, D1에서만) 및 이중 용량(즉, D1 및 D14에서) 치료는 2주 후 HBeAg가 검출 수준 이하로 감소를 유도하였다. 엔테카비르 또는 염기 편집 시약으로 처리된 마우스는 21일 차에 HBV DNA의 혈청 수준에서 약 2 log 감소를 보였다.
아래 표 23은 생체내에서 염기 편집 시약을 평가하는 데 사용되는 실험 설계의 요약을 제공한다. 마우스는 생체내에서 HBV 복제를 가능하게 하는 HBVcircle 폴리뉴클레오티드를 함유하였다. 예를 들어, 예시적인 마우스 모델의 설명을 위해 문헌(Yan et al., J. Hepatol 2017 66:1149-1157)을 참조한다. 마우스에게 BE4를 암호화하는 mRNA(시티딘 염기 편집기) 및 가이드 RNA gRNA37 및 gRNA40 또는 중증 변형[HM]을 갖는 스캐폴드를 함유하는 가이드 RNA gRNA37-HM 및 gRNA-40-HM을 함유하는 지질 나노입자(BL4 LNP)를 투여하였다. 염기 편집 시약을 사용한 치료의 효능을 엔테카비르를 사용한 치료의 효능과 비교하였다. 마우스에게 1일 차부터 14일 차까지 매일 엔테카비르를 투여하거나, 마우스에게 염기 편집 시약을 1일 차에 한번만 투여하거나 두 번 투여했는데, 제1 투여는 1일 차에, 제2 투여는 14일 차였다. 엔테카비르(ETV)를 경구 투여하였다. 혈청내 HBsAg, HbeAg 및 HBV DNA 수준을 매주 측정하였다(도 24a-24c 및 25a-25c).
[표 23] 생체내 염기 편집 시약을 평가하기 위한 실험 설계.
'LNP'는 '지질 나노입자'를 가리키고, 그룹 1은 처리되지 않은 마우스에 해당하고, 'D1'은 '1일'을 가리키고, 'D14'는 '14일'을 가리키고, '일정'은 투여일을 가리키고, 'ETV'는 '엔테카비르'를 가리키고, 'BE'는 '염기 편집기'를 가리키고, 'x2'는 두 개의 상이한 날(즉, D1 및 D14)에서의 투여를 가리키고, 'gRNA(37+40)'는 gRNA37과 gRNA40의 조합을 가리키고, 'gRNA(37-40)-HM'은 gRNA37-HM과 gRNA-40-HM의 조합을 가리키고, BL4는 지질 나노입자 제형을 나타낸다. 음성 대조군으로 마우스 PCSK9(mus.PCSK9)를 표적으로 하는 가이드를 사용하였다.
요약하면, 데이터는 염기 편집이 HBV 복제를 폐지하는 돌연변이를 도입하고 바이러스 단백질 발현을 침묵시킴으로써 cccDNA를 불활성화할 수 있음을 나타낸다.
실시예 9: 시토신 염기 편집에 의한 B형 간염 바이러스 게놈 저장소의 기능적 불활성화
HBV 게놈의 보존된 영역을 표적으로 하는 gRNA를 설계하고 스크리닝하였다(도 26a 및 26b). 흥미롭게도, BE4 및 다음의 gRNA를 이용한 염기 편집은 다음과 같다:
gRNA S1(gRNA H) 프로토스페이서: GAAAGCCCAGGATGATGGGA
gRNA C2(gRNA B) 프로토스페이서: CCATGCCCCAAAGCCACCCA
gRNA EMSbeam12 프로토스페이서: GACTTCTCTCAATTTTCTAG
일차 인간 간세포에서 HBV 반등을 방지하였다(도 27a-d). 종결 코돈을 도입하는 두 개의 gRNA를 CBE와 다중화하는 것은 HepG2-NTCP(도 28a-d) 및 일차 인간 간세포에서 HBsAg, HBeAg, HBV DNA 및 3.5kb RNA를 감소시켰다. 염기 편집은 자연적으로 통합된 HBB로부터 HBs를 감소시켰다(도 29a-c). 이론에 얽매이려는 의도 없이, 바이러스 마커의 감소는 cccDNA 수준에 영향을 미치지 않으면서 cccDNA의 염기 편집에 의해 유도될 가능성이 있다. 도 30a-c에 나타낸 바와 같이, 염기 편집은 자연적으로 통합된 HBV에서 HBs를 크게 감소시켰다. 편집 시약을 표준 항바이러스 3TC(라미부딘)로 조합 처리하는 것은 더 높은 염기 편집 효율의 검출을 초래하였다.
실시예 10: 시토신 염기 편집은 B형 간염 바이러스 복제를 억제하고 시험관내 및 생체내에서 HBsAg 발현을 감소시켰다.
실시예 9의 gRNA를 BE4 염기 편집기와 다중화하는 것은 HepG2-NTCP에서 HBV 바이러스 매개변수를 동시에 감소시켰다(도 31a-e). 염기 편집기는 cccDNA 수준을 감소시키지 않고 cccDNA 편집을 통해 기능한다. 염기 편집은 일차 인간 간세포[PHH]에서 바이러스 반등을 방지했다(도 32a-c).
BE4 mRNA 및 gRNA S1/C2의 지질 나노입자 매개 전달은 HBV 미니서클 뮤린 모델에서 바이러스 마커의 지속적인 감소를 유도한다(도 33a-c). HBV 미니서클 마우스 모델은 면역적격 마우스에서 HBV-유사 바이러스 입자의 내구성 있는 생산 및 HBV 항원 발현을 지원한다. cccDNA-유사 미니서클 플라스미드를 사용한 유체역학적으로 주입하고 4주 후, 염기 편집 시약(지질 나노입자[LNP]로 제형화된 mRNA 및 gRNA, 2mg/kg)을 마우스에 1 또는 2회 용량(2x)을 투여했다. 엔테카비르(ETV) 치료 마우스에게 2주간 항바이러스제 0.03mg/kg을 경구 투여한 후 치료를 중단하였다.
요약하면, HBV 유전자 HBs 및 프리코어에서 종결 코돈을 도입하는 두 개의 gRNA를 CBE와 다중화하는 것은 HepG2-NTCP 및 인간 일차 간세포에서 HBsAg, HBeAg, HBV DNA 및 3.5kb RNA의 동시 감소로 이어진다. 이론에 얽매이려는 의도는 아니지만, 바이러스 마커의 감소는 cccDNA의 염기 편집에 의해 유도될 가능성이 있으나, cccDNA 수준의 감소에 의해서는 유도되지 않는다.
HBV 미니서클 마우스 모델에서 생체내 개념 증명: 2mg/kg의 HBV 표적화 염기 편집기로 제형화된 LNP를 사용한 IV 주사(들)는 HBsAg의 지속적인 감소를 초래하며, 몇몇 마우스는 HBsAg의 손실뿐만 아니라 HBeAg 및 혈청 HBV DNA의 감소를 나타낸다. 요약하면, 데이터는 염기 편집이 HBV 복제를 폐지하는 돌연변이를 도입하고 바이러스 단백질 발현을 침묵시킴으로써 cccDNA를 불활성화할 수 있음을 가리킨다(도 29).
gRNA EMSbeam12 및 MSPbeam37-PLC와 조합된 BE4는 알렉산더 간암 세포주, PLC/PRF/5에 존재하는 자연적으로 통합된 HBV 게놈을 편집하였다(도 34a). 이러한 편집은 HBsAg 분비를 감소시켰다(도 34b).
다음 방법 및 물질이 위의 실시예에서 사용되었다.
HBV 감염 시험을 위한 일차 인간 간세포 시스템
염기 편집기 시스템의 항바이러스 효능을 테스트하기 위해 일차 간세포[PHH] 공동 배양물을 HBV로 감염시켰다. HBV 바이러스에 감염된 일차 간세포 공동 배양물[PHH]은 염기 편집 시스템의 항-바이러스 활성을 평가하기 위해 임상적으로 관련된 시스템이다. 염기 편집 시약[mRNA 및 합성 gRNA를 암호화하는염기 편집기(들)]을 2 주 과정에 걸쳐 2 회 리포펙션을 통해 형질감염시켰다. 제1 형질감염은 감염 후 약 3, 4 또는 7일 차[감염 후 일 수(dpi)]에 수행되었다. 이론에 얽매이지 않고, 이 3 내지 7일의 기간은 형질감염 시점에 cccDNA가 완전히 형성되었음을 보장하였다. 제2 형질감염은 감염 후 약 7, 10, 11, 또는 14일 차에 이루어졌다. 세포외 매개변수(예를 들어, HBsAg, HBeAg, 및 HBV DNA)를 실험 과정에 걸쳐 모니터링하고 세포내 매개변수(HBV DNA, 바이러스 RNA, 및 편집)를 실험이 끝날 때 측정하였다. 세포를 실험 종료시(예를 들어, 15, 17, 21, 또는 25일 차에)에 용해시켰다.
형질감염 세부사항: 제조업체의 프로토콜에 따라 리포펙션(리포펙타민 messengerMax, thermofisher Scientific)을 통해 형질감염된 24 웰 플레이트(염기 편집기-암호화 mRNA 600ng +gRNA 200ng)에서 웰 당 총 RNA 800ng인 RNA 포맷.
실시예 11: 라미부딘(LAM)으로 전처리하거나 전처리하지 않은 간암 세포주 HepG2.2.15의 시험관내 시토신 염기 편집은 HBsAg 및 HBeAg의 수준을 감소시켰다.
라미부딘(LAM)을 전처리한 것과 전처리하지 않은 간암 세포주 HepG2.2.15의 생체내 염기 편집을 평가하기 위한 실험을 수행하였다. HepG2.2.15 세포를 염기 편집하고, 이어서 도 35에 나타낸 실험 계획에 따라 폴리펩티드 발현을 평가하였다. 세포를 0일 차(D0)에 접종하였다. 1일 차(D1)에, LAM으로 전처리된 세포에 대해 LAM 전처리를 시작하였다. 4일 차(D4)에 세포를 LAM이 있거나 없는 새로운 웰로 옮겼다. 5일 차(D5)에 BE4 염기 편집기를 암호화하는 mRNA 및 하나 이상의 가이드 폴리뉴클레오티드 gRNA12(HBs 유전자를 표적으로 하는 EMSbeam12), gRNA37(HBs 유전자를 표적으로 하는 MSPbeam37) 및 gRNA40(HBeAg를 암호화하는 유전자를 표적으로 하는 MSPbeam40)으로 세포를 형질감염시켰다(도 36a 및 36b). 성장 배지는 8일 차(D8)에 교체되었다. 11일 차(형질도입 후 D11 및 6일)에 배양 상청액을 효소 결합 면역흡착 분석을 사용한 분석을 위해 수집하여 HBsAg 및 HBeAg에 대한 발현 수준을 측정하였다. HBs 유전자를 표적으로 하는 가이드 gRNA37 또는 gRNA12를 사용하여 편집된 세포에 대해 HBsAg 발현의 강력한 감소가 관찰되었고, HBeAg를 암호화하는 유전자를 표적으로 하는 가이드 gRNA40을 사용하여 편집된 세포에 대해 HBeAg 발현의 강력한 감소가 관찰되었다. gRNA40 및 gRNA37 둘 다를 사용하여 편집된 세포는 HBsAg 및 HBeAg 둘 다의 발현이 감소되었음을 나타내었다.
다른 구현예
앞선 설명에서, 본원에 기재된 발명을 다양한 용도 및 조건에 채택하기 위해 변형 및 수정이 이루어질 수 있음이 분명해질 것이다. 이와 같은 구현예들은 또한 다음 청구범위에 속한다.
본원의 임의의 변수 정의에 포함된 요소의 목록에 대한 설명은 나열된 요소의 임의의 단일 요소 또는 조합(또는 하위 조합)으로서의 변수 정의를 포함한다. 본원의 구현예의 설명에는 임의의 단일 구현예 또는 그 밖의 기타 구현예들 또는 이들의 일부분과 조합된 구현예가 포함된다.
본 명세서에 언급된 모든 특허 및 간행물은 각각의 독립된 특허 및 간행물이 참조에 의해 통합되는 것으로 구체적이고 개별적으로 표시된 것과 동일한 범위까지 본 명세서에 참조로 포함된다. 본 개시는 PCT/US20/32226과 관련될 수 있고, 이의 개시는 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
서열목록 전자파일 첨부

Claims (138)

  1. B형 간염 바이러스[hepatitis B virus , HBV] 게놈의 핵염기를 편집하는 방법으로서, 상기 HBV 게놈을 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제를 포함하는 염기 편집기 및 하나 이상의 가이드 RNA와 접촉시키는 단계를 포함하되, 상기 가이드 RNA는 상기 염기 편집기를 표적으로 하여 상기 HBV 게놈의 핵염기를 변경시키고, 상기 하나 이상의 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), GAAAGCCCAAGAUGAUGGGA(서열 번호 10834), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 포함하는, 방법.
  2. B형 간염 바이러스[HBV] 게놈의 핵염기를 편집하는 방법으로서,
    (i) HBV 게놈을 포함하는 세포를 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인과 아데노신 데아미나아제 또는 시티딘 데아미나아제를 포함하는 염기 편집기 및 하나 이상의 가이드 RNA와 접촉시키는 단계이되, 상기 가이드 RNA는 상기 염기 편집기를 표적으로 하여 상기 HBV 게놈의 핵염기를 변경시킴으로써 상기 HBV 게놈에서 핵염기를 편집하는, 단계; 및
    (ii) 상기 세포를 항레트로바이러스 약물과 접촉시키는 단계이되, 상기 세포를 상기 항레트로바이러스 약물과 접촉시키는 단계는 상기 항레트로바이러스 약물과 접촉하지 않은 기준 세포에 비해 염기 편집 효율이 증가하는 것과 관련이 있는 단계를 포함하는, 방법.
  3. 통합[integrated] HBV DNA에서 생성된 HBsAg을 감소시키는 방법으로서, HBV 게놈을 포함하는 세포를 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 또는 시티딘 데아미나아제를 포함하는 염기 편집기 및 하나 이상의 가이드 RNA와 접촉시키는 단계를 포함하되, 상기 가이드 RNA는 상기 염기 편집기를 표적으로 하여 상기 HBV 게놈의 핵염기를 변경함으로써 통합 HBV DNA에서 HBsAg 생산을 감소시키는, 방법.
  4. 제2항에 있어서, 상기 항레트로바이러스 약물은 라미부딘(Lamivudine), 엔테카비르(Entecavir), 테노포비르(Tenofovir), 인터페론(Interferon), 및 페그-인터페론(Peg-Interferon)으로 이루어진 군에서 선택되는, 방법.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서, 단계 (i)는 단계 (ii)에 선행하거나, 단계 (ii)는 단계 (i)에 선행하는, 방법.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 세포는 단계 (i)를 시행하기 약 또는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 또는 14일 전에 상기 항레트로바이러스 약물과 처음으로 접촉되는, 방법.
  7. 제2항 내지 제6항 중 어느 한 항에 있어서, 상기 세포는 상기 항레트로바이러스 약물과 이전에 접촉된 적이 없는, 방법.
  8. 제2항 내지 제7항 중 어느 한 항에 있어서, 상기 세포는 대상 내에 있는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 HBV 게놈은 두 개 이상의 가이드 RNA와 동시에 접촉되는, 방법.
  10. 제2항 내지 제9항 중 어느 한 항에 있어서, 상기 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나에서 선택되는, 방법.
  11. 제2항 내지 제10항 중 어느 한 항에 있어서, 상기 하나 이상의 가이드 RNA는 표 2A, 표 2B, 표 2C 및/또는 서열 번호 3105-5485 및 8220-10830에 나열된 서열에서 선택되는 스페이서 서열을 포함하는, 방법.
  12. 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 하나 이상의 가이드 RNA는 상기 뉴클레오티드 서열 GAAAGCCCAGGAUGAUGGGA(서열 번호 657), 5'- GAAAGCCCAAGATGATGGGA-3', 및 CCAUGCCCCAAAGCCACCCA(서열 번호 662)를 포함하는 스페이서를 포함하는, 방법.
  13. 제2항 내지 제12항 중 어느 한 항에 있어서, 상기 하나 이상의 가이드 RNA는 상기 뉴클레오티드 서열mG*mA*mA*AGCCCAGGAUGAUGGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 424) 및 mC*mC*mA*UGCCCCAAAGCCACCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 422)를 포함하는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 하나 이상의 가이드 RNA는 다음 스캐폴드 서열gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 포함하되, a, c, u 또는 g는 2'O-메틸(M) 변형이 있는 염기를 나타내고, as, cs, us, 또는 gs는 2'-O-메틸 3'-포스포로티오에이트(MS) 변형이 있는 염기를 나타내는, 방법.
  15. 제2항 내지 제12항 중 어느 한 항에 있어서, 상기 하나 이상의 가이드 RNA는 다음 뉴클레오티드 서열 cscsasUGCCCCAAAGCCACCCAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 424) 및 cscsasUGCCCCAAAGCCACCCAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 422)를 포함하되, a, c, u 또는 g는 각각 2'O-메틸(M) 변형을 함유하는 A, C, U 또는 G 뉴클레오티드를 나타내고, as, cs, us 또는 gs는 각각 2'-O-메틸 3'-포스포로티오에이트(MS) 변형을 함유하는 A, C, U 또는 G 뉴클레오티드를 나타내는, 방법.
  16. 제2항 내지 제15항 중 어느 한 항에 있어서, 상기 세포는 제1 및 제2 시점에 상기 하나 이상의 가이드 RNA 및 상기 염기 편집기와 접촉되는, 방법.
  17. 제16항에 있어서, 상기 세포가 접촉되는 상기 제1 및 제2 시간 사이는 적어도 1주가 소요되는, 방법.
  18. 제16항에 있어서, 상기 세포가 접촉되는 상기 제1 및 제2 시간 사이는 적어도 2주가 소요되는, 방법.
  19. 제2항 내지 제18항 중 어느 한 항에 있어서, 염기 편집 효율이 적어도 약 5%, 10%, 15%, 또는 20% 개선되는, 방법.
  20. B형 간염 바이러스[HBV] 게놈의 핵염기를 편집하는 방법으로서, HBV 게놈을 포함하는 세포를 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 또는 시티딘 데아미나아제를 포함하는 염기 편집기를 암호화하는 mRNA 및 서열 GAAAGCCCAGGAUGAUGGGA(서열 번호 657) 및 CCAUGCCCCAAAGCCACCCA(서열 번호 662)를 포함하는 하나 이상의 가이드 RNA를 접촉시키는 단계를 포함하되, 상기 하나 이상의 가이드 RNA는 상기 염기 편집기를 표적으로 하여 상기 HBV 게놈의 상기 핵염기를 변경함으로써 상기 HBV 게놈의 핵염기를 편집하는, 방법.
  21. 제20항에 있어서, 상기 세포를 라미부딘과 접촉시키는 단계를 더 포함하되, 상기 세포를 라미부딘과 접촉시키는 단계는 상기 항레트로바이러스 약물과 접촉되지 않은 기준 세포에 비해 염기 편집 효율이 증가하는 것과 관련이 있는, 방법.
  22. 제20항 또는 제21항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 포함하되, a, c, u 또는 g는 2'O-메틸(M) 변형이 있는 염기를 나타내고, as, cs, us, 또는 gs는 2'-O-메틸 3'-포스포로티오에이트(MS) 변형이 있는 염기를 나타내는, 방법.
  23. 제20항 또는 제21항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 422)를 포함하되, mA*, mC*, mG*, 및 mU*는 2 '-O-메틸 3'-포스포로티오에이트 변형이 있는 염기를 나타내는, 방법.
  24. 제20항 내지 제23항 중 어느 한 항에 있어서, 상기 세포는 제1 및 제2 시점에 상기 하나 이상의 가이드 RNA 및 상기 염기 편집기와 접촉되는, 방법.
  25. 제24항에 있어서, 상기 세포가 접촉되는 상기 제1 및 제2 시간 사이는 적어도 1주가 소요되는, 방법.
  26. 제20항 내지 제25항 중 어느 한 항에 있어서, 상기 염기 편집기는 BE4인 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 핵염기는 HBV 단백질을 암호화하는 폴리뉴클레오티드에 있는, 방법.
  28. 제1항 또는 제26항 중 어느 한 항에 있어서, 상기 접촉시키는 단계는 진핵 세포, 포유류 세포, 또는 인간 세포에서 이루어지는, 방법.
  29. 제2항 내지 제28항 중 어느 한 항에 있어서, 상기 세포는 생체내 또는 생체외에 있는, 방법.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 아데노신 데아미나아제는 B형 간염 바이러스[HBV] 게놈에서 표적을 A·T에서 G·C로 전환하는, 방법.
  31. 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 핵염기는 HBV 코어 단백질(코어), HBV 폴리머라아제(Pol), HBV 표면 단백질 또는 HBV 단백질 X에서 선택되는 HBV 단백질을 암호화하는 폴리뉴클레오티드 서열 내에 있는, 방법.
  32. 제1항 내지 제31항 중 어느 한 항에 있어서, 상기 HBV 단백질을 암호화하는 폴리뉴클레오티드에서 핵염기의 변경은 과오[missense] 돌연변이를 초래하는, 방법.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 핵염기는 전사 부위[transcription site]와 관련이 있는, 방법.
  34. 제33항에 있어서, 상기 전사 부위는 인핸서 II 박스 A, 인핸서 I, 및 HBX 프로모터 중 하나 이상에서 선택되는, 방법.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 상기 핵염기의 변경은 HBV 단백질을 암호화하는 폴리뉴클레오티드 서열의 전사가 감소하는 것과 관련이 있는, 방법.
  36. 제35항에 있어서, 상기 HBV 단백질은 HBV 폴리머라아제(Pol), 및/또는 HBV 단백질 X인, 방법.
  37. 제32항에 있어서, 상기 과오 돌연변이는 HBV pol 유전자에 있는, 방법.
  38. 제37항에 있어서, 상기 과오 돌연변이는 상기 HBV pol 유전자에 의해 암호화된 HBV 폴리머라아제 단백질에서 E24G, L25F, P26F, R27C, V48A, V48I, S382F, V378I, V378A, V379I, V379A, L377F, D380G, D380N, F381P, R376G, A422T, F423P, A432V, M433V, P434S, D540G, A688V, D689G, A717T, E718K, P713S, P713L, 또는 L719P를 초래하는, 방법.
  39. 제32항에 있어서, 상기 과오 돌연변이는 HBV 코어 유전자에 있는, 방법.
  40. 제39항에 있어서, 상기 과오 돌연변이는 상기 HBV 코어 유전자에 의해 암호화된 HBV 코어 단백질에서 T160A, T160A, P161F, S162L, C183R, 또는 *184Q를 초래하는, 방법.
  41. 제32항에 있어서, 상기 과오 돌연변이는 HBV X 유전자에 있는, 방법.
  42. 제41항에 있어서, 상기 과오 돌연변이는 상기 HBV X 유전자에 의해 암호화된 HBV X 단백질에서 H86R, W120R, E122K, E121K, 또는 L141P를 초래하는, 방법.
  43. 제32항에 있어서, 상기 과오 돌연변이는 HBV S 유전자에 있는, 방법.
  44. 제43항에 있어서, 상기 과오 돌연변이는 상기 HBV S 유전자에 의해 암호화된 HBV S 단백질에서 S38F, L39F, W35R, W36R, T37I, T37A, R78Q, S34L, F80P, 또는 D33G를 초래하는, 방법.
  45. 제1항 내지 제44항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 Cas12 폴리펩티드를 포함하는, 방법.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, 또는 Cas12i를 포함하는, 방법.
  47. 제1항 내지 제46항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 바실루스 히사시이(Bacillus hisashii) Cas12b, 바실루스 써모아밀로보란스(Bacillus thermoamylovorans) Cas12b, 바실루스 속(Bacillus sp.) V3-13 Cas12b, 또는 알리시클로바실루스 아시디필루스(Alicyclobacillus acidiphilus) Cas12b에 대해 적어도 약 85%의 아미노산 서열 동일성이 있는 서열을 포함하는, 방법.
  48. 제47항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 바실루스 히아사시이 Cas12b(bhCas12b)에 대해 적어도 약 85%의 아미노산 서열 동일성이 있는 서열을 포함하는, 방법.
  49. 제1항 내지 제48항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 뉴클레아제 불활성 또는 니카아제(nickase) 변이체를 포함하는, 방법.
  50. 제49항에 있어서, 상기 뉴클레아제 불활성 또는 니카아제 변이체는 아미노산 치환 D952A, S893R, K846R, 및 E837G, 또는 이의 상응하는 아미노산 치환을 포함하는 뉴클레아제 불활성화 bhCas12b를 포함하는, 방법.
  51. 제1항 내지 제50항 중 어느 한 항에 있어서, 상기 아데노신 데아미나아제 도메인은 데옥시리보핵산[deoxyribonucleic acid, DNA]에서 아데닌을 탈아미노화할 수 있는, 방법.
  52. 제1항 내지 제51항 중 어느 한 항에 있어서, 상기 아데노신 데아미나아제는 TadA 데아미나아제인, 방법.
  53. 제52항에 있어서, 상기 TadA 데아미나아제는 TadA*7.10, TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24인, 방법.
  54. 제53항에 있어서, 상기 TadA 데아미나아제는 TadA*8.13인, 방법.
  55. 제1항 내지 제54항 중 어느 한 항에 있어서, 상기 하나 이상의 가이드 RNA는 CRISPR RNA(crRNA) 및 트랜스 암호화된 작은 RNA[trans-encoded small RNA, tracrRNA]를 포함하되, 상기 crRNA는 HBV 핵산 서열에 상보적인 핵산 서열을 포함하는, 방법.
  56. 제1항 내지 제55항 중 어느 한 항에 있어서, 상기 염기 편집기는 HBV 핵산 서열에 상보적인 핵산 서열을 포함하는 단일 가이드 RNA[single guide RNA, sgRNA]와 복합체를 형성하는, 방법.
  57. 제1항 내지 제56항 중 어느 한 항에 있어서, 두 개 이상의 핵염기를 편집하는 단계를 포함하는, 방법.
  58. 제1항 내지 제57항 중 어느 한 항에 있어서, 두 개 이상의 HBV 핵산 서열을 표적으로 하는 두 개 이상의 가이드 RNA를 상기 HBV 게놈과 접촉시키는 단계를 포함하는, 방법.
  59. 대상에서 B형 간염 바이러스[HBV] 감염을 치료하는 방법으로서, 이를 필요로 하는 대상에게 융합 단백질, 단백질 복합체, 또는 상기 융합 단백질 또는 단백질 복합체를 암호화하는 폴리뉴클레오티드, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 도메인인 염기 편집기 도메인을 포함하는 상기 융합 단백질 또는 단백질 복합체, 및 상기 염기 편집기 도메인을 표적으로 하여 A·T에서 G·C로 상기 HBV 게놈의 핵염기를 변경하는 하나 이상의 가이드 RNA를 투여하는 단계를 포함하되, 상기 하나 이상의 가이드 RNA는ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 포함하는, 방법.
  60. 대상에서 B형 간염 바이러스[HBV] 감염을 치료하는 방법으로서, 이를 필요로 하는 대상에게 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 도메인인 염기 편집기를 암호화하는 하나 이상의 폴리뉴클레오티드, 및 상기 염기 편집기 도메인을 표적으로 하여 A·T에서 G·C로 상기 HBV 게놈의 핵염기를 변경하는 하나 이상의 가이드 RNA를 투여하는 단계를 포함하되, 상기 하나 이상의 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 포함하는, 방법.
  61. 대상에서 B형 간염 바이러스[HBV] 감염을 치료하는 방법으로서, 이를 필요로 하는 대상에게 하나 이상의 가이드 RNA 및 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 아데노신 데아미나아제 또는 시티딘 데아미나아제를 포함하는 염기 편집기를 투여하는 단계를 포함하되, 상기 하나 이상의 가이드 RNA는 서열 GAAAGCCCAGGAUGAUGGGA(서열 번호 657) 및 CCAUGCCCCAAAGCCACCCA(서열 번호 662)를 포함하고, 상기 염기 편집기를 표적으로 하여 HBV 게놈의 핵염기를 변경함으로써 HBV 게놈의 핵염기를 편집하는, 방법.
  62. 제59항 내지 제61항 중 어느 한 항에 있어서, 상기 대상은 포유류 또는 인간인, 방법.
  63. 제59항 내지 제62항 중 어느 한 항에 있어서, 상기 융합 단백질, 상기 융합 단백질을 암호화하는 상기 폴리뉴클레오티드, 또는 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 상기 염기 편집기 도메인을 암호화하는 하나 이상의 폴리뉴클레오티드, 및 상기 하나 이상의 가이드 RNA를 대상의 세포에 전달하는 단계를 포함하는, 방법.
  64. 제63항에 있어서, 상기 세포는 간세포인 방법.
  65. 제59항 내지 제64항에 있어서, 상기 핵염기는 HBV 단백질을 암호화하는 폴리뉴클레오티드에 있는, 방법.
  66. 제65항에 있어서, 상기 HBV 단백질은 HBV 코어 단백질(코어), HBV 폴리머라아제(Pol), HBV 표면 단백질, 또는 HBV 단백질 X인, 방법.
  67. 제65항 또는 제66항에 있어서, 상기 HBV 단백질을 암호화하는 상기 폴리뉴클레오티드에서 상기 핵염기의 변경은 과오 돌연변이를 초래하는, 방법.
  68. 제59항 내지 제67항 중 어느 한 항에 있어서, 상기 핵염기는 전사 부위와 관련이 있는, 방법.
  69. 제68항에 있어서, 상기 전사 부위는 인핸서 II 박스 A, 인핸서 I, 및 HBX 프로모터 중 하나 이상에서 선택되는, 방법.
  70. 제59항 내지 제69항 중 어느 한 항에 있어서, 상기 핵염기의 변경은 HBV 단백질을 암호화하는 폴리뉴클레오티드 서열의 전사가 감소하는 것과 관련이 있는, 방법.
  71. 제70항에 있어서, 상기 HBV 단백질은 HBV 폴리머라아제(Pol), 및/또는 HBV 단백질 X인, 방법.
  72. 제67항에 있어서, 상기 과오 돌연변이는 HBV pol 유전자에 있는, 방법.
  73. 제72항에 있어서, 상기 과오 돌연변이는 상기 HBV pol 유전자에 의해 암호화된 HBV 폴리머라아제 단백질에서 E24G, L25F, P26F, R27C, V48A, V48I, S382F, V378I, V378A, V379I, V379A, L377F, D380G, D380N, F381P, R376G, A422T, F423P, A432V, M433V, P434S, D540G, A688V, D689G, A717T, E718K, P713S, P713L, 또는 L719P를 초래하는, 방법.
  74. 제67항에 있어서, 상기 과오 돌연변이는 HBV 코어 유전자에 있는, 방법.
  75. 제74항에 있어서, 상기 과오 돌연변이는 상기 HBV 코어 유전자에 의해 암호화된 HBV 코어 단백질에서 T160A, T160A, P161F, S162L, C183R, 또는 *184Q를 초래하는, 방법.
  76. 제67항에 있어서, 상기 과오 돌연변이는 HBV X 유전자에 있는, 방법.
  77. 제76항에 있어서, 상기 과오 돌연변이는 상기 HBV X 유전자에 의해 암호화된 HBV X 단백질에서 H86R, W120R, E122K, E121K, 또는 L141P를 초래하는, 방법.
  78. 제67항에 있어서, 상기 과오 돌연변이는 HBV S 유전자에 있는, 방법.
  79. 제78항에 있어서, 상기 과오 돌연변이는 상기 HBV S 유전자에 의해 암호화된 HBV S 단백질에서 S38F, L39F, W35R, W36R, T37I, T37A, R78Q, S34L, F80P, 또는 D33G를 초래하는, 방법.
  80. 제59항 내지 제79항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 Cas12 폴리펩티드를 포함하는, 방법.
  81. 제59항 내지 제80항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, 또는 Cas12i를 포함하는, 방법.
  82. 제59항 내지 제81항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 바실루스 히사시이 Cas12b, 바실루스 써모아밀로보란스 Cas12b, 바실루스 속 V3-13 Cas12b, 또는 알리시클로바실루스 아시디필루스 Cas12b에 대해 적어도 약 85%의 아미노산 서열 동일성이 있는 서열을 포함하는, 방법.
  83. 제82항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 바실루스 히아사시이 Cas12b(bhCas12b)에 대해 적어도 약 85%의 아미노산 서열 동일성이 있는 서열을 포함하는, 방법.
  84. 제59항 내지 제83항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 뉴클레아제 불활성 또는 니카아제 변이체인, 방법.
  85. 제84항에 있어서, 상기 뉴클레아제 불활성 또는 니카아제 변이체는 아미노산 치환 D952A, S893R, K846R, 및 E837G, 또는 이의 상응하는 아미노산 치환을 포함하는 뉴클레아제 불활성화 bhCas12b인, 방법.
  86. 제59항 내지 제85항 중 어느 한 항에 있어서, 상기 아데노신 데아미나아제 도메인은 데옥시리보핵산[DNA]에서 아데닌을 탈아미노화할 수 있는, 방법.
  87. 제59항 내지 제86항 중 어느 한 항에 있어서, 상기 아데노신 데아미나아제는 TadA 데아미나아제인, 방법.
  88. 제87항에 있어서, 상기 TadA 데아미나아제는 TadA*7.10, TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24인, 방법.
  89. 제88항에 있어서, 상기 TadA 데아미나아제는 TadA*8.13인, 방법.
  90. 제59항 내지 제89항 중 어느 한 항에 있어서, 상기 하나 이상의 가이드 RNA는 CRISPR RNA(crRNA) 및 트랜스 암호화된 작은 RNA[tracrRNA]를 포함하되, 상기 crRNA는 HBV 핵산 서열에 상보적인 핵산 서열을 포함하는, 방법.
  91. 제59항 내지 제90항 중 어느 한 항에 있어서, 상기 염기 편집기는 HBV 핵산 서열에 상보적인 핵산 서열을 포함하는 단일 가이드 RNA[sgRNA]와 복합체를 형성하는, 방법.
  92. 제59항 내지 제91항 중 어느 한 항에 있어서, 두 개 이상의 핵염기를 편집하는 단계를 포함하는 방법.
  93. 제59항 내지 제92항 중 어느 한 항에 있어서, 두 개 이상의 HBV 핵산 서열을 표적으로 하는 두 개 이상의 가이드 RNA를 상기 HBV 게놈과 접촉시키는 단계를 포함하는 방법.
  94. 제92항 또는 제93항에 있어서, 3, 4, 또는 5 개의 상기 HBV 게놈을 표적으로 하는 두 개 이상의 가이드 RNA를 포함하는 방법.
  95. 제59항 내지 제93항 중 어느 한 항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 포함하되, a, c, u 또는 g는 2'O-메틸(M) 변형이 있는 염기를 나타내고, as, cs, us, 또는 gs는 2'-O-메틸 3'-포스포로티오에이트(MS) 변형이 있는 염기를 나타내는, 방법.
  96. 제59항 내지 제93항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 422)를 포함하되, mA*, mC*, mG*, 및 mU*는 2 '-O-메틸 3'-포스포로티오에이트 변형이 있는 염기를 나타내는, 방법.
  97. 제63항 또는 제64항에 있어서, 상기 세포는 제1 및 제2 시점에 상기 하나 이상의 가이드 RNA 및 상기 염기 편집기와 접촉되는, 방법.
  98. 제97항에 있어서, 상기 세포가 접촉되는 상기 제1 및 제2 시간 사이는 적어도 1주가 소요되는, 방법.
  99. 제97항에 있어서, 상기 세포가 접촉되는 상기 제1 및 제2 시간 사이는 적어도 2주가 소요되는, 방법.
  100. 가이드 RNA(들)와 결합한 염기 편집기(들)를 포함하는 조성물에 있어서, 상기 가이드 RNA(들)는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 그의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 포함하는, 방법.
  101. 제100항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 포함하되, a, c, u 또는 g는 2'O-메틸(M) 변형이 있는 염기를 나타내고, as, cs, us, 또는 gs는 2'-O-메틸 3'-포스포로티오에이트(MS) 변형이 있는 염기를 나타내는, 조성물.
  102. 제100항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 422)를 포함하되, mA*, mC*, mG*, 및 mU*는 2 '-O-메틸 3'-포스포로티오에이트 변형이 있는 염기를 나타내는, 조성물.
  103. 제100항 내지 제102항 중 어느 한 항에 있어서, 상기 염기 편집기는 아데노신 데아미나아제를 포함하는, 조성물.
  104. 제103항에 있어서, 상기 아데노신 데아미나아제는 데옥시리보핵산[DNA]에서 아데닌을 탈아미노화할 수 있는, 조성물.
  105. 제104항에 있어서, 상기 아데노신 데아미나아제는 TadA 데아미나아제인, 조성물.
  106. 제105항에 있어서, 상기 TadA 데아미나아제는 TadA*7.10, TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24인, 조성물.
  107. 제106항에 있어서, 상기 TadA 데아미나아제는 TadA*8.13인, 조성물.
  108. 제100항 내지 제106항 중 어느 한 항에 있어서, 상기 염기 편집기는
    (i) 뉴클레아제 불활성 bhCas12b를 포함하거나,
    (ii) 다음과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 조성물.
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIALGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYKERSRFENSRLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCRVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK(서열 번호 418).
  109. 제100항 내지 제108항 중 어느 한 항에 있어서, 지질을 더 포함하는 조성물.
  110. 제109항에 있어서, 상기 지질은 양이온성 지질인, 조성물.
  111. 제100항 내지 제110항 중 어느 한 항에 있어서, 약학적으로 허용되는 부형제를 더 포함하는 조성물.
  112. HBV 감염의 치료를 위한 약학적 조성물에 있어서,
    (i) 염기 편집기, 또는 상기 염기 편집기를 암호화하는 핵산, 및 약학적으로 허용되는 부형제에서 HBV 유전자에 상보적인 핵산 서열을 포함하는 하나 이상의 가이드 RNA(gRNA)를 포함하되, 상기 하나 이상의 가이드 RNA는 ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410), UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 포함하는, 약학적 조성물.
  113. 제112항에 있어서, 상기 염기 편집기는
    (i) 뉴클레아제 불활성 bhCas12b를 포함하거나,
    (ii) 다음과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 약학적 조성물.
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIALGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYKERSRFENSRLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCRVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK(서열 번호 418).
  114. 제112항 또는 제113항에 있어서, 상기 염기 편집기는 bhCas12b, 또는 아미노산 치환 D952A, S893R, K846R 및 E837G를 포함하는 bhCas12b 변이체를 포함하는, 약학적 조성물.
  115. 제112항 내지 제114항 중 어느 한 항에 있어서, 상기 하나 이상의 gRNA 및 상기 염기 편집기는 함께 제형화되는, 약학적 조성물.
  116. 제112항 내지 제115항 중 어느 한 항에 있어서, 상기 하나 이상의 gRNA 및 상기 염기 편집기는 별도로 제형화되는, 약학적 조성물.
  117. 제112항 내지 제116항 중 어느 한 항에 있어서, 포유류 세포에서의 발현에 적합한 벡터를 더 포함하되, 상기 벡터는 상기 염기 편집기를 암호화하는 폴리뉴클레오티드를 포함하는, 약학적 조성물.
  118. 제117항에 있어서, 상기 벡터는 바이러스 벡터인, 약학적 조성물.
  119. 제118항에 있어서, 상기 바이러스 벡터는 레트로바이러스 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 헤르페스바이러스 벡터, 또는 아데노 연관 바이러스 벡터[adeno-associated viral vector, AAV]인, 약학적 조성물.
  120. 제112항 내지 제119항 중 어느 한 항에 있어서, 포유류 세포에서의 발현에 적합한 리보뉴클레오입자를 더 포함하는, 약학적 조성물.
  121. 제112항 내지 제120항 중 어느 한 항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 포함하되, a, c, u 또는 g는 2'O-메틸(M) 변형이 있는 염기를 나타내고, as, cs, us, 또는 gs는 2'-O-메틸 3'-포스포로티오에이트(MS) 변형이 있는 염기를 나타내는, 조성물.
  122. 제112항 내지 제120항 중 어느 한 항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 422)를 포함하되, mA*, mC*, mG*, 및 mU*는 2 '-O-메틸 3'-포스포로티오에이트 변형이 있는 염기를 나타내는, 조성물.
  123. HBV 감염을 치료하는 방법으로서, 이를 필요로 하는 대상에게 제100항 내지 제111항 중 어느 한 항의 조성물을 투여하는 단계를 포함하는 방법.
  124. HBV 감염을 치료하는 방법으로서, 이를 필요로 하는 대상에게 제112항 내지 제123항 중 어느 한 항의 약학적 조성물을 투여하는 단계를 포함하는 방법.
  125. 제123항 또는 제124항에 있어서, 상기 HBV는 유전자형 A, 또는 유전자형 D를 가지는, 방법.
  126. 제123항 내지 제125항 중 어느 한 항에 있어서, 상기 방법은 B형 간염 표면 항원, B형 간염 E 항원, B형 간염 바이러스 총 DNA, B형 간염 3.5 kb RNA, 및 B형 간염 공유결합폐환형 DNA로 이루어진 군에서 선택되는 마커의 수준을 감소시키는 방법.
  127. 제123항 내지 제126항 중 어느 한 항에 있어서, 상기 방법은 상기 B형 간염 S 항원 부위 및 상기 프리코어 부위[PreCore site]를 편집하는 방법.
  128. 제123항 내지 제127항 중 어느 한 항에 있어서, 상기 편집 효율은 상기 S 항원 부위에서 약 30%이고 상기 프리코어 부위에서 약 60%인 방법.
  129. 대상에서 HBV 감염을 치료하는 데 사용되는, 제100항 내지 제111항 중 어느 한 항의 조성물의 용도.
  130. 대상에서 HBV 감염을 치료하는 데 사용되는, 제112항 내지 제123항 중 어느 한 항의 약학적 조성물의 용도.
  131. 제129항 또는 제130항에 있어서, 상기 대상은 포유류인, 용도.
  132. 제129항 내지 제131항 중 어느 한 항에 있어서, 상기 대상은 인간인, 용도.
  133. ACAAGAAUCCUCACAAUACC(서열 번호 405), UCGCUGGAUGUGUCUGCGGC(서열 번호 406), CACCUGUAUUCCCAUCCCAU(서열 번호 407), GGGGCCAAGUCUGUACAGCA(서열 번호 408), GCUGACGCAACCCCCACUGG(서열 번호 409), GGAGCUACUGUGGAGUUACU(서열 번호 410)UUCUUCUAGGGGACCUGCCU(서열 번호 411), GAGGACAAACGGGCAACAUA(서열 번호 412), UUGUCAACAAGAAAAACCCC(서열 번호 413), CCCAAGGUCUUACAUAAGAG(서열 번호 414), CCGGGCAACGGGGUAAAGGU(서열 번호 415), ACACAGAAAGGCCUUGUAAG(서열 번호 416), 및 CACGCACGCGCUGAUGGCCC(서열 번호 417) 중 하나 이상에서 선택되는 5'에서 3'까지의 뉴클레오티드 서열, 또는 이의 1, 2, 3, 4 또는 5 개의 뉴클레오티드 5' 및/또는 3' 절두 단편을 포함하는 가이드 RNA.
  134. 제133항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(서열 번호 317)를 포함하되, a, c, u 또는 g는 2'O-메틸(M) 변형이 있는 염기를 나타내고, as, cs, us, 또는 gs는 2'-O-메틸 3'-포스포로티오에이트(MS) 변형이 있는 염기를 나타내는 가이드 RNA.
  135. 제133항에 있어서, 상기 가이드 RNA는 다음 스캐폴드 서열 GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(서열 번호 422)를 포함하되, mA*, mC*, mG*, 및 mU*는 2'-O-메틸 3'-포스포로티오에이트 변형이 있는 염기를 나타내는 가이드 RNA.
  136. (i) 염기 편집기를 암호화하는 핵산, 및 (ii) 제133항 내지 제135항 중 어느 한 항의 가이드 RNA를 포함하는 약학적 조성물.
  137. 제136항에 있어서, 지질을 더 포함하는 약학적 조성물.
  138. 제136항 또는 제137항에 있어서, 상기 염기 편집기를 암호화하는 상기 핵산은 mRNA인, 약학적 조성물.
KR1020247012453A 2021-09-27 2022-09-27 B형 간염 바이러스 감염을 치료하기 위한 조성물 및 방법 KR20240111821A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202163248938P 2021-09-27 2021-09-27
US63/248,938 2021-09-27
US202263357623P 2022-06-30 2022-06-30
US63/357,623 2022-06-30
US202263371634P 2022-08-16 2022-08-16
US63/371,634 2022-08-16
PCT/US2022/077105 WO2023049935A1 (en) 2021-09-27 2022-09-27 Compositions and methods for treating hepatitis b virus infection

Publications (1)

Publication Number Publication Date
KR20240111821A true KR20240111821A (ko) 2024-07-17

Family

ID=85721334

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247012453A KR20240111821A (ko) 2021-09-27 2022-09-27 B형 간염 바이러스 감염을 치료하기 위한 조성물 및 방법

Country Status (6)

Country Link
US (1) US20240294914A1 (ko)
EP (1) EP4408986A1 (ko)
KR (1) KR20240111821A (ko)
AU (1) AU2022353130A1 (ko)
CA (1) CA3233413A1 (ko)
WO (1) WO2023049935A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2966170A1 (en) * 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV inactivation
US11566236B2 (en) * 2018-02-05 2023-01-31 Vertex Pharmaceuticals Incorporated Materials and methods for treatment of hemoglobinopathies
CN114929287A (zh) * 2019-05-10 2022-08-19 比姆医疗股份有限公司 用于治疗乙型肝炎的组合物和方法

Also Published As

Publication number Publication date
EP4408986A1 (en) 2024-08-07
WO2023049935A1 (en) 2023-03-30
CA3233413A1 (en) 2023-03-30
US20240294914A1 (en) 2024-09-05
AU2022353130A1 (en) 2024-04-11

Similar Documents

Publication Publication Date Title
US20220401530A1 (en) Methods of substituting pathogenic amino acids using programmable base editor systems
JP2022546608A (ja) 新規核酸塩基エディター及びその使用方法
EP3790964A1 (en) Methods of suppressing pathogenic mutations using programmable base editor systems
AU2019266327A1 (en) Methods of editing single nucleotide polymorphism using programmable base editor systems
EP3965832A1 (en) Compositions and methods for treating hepatitis b
US20230101597A1 (en) Compositions and methods for treating alpha-1 antitrypsin deficiency
JP2022533673A (ja) プログラム可能塩基エディターシステムを用いた一塩基多型編集法
AU2020336953A1 (en) Compositions and methods for editing a mutation to permit transcription or expression
KR20230158476A (ko) 유전자 요법을 위한 재조합 광견병 바이러스
CA3198671A1 (en) Compositions and methods for treating glycogen storage disease type 1a
KR20240111821A (ko) B형 간염 바이러스 감염을 치료하기 위한 조성물 및 방법
JP2024534639A (ja) B型肝炎ウイルス感染症を治療するための組成物及び方法
US20240132868A1 (en) Compositions and methods for the self-inactivation of base editors
WO2023086953A1 (en) Compositions and methods for the treatment of hereditary angioedema (hae)