KR20200067190A - A형 혈우병을 위한 유전자 편집용 조성물 및 방법 - Google Patents

A형 혈우병을 위한 유전자 편집용 조성물 및 방법 Download PDF

Info

Publication number
KR20200067190A
KR20200067190A KR1020207013950A KR20207013950A KR20200067190A KR 20200067190 A KR20200067190 A KR 20200067190A KR 1020207013950 A KR1020207013950 A KR 1020207013950A KR 20207013950 A KR20207013950 A KR 20207013950A KR 20200067190 A KR20200067190 A KR 20200067190A
Authority
KR
South Korea
Prior art keywords
grna
nucleic acid
dna endonuclease
cell
sequence
Prior art date
Application number
KR1020207013950A
Other languages
English (en)
Inventor
알란 리차드 브룩스
Original Assignee
크리스퍼 테라퓨틱스 아게
바이엘 헬쓰케어 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크리스퍼 테라퓨틱스 아게, 바이엘 헬쓰케어 엘엘씨 filed Critical 크리스퍼 테라퓨틱스 아게
Publication of KR20200067190A publication Critical patent/KR20200067190A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/10Dispersions; Emulsions
    • A61K9/127Liposomes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Diabetes (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Plant Pathology (AREA)
  • Dispersion Chemistry (AREA)
  • Dermatology (AREA)
  • Nanotechnology (AREA)
  • Optics & Photonics (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)

Abstract

대상체에서 A형 혈우병을 생체외 또는 생체내에서 치료하기 위한 물질 및 방법이 제공된다. 또한, FVIII-인코딩 유전자를 게놈, 특히 알부민 유전자의 유전자좌 내에 낙 인(knock-in)시키기 위한 물질 및 방법이 제공된다.

Description

A형 혈우병을 위한 유전자 편집용 조성물 및 방법
관련 출원과의 상호-참조
본 출원은 2017년 10월 17일자 출원된 미국 가특허 출원 제62/573,633호에 대한 우선권의 이익을 주장하며, 이의 개시는 그의 전문이 본원에 참조로 포함된다.
기술분야
본원과 함께 제공된 개시는 생체외 및 생체내 둘 모두에서 A형 혈우병을 갖는 환자를 치료하기 위한 물질 및 방법에 관한 것이다. 또한, 본 개시는 게놈 편집에 의해, 인자 VIII(FVIII)과 같은 세포 내의 혈액-응고 단백질의 발현, 기능 또는 활성을 조절하기 위한 편집용 물질 및 방법을 제공한다.
A형 혈우병(HemA)은 낮은 또는 검출 가능하지 않은 수준의 혈중 FVIII 단백질을 초래하는 인자 VIII(FVIII) 유전자의 유전적 결함에 의해 야기된다. 이는 조직 손상의 부위에서 비효율적인 혈전 형성을 초래하여 제어되지 않는 출혈을 야기하며, 이는 치료되지 않는 경우 치명적일 수 있다. 결손 FVIII 단백질의 대체는 HemA 환자를 위한 효율적인 치료이며, 현재 치료 기준이다. 그러나, 단백질 대체 요법은 FVIII 단백질의 빈번한 정맥내 주사를 필요로 하며, 이는 성인의 경우 불편하고, 소아의 경우 문제가 되며, 비용이 많이 들고($200,000 초과/년), 치료 섭생을 엄밀히 따르지 않는다면, 파탄성 출혈을 초래할 수 있다.
FVIII 유전자는 간 및 체내의 다른 부위에 존재하는 동모양혈관 내피 세포에서 주로 발현된다. 외인성 FVIII은 간의 간세포에서 발현되고, 그로부터 분비되어, 순환 중 FVIII을 생성하고, 이에 따라 질병의 치유에 영향을 미칠 수 있다. 간의 간세포를 표적화하는 유전자 운반 방법이 개발되어, 동물 모델에서, 그리고 임상 시험의 환자에서, HemA에 대한 치료로서 FVIII 유전자를 운반하는 데 사용되었다.
A형 혈우병에 대한 영구적인 치유가 매우 바람직하다. 아데노 연관 바이러스(AAV)를 사용하는 종래의 바이러스 기반의 유전자 요법이 전-임상 동물 모델에서 그리고 환자에서 가능성을 보여줄 수 있지만, 그것은 수많은 단점을 갖는다. AAV 기반의 유전자 요법은 AAV 바이러스 캡시드(전형적으로 특히 혈청형 AAV5, AAV8 또는 AAV9 또는 AAVrh10 사용) 내측에 캡슐화된 간 특이적 프로모터에 의해 유도되는 FVIII 유전자를 사용한다. 유전자 요법을 위해 사용되는 모든 AAV 바이러스는 패키징된 유전자 카세트를 형질도입된 세포의 핵 내로 전달하며, 여기서, 유전자 카세트는 거의 배타적으로 에피솜으로 남아 있고, 그것은 치료적 단백질이 생기게 하는 치료적 유전자의 에피솜 카피이다. AAV는 그의 캡슐화된 DNA를 숙주 세포의 게놈 내로 통합하기 위한 메커니즘을 갖지 않고, 대신에 에피솜으로서 유지되며, 이에 따라 이는 숙주 세포가 분열할 때 복제되지 않는다. 에피솜 DNA는 또한 시간이 지남에 따라 분해를 겪을 수 있다. AAV 에피솜을 함유하는 간 세포가 분열하도록 유도되는 경우, AAV 게놈은 복제되지 않고, 대신에 희석되는 것이 입증된 바 있다. 결과적으로, AAV 기반의 유전자 요법은 간이 아직 성인 크기에 도달하지 않은 소아에게 제공되는 경우 유효하지 않을 것으로 예상된다. 또한, AAV 기반의 유전자 요법은 동물 데이터에 의해 10년만큼 긴 기간에 걸쳐 치료 효과의 오직 적은 소실만이 입증된 바 있지만, 성인에게 제공되는 경우 얼마나 오래 지속될 지는 현재 알려져 있지 않다. 따라서, HemA에 대한 새로운 효율적이고 영구적인 치료를 개발하는 것이 절실하게 필요하다.
일 양태에서, 내인성 알부민 유전자좌 내의 또는 그 근처의 게놈 서열에 상보성인 서열을 갖는 가이드 RNA(gRNA) 서열이 본원에 제공된다.
일부 구현예에서, gRNA는 표 3에 열거된 것들로부터 선택되는 스페이서 서열 및 표 3에 열거된 것들 중 임의의 것에 대하여 적어도 85% 상동성을 갖는 그의 변이체를 포함한다.
또 다른 양태에서, 상기 언급된 gRNA 중 임의의 것을 갖는 조성물이 본원에 제공된다.
일부 구현예에서, 조성물의 gRNA는 표 3에 열거된 것들로부터 선택되는 스페이서 서열 및 표 3에 열거된 것들 중 임의의 것에 대하여 적어도 85% 상동성을 갖는 그의 변이체를 포함한다.
일부 구현예에서, 조성물은 하기의 것 중 하나 이상을 추가로 포함한다: 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여자 주형.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스(Staphylococcus lugdunensis)로부터의 것이다(SluCas9).
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 코돈 최적화된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 코돈 최적화된다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA)이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA)이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA는 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, 조성물은 리포좀 또는 지질 나노입자를 추가로 포함한다.
일부 구현예에서, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다.
일부 구현예에서, DNA 엔도뉴클레아제는 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, 리포좀 또는 지질 나노입자는 gRNA를 또한 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 gRNA와 사전복합체화되어, 리보핵단백질(RNP) 복합체를 형성한다.
또 다른 양태에서, 상기 기재된 조성물 중 임의의 것을 갖고, 사용 설명서를 추가로 갖는 키트가 본원에 제공된다.
또 다른 양태에서, 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA); 및 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형을 포함하는 시스템이 본원에 제공된다.
일부 구현예에서, gRNA는 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 숙주 세포는 인간 세포이다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산은 숙주 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 숙주 세포는 인간 세포이다.
일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA)이다.
일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA)이다. 일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA이다.
일부 구현예에서, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다.
일부 구현예에서, 공여자 주형은 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, gRNA 표적 부위는 시스템 내의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여자 주형의 gRNA 표적 부위는 시스템 내의 gRNA에 대한 게놈 gRNA 표적 부위의 역 상보물이다.
일부 구현예에서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자로 제형화된다. 일부 구현예에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다.
일부 구현예에서, 시스템은 gRNA와 사전복합체화되어 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 포함한다.
또 다른 양태에서, 세포 내의 게놈의 편집 방법이 본원에 제공되며, 당해 방법은 하기의 것을 세포에 제공하는 단계를 포함한다: (a) 상기 기술된 gRNA 중 임의의 것; (b) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여자 주형.
일부 구현예에서, gRNA는 SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, gRNA는 표 3에 열거된 것들로부터 선택되는 스페이서 서열 및 표 3에 열거된 것들 중 임의의 것에 대하여 적어도 85% 상동성을 갖는 그의 변이체를 갖는다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제; 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화된다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA)이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA)이다.
일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA는 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다.
일부 구현예에서, 공여자 주형은 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여자 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물이다. 일부 구현예에서,
일부 구현예에서, (a), (b) 및 (c) 중 하나 이상은 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 세포로의 제공 이전에 gRNA와 사전복합체화되어 리보핵단백질(RNP) 복합체를 형성한다.
일부 구현예에서, (a) 및 (b)는 (c)를 세포에 제공한 후에 세포에 제공된다.
일부 구현예에서, (a) 및 (b)는 (c)를 세포에 제공한지 약 1일 내지 14일 후에 세포에 제공된다.
일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 4일보다 긴 시간 후에 세포에 제공된다.
일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)를 세포에 제공한지 적어도 14일 후에 세포에 제공된다.
일부 구현예에서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공된다.
일부 구현예에서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내의 알부민 유전자 또는 알부민 유전자 조절 요소에서, 그 내에서 또는 그 근처에서 이루어진다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에서 이루어진다.
일부 구현예에서, 삽입은 게놈 내의 인간 알부민 유전자의 제1 엑손의 말단의 적어도 37 bp 하류 및 게놈 내의 인간 알부민 유전자의 제2 엑손의 개시의 적어도 330 bp 상류에서 이루어진다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 세포는 간세포이다.
또 다른 양태에서, 세포의 게놈이 상기 기술된 방법 중 임의의 것에 의해 편집되는 유전적으로 변형된 세포가 본원에 제공된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내의 알부민 유전자 또는 알부민 유전자 조절 요소에서, 그 내에서 또는 그 근처에서 이루어진다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에서 이루어진다.
일부 구현예에서, 삽입은 게놈 내의 인간 알부민 유전자의 제1 엑손의 말단의 적어도 37 bp 하류 및 게놈 내의 인간 알부민 유전자의 제2 엑손의 개시의 적어도 330 bp 상류에서 이루어진다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 코돈 최적화된다.
일부 구현예에서, 세포는 간세포이다.
또 다른 양태에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공되며, 당해 방법은 하기의 것을 대상체 내의 세포에 제공하는 단계를 포함한다: (a) SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA; (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형.
일부 구현예에서, gRNA는 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, 대상체는 A형 혈우병을 갖거나 또는 A형 혈우병을 갖는 것으로 의심되는 환자이다.
일부 구현예에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받는다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제; 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화된다.
일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA)이다.
일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA)이다. 일부 구현예에서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA이다.
일부 구현예에서, (a)의 gRNA, (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 (c)의 공여자 주형 중 하나 이상은 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다.
일부 구현예에서, 공여자 주형은 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여자 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물이다.
일부 구현예에서, 공여자 주형을 세포에 제공하는 단계는 공여자 주형을 대상체에게 투여하는 것을 포함한다. 일부 구현예에서, 투여는 정맥내 경로를 통해 이루어진다.
일부 구현예에서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자로 제형화된다. 일부 구현예에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다.
일부 구현예에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계는 리포좀 또는 지질 나노입자를 대상체에게 투여하는 것을 포함한다. 일부 구현예에서, 투여는 정맥내 경로를 통해 이루어진다.
일부 구현예에서, 상기 방법은 gRNA와 사전-복합체화되어 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 세포에 제공하는 단계를 포함한다.
일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 4일보다 긴 시간 후에 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 적어도 14일 후에 세포에 제공된다.
일부 구현예에서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공된다. 일부 구현예에서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에, 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공된다.
일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 대상체에게 투여하는 것을 포함한다.
일부 구현예에서, (c)의 공여자 주형을 세포에 제공하는 단계는 AAV 벡터에 인코딩된 공여자 주형을 대상체에게 투여하는 것을 포함한다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 세포는 간세포이다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 대상체의 간에서 발현된다.
또 다른 양태에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공된다. 상기 방법은 상기 언급된 유전적으로 변형된 세포 중 임의의 것을 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 대상체는 A형 혈우병을 갖거나, A형 혈우병을 갖는 것으로 의심되는 환자이다.
일부 구현예에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받는다.
일부 구현예에서, 유전적으로 변형된 세포는 자가이다.
일부 구현예에서, 세포는 간세포이다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내의 알부민 유전자 또는 알부민 유전자 조절 요소에서, 그 내에서 또는 그 근처에서 이루어진다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에서 이루어진다.
일부 구현예에서, 삽입은 게놈 내의 인간 알부민 유전자의 제1 엑손의 말단의 적어도 37 bp 하류 및 게놈 내의 인간 알부민 유전자의 제2 엑손의 개시의 적어도 330 bp 상류에서 이루어진다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 상기 방법은 대상체로부터 생물학적 시료를 수득하는 단계로서, 생물학적 시료가 간세포를 포함하는 단계 및 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열을 세포의 게놈 서열 내로 삽입하여, 그에 의해, 유전적으로 변형된 세포를 생성함으로써 간세포의 게놈을 편집하는 단계를 추가로 포함한다.
또 다른 양태에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공된다. 상기 방법은 대상체로부터 생물학적 시료를 수득하는 단계로서, 생물학적 시료가 간세포를 포함하는 단계, (a) 상기 기술된 gRNA 중 임의의 것; (b) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여자 주형을 간세포에 제공하여, 그에 의해, 유전적으로 변형된 세포를 생성하는 단계, 및 유전적으로 변형된 세포를 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 대상체는 A형 혈우병을 갖거나 또는 A형 혈우병을 갖는 것으로 의심되는 환자이다.
일부 구현예에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받는다.
일부 구현예에서, 유전적으로 변형된 세포는 자가이다.
일부 구현예에서, gRNA는 표 3에 열거된 것들 및 표 3에 열거된 것들 중 임의의 것에 대하여 적어도 85% 상동성을 갖는 그의 변이체로부터 선택되는 서열을 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 코돈 최적화된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 코돈 최적화된다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA 서열은 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, (a), (b) 및 (c) 중 하나 이상은 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다.
일부 구현예에서, DNA 엔도뉴클레아제는 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, 리포좀 또는 지질 나노입자는 gRNA를 또한 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 세포로의 제공 이전에 gRNA와 사전복합체화되어, 리보핵단백질(RNP) 복합체를 형성한다.
일부 구현예에서, (a) 및 (b)는 (c)를 세포에 제공한 후에 세포에 제공된다.
일부 구현예에서, (a) 및 (b)는 (c)를 세포에 제공한지 약 1일 내지 14일 후에 세포에 제공된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내의 알부민 유전자 또는 알부민 유전자 조절 요소에서, 그 내에서 또는 그 근처에서 이루어진다.
일부 구현예에서, 삽입은 알부민 유전자의 제1 인트론 내에서 이루어진다.
일부 구현예에서, 삽입은 게놈 내의 인간 알부민 유전자의 제1 엑손의 말단의 적어도 37 bp 하류 및 게놈 내의 인간 알부민 유전자의 제2 엑손의 개시의 적어도 330 bp 상류에서 이루어진다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 세포는 간세포이다.
또 다른 양태에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공된다. 상기 방법은 하기의 것을 대상체 내의 세포에 제공하는 단계를 포함한다: (a) 상기 기술된 gRNA 중 임의의 것; (b) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 갖는 공여자 주형.
일부 구현예에서, 대상체는 A형 혈우병을 갖거나 또는 A형 혈우병을 갖는 것으로 의심되는 환자이다.
일부 구현예에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받는다.
일부 구현예에서, gRNA는 표 3에 열거된 것들 및 표 3에 열거된 것들 중 임의의 것에 대하여 적어도 85% 상동성을 갖는 그의 변이체로부터 선택되는 서열을 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제; 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다.
일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 코돈 최적화된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 코돈 최적화된다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 데옥시리보핵산(DNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 리보핵산(RNA) 서열이다.
일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 RNA 서열은 공유 결합을 통해 gRNA에 연결된다.
일부 구현예에서, (a), (b) 및 (c) 중 하나 이상은 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다.
일부 구현예에서, DNA 엔도뉴클레아제는 리포좀 또는 지질 나노입자로 제형화된다.
일부 구현예에서, 리포좀 또는 지질 나노입자는 gRNA를 또한 포함한다.
일부 구현예에서, DNA 엔도뉴클레아제는 세포로의 제공 이전에 gRNA와 사전복합체화되어, 리보핵단백질(RNP) 복합체를 형성한다.
일부 구현예에서, (a) 및 (b)는 (c)를 세포에 제공한 후에 세포에 제공된다.
일부 구현예에서, (a) 및 (b)는 (c)를 세포에 제공한지 약 1일 내지 14일 후에 세포에 제공된다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 세포의 게놈 서열 내로 삽입된다.
일부 구현예에서, 삽입은 세포의 게놈 내의 알부민 유전자 또는 알부민 유전자 조절 요소에서, 그 내에서 또는 그 근처에서 이루어진다.
일부 구현예에서, 삽입은 세포의 게놈 내의 알부민 유전자의 제1 인트론 내에서 이루어진다.
일부 구현예에서, 삽입은 게놈 내의 인간 알부민 유전자의 제1 엑손의 말단의 적어도 37 bp 하류 및 게놈 내의 인간 알부민 유전자의 제2 엑손의 개시의 적어도 330 bp 상류에서 이루어진다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 세포는 간세포이다.
일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 대상체의 간에서 발현된다.
또 다른 양태에서, 상기 기술된 시스템의 하나 이상의 요소를 포함하며, 사용 설명서를 추가로 포함하는 키트가 본원에 제공된다.
본 개시의 소정의 특징 및 이점의 이해는 개시의 원리가 이용되는 예시적인 구현예를 제시한 하기의 과제의 해결 수단 및 첨부 도면을 참조하여 수득될 것이며:
도 1은 상이하게 코돈 최적화된 FVIII-BDD 코딩 서열의 다수의 정렬을 보여준다. 성숙 코딩 서열만이 나타나 있다(신호 펩티드 영역이 결실됨). ClustalW 알고리즘이 사용되었다.
도 2는 DNA 공여자 주형의 비제한적인 예시적인 설계를 보여준다.
도 3은 Hepa1-6 세포에서의 mAlb gRNA-T1의 절단 효율의 TIDE 분석의 결과를 보여준다.
도 4는 상이한 용량의 Cas9 mRNA 및 mAlb gRNA_T1을 캡슐화하는 지질 나노입자(LNP) 또는 PBS 대조군을 투여한지 3일 후의 마우스의 간 및 비장에서의 INDEL 빈도의 결과를 보여준다. 그룹당 N=5마리의 마우스, 평균 값이 플롯팅되어 있다.
도 5는 실시예 4에 사용되는 알부민 인트론 1 내로의 표적화된 통합을 위한 DNA 공여자 주형의 설계를 보여준다. SA; 스플라이스 수여자 서열, LHA; 좌측 상동성 아암; RHA; 우측 상동성 아암, pA; 폴리 아데닐화 신호, gRNA 부위; gRNA 표적화된 Cas9 뉴클레아제에 의한 절단을 매개하는 gRNA에 대한 표적 부위, 델타 푸린; FVIII 내의 푸린 부위의 결실, FVIII-BDD; B-도메인이 SQ 연결 펩티드로 대체된 B-도메인 결실(BDD)을 갖는 인간 FVIII에 대한 코딩 서열.
도 6은 4명의 공여자로부터의 일차 인간 간세포 내의 인간 알부민 인트론 1을 표적화하는 8개의 후보 gRNA의 INDEL 빈도를 보여준다. AAVS1 유전자좌 및 비관련된 인간 유전자(C3)를 표적화하는 gRNA가 대조군으로서 포함된다.
도 7은 상이한 알부민 가이드 RNA 및 spCas9 mRNA가 트랜스펙션된 비-인간 영장류(원숭이) 일차 간세포 내의 INDEL 빈도를 보여준다.
도 8은 예시적인 AAV-mSEAP 공여자 카세트의 개략도를 보여준다.
도 9는 AAV로의 패키징을 위해 사용되는 예시적인 FVIII 공여자 카세트의 개략도를 보여준다.
도 10은 AAV8-pCB056에 이어서 spCas9 mRNA 및 mAlbT1 가이드 RNA를 캡슐화하는 LNP의 주사 후에 시간이 지남에 따른 A형 혈우병 마우스의 혈중 FVIII 수준을 보여준다.
도 11은 spCas9 mRNA 및 gRNA를 캡슐화하는 LNP를 주사한지 10일 및 17일 후의 A형 혈우병 마우스 내의 FVIII 수준을 보여준다. LNP를 AAV8-pCB056 이후 17일 또는 4일에 투여하였다.
도 12는 인간 FVIII 유전자 및 상이한 폴리아데닐화 신호 서열을 함유하는 예시적인 플라스미드 공여자의 개략도를 보여준다.
도 13은 3가지의 상이한 폴리A 신호를 갖는 플라스미드 공여자에 이어서 LNP 캡슐화된 Cas9mRNA 및 mAlbT1 gRNA의 유체역학적 주사 이후 마우스 내의 FVIII 활성 및 FVIII 활성/표적화된 통합 비를 보여준다. 그룹 2, 3 및 4에는 각각 pCB065, pCB076 및 pCB077을 투여하였다. 표는 각 개별 마우스에 대한 제10일의 FVIII 활성에 대한 값, 표적화된 통합 빈도 및 FVIII 활성/TI 비(비)를 포함한다.
표 14는 일차 인간 간세포에서 표적화된 통합을 평가하기 위해 사용되는 예시적인 AAV 공여자 카세트의 개략도를 보여준다.
도 15는 spCas9 mRNA 및 hALb4 gRNA의 리포펙션과 함께 또는 이것 없이 AAV-DJ-SEAP 바이러스로 형질도입된 일차 인간 간세포의 배지 중 SEAP 활성을 보여준다. 2명의 세포 공여자(HJK, ONR)를 시험하였으며, 흑색 및 백색 막대로 표시되어 있다. 좌측 상의 3쌍의 막대는 오직 Cas9 및 gRNA(제1 쌍의 막대), 단독의 100,000 MOI의 AAV-DJ-pCB0107(SEAP 바이러스)(제2 쌍의 막대) 또는 단독의 100,000 MOI의 AAV-DJ-pCB0156(FVIII 바이러스)(제3 쌍의 막대)이 트랜스펙션된 세포의 대조군 조건에서의 SEAP 활성을 나타낸다. 우측 상의 4쌍의 막대는 다양한 MOI의 AAV-DJ-pCB0107(SEAP 바이러스)이 형질도입되고, Cas9 mRNA 및 hAlb T4 gRNA가 트랜스펙션된 세포의 웰에서의 SEAP 활성을 나타낸다.
도 16은 spCas9 mRNA 및 hALb4 gRNA의 리포펙션과 함께 또는 이것 없이 AAV-DJ-FVIII 바이러스로 형질도입된 일차 인간 간세포의 배지 중 FVIII 활성을 보여준다. 2명의 세포 공여자(HJK, ONR)를 시험하였으며, 흑색 및 백색 막대로 표시되어 있다. 좌측 상의 2쌍의 막대는 단독의 100,000 MOI의 AAV-DJ-pCB0107(SEAP 바이러스)(제1 쌍의 막대) 또는 단독의 100,000 MOI의 AAV-DJ-pCB0156(FVIII 바이러스)(제2 쌍의 막대)이 형질도입된 세포의 대조군 조건에서의 FVIII 활성을 나타낸다. 우측 상의 4쌍의 막대는 다양한 MOI의 AAV-DJ-pCB0156(FVIII 바이러스)이 형질도입되고, Cas9 mRNA 및 hAlb T4 gRNA가 트랜스펙션된 세포의 웰로부터의 배지 중 FVIII 활성을 나타낸다.
개시는 특히 게놈 편집에 의해 세포에서 혈액-응고 단백질, 예컨대 인자 VIII(FVIII)의 발현, 기능 또는 활성을 조절하기 위한 편집용 조성물 및 방법을 제공한다. 개시는 또한 특히 생체외 및 생체내 둘 모두에서 A형 혈우병을 갖는 환자를 치료하기 위한 조성물 및 방법을 제공한다.
정의
다르게 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 청구된 대상이 속하는 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 발명을 실시하기 위한 구체적인 내용이 예시적이며 설명만을 위한 것이며 청구된 어떠한 특허 대상도 한정하지 않는 것으로 이해하여야 한다. 본 출원에서, 단수의 사용은 달리 특정되지 않으면, 복수를 포함한다. 본 명세서에서 사용된 바와 같이 단수 형태는 문맥에서 명백하게 달리 언급되지 않으면, 복수 참조대상을 포함함을 주의해야 한다. 본 출원에서, "또는"의 사용은 달리 언급되지 않으면, "및/또는"을 의미한다. 또한, 용어 "포함하는" 뿐만 아니라, 다른 형태, 예컨대 "포함한다", "포함하다", 및 "포함된"의 사용은 제한적이지 않다.
개시의 다양한 특징이 단일의 구현예의 맥락에서 기술될 수 있지만, 특징은 또한 개별적으로 또는 임의의 적합한 조합으로 제공될 수 있다. 역으로, 개시가 명확성을 위하여 본원에서 개별 구현예의 맥락으로 기술될 수 있지만, 개시는 또한 단일의 구현예에서 구현될 수 있다. 본원에 인용된 임의의 공개된 특허 출원 및 임의의 다른 공개된 참고문헌, 문서, 사본 및 과학 문헌은 임의의 목적을 위하여 본원에 참조로 포함된다. 상충하는 경우에, 정의를 포함하는 특허 명서세가 좌우할 것이다. 또한, 물질, 방법 및 예는 단지 예시적인 것이며, 제한하는 것으로 의도되지 않는다.
본원에 사용되는 바와 같이, 범위 및 양은 "약" 특정 값 또는 범위로서 표현될 수 있다. 약은 또한 정확한 양을 포함한다. 따라서, "약 5 ㎕"는 "약 5 ㎕" 및 또한 "5 ㎕"를 의미한다. 일반적으로, 용어 "약"은 실험 오차, 예컨대 ± 10% 이내인 것으로 예상될 양을 포함한다.
수치 값의 범위가 본원에 제시되는 경우, 범위의 하한과 상한 사이의 각각의 개재하는 값, 범위의 상한 및 하한인 값 및 범위와 함께 언급된 모든 값은 본 개시 내에 포함되는 것이 예상된다. 범위의 하한과 상한 내의 모든 가능한 하위-범위도 또한 본 개시에 의해 포함된다.
용어 "폴리펩티드", "폴리펩티드 서열", "펩티드", "펩티드 서열", "단백질", "단백질 서열" 및 "아미노산 서열"은 펩티드 결합에 의해 서로 연결된 일련의 선형의 아미노산 잔기를 표기하기 위하여 본원에 상호 교환 가능하게 사용되며, 일련의 것은 단백질, 폴리펩티드, 올리고펩티드, 펩티드 및 그의 단편을 포함할 수 있다. 단백질은 자연 발생 아미노산 및/또는 합성(예를 들어, 변형된 또는 비-자연 발생) 아미노산으로 구성될 수 있다. 따라서, 본원에 사용되는 바와 같은 "아미노산" 또는 "펩티드 잔기"는 자연 발생 및 합성 아미노산 둘 모두를 의미한다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 이종 아미노산 서열과의 융합 단백질, N-말단 메티오닌 잔기와 함께 또는 이것 없이 이종 및 동종 리더 서열과의 융합; 면역학적으로 태깅된 단백질; 검출 가능한 융합 파트너와의 융합 단백질, 예를 들어, 융합 파트너로서 형광 단백질, β-갈락토시다제, 루시퍼라제 등을 포함하는 융합 단백질을 포함하지만, 이들에 한정되지 않는 융합 단백질을 포함한다. 또한, 아미노산 서열의 시작 또는 끝의 대시 기호는 하나 이상의 아미노산 잔기의 추가의 서열로의 펩티드 결합, 또는 카복실 또는 하이드록실 말단기로의 공유 결합 중 어느 하나를 나타내는 것을 주의해야 한다. 그러나, 대시 기호의 부재는 이를 생략하는 것이 아미노산 서열의 표현에서 관례이기 때문에, 이러한 펩티드 결합 또는 카복실 또는 하이드록실 말단기로의 공유 결합이 존재하지 않는 것을 의미하는 것으로 해석되지 않아야 한다.
본원에 상호 교환 가능하게 사용되는 용어 "폴리뉴클레오티드", "폴리뉴클레오티드 서열", "올리고뉴클레오티드", "올리고뉴클레오티드 서열", "올리고머", "올리고", "핵산 서열" 또는 "뉴클레오티드 서열"은 임의의 길이의 중합체 형태의 뉴클레오티드, 즉, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 나타낸다. 따라서, 이 용어는, 단일-, 이중- 또는 다중-가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및 피리미딘 염기, 또는 다른 천연, 화학적으로 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오티드 염기를 갖는 중합체를 포함하지만, 이들로 제한되지 않는다.
용어 "유도체" 및 "변이체"는 제한 없이 본원에 개시된 화합물로부터 유래된 구조 또는 서열을 가지며, 그의 구조 또는 서열이 동일한 또는 유사한 활성 및 유용성을 갖도록 또는 이러한 유사성에 기초하여 당업자에 의해 참조된 화합물과 동일한 또는 유사한 활성 및 유용성을 나타내는 것으로 예상되어, 그에 의해, 상호 교환 가능하게 "기능적으로 등가의" 또는 "기능적 등가물"로 지칭되도록 본원에 개시된 것들과 충분히 유사한 임의의 화합물, 예컨대 핵산 또는 단백질을 나타낸다. "유도체" 또는 "변이체"를 수득하기 위한 변형은 예를 들어, 핵산 또는 아미노산 잔기 중 하나 이상의 부가, 결실 및/또는 치환을 포함할 수 있다.
단백질의 맥락에서 기능적 등가물 또는 기능적 등가물의 단편은 하나 이상의 보존적 아미노산 치환을 가질 수 있다. 용어 "보존적 아미노산 치환"은 원래의 아미노산과 유사한 특성을 갖는 또 다른 아미노산으로의 아미노산의 치환을 지칭한다. 보존적 아미노산의 그룹은 하기와 같다:
Figure pct00001
보존적 치환은 바람직한 소정의 펩티드 또는 그의 단편의 임의의 위치 내에 도입될 수 있다. 그러나, 비-보존적 치환, 특히 비제한적으로, 임의의 하나 이상의 위치 내의 비-보존적 치환을 도입하는 것이 또한 바람직할 수 있다. 펩티드의 기능적으로 동등한 단편의 형성을 야기하는 비-보존적 치환은 예를 들어, 극성, 전하 및/또는 입체 크기가 실질적으로 상이한 반면, 그의 유도체 또는 변이체 단편의 기능을 유지할 것이다.
"서열 동일성의 백분율"은 2개의 최적으로 정렬된 서열을 비교창에 걸쳐 비교함으로써 결정되며, 비교창 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 일부는 2개의 서열의 최적의 정렬을 위하여 (부가 또는 결실을 갖지 않는) 참조 서열과 비교하여 부가 또는 결실(즉, 갭)을 가질 수 있다. 일부 경우에, 동일한 핵산 염기 또는 아미노산 잔기가 두 서열 모두에 존재하는 위치의 수를 결정하여 일치되는 위치의 수를 제공하고, 일치되는 위치의 수를 비교창 내의 총 위치의 수로 나누고, 결과를 100과 곱하여 서열 동일성의 백분율을 제공함으로써 백분율을 계산할 수 있다.
2개의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "동일한" 또는 "동일성" 백분율은 하기의 서열 정렬 알고리즘 중 하나를 사용하여 또는 수동의 정렬 및 육안의 검사에 의해 측정시, 비교창 또는 표기된 영역에 걸쳐 최대의 상응성을 위하여 비교되고 정렬되는 경우, 동일하거나, 특정 백분율의 동일한 아미노산 잔기 또는 뉴클레오티드(예를 들어, 특정 영역, 예를 들어, 전체 폴리펩티드 서열 또는 폴리펩티드의 개별 도메인에 걸쳐 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 동일성)를 갖는 2개 이상의 서열 또는 하위서열을 나타낸다. 이어서, 이러한 서열은 "실질적으로 동일하다"라고 한다. 이러한 정의는 또한 시험 서열의 상보물을 나타낸다.
본원에 상호 교환 가능하게 사용되는 용어 "상보성" 또는 "실질적으로 상보성인"은 핵산(예를 들어, DNA 또는 RNA)이 서열-특이적, 역평행 방식으로 또 다른 핵산에 비-공유적으로 결합되게 하는, 즉, 왓슨-크릭 염기쌍 및/또는 G/U 염기쌍을 형성하게 하는(즉, 핵산이 상보성 핵산에 특이적으로 결합하는) 뉴클레오티드의 서열을 갖는 것을 의미한다. 해당 분야에 알려져 있는 바와 같이, 표준 왓슨-크릭 염기-쌍형성은 하기를 포함한다: 티미딘(T)과 염기쌍을 형성하는 아데닌(A), 우라실(U)과 염기쌍을 형성하는 아데닌(A) 및 시토신(C)과 염기쌍을 형성하는 구아닌(G).
특정 RNA를 "인코딩하는" DNA 서열은 RNA로 전사되는 DNA 핵산 서열이다. DNA 폴리뉴클레오티드는 단백질로 번역되는 RNA(mRNA)를 인코딩할 수 있거나, 또는 DNA 폴리뉴클레오티드는 단백질로 번역되지 않는 RNA(예를 들어, tRNA, rRNA 또는 가이드 RNA; "비-코딩" RNA 또는 "ncRNA"로도 지칭됨)를 인코딩할 수 있다. 단백질 코딩 서열 또는 특정 단백질 또는 폴리펩티드를 인코딩하는 서열은 적절한 조절 서열의 제어 하에 배치되는 경우 시험관내에서 또는 생체내에서 (DNA의 경우에) mRNA로 전사되고, (mRNA의 경우에) 폴리펩티드로 번역되는 핵산 서열이다.
본원에 사용되는 바와 같이, "코돈"은 함께 DNA 또는 RNA 분자에서 유전 암호의 단위를 형성하는 3개 뉴클레오티드의 서열을 지칭한다. 본원에 사용되는 바와 같이, 용어 "코돈 축퇴성"은 인코딩된 폴리펩티드의 아미노산 서열에 영향을 미치지 않고, 뉴클레오티드 서열의 변이를 가능하게 하는 유전 암호의 성질을 나타낸다.
용어 "코돈-최적화된" 또는 "코돈 최적화"는 DNA에 의해 인코딩되는 폴리펩티드를 변경시키지 않고, 숙주 유기체의 전형적인 코돈 사용을 반영하기 위한 유전자 내의 코돈 또는 핵산 분자의 코딩 영역의 변경을 나타낸다. 이러한 최적화는 적어도 하나 또는 하나 초과 또는 유의미한 수의 코돈을 해당 유기체의 유전자에서 더욱 빈번하게 사용되는 하나 이상의 코돈으로 대체하는 것을 포함한다. 코돈 사용 표는 예를 들어, www.kazusa.or.jp/codon/(방문일: 2008년 3월 20일)에서 이용 가능한 "코돈 사용 데이터베이스"에서 용이하게 입수 가능하다. 각 유기체 내의 코돈 사용 또는 코돈 선호에 대한 지식을 사용함으로써, 당업자는 빈도를 임의의 주어진 폴리펩티드 서열에 적용하고, 폴리펩티드를 인코딩하지만, 주어진 종에 최적인 코돈을 사용하는 코돈-최적화된 코딩 영역의 핵산 단편을 생성할 수 있다. 코돈-최적화된 코딩 영역은 당업자에게 알려져 있는 다양한 방법에 의해 설계될 수 있다.
예를 들어, 세포, 핵산, 단백질 또는 벡터에 관하여 사용되는 경우, 용어 "재조합" 또는 "엔지니어링된"은 세포, 핵산, 단백질 또는 벡터가 실험실 방법에 의해 변형된 바 있거나, 그의 결과물인 것을 나타낸다. 따라서, 예를 들어, 재조합 또는 엔지니어링된 단백질은 실험실 방법에 의해 생성되는 단백질을 포함한다. 재조합 또는 엔지니어링된 단백질은 고유(비-재조합 또는 야생형) 형태의 단백질 내에서 관찰되지 않는 아미노산 잔기를 포함할 수 있거나, 변형된, 예를 들어, 표지된 아미노산 잔기를 포함할 수 있다. 상기 용어는 펩티드, 단백질 또는 핵산 서열에 대한 임의의 변형을 포함할 수 있다. 이러한 변형은 하기의 것을 포함할 수 있다: 하나 이상의 아미노산, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드로 구성되는 펩티드, 단백질 또는 핵산 서열의 임의의 화학적 변형; 펩티드 또는 단백질 내의 아미노산 중 하나 이상의 부가, 결실 및/또는 치환; 및 핵산 서열 내의 핵산 중 하나 이상의 부가, 결실 및/또는 치환.
용어 "게놈 DNA" 또는 "게놈 서열"은 박테리아, 진균, 조류, 식물 또는 동물의 게놈의 DNA를 포함하나 이들에 한정되지 않는 유기체의 게놈의 DNA를 나타낸다.
본원에 사용되는 바와 같이, 핵산의 맥락에서 "트랜스유전자", "외인성 유전자" 또는 "외인성 서열"은 세포의 게놈에 존재하지 않지만, 예를 들어, 게놈-편집을 통해 게놈 내로 인공적으로 도입되는 핵산 서열 또는 유전자를 나타낸다.
본원에 사용되는 바와 같이, 핵산의 맥락에서 "내인성 유전자" 또는 "내인성 서열"은 임의의 인공의 수단을 통해 도입되지 않고, 세포의 게놈에 천연적으로 존재하는 핵산 서열 또는 유전자를 나타낸다.
용어 "벡터" 또는 "발현 벡터"는 또 다른 DNA 세그먼트, 즉, "삽입물"이 부착되어, 세포 내에서 부착된 세그먼트의 복제를 야기할 수 있는 레플리콘, 예컨대 플라스미드, 파지, 바이러스 또는 코스미드를 의미한다.
용어 "발현 카세트"는 프로모터에 작동 가능하게 연결된 DNA 코딩 서열을 갖는 벡터를 나타낸다. "작동 가능하게 연결된"은 그렇게 기술된 성분이 그들의 의도된 방식으로 기능하게 하는 관계로 그들이 존재하는 병치를 나타낸다. 예를 들어, 프로모터가 그의 전사 또는 발현에 영향을 미친다면, 프로모터는 코딩 서열에 작동 가능하게 연결된다. 용어 "재조합 발현 벡터" 또는 "DNA 구축물"은 벡터 및 적어도 하나의 삽입물을 갖는 DNA 분자를 나타내도록 본원에서 상호 교환 가능하게 사용된다. 재조합 발현 벡터는 통상 삽입물(들)의 발현 및/또는 증량의 목적을 위해 또는 다른 재조합 뉴클레오티드 서열의 구축을 위해 생성된다. 핵산(들)은 프로모터 서열에 작동 가능하게 연결될 수 있거나, 그렇지 않을 수 있으며, DNA 조절 서열에 작동 가능하게 연결될 수 있거나, 그렇지 않을 수 있다.
용어 "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이 뉴클레오티드 서열의 발현을 가능하게 하는 방식으로 조절 서열(들)에 연결된 것을 의미한다. 용어 "조절 서열"은 예를 들어, 프로모터, 인핸서 및 다른 발현 제어 요소(예를 들어, 폴리아데닐화 신호)를 포함하는 것으로 의도된다. 이러한 조절 서열은 해당 분야에 널리 알려져 있으며, 예를 들어, 문헌[Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)]에 기술되어 있다. 조절 서열은 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성성 발현을 유도하는 것들 및 오직 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 유도하는 것들(예를 들어, 조직-특이적 조절 서열)을 포함한다. 발현 벡터의 설계가 표적 세포의 선택, 요망되는 발현 수준 등과 같은 인자에 따라 달라질 수 있는 것이 당업자에 의해 인식될 것이다.
세포는 이러한 DNA가 세포 내측으로 도입되는 경우 외인성 DNA, 예를 들어, 재조합 발현 벡터에 의해 "유전적으로 변형"되거나, "형질전환"되거나, "트랜스펙션"된다. 외인성 DNA의 존재는 영구적인 또는 일시적인 유전적 변화를 초래한다. 형질전환 DNA는 세포의 게놈 내로 통합(공유적으로 연결)될 수 있거나, 그렇지 않을 수 있다. 치료적 활성을 갖는, 예를 들어, A형 혈우병을 치료하는 유전적으로 변형된(또는 형질전환된 또는 트랜스펙션된) 세포가 사용되고, 치료적 세포로 지칭될 수 있다.
분자, 예컨대 펩티드 단편의 맥락에서 사용되는 용어 "농도"는 주어진 부피의 용액 중 존재하는 분자의 양, 예를 들어, 분자의 몰수를 나타낸다.
용어 "개체", "대상체" 및 "숙주"는 본원에서 상호교환 가능하게 사용되며, 진단, 치료 또는 치료법이 요망되는 임의의 대상체를 나타낸다. 일부 양태에서, 대상체는 포유동물이다. 일부 양태에서, 대상체는 인간이다. 일부 양태에서, 대상체는 인간 환자이다. 일부 양태에서, 대상체는 A형 혈우병을 가질 수 있거나, 이를 갖는 것으로 의심되고/거나 A형 혈우병의 하나 이상의 증상을 갖는다. 일부 양태에서, 대상체는 진단시에 또는 그 이후에 A형 혈우병의 위험이 있는 것으로 진단받은 인간이다. 일부 경우에, A형 혈우병의 위험이 있는 것으로의 진단은 내인성 인자 VIII(FVIII) 유전자 또는 FVIII 유전자의 발현에 영향을 미칠 수 있는 게놈 내의 인자 VIII(FVIII) 유전자 근처의 게놈 서열 내의 하나 이상의 돌연변이의 존재에 기초하여 결정될 수 있다.
질병 또는 질환과 관련하여 사용되는 용어 "치료"는 적어도 개체가 걸린 질환과 연관된 증상의 개선이 달성되는 것을 의미하며, 개선은 넓은 의미에서 적어도 파라미터, 예를 들어, 치료 중인 질환(예를 들어, A형 혈우병)과 연관된 증상의 세기의 감소를 나타내기 위해 사용된다. 이와 같이, 치료는 또한 병태 또는 적어도 이와 관련된 증상이 완전히 저해되는, 예를 들어 발생이 예방되거나, 또는 완전히 제거되어, 숙주가 더 이상 질환 또는 적어도 질환을 특징으로 하는 증상을 앓지 않게 된 상황을 포함한다. 따라서, 치료는 하기를 포함한다: (i) 예방, 즉, 임상 증상이 발생하지 않도록 하는 것, 예를 들어, 질병 진행을 방지하는 것을 포함하여, 임상 증상의 발생 위험을 감소시키는 것; (ii) 저해, 즉, 임상 증상의 발생 또는 추가의 발생을 저지하는 것, 예를 들어 활성인 질병을 경감시키는 또는 완전히 저해하는 것.
본원에 사용되는 용어 "유효량", "약제학적 유효량" 또는 "치료적 유효량"은 특정 질환을 갖는 대상체에게 투여되는 경우, 요망되는 유용성을 제공하기에 충분한 조성물의 양을 의미한다. A형 혈우병의 생체외 치료의 맥락에서, 용어 "유효량"은 A형 혈우병의 적어도 하나 이상의 징후 또는 증상을 예방하거나 경감시키는 데 필요한 치료적 세포 또는 그들의 자손의 집단의 양을 나타내며, 요망되는 효과를 제공하기에, 예를 들어, 대상체의 A형 혈우병의 증상을 치료하기에 충분한 치료적 세포 또는 그들의 자손을 갖는 조성물의 양에 관한 것이다. 따라서, 용어 "치료적 유효량"은 치료를 필요로 하는 대상체, 예컨대 A형 혈우병을 갖거나, 이에 대한 위험이 있는 대상체에게 투여되는 경우, 특정 효과를 촉진시키기에 충분한 치료적 세포 또는 치료적 세포를 갖는 조성물의 양을 나타낸다. 유효량은 또한 질병의 증상의 발생을 예방하거나 지연시키거나, 질병의 증상의 과정을 변경(예를 들어, 비제한적으로, 질병의 증상의 진행을 둔화)시키거나, 질병의 증상을 역행시키기에 충분한 양을 포함할 것이다. 대상체(예를 들어, 환자)에서의 A형 혈우병의 생체내 치료 또는 시험관내에서 배양되는 세포에서 행해지는 게놈 편집의 맥락에서, 유효량은 대상체 내의 세포 또는 시험관내에서 배양된 세포의 게놈을 편집하는 데 필요한, 게놈 편집을 위해 사용되는 성분, 예컨대, gRNA, 공여자 주형 및/또는 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제)의 양을 나타낸다. 임의의 주어진 경우에, 적절한 "유효량"이 일상적인 실험을 사용하여 당업자에 의해 결정될 수 있는 것이 이해된다.
본원에 사용되는 용어 "약제학적으로 허용 가능한 부형제"는 대상체로의 관심 화합물(들)의 투여를 위한 약제학적으로 허용 가능한 담체, 첨가제 또는 희석제를 제공하는 임의의 적합한 물질을 나타낸다. "약제학적으로 허용 가능한 부형제"는 약제학적으로 허용 가능한 희석제, 약제학적으로 허용 가능한 첨가제 및 약제학적으로 허용 가능한 담체로서 지칭되는 물질을 포함할 수 있다.
핵산
게놈-표적화 핵산 또는 가이드 RNA
본 개시는 관련 폴리펩티드(예를 들어, 부위-지정 폴리펩티드 또는 DNA 엔도뉴클레아제)의 활성을 표적 핵산 내의 특정 표적 서열에 지향시킬 수 있는 게놈-표적화 핵산을 제공한다. 일부 구현예에서, 게놈-표적화 핵산은 RNA이다. 게놈-표적화 RNA는 본원에서 "가이드 RNA" 또는 "gRNA"로서 지칭된다. 가이드 RNA는 적어도 CRISPR 반복 서열 및 관심 표적 핵산 서열에 혼성화하는 스페이서 서열을 갖는다. II형 시스템에서, gRNA는 또한 tracrRNA 서열로 지칭되는 제2 RNA를 갖는다. II형 가이드 RNA(gRNA)에서, CRISPR 반복 서열 및 tracrRNA 서열은 서로 혼성화하여 듀플렉스를 형성한다. V형 가이드 RNA(gRNA)에서, crRNA는 듀플렉스를 형성한다. 두 시스템 모두에서, 듀플렉스는 부위-지정 폴리펩티드에 결합하여, 가이드 RNA 및 부위-지정 폴리펩티드가 복합체를 형성하게 한다. 게놈-표적화 핵산은 그와 부위-지정 폴리펩티드의 회합 덕분에 복합체에 표적 특이성을 제공한다. 따라서, 게놈-표적화 핵산은 부위-지정 폴리펩티드의 활성을 유도한다.
일부 구현예에서, 게놈-표적화 핵산은 이중-분자 가이드 RNA이다. 일부 구현예에서, 게놈-표적화 핵산은 단일-분자 가이드 RNA이다. 이중-분자 가이드 RNA는 2개 가닥의 RNA를 갖는다. 제1 가닥은 5'에서 3' 방향으로, 선택적인 스페이서 연장 서열, 스페이서 서열 및 최소 CRISPR 반복 서열을 갖는다. 제2 가닥은 (최소 CRISPR 반복 서열에 상보성인) 최소 tracrRNA 서열, 3' tracrRNA 서열 및 선택적인 tracrRNA 연장 서열을 갖는다. II형 시스템에서 단일-분자 가이드 RNA(sgRNA)는 5'에서 3' 방향으로 선택적인 스페이서 연장 서열, 스페이서 서열, 최소 CRISPR 반복 서열, 단일-분자 가이드 링커, 최소 tracrRNA 서열, 3' tracrRNA 서열 및 선택적인 tracrRNA 연장 서열을 갖는다. 선택적인 tracrRNA 연장부는 가이드 RNA에 추가의 기능(예를 들어, 안정성)을 부여하는 요소를 가질 수 있다. 단일-분자 가이드 링커는 최소 CRISPR 반복부 및 최소 tracrRNA 서열을 연결시켜 헤어핀 구조를 형성한다. 선택적인 tracrRNA 연장부는 하나 이상의 헤어핀을 갖는다. V형 시스템에서 단일-분자 가이드 RNA(sgRNA)는 5'에서 3' 방향으로 최소 CRISPR 반복 서열 및 스페이서 서열을 갖는다.
예시에 의해, CRISPR/Cas/Cpf1 시스템에서 사용되는 가이드 RNA 또는 다른 더 작은 RNA는 하기에 예시되고, 해당 분야에 기술된 바와 같이 화학적 수단에 의해 용이하게 합성될 수 있다. 화학적 합성 절차가 계속적으로 확장되지만, 고성능 액체 크로마토그래피(HPLC, 이것은 PAGE와 같이 겔을 사용하지 않음)와 같은 절차에 의한 이러한 RNA의 정제는 더욱 난제가 되는 경향이 있는데, 이는 폴리뉴클레오티드 길이가 백여개의 뉴클레오티드를 상당히 넘게 증가하기 때문이다. 더 긴 길이의 RNA를 생성하기 위하여 사용되는 하나의 접근법은 함께 라이게이션되는 2개 이상의 분자를 생성하는 것이다. 훨씬 더 긴 RNA, 예컨대 Cas9 또는 Cpf1 엔도뉴클레아제를 인코딩하는 것들은 효소적으로 더욱 용이하게 생성된다. 해당 분야에 기술된 바와 같이, 다양한 유형의 RNA 변형, 예를 들어, 안정성을 향상시키고/향상시키거나 선천적 면역 반응의 가능성 또는 정도를 감소시키고/감소시키거나 다른 속성을 향상시키는 변형이 RNA의 화학적 합성 및/또는 효소적 생성 동안 또는 그 후에 도입될 수 있다.
스페이서 연장 서열
게놈-표적화 핵산의 일부 구현예에서, 스페이서 연장 서열은 활성을 변경시키고/변경시키거나 안정성을 제공하고/제공하거나 게놈-표적화 핵산의 변형을 위한 위치를 제공할 수 있다. 스페이서 연장 서열은 온- 또는 오프-표적 활성 또는 특이성을 변경시킬 수 있다. 일부 구현예에서, 스페이서 연장 서열이 제공된다. 스페이서 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000 또는 7000개 이상보다 많은 뉴클레오티드의 길이를 가질 수 있다. 스페이서 연장 서열은 약 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000 또는 7000개 이상의 뉴클레오티드의 길이를 가질 수 있다. 스페이서 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000, 7000개 이상보다 적은 뉴클레오티드의 길이를 가질 수 있다. 일부 구현예에서, 스페이서 연장 서열은 10개 미만의 뉴클레오티드 길이이다. 일부 구현예에서, 스페이서 연장 서열은 10개 내지 30개의 뉴클레오티드 길이이다. 일부 구현예에서, 스페이서 연장 서열은 30개 내지 70개의 뉴클레오티드 길이이다.
일부 구현예에서, 스페이서 연장 서열은 또 다른 모이어티(예를 들어, 안정성 제어 서열, 엔도리보뉴클레아제 결합 서열, 리보자임)를 갖는다. 일부 구현예에서, 모이어티는 핵산 표적화 핵산의 안정성을 감소시키거나 증가시킨다. 일부 구현예에서, 모이어티는 전사 종결자 세그먼트(즉, 전사 종결 서열)이다. 일부 구현예에서, 모이어티는 진핵 세포에서 기능한다. 일부 구현예에서, 모이어티는 원핵 세포에서 기능한다. 일부 구현예에서, 모이어티는 진핵 세포 및 원핵 세포 둘 모두에서 기능한다. 적합한 모이어티의 비제한적인 예는 5' 캡(예를 들어, 7-메틸구아닐레이트 캡(m7 G)), 리보스위치 서열(예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함), dsRNA 듀플렉스(즉, 헤어핀)를 형성하는 서열, RNA를 하위세포 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)에 표적화하는 서열, 트래킹(예를 들어, 형광 분자로의 직접적인 컨쥬게이션, 형광 검출을 용이하게 하는 모이어티로의 컨쥬게이션, 형광 검출을 허용하는 서열 등)을 제공하는 변형 또는 서열, 및/또는 단백질(예를 들어, 전사 활성자, 전사 억제자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 비롯한, DNA에서 작용하는 단백질)을 위한 결합 부위를 제공하는 변형 또는 서열을 포함한다.
스페이서 서열
스페이서 서열은 관심 표적 핵산 내의 서열에 혼성화한다. 게놈-표적화 핵산의 스페이서는 혼성화(즉, 염기 쌍형성)를 통하여 서열-특이적인 방식으로 표적 핵산과 상호작용한다. 따라서, 스페이서의 뉴클레오티드 서열은 관심 표적 핵산의 서열에 따라 달라진다.
본원의 CRISPR/Cas 시스템에서, 스페이서 서열은 시스템에서 사용되는 Cas9 효소의 PAM의 5'에 위치된 표적 핵산에 혼성화되도록 설계된다. 스페이서는 표적 서열과 완벽하게 일치할 수 있거나, 불일치를 가질 수 있다. 각각의 Cas9 효소는 그것이 표적 DNA에서 인식하는 특정 PAM 서열을 갖는다. 예를 들어, 스트렙토코커스 피오게네스는 표적 핵산에서 서열 5'-NRG-3'(여기서 R은 A 또는 G 중 어느 하나를 갖고, N은 임의의 뉴클레오티드이고, N은 스페이서 서열에 의해 표적화된 표적 핵산 서열의 바로 3'임)을 갖는 PAM을 인식한다.
일부 구현예에서, 표적 핵산 서열은 20개의 뉴클레오티드를 갖는다. 일부 구현예에서, 표적 핵산은 20개 미만의 뉴클레오티드를 갖는다. 일부 구현예에서, 표적 핵산은 20개 초과의 뉴클레오티드를 갖는다. 일부 구현예에서, 표적 핵산은 적어도 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오티드를 갖는다. 일부 구현예에서, 표적 핵산은 최대 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오티드를 갖는다. 일부 구현예에서, 표적 핵산 서열은 PAM의 제1 뉴클레오티드의 바로 5'에 20개의 염기를 갖는다. 예를 들어, 5'-NNNNNNNNNNNNNNNNNNNNNRG-3'(SEQ ID NO: 100)을 포함하는 서열에서, 표적 핵산은 Ns에 상응하는 서열을 갖고, 여기서 N은 임의의 뉴클레오티드이며, 밑줄 표시된 NRG 서열(R은 G 또는 A임)은 스트렙토코커스 피오게네스 Cas9 PAM이다. 일부 구현예에서, 스트렙토코커스 피오게네스 Cas9에 의해 인식되는 서열로서 본 개시의 조성물 및 방법에 사용되는 PAM 서열은 NGG이다.
일부 구현예에서, 표적 핵산에 혼성화하는 스페이서 서열은 적어도 약 6개의 뉴클레오티드(nt)의 길이를 갖는다. 스페이서 서열은 적어도 약 6 nt, 약 10 nt, 약 15 nt, 약 18 nt, 약 19 nt, 약 20 nt, 약 25 nt, 약 30 nt, 약 35 nt 또는 약 40 nt, 약 6 nt 내지 약 80 nt, 약 6 nt 내지 약 50 nt, 약 6 nt 내지 약 45 nt, 약 6 nt 내지 약 40 nt, 약 6 nt 내지 약 35 nt, 약 6 nt 내지 약 30 nt, 약 6 nt 내지 약 25 nt, 약 6 nt 내지 약 20 nt, 약 6 nt 내지 약 19 nt, 약 10 nt 내지 약 50 nt, 약 10 nt 내지 약 45 nt, 약 10 nt 내지 약 40 nt, 약 10 nt 내지 약 35 nt, 약 10 nt 내지 약 30 nt, 약 10 nt 내지 약 25 nt, 약 10 nt 내지 약 20 nt, 약 10 nt 내지 약 19 nt, 약 19 nt 내지 약 25 nt, 약 19 nt 내지 약 30 nt, 약 19 nt 내지 약 35 nt, 약 19 nt 내지 약 40 nt, 약 19 nt 내지 약 45 nt, 약 19 nt 내지 약 50 nt, 약 19 nt 내지 약 60 nt, 약 20 nt 내지 약 25 nt, 약 20 nt 내지 약 30 nt, 약 20 nt 내지 약 35 nt, 약 20 nt 내지 약 40 nt, 약 20 nt 내지 약 45 nt, 약 20 nt 내지 약 50 nt 또는 약 20 nt 내지 약 60 nt일 수 있다. 일부 구현예에서, 스페이서 서열은 20개의 뉴클레오티드를 갖는다. 일부 구현예에서, 스페이서는 19개의 뉴클레오티드를 갖는다. 일부 구현예에서, 스페이서는 18개의 뉴클레오티드를 갖는다. 일부 구현예에서, 스페이서는 17개의 뉴클레오티드를 갖는다. 일부 구현예에서, 스페이서는 16개의 뉴클레오티드를 갖는다. 일부 구현예에서, 스페이서는 15개의 뉴클레오티드를 갖는다.
일부 구현예에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 100%이다. 일부 구현예에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 최대 약 30%, 최대 약 40%, 최대 약 50%, 최대 약 60%, 최대 약 65%, 최대 약 70%, 최대 약 75%, 최대 약 80%, 최대 약 85%, 최대 약 90%, 최대 약 95%, 최대 약 97%, 최대 약 98%, 최대 약 99% 또는 100%이다. 일부 구현예에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 표적 핵산의 상보성 가닥의 표적 서열의 가장 5'인 6개의 인접 뉴클레오티드에 걸쳐 100%이다. 일부 구현예에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 약 20개의 인접 뉴클레오티드에 걸쳐서 적어도 60%이다. 일부 구현예에서, 스페이서 서열 및 표적 핵산의 길이는 1개 내지 6개 뉴클레오티드가 상이할 수 있으며, 이는 벌지(bulge) 또는 벌지들로 생각될 수 있다.
일부 구현예에서, 스페이서 서열은 컴퓨터 프로그램을 사용하여 설계되거나 선택된다. 컴퓨터 프로그램은 변수, 예컨대 예측된 용융 온도, 2차 구조 형성, 예측된 어닐링 온도, 서열 동일성, 게놈 컨텍스트, 염색질 접근성, GC%, 게놈 발생(예를 들어, 동일하거나 유사하지만 불일치, 삽입 또는 결실의 결과로서 하나 이상의 스팟에서 달라지는 서열)의 빈도, 메틸화 상태, SNP의 존재 등을 사용할 수 있다.
최소 CRISPR 반복부 서열
일부 구현예에서, 최소 CRISPR 반복부 서열은 참조 CRISPR 반복부 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 crRNA)에 대하여 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열이다.
일부 구현예에서, 최소 CRISPR 반복부 서열은 세포 내의 최소 tracrRNA 서열에 혼성화할 수 있는 뉴클레오티드를 갖는다. 최소 CRISPR 반복부 서열 및 최소 tracrRNA 서열은 듀플렉스, 즉 염기-쌍 형성된 이중-가닥 구조를 형성한다. 함께, 최소 CRISPR 반복부 서열 및 최소 tracrRNA 서열은 부위-지정 폴리펩티드에 결합한다. 최소 CRISPR 반복부 서열의 적어도 일부는 최소 tracrRNA 서열에 혼성화된다. 일부 구현예에서, 최소 CRISPR 반복부 서열의 적어도 일부는 최소 tracrRNA 서열과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성을 갖는다. 일부 구현예에서, 최소 CRISPR 반복부 서열의 적어도 일부는 최소 tracrRNA 서열과 최대 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성을 갖는다.
최소 CRISPR 반복부 서열은 약 7개의 뉴클레오티드 내지 약 100개의 뉴클레오티드 길이를 가질 수 있다. 예를 들어, 최소 CRISPR 반복부 서열의 길이는 약 7개의 뉴클레오티드(nt) 내지 약 50 nt, 약 7 nt 내지 약 40 nt, 약 7 nt 내지 약 30 nt, 약 7 nt 내지 약 25 nt, 약 7 nt 내지 약 20 nt, 약 7 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt 또는 약 15 nt 내지 약 25 nt이다. 일부 구현예에서, 최소 CRISPR 반복부 서열은 대략 9개 뉴클레오티드 길이이다. 일부 구현예에서, 최소 CRISPR 반복부 서열은 대략 12개 뉴클레오티드 길이이다.
일부 구현예에서, 최소 CRISPR 반복부 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 CRISPR 반복부 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 crRNA)과 적어도 약 60% 동일하다. 예를 들어, 최소 CRISPR 반복부 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 CRISPR 반복부 서열과 적어도 약 65% 동일하거나, 적어도 약 70% 동일하거나, 적어도 약 75% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 85% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나 또는 100% 동일하다.
최소 tracrRNA 서열
일부 구현예에서, 최소 tracrRNA 서열은 참조 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 tracrRNA)에 대하여 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열이다.
일부 구현예에서, 최소 tracrRNA 서열은 세포 내의 최소 CRISPR 반복부 서열에 혼성화하는 뉴클레오티드를 갖는다. 최소 tracrRNA 서열 및 최소 CRISPR 반복부 서열은 듀플렉스, 즉 염기-쌍 형성된 이중-가닥 구조를 형성한다. 함께, 최소 tracrRNA 서열 및 최소 CRISPR 반복부는 부위-지정 폴리펩티드에 결합한다. 최소 tracrRNA 서열의 적어도 일부는 최소 CRISPR 반복부 서열에 혼성화할 수 있다. 일부 구현예에서, 최소 tracrRNA 서열은 최소 CRISPR 반복부 서열과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성이다.
최소 tracrRNA 서열은 약 7개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이를 가질 수 있다. 예를 들어, 최소 tracrRNA 서열은 약 7개 뉴클레오티드(nt) 내지 약 50 nt, 약 7 nt 내지 약 40 nt, 약 7 nt 내지 약 30 nt, 약 7 nt 내지 약 25 nt, 약 7 nt 내지 약 20 nt, 약 7 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt 또는 약 15 nt 내지 약 25 nt 길이일 수 있다. 일부 구현예에서, 최소 tracrRNA 서열은 대략 9개 뉴클레오티드 길이이다. 일부 구현예에서, 최소 tracrRNA 서열은 대략 12개 뉴클레오티드이다. 일부 구현예에서, 최소 tracrRNA는 문헌[Jinek et al. Science, 337(6096):816-821 (2012)]에 기술된 tracrRNA 뉴클레오티드 23 내지 48로 이루어진다.
일부 구현예에서, 최소 tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 tracrRNA(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 tracrRNA) 서열과 적어도 약 60% 동일하다. 예를 들어, 최소 tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 tracrRNA 서열과 적어도 약 65% 동일하거나, 약 70% 동일하거나, 약 75% 동일하거나, 약 80% 동일하거나, 약 85% 동일하거나, 약 90% 동일하거나, 약 95% 동일하거나, 약 98% 동일하거나, 약 99% 동일하거나 또는 100% 동일하다.
일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 이중 헬릭스를 갖는다. 일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 뉴클레오티드를 갖는다. 일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오티드를 갖는다.
일부 구현예에서, 듀플렉스는 불일치를 갖는다(즉, 듀플렉스의 두 가닥은 100% 상보적이지는 않다). 일부 구현예에서, 듀플렉스는 적어도 약 1, 2, 3, 4 또는 5개의 불일치를 갖는다. 일부 구현예에서, 듀플렉스는 최대 약 1, 2, 3, 4, 또는 5개의 불일치를 갖는다. 일부 구현예에서, 듀플렉스는 2개 이하의 불일치를 갖는다.
벌지
일부 구현예에서, 최소 CRISPR RNA와 최소 tracrRNA 간의 듀플렉스 내에 "벌지"가 존재한다. 벌지는 듀플렉스 내의 뉴클레오티드의 쌍을 형성하지 않은 영역이다. 일부 구현예에서, 벌지는 부위-지정 폴리펩티드로의 듀플렉스의 결합에 기여한다. 벌지는 듀플렉스의 한 측에 쌍을 형성하지 않은 5'-XXXY-3'를 가지며, 여기서 X는 임의의 퓨린이고, Y는 반대 가닥 상의 뉴클레오티드와 워블 쌍(wobble pair) 및 듀플렉스의 다른 측 상에 쌍을 형성하지 않는 뉴클레오티드 영역을 형성할 수 있는 뉴클레오티드를 갖는다. 듀플렉스의 2개의 측 상의 쌍을 형성하지 않는 뉴클레오티드의 수는 상이할 수 있다.
일 예에서, 벌지는 벌지의 최소 CRISPR 반복부 가닥 상에 쌍을 형성하지 않은 퓨린(예를 들어, 아데닌)을 갖는다. 일부 구현예에서, 벌지는 벌지의 최소 tracrRNA 서열 가닥의 쌍을 형성하지 않은 5'-AAGY-3'을 가지며, 여기서 Y는 최소 CRISPR 반복부 가닥 상의 뉴클레오티드와 워블 쌍을 형성할 수 있는 뉴클레오티드를 갖는다.
일부 구현예에서, 듀플렉스의 최소 CRISPR 반복부 측 상의 벌지는 적어도 1, 2, 3, 4 또는 5개 이상의 쌍을 형성하지 않은 뉴클레오티드를 갖는다. 일부 구현예에서, 듀플렉스의 최소 CRISPR 반복부 측 상의 벌지는 최대 1, 2, 3, 4 또는 5개 이상의 쌍을 형성하지 않은 뉴클레오티드를 갖는다. 일부 구현예에서, 듀플렉스의 최소 CRISPR 반복부 측 상의 벌지는 1개의 쌍을 형성하지 않은 뉴클레오티드를 갖는다.
일부 구현예에서, 듀플렉스의 최소 tracrRNA 서열 측 상의 벌지는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 쌍을 형성하지 않은 뉴클레오티드를 갖는다. 일부 구현예에서, 듀플렉스의 최소 tracrRNA 서열 측 상의 벌지는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 쌍을 형성하지 않은 뉴클레오티드를 갖는다. 일부 구현예에서, 듀플렉스의 제2 측(예를 들어, 듀플렉스의 최소 tracrRNA 서열 측) 상의 벌지는 4개의 쌍을 형성하지 않은 뉴클레오티드를 갖는다.
일부 구현예에서, 벌지는 적어도 하나의 워블 쌍형성을 갖는다. 일부 구현예에서, 벌지는 최대 하나의 워블 쌍형성을 갖는다. 일부 구현예에서, 벌지는 적어도 하나의 퓨린 뉴클레오티드를 갖는다. 일부 구현예에서, 벌지는 적어도 3개의 퓨린 뉴클레오티드를 갖는다. 일부 구현예에서, 벌지 서열은 적어도 5개의 퓨린 뉴클레오티드를 갖는다. 일부 구현예에서, 벌지 서열은 적어도 하나의 구아닌 뉴클레오티드를 갖는다. 일부 구현예에서, 벌지 서열은 적어도 하나의 아데닌 뉴클레오티드를 갖는다.
헤어핀
다양한 구현예에서, 하나 이상의 헤어핀은 3' tracrRNA 서열 내의 최소 tracrRNA에 대하여 3'에 위치한다.
일부 구현예에서, 헤어핀은 최소 CRISPR 반복부 및 최소 tracrRNA 서열 듀플렉스에서 마지막 쌍을 형성한 뉴클레오티드로부터 3'의 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 뉴클레오티드에서 출발한다. 일부 구현예에서, 헤어핀은 최소 CRISPR 반복부 및 최소 tracrRNA 서열 듀플렉스에서 마지막 쌍을 형성한 뉴클레오티드의 3'의 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오티드에서 출발할 수 있다.
일부 구현예에서, 헤어핀은 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 연속 뉴클레오티드를 갖는다. 일부 구현예에서, 헤어핀은 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15개 이상의 연속 뉴클레오티드를 갖는다.
일부 구현예에서, 헤어핀은 CC 디뉴클레오티드(즉, 2개의 연속 시토신 뉴클레오티드)를 갖는다.
일부 구현예에서, 헤어핀은 듀플렉스화된 뉴클레오티드(예를 들어, 함께 혼성화된, 헤어핀의 뉴클레오티드)를 갖는다. 예를 들어, 헤어핀은 3' tracrRNA 서열의 헤어핀 듀플렉스의 GG 디뉴클레오티드에 혼성화되는 CC 디뉴클레오티드를 갖는다.
헤어핀 중 하나 이상은 부위-지정 폴리펩티드의 가이드 RNA-상호작용 영역과 상호작용할 수 있다.
일부 구현예에서, 2개 이상의 헤어핀이 존재하고, 일부 구현예에서 3개 이상의 헤어핀이 존재한다.
3' tracrRNA 서열
일부 구현예에서, 3' tracrRNA 서열은 참조 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 tracrRNA)에 대하여 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열을 갖는다.
일부 구현예에서, 3' tracrRNA 서열은 약 6개의 뉴클레오티드 내지 약 100개의 뉴클레오티드 길이를 갖는다. 예를 들어, 3' tracrRNA 서열은 약 6개의 뉴클레오티드(nt) 내지 약 50 nt, 약 6 nt 내지 약 40 nt, 약 6 nt 내지 약 30 nt, 약 6 nt 내지 약 25 nt, 약 6 nt 내지 약 20 nt, 약 6 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt 또는 약 15 nt 내지 약 25 nt의 길이를 가질 수 있다. 일부 구현예에서, 3' tracrRNA 서열은 대략 14개의 뉴클레오티드 길이를 갖는다.
일부 구현예에서, 3' tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 3' tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 3' tracrRNA 서열)과 적어도 약 60% 동일하다. 예를 들어, 3' tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 3' tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 3' tracrRNA 서열)과 적어도 약 60% 동일하거나, 약 65% 동일하거나, 약 70% 동일하거나, 약 75% 동일하거나, 약 80% 동일하거나, 약 85% 동일하거나, 약 90% 동일하거나, 약 95% 동일하거나, 약 98% 동일하거나, 약 99% 동일하거나 또는 100% 동일하다.
일부 구현예에서, 3' tracrRNA 서열은 하나를 초과하는 듀플렉스화된 영역(예를 들어, 헤어핀, 혼성화된 영역)을 갖는다. 일부 구현예에서, 3' tracrRNA 서열은 2개의 듀플렉스화된 영역을 갖는다.
일부 구현예에서, 3' tracrRNA 서열은 스템 루프 구조를 갖는다. 일부 구현예에서, 3' tracrRNA에서의 스템 루프 구조는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 뉴클레오티드를 갖는다. 일부 구현예에서, 3' tracrRNA에서의 스템 루프 구조는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오티드를 갖는다. 일부 구현예에서, 스템 루프 구조는 기능적 모이어티를 갖는다. 예를 들어, 스템 루프 구조는 압타머, 리보자임, 단백질-상호작용 헤어핀, CRISPR 어레이, 인트론 또는 엑손을 가질 수 있다. 일부 구현예에서, 스템 루프 구조는 적어도 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 갖는다. 일부 구현예에서, 스템 루프 구조는 최대 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 갖는다.
일부 구현예에서, 3' tracrRNA 서열에서 헤어핀은 P-도메인을 갖는다. 일부 구현예에서, P-도메인은 헤어핀 내의 이중-가닥 영역을 갖는다.
tracrRNA 연장 서열
일부 구현예에서, tracrRNA 연장 서열은 tracrRNA가 단일-분자 가이드와 관련되는지 또는 이중-분자 가이드와 관련되는지 여부와 상관없이 제공될 수 있다. 일부 구현예에서, tracrRNA 연장 서열은 약 1개 뉴클레오티드 내지 약 400개 뉴클레오티드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380 또는 400개 초과의 뉴클레오티드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 약 20개 내지 약 5000개 이상의 뉴클레오티드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1000개 초과의 뉴클레오티드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400개 이상보다 적은 뉴클레오티드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 1000개 미만의 뉴클레오티드 길이를 가질 수 있다. 일부 구현예에서, tracrRNA 연장 서열은 10개 미만의 뉴클레오티드 길이를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 10개 내지 30개의 뉴클레오티드 길이이다. 일부 구현예에서, tracrRNA 연장 서열은 30개 내지 70개의 뉴클레오티드 길이이다.
일부 구현예에서, tracrRNA 연장 서열은 기능적 모이어티(예를 들어, 안정성 제어 서열, 리보자임, 엔도리보뉴클레아제 결합 서열)를 갖는다. 일부 구현예에서, 기능적 모이어티는 전사 종결자 세그먼트(즉, 전사 종결 서열)를 갖는다. 일부 구현예에서, 기능적 모이어티는 약 10개 뉴클레오티드(nt) 내지 약 100개 뉴클레오티드, 약 10 nt 내지 약 20 nt, 약 20 nt 내지 약 30 nt, 약 30 nt 내지 약 40 nt, 약 40 nt 내지 약 50 nt, 약 50 nt 내지 약 60 nt, 약 60 nt 내지 약 70 nt, 약 70 nt 내지 약 80 nt, 약 80 nt 내지 약 90 nt 또는 약 90 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt 또는 약 15 nt 내지 약 25 nt의 총 길이를 갖는다. 일부 구현예에서, 기능적 모이어티는 진핵 세포에서 기능한다. 일부 구현예에서, 기능적 모이어티는 원핵 세포에서 기능한다. 일부 구현예에서, 기능적 모이어티는 진핵 및 원핵 세포 둘 모두에서 기능한다.
적합한 tracrRNA 연장 기능적 모이어티의 비제한적인 예는 3' 폴리-아데닐화된 테일, 리보스위치 서열(예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함), dsRNA 듀플렉스(즉, 헤어핀)를 형성하는 서열, RNA를 하위세포 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)에 표적화하는 서열, 트래킹(예를 들어, 형광 분자로의 직접적인 컨쥬게이션, 형광 검출을 용이하게 하는 모이어티로의 컨쥬게이션, 형광 검출을 허용하는 서열 등)을 제공하는 변형 또는 서열, 및/또는 단백질(예를 들어, 전사 활성자, 전사 억제자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 비롯한, DNA에서 작용하는 단백질)을 위한 결합 부위를 제공하는 변형 또는 서열을 포함한다. 일부 구현예에서, tracrRNA 연장 서열은 프라이머 결합 부위 또는 분자 인덱스(예를 들어, 바코드 서열)를 갖는다. 일부 구현예에서, tracrRNA 연장 서열은 하나 이상의 친화성 태그를 갖는다.
단일-분자 가이드 링커 서열
일부 구현예에서, 단일-분자 가이드 핵산의 링커 서열은 약 3개의 뉴클레오티드 내지 약 100개의 뉴클레오티드 길이를 갖는다. 예를 들어, 상기 문헌[Jinek et al.]에서는, 단순한 4 뉴클레오티드 "테트라루프"(-GAAA-)가 사용되었다(문헌[Science, 337(6096):816-821 (2012)]). 예시적인 링커는 약 3개 뉴클레오티드(nt) 내지 약 90 nt, 약 3 nt 내지 약 80 nt, 약 3 nt 내지 약 70 nt, 약 3 nt 내지 약 60 nt, 약 3 nt 내지 약 50 nt, 약 3 nt 내지 약 40 nt, 약 3 nt 내지 약 30 nt, 약 3 nt 내지 약 20 nt, 약 3 nt 내지 약 10 nt의 길이를 갖는다. 예를 들어, 링커는 약 3 nt 내지 약 5 nt, 약 5 nt 내지 약 10 nt, 약 10 nt 내지 약 15 nt, 약 15 nt 내지 약 20 nt, 약 20 nt 내지 약 25 nt, 약 25 nt 내지 약 30 nt, 약 30 nt 내지 약 35 nt, 약 35 nt 내지 약 40 nt, 약 40 nt 내지 약 50 nt, 약 50 nt 내지 약 60 nt, 약 60 nt 내지 약 70 nt, 약 70 nt 내지 약 80 nt, 약 80 nt 내지 약 90 nt 또는 약 90 nt 내지 약 100 nt의 길이를 가질 수 있다. 일부 구현예에서, 단일-분자 가이드 핵산의 링커는 4개 내지 40개의 뉴클레오티드이다. 일부 구현예에서, 링커는 적어도 약 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500 또는 7000개 이상의 뉴클레오티드이다. 일부 구현예에서, 링커는 최대 약 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500 또는 7000개 이상의 뉴클레오티드이다.
링커는 다양한 서열 중 임의의 것을 가질 수 있지만, 일부 구현예에서 링커는 가이드의 다른 기능적 영역을 간섭할 수 있는 분자내 결합을 유발할 수 있는 가이드 RNA의 다른 부분에 대하여 상동성인 광범위한 영역을 갖는 서열을 갖지 않을 것이다. 상기 문헌[Jinek et al.]에서, 단순한 4 뉴클레오티드 서열 -GAAA-가 사용되지만(문헌[Science, 337(6096):816-821 (2012)]), 더 긴 서열을 비롯한, 다수의 다른 서열이 마찬가지로 사용될 수 있다.
일부 구현예에서, 링커 서열은 기능적 모이어티를 갖는다. 예를 들어, 링커 서열은 압타머, 리보자임, 단백질-상호작용 헤어핀, 단백질 결합 부위, CRISPR 어레이, 인트론 또는 엑손을 포함하는 하나 이상의 특징부를 가질 수 있다. 일부 구현예에서, 링커 서열은 적어도 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 갖는다. 일부 구현예에서, 링커 서열은 최대 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 갖는다.
일부 구현예에서, 본 개시에 따른 gRNA에 의해 표적화된 게놈 위치는 게놈, 예를 들어, 인간 게놈 내의 내인성 알부민 유전자좌에, 그 내에 또는 그 근처에 존재할 수 있다. 이러한 위치를 표적화하는 예시적인 가이드 RNA는 표 3 또는 표 4에 열거된 스페이서 서열(예를 들어, SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열) 및 관련 Cas9 또는 Cpf1 절단 부위를 포함한다. 예를 들어, SEQ ID NO: 18로부터의 스페이서 서열을 포함하는 gRNA는 스페이서 서열 UAAUUUUCUUUUGCGCACUA(SEQ ID NO: 105)를 포함할 수 있다. 당업자에 의해 이해되는 바와 같이, 각각의 가이드 RNA는 그의 게놈 표적 서열에 상보적인 스페이서 서열을 포함하도록 설계된다. 예를 들어, 표 3 또는 표 4에 열거된 스페이서 서열의 각각은 단일의 RNA 키메라 또는 (상응하는 tracrRNA와 함께) crRNA에 삽입될 수 있다. 문헌[Jinek et al., Science, 337, 816-821 (2012)] 및 문헌[Deltcheva et al., Nature, 471, 602-607 (2011)]을 참조한다.
공여자 DNA 또는 공여자 주형
부위-지정 폴리펩티드, 예컨대 DNA 엔도뉴클레아제는 핵산, 예를 들어 게놈 DNA 내에 이중-가닥 파단 또는 단일-가닥 파단을 도입할 수 있다. 이중-가닥 파단은 세포의 내인성 DNA-수선 경로(예를 들어, 상동성-의존적 수선(HDR) 또는 비-상동성 말단 연결 또는 대안적인 비-상동성 말단 연결(A-NHEJ) 또는 미세상동성-매개 말단 연결(MMEJ))를 자극할 수 있다. NHEJ는 상동성 주형에 대한 요구 없이 절단된 표적 핵산을 수선할 수 있다. 이것은 때때로 절단 부위에서 표적 핵산 내에 작은 결실 또는 삽입(indel)을 야기할 수 있고, 유전자 발현의 붕괴 또는 변경을 야기할 수 있다. 상동성 재조합(HR)으로도 알려져 있는 HDR은 상동성 수선 주형 또는 공여자가 이용 가능한 경우 일어날 수 있다.
상동성 공여자 주형은 표적 핵산 절단 부위를 플랭킹하는 서열에 상동성인 서열을 갖는다. 자매 염색분체가 수선 주형으로서 세포에 의해 일반적으로 사용된다. 그러나, 게놈 편집의 목적을 위하여, 수선 주형은 흔히 외인성 핵산, 예컨대 플라스미드, 듀플렉스 올리고뉴클레오티드, 단일-가닥 올리고뉴클레오티드, 이중-가닥 올리고뉴클레오티드, 또는 바이러스 핵산으로서 공급된다. 외인성 공여자 주형을 사용하여, 상동성의 플랭킹 영역 사이에 추가 핵산 서열(예컨대 트랜스유전자) 또는 변형(예컨대 단일 또는 다수의 염기 변화 또는 결실)을 도입하여 추가 또는 변경된 핵산 서열이 또한 표적 유전자좌 내에 혼입되게 하는 것이 일반적이다. MMEJ는 작은 결실 및 삽입이 절단 부위에서 일어날 수 있다는 점에서 NHEJ와 유사한 유전 결과를 야기한다. MMEJ는 절단 부위를 플랭킹하는 몇몇 염기쌍의 상동성 서열을 사용하여 선호되는 말단-연결 DNA 수선 결과를 유도한다. 일부 예에서, 뉴클레아제 표적 영역에서의 잠재적인 미세상동성의 분석을 기반으로 가능한 수선 결과를 예측하는 것이 가능할 수 있다.
따라서, 일부 경우에서, 상동성 재조합을 사용하여 표적 핵산 절단 부위 내로 외인성 폴리뉴클레오티드 서열을 삽입한다. 외인성 폴리뉴클레오티드 서열은 본원에서 공여자 폴리뉴클레오티드(또는 공여자 또는 공여자 서열 또는 폴리뉴클레오티드 공여자 주형)로 지칭된다. 일부 구현예에서, 공여자 폴리뉴클레오티드, 공여자 폴리뉴클레오티드의 일부, 공여자 폴리뉴클레오티드의 카피, 또는 공여자 폴리뉴클레오티드의 카피의 일부가 표적 핵산 절단 부위 내에 삽입된다. 일부 구현예에서, 공여자 폴리뉴클레오티드는 외인성 폴리뉴클레오티드 서열, 즉 표적 핵산 절단 부위에서 천연적으로 발생하지 않는 서열이다.
외인성 DNA 분자가 이중 가닥 파단이 발생하는 세포의 핵 내에 충분한 농도로 공급되는 경우, 외인성 DNA는 NHEJ 수선 과정 동안 이중 가닥 파단부에 삽입될 수 있으며, 이에 따라 게놈으로의 영구적인 부가물이 된다. 이들 외인성 DNA 분자는 일부 구현예에서 공여자 주형으로서 지칭된다. 공여자 주형이 선택적으로 관련 조절 서열, 예컨대 프로모터, 인핸서, 폴리A 서열 및/또는 스플라이스 수여자 서열(본원에 "공여자 카세트"로서도 지칭됨)과 함께 관심 유전자, 예컨대 FVIII 유전자에 대한 코딩 서열을 함유한다면, 관심 유전자는 게놈 내의 통합된 카피로부터 발현되어, 세포의 일생을 위한 영구적인 발현을 초래할 수 있다. 더욱이, 공여자 DNA 주형의 통합된 카피는 세포가 분열하는 경우 딸 세포로 전달될 수 있다.
이중 가닥 파단부의 어느 하나의 측에서 DNA 서열에 대하여 상동성을 갖는 플랭킹 DNA 서열(상동성 아암으로 지칭됨)을 함유하는 충분한 농도의 공여자 DNA 주형의 존재 하에서, 공여자 DNA 주형은 HDR 경로를 통해 통합될 수 있다. 상동성 아암은 공여자 주형과, 이중 가닥 파단부의 어느 하나의 측의 서열 간의 상동성 재조합을 위한 기질로서 작용한다. 이는 공여자 주형의 오류 부재 삽입을 초래할 수 있으며, 여기서, 이중 가닥 파단부의 어느 하나의 측의 서열이 비-변형된 게놈에서의 것으로부터 변경되지 않는다.
HDR에 의한 편집을 위한 공급된 공여자는 현저하게 달라지지만 일반적으로는 게놈 DNA에 대한 어닐링을 허용하도록 작거나 큰 플랭킹 상동성 아암을 갖는 의도된 서열을 함유한다. 도입된 유전적 변화를 플랭킹하는 상동성 영역은 30 bp 이하이거나 또는 프로모터, cDNA 등을 함유할 수 있는 수-킬로베이스 카세트만큼 클 수 있다. 단일-가닥 및 이중-가닥 올리고뉴클레오티드 공여자 둘 모두가 사용될 수 있다. 이들 올리고뉴클레오티드는 100 nt 미만에서 수 kb 초과의 크기 범위이지만, 더 긴 ssDNA가 또한 생성되고 사용될 수 있다. PCR 앰플리콘, 플라스미드 및 미니-서클(mini-circle)을 포함하는 이중-가닥 공여자가 흔히 사용된다. 일반적으로, AAV 벡터가 공여자 주형의 매우 효과적인 운반 수단인 것으로 관찰되었지만, 개별 공여자에 대한 패키징 한계는 5kb 미만이다. 공여자의 활성 전사는 HDR을 3배 증가시켰는데, 이는 프로모터의 포함이 전환을 증가시킬 수 있다는 것을 나타낸다. 이에 반해서, 공여자의 CpG 메틸화는 유전자 발현 및 HDR을 감소시킬 수 있다.
일부 구현예에서, 공여자 DNA는 다양한 상이한 방법에 의해, 예를 들어, 트랜스펙션, 나노-입자, 마이크로-주사 또는 바이러스 형질도입에 의해 독립적으로 또는 뉴클레아제와 함께 공급될 수 있다. 일부 구현예에서 HDR을 위한 공여자의 이용 가능성을 증가시키기 위하여 다양한 테더링 옵션(tethering option)이 사용될 수 있다. 예는 공여자를 뉴클레아제에 부착시키는 것, 근처에 결합하는 DNA 결합 단백질에 부착시키는 것 또는 DNA 말단 결합 또는 수선에 관여되는 단백질에 부착시키는 것을 포함한다.
NHEJ 또는 HDR에 의한 게놈 편집에 더하여, NHEJ 경로 및 HR 둘 모두를 사용하는 부위-특이적 유전자 삽입이 행해질 수 있다. 아마도 인트론/엑손 경계를 포함하는 특정 환경에서 조합 접근법이 적용 가능할 수 있다. NHEJ는 인트론에서 라이게이션을 위하여 효과적인 것으로 증명될 수 있지만, 오류-부재 HDR은 코딩 영역에서 더 적합할 수 있다.
구현예들에서, 게놈 내로 삽입시키고자 하는 외인성 서열은 인자 VIII(FVIII) 유전자 또는 그의 기능적 유도체이다. 외인성 유전자는 인자 VIII 단백질 또는 그의 기능적 유도체를 인코딩하는 뉴클레오티드 서열을 포함할 수 있다. FVIII 유전자의 기능적 유도체는 야생형 FVIII 단백질, 예컨대 야생형 인간 FVIII 단백질의 실질적인 활성, 예를 들어, 야생형 FVIII 단백질이 나타내는 활성의 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 또는 약 100%를 갖는 FVIII 단백질의 기능적 유도체를 인코딩하는 핵산 서열을 포함할 수 있다. 일부 구현예에서, FVIII 단백질의 기능적 유도체는 FVIII 단백질, 예를 들어, 야생형 FVIII 단백질에 대하여 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 아미노산 서열 동일성을 가질 수 있다. 일부 구현예에서, 당업자는 해당 분야에 알려져 있는 다수의 방법을 사용하여, 화합물, 예를 들어, 펩티드 또는 단백질의 기능 또는 활성을 시험할 수 있다. FVIII 단백질의 기능적 유도체는 또한 야생형 FVIII 단백질의 임의의 단편, 또는 전장, 야생형 FVIII 단백질 내의 아미노산 잔기 중 하나 이상에 보존적 변형을 갖는 변형된 FVIII 단백질의 단편을 포함할 수 있다. 따라서, 일부 구현예에서, FVIII 유전자의 핵산 서열의 기능적 유도체는 FVIII 유전자, 예를 들어, 야생형 FVIII 유전자에 대하여 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 핵산 서열 동일성을 가질 수 있다.
일부 구현예에서, 인자 VIII(FVIII) 유전자 또는 그의 기능적 유도체의 삽입이 고려되는 경우, 인자 VIII 유전자 또는 그의 기능적 유도체의 cDNA가 결함이 있는 FVIII 유전자 또는 그의 조절 서열을 갖는 환자의 게놈 내로 삽입될 수 있다. 이러한 경우에, 공여자 DNA 또는 공여자 주형은 인자 VIII 유전자 또는 그의 기능적 유도체를 인코딩하는 서열, 예를 들어, cDNA 서열을 갖는 발현 카세트 또는 벡터 구축물일 수 있다. 일부 구현예에서, 본 개시의 다른 곳에 기술된 변형된 인자 VIII 단백질, 예컨대 FVIII-BDD를 인코딩하는 서열을 함유하는 발현 벡터가 사용될 수 있다.
일부 구현예에서, 공여자 카세트를 포함하는 본원에 기술된 공여자 주형 중 임의의 것에 따라, 공여자 카세트는 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 예를 들어, 이러한 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및/또는 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함할 수 있다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함한다. 일부 구현예에서, 공여자 주형은 공여자 주형의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함한다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함한다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함하며, 2개의 gRNA 표적 부위는 동일한 서열을 포함한다. 일부 구현예에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위와 동일한 서열을 포함한다. 일부 구현예에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위의 역 상보물을 포함한다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위와 동일한 서열을 포함한다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위의 역 상보물을 포함한다.
부위-지정 폴리펩티드 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산
일부 구현예에서, 게놈 편집의 방법 및 조성물은 이에 따라 부위-지정 폴리펩티드 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 서열(또는 올리고뉴클레오티드)을 사용할 수 있다. 부위-지정 폴리펩티드를 인코딩하는 핵산 서열은 DNA 또는 RNA일 수 있다. 부위-지정 폴리펩티드를 인코딩하는 핵산 서열이 RNA이면, 그것은 gRNA 서열에 공유적으로 연결되거나 개별 서열로서 존재할 수 있다. 일부 구현예에서, 부위-지정 폴리펩티드 또는 DNA 엔도뉴클레아제의 펩티드 서열이 그의 핵산 서열 대신에 사용될 수 있다.
벡터
또 다른 양태에서, 본 개시는 본 개시의 게놈-표적화 핵산, 본 개시의 부위-지정 폴리펩티드 및/또는 본 개시의 방법의 구현예를 수행하는 데 필요한 임의의 핵산 또는 단백질성 분자를 인코딩하는 뉴클레오티드 서열을 갖는 핵산을 제공한다. 일부 구현예에서, 이러한 핵산은 벡터(예를 들어, 재조합 발현 벡터)이다.
고려되는 발현 벡터는 백시니아 바이러스, 폴리오바이러스, 아데노바이러스, 아데노-연관 바이러스, SV40, 단순 헤르페스 바이러스, 인간 면역결핍 바이러스, 레트로바이러스(예를 들어, 쥣과 백혈병 바이러스, 비장 괴사 바이러스, 및 레트로바이러스, 예컨대 라우스 육종 바이러스, 하비 육종 바이러스, 조류 백혈증 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스, 및 유방 종양 바이러스로부터 유래된 벡터) 및 다른 재조합 벡터를 기반으로 하는 바이러스 벡터를 포함하지만, 이들로 제한되지 않는다. 진핵 표적 세포를 위하여 고려되는 다른 벡터는 벡터 pXT1, pSG5, pSVK3, pBPV, pMSG 및 pSVLSV40(Pharmacia)을 포함하지만, 이들로 제한되지 않는다. 진핵 표적 세포를 위해 고려되는 추가의 벡터는 벡터 pCTx-1, pCTx-2 및 pCTx-3을 포함하지만, 이들로 제한되지 않는다. 숙주 세포와 상용성인 한, 다른 벡터가 사용될 수 있다.
일부 구현예에서, 벡터는 하나 이상의 전사 및/또는 번역 제어 요소를 갖는다. 사용되는 숙주/벡터 시스템에 따라, 구성성 프로모터 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결자 등을 비롯한, 다수의 적합한 전사 및 번역 제어 요소 중 임의의 것이 발현 벡터에서 사용될 수 있다. 일부 구현예에서, 벡터는 바이러스 서열 또는 CRISPR 기구의 성분 또는 다른 요소를 불활성화시키는 자가-불활성화 벡터이다.
적합한 진핵생물 프로모터(즉, 진핵 세포에서 기능성인 프로모터)의 비제한적인 예는 거대세포바이러스(CMV) 급초기, 단순 헤르페스 바이러스(HSV) 티미딘 키나제, 초기 및 후기 SV40, 레트로바이러스로부터의 긴 말단 반복부(LTR), 인간 신장 인자-1 프로모터(EF1), 닭 베타-액틴 프로모터(CAG)에 융합된 거대세포바이러스(CMV) 인핸서를 갖는 하이브리드 구축물, 쥣과 줄기세포 바이러스 프로모터(MSCV), 포스포글리세레이트 키나제-1 유전자좌 프로모터(PGK) 및 마우스 메탈로티오네인-I로부터의 것을 포함한다.
Cas 엔도뉴클레아제와 관련하여 사용되는 가이드 RNA를 비롯한 작은 RNA를 발현시키기 위하여, 다양한 프로모터, 예컨대 예를 들어 U6 및 H1을 비롯한 RNA 중합효소 III 프로모터가 유리할 수 있다. 이러한 프로모터의 사용을 향상시키기 위한 파라미터 및 이의 설명은 해당 분야에 공지되어 있고, 추가 정보 및 접근법은 정기적으로 기술되어 있으며; 예를 들어, 문헌[Ma, H. et al., Molecular Therapy - Nucleic Acids 3, e161 (2014) doi:10.1038/mtna.2014.12]을 참조한다.
발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 함유할 수 있다. 발현 벡터는 또한 발현을 증폭시키기 위한 적절한 서열을 포함할 수 있다. 발현 벡터는 또한 부위-지정 폴리펩티드에 융합된 비-고유 태그(예를 들어, 히스티딘 태그, 혈구응집소 태그, 녹색 형광 단백질 등)를 인코딩하는 뉴클레오티드 서열을 포함하여, 융합 단백질을 야기할 수 있다.
일부 구현예에서, 프로모터는 유도성 프로모터(예를 들어, 열 충격 프로모터, 테트라사이클린-조절 프로모터, 스테로이드-조절 프로모터, 금속-조절 프로모터, 에스트로겐 수용체-조절 프로모터 등)이다. 일부 구현예에서, 프로모터는 구성성 프로모터(예를 들어, CMV 프로모터, UBC 프로모터)이다. 일부 구현예에서, 프로모터는 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터(예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)이다. 일부 구현예에서, 유전자가 게놈 내로 삽입된 후에 게놈에 존재하는 내인성 프로모터 하에서 발현될 것이면, 벡터는 숙주 세포에서 발현될 적어도 하나의 유전자를 위한 프로모터를 갖지 않는다.
부위-지정 폴리펩티드 또는 DNA 엔도뉴클레아제
NHEJ 및/또는 HDR로 인한 표적 DNA의 변형은 예를 들어, 돌연변이, 결실, 변경, 통합, 유전자 교정, 유전자 대체, 유전자 태깅, 트랜스유전자 삽입, 뉴클레오티드 결실, 유전자 붕괴, 전좌 및/또는 유전자 돌연변이를 야기할 수 있다. 비-고유 핵산을 게놈 DNA 내로 통합시키는 과정은 게놈 편집의 일 예이다.
부위-지정 폴리펩티드는 DNA를 절단하기 위하여 게놈 편집에서 사용되는 뉴클레아제이다. 부위-지정은 하나 이상의 폴리펩티드 또는 폴리펩티드를 인코딩하는 하나 이상의 mRNA로서 세포 또는 환자에게 투여될 수 있다.
CRISPR/Cas 또는 CRISPR/Cpf1 시스템의 맥락에서, 부위-지정 폴리펩티드는 가이드 RNA에 결합할 수 있으며, 이는 결과적으로 폴리펩티드가 지향되는 표적 DNA 내의 부위를 특정한다. 본원에서 CRISPR/Cas 또는 CRISPR/Cpf1 시스템의 구현예에서, 부위-지정 폴리펩티드는 엔도뉴클레아제, 예컨대 DNA 엔도뉴클레아제이다.
일부 구현예에서, 부위-지정 폴리펩티드는 복수의 핵산-절단(즉, 뉴클레아제) 도메인을 갖는다. 2개 이상의 핵산-절단 도메인은 링커를 통해 함께 연결될 수 있다. 일부 구현예에서, 링커는 유연성 링커를 갖는다. 링커는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40개 이상의 아미노산 길이를 가질 수 있다.
천연-발생 야생형 Cas9 효소는 2개의 뉴클레아제 도메인, HNH 뉴클레아제 도메인 및 RuvC 도메인을 갖는다. 본원에서, "Cas9"는 천연-발생 Cas9 및 재조합 Cas9 둘 모두를 지칭한다. 본원에 고려되는 Cas9 효소는 HNH 또는 HNH-유사 뉴클레아제 도메인, 및/또는 RuvC 또는 RuvC-유사 뉴클레아제 도메인을 갖는다.
HNH 또는 HNH-유사 도메인은 McrA-유사 폴드를 갖는다. HNH 또는 HNH-유사 도메인은 2개의 역평행 β-가닥 및 α-헬릭스를 갖는다. HNH 또는 HNH-유사 도메인은 금속 결합 부위(예를 들어, 2가 양이온 결합 부위)를 갖는다. HNH 또는 HNH-유사 도메인은 표적 핵산의 하나의 가닥(예를 들어, crRNA 표적화된 가닥의 상보성 가닥)을 절단할 수 있다.
RuvC 또는 RuvC-유사 도메인은 RNaseH 또는 RNaseH-유사 폴드를 갖는다. RuvC/RNaseH 도메인은 RNA 및 DNA 둘 모두에서의 작용을 비롯한 다양한 핵산-기반 기능 세트에 관여된다. RNaseH 도메인은 복수의 α-헬릭스에 의해 둘러싸인 5개의 β-가닥을 갖는다. RuvC/RNaseH 또는 RuvC/RNaseH-유사 도메인은 금속 결합 부위(예를 들어, 2가 양이온 결합 부위)를 갖는다. RuvC/RNaseH 또는 RuvC/RNaseH-유사 도메인은 표적 핵산의 하나의 가닥(예를 들어, 이중-가닥 표적 DNA의 비-상보성 가닥)을 절단할 수 있다.
일부 구현예에서, 부위-지정 폴리펩티드는 예시적인 야생형 부위-지정 폴리펩티드[예를 들어, 스트렙토코커스 피오게네스, US2014/0068797호 Sequence ID No. 8 또는 문헌[Sapranauskas et al., Nucleic Acids Res, 39(21): 9275-9282 (2011)]으로부터의 Cas9] 및 다양한 다른 부위-지정 폴리펩티드에 대하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 예시적인 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)의 뉴클레아제 도메인에 대하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)에 대하여 적어도 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지정 폴리펩티드는 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)에 대하여 최대 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 HNH 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)에 대하여 적어도 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 HNH 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)에 대하여 최대 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 RuvC 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)에 대하여 적어도: 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 갖는다. 일부 구현예에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 RuvC 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)에 대하여 최대 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 변형된 형태의 예시적인 야생형 부위-지정 폴리펩티드를 갖는다. 변형된 형태의 예시적인 야생형 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 핵산-절단 활성을 감소시키는 돌연변이를 갖는다. 일부 구현예에서, 변형된 형태의 예시적인 야생형 부위-지정 폴리펩티드는 예시적인 야생형 부위-지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)의 핵산-절단 활성의 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만을 갖는다. 변형된 형태의 부위-지정 폴리펩티드는 실질적인 핵산-절단 활성을 갖지 않을 수 있다. 부위-지정 폴리펩티드가 실질적인 핵산-절단 활성을 갖지 않는 변형된 형태인 경우, 그것은 본원에서 "효소적으로 불활성"인 것으로 지칭된다.
일부 구현예에서, 변형된 형태의 부위-지정 폴리펩티드는 (예를 들어, 이중-가닥 표적 핵산의 당-포스페이트 백본 중 오직 하나를 절단함으로써) 표적 핵산 상에 단일-가닥 파단(SSB)을 유도할 수 있게 하는 돌연변이를 갖는다. 일부 구현예에서, 돌연변이는 야생형 부위 지정 폴리펩티드(예를 들어, 상기 스트렙토코커스 피오게네스로부터의 Cas9)의 복수의 핵산-절단 도메인 중 하나 이상에서 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만의 핵산-절단 활성을 야기한다. 일부 구현예에서, 돌연변이는 복수의 핵산-절단 도메인 중 하나 이상이 표적 핵산의 상보적인 가닥을 절단하는 능력을 보유하지만, 표적 핵산의 비-상보적인 가닥을 절단하는 그의 능력을 감소되게 한다. 일부 구현예에서, 돌연변이는 복수의 핵산-절단 도메인 중 하나 이상이 표적 핵산의 비-상보적인 가닥을 절단하는 능력을 보유하지만, 표적 핵산의 상보적인 가닥을 절단하는 능력이 감소되게 한다. 예를 들어, 예시적인 야생형 스트렙토코커스 피오게네스 Cas9 폴리펩티드 내의 잔기, 예컨대 Asp10, His840, Asn854 및 Asn856을 돌연변이시켜, 복수의 핵산-절단 도메인(예를 들어, 뉴클레아제 도메인) 중 하나 이상을 불활성화시킨다. 일부 구현예에서, 돌연변이될 잔기는 (예를 들어, 서열 및/또는 구조적 정렬에 의해 결정시) 예시적인 야생형 스트렙토코커스 피오게네스 Cas9 폴리펩티드 내의 잔기 Asp10, His840, Asn854 및 Asn856에 상응한다. 돌연변이의 비제한적인 예는 D10A, H840A, N854A 또는 N856A를 포함한다. 당업자는 알라닌 치환 이외의 돌연변이가 적합함을 인식할 것이다.
일부 구현예에서, D10A 돌연변이를 H840A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 일부 구현예에서, H840A 돌연변이를 D10A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 일부 구현예에서, N854A 돌연변이를 H840A, D10A, 또는 N856A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 일부 구현예에서, N856A 돌연변이를 H840A, N854A, 또는 D10A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 실질적으로 비활성인 뉴클레아제 도메인을 갖는 부위-지정 폴리펩티드는 "닉카아제(nickase)"로서 지칭된다.
일부 구현예에서, RNA-가이드된 엔도뉴클레아제, 예를 들어, Cas9의 변이체를 사용하여 CRISPR-매개된 게놈 편집의 특이성을 증가시킬 수 있다. 야생형 Cas9는 전형적으로 표적 서열(예컨대 내인성 게놈 유전자좌) 내의 명시된 약 20개의 뉴클레오티드 서열과 혼성화하도록 설계된 단일의 가이드 RNA에 의해 가이드된다. 그러나, 몇몇의 불일치가 가이드 RNA와 표적 유전자좌 사이에서 용인되어, 표적 부위에서 필요한 상동성의 길이를 예를 들어, 13개 뉴클레오티드 만큼 적은 상동성으로 효율적으로 감소시키고, 그에 의해 표적 게놈 내의 다른 곳에서의 CRISPR/Cas9 복합체에 의한 결합 및 이중-가닥 핵산 절단(오프-표적 절단이라고도 공지됨)에 대한 가능성을 증가시킬 수 있다. Cas9의 닉카아제 변이체는 각각 단지 하나의 가닥을 절단하기 때문에, 이중-가닥 파단을 생성하기 위하여, 닉카아제의 쌍이 표적 핵산의 매우 근접한 반대편 가닥에 결합하고, 그에 의해 이중-가닥 파단의 등가물인 한 쌍의 닉(nick)을 생성하는 것이 필요하다. 이는 2개의 개별 가이드 RNA(각각의 닉카아제에 대한 것)가 표적 핵산의 매우 근접한 반대편 가닥 상에서 결합해야 할 필요가 있다. 이러한 요건은 이중-가닥 파단이 발생하는 데 필요한 상동성의 최소 길이를 본질적으로 배가시키고, 그에 의해 이중-가닥 절단 사건이 게놈 내의 다른 곳에서 일어날 가능성을 감소시키며, 여기서 2개의 가이드 RNA 부위가 존재하는 경우에는 이중-가닥 파단이 형성되게 하기에 충분히 서로 가까울 가능성이 낮다. 해당 분야에 기술된 바와 같이, 또한, 닉카아제를 사용하여 NHEJ에 비해서 HDR를 촉진시킬 수 있다. HDR을 사용하여 목적하는 변화를 효과적으로 매개하는 특이적 공여자 서열의 이용을 통해 게놈 내의 표적 부위 내로 선택된 변화를 도입할 수 있다. 유전자 편집에서 사용하기 위한 다양한 CRISPR/Cas 시스템의 설명은 예를 들어, 국제 특허 출원 공개 제WO2013/176772호; 및 문헌[Nature Biotechnology 32, 347-355 (2014)], 및 이들에 언급된 참고문헌에서 찾아볼 수 있다.
일부 구현예에서, 부위-지정 폴리펩티드(예를 들어, 변이체, 돌연변이된, 효소적으로 비활성 및/또는 조건부로 효소적으로 비활성인 부위-지정 폴리펩티드)는 핵산을 표적화한다. 일부 구현예에서, 부위-지정 폴리펩티드(예를 들어, 변이체, 돌연변이된, 효소적으로 비활성 및/또는 조건부로 효소적으로 비활성인 엔도리보뉴클레아제)는 DNA를 표적화한다. 일부 구현예에서, 부위-지정 폴리펩티드(예를 들어, 변이체, 돌연변이된, 효소적으로 비활성 및/또는 조건부로 효소적으로 비활성인 엔도리보뉴클레아제)는 RNA를 표적화한다.
일부 구현예에서, 부위-지정 폴리펩티드는 하나 이상의 비-고유 서열을 갖는다(예를 들어, 부위-지정 폴리펩티드는 융합 단백질이다).
일부 구현예에서, 부위-지정 폴리펩티드는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9에 대하여 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 핵산 결합 도메인, 및 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9에 대하여 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 및 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9에 대하여 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 및 2개의 핵산 절단 도메인을 가지며, 여기서 핵산 절단 도메인 중 하나 또는 둘 모두는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9로부터의 뉴클레아제 도메인에 대하여 적어도 50% 아미노산 동일성을 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9에 대하여 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인), 및 비-고유 서열(예를 들어, 핵 국소화 신호) 또는 부위-지정 폴리펩티드를 비-고유 서열에 연결하는 링커를 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9에 대하여 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 가지며, 여기서 부위-지정 폴리펩티드는 뉴클레아제 도메인의 절단 활성을 적어도 50% 감소시키는 핵산 절단 도메인 중 하나 또는 둘 모두 내의 돌연변이를 갖는다.
일부 구현예에서, 부위-지정 폴리펩티드는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9에 대하여 적어도 15% 아미노산 동일성을 갖는 아미노산 서열, 및 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 가지며, 여기서 뉴클레아제 도메인 중 하나는 아스파르트산 10의 돌연변이를 갖고/갖거나, 뉴클레아제 도메인 중 하나는 히스티딘 840의 돌연변이를 갖고, 돌연변이는 뉴클레아제 도메인(들)의 절단 활성을 적어도 50% 감소시킨다.
일부 구현예에서, 하나 이상의 부위-지정 폴리펩티드, 예를 들어 DNA 엔도뉴클레아제는 게놈 내의 특정 유전자좌에서 하나의 이중-가닥 파단을 함께 야기하는 2개의 닉카아제, 또는 게놈 내의 특정 유전자좌에서 2개의 이중-가닥 파단을 함께 야기하는 4개의 닉카아제를 포함한다. 대안적으로, 하나의 부위-지정 폴리펩티드, 예를 들어 DNA 엔도뉴클레아제는 게놈 내의 특정 유전자좌에서 하나의 이중-가닥 파단을 야기한다.
일부 구현예에서, 부위-지정 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 사용하여 게놈을 편집할 수 있다. 이러한 구현예의 일부에서, 부위-지정 폴리펩티드를 인코딩하는 폴리뉴클레오티드는 관심 표적 DNA를 함유하는 세포에서의 발현을 위하여 해당 분야의 표준 방법에 따라 코돈-최적화된다. 예를 들어, 의도된 표적 핵산이 인간 세포에 존재하는 경우, Cas9를 인코딩하는 인간 코돈-최적화된 폴리뉴클레오티드는 Cas9 폴리펩티드의 생성을 위해 사용하는 것이 고려된다.
하기에는 본 개시의 다양한 구현예에 사용될 수 있는 부위-지정 폴리펩티드의 일부 예가 제공된다.
CRISPR 엔도뉴클레아제 시스템
CRISPR(클러스터링된 규칙적 간격의 짧은 회문 반복부) 게놈 유전자좌가 다수의 원핵생물(예를 들어, 박테리아 및 고세균)의 게놈에서 발견될 수 있다. 원핵생물에서, CRISPR 유전자좌는 면역계의 한 유형으로서 기능하여 외래 침입자, 예컨대 바이러스 및 파지에 대하여 원핵생물을 방어하는 것을 돕는 생성물을 인코딩한다. CRISPR 유전자좌 기능의 3 단계가 존재한다: CRISPR 유전자좌 내로의 새로운 서열의 통합, CRISPR RNA(crRNA)의 발현, 및 외래 침입자 핵산의 침묵화(silencing). 5가지 유형의 CRISPR 시스템(예를 들어, I형, II형, III형, U형 및 V형)이 확인된 바 있다.
CRISPR 유전자좌는 "반복부"라 지칭되는 다수의 짧은 반복 서열을 포함한다. 반복부는 발현되는 경우, 이차 헤어핀 구조(예를 들어, 헤어핀)를 형성할 수 있고/있거나 비구조화된 단일-가닥 서열을 가질 수 있다. 반복부는 통상적으로 클러스터로 발생하고, 빈번하게는 종들 사이에 분기한다. 반복부는 "스페이서"라고 지칭되는 독특한 개재 서열이 규칙적으로 산재되어, 반복부-스페이서-반복부 유전자좌 구조를 야기한다. 스페이서는 공지된 외래 침입자 서열과 동일하거나 또는 이와 높은 상동성을 갖는다. 스페이서-반복부 단위는 crisprRNA(crRNA)를 인코딩하는데, 이것은 스페이서-반복부 단위의 성숙 형태로 가공된다. crRNA는 표적 핵산(원핵생물에서의 자연 발생 형태에서, 스페이서 서열은 외래 침입자 핵산을 표적화함)을 표적화는 데 관여되는 "씨드" 또는 스페이서 서열을 갖는다. 스페이서 서열은 crRNA의 5' 또는 3' 말단에 위치된다.
CRISPR 유전자좌는 또한 CRISPR 연관(Cas) 유전자를 인코딩하는 폴리뉴클레오티드 서열을 갖는다. Cas 유전자는 원핵생물에서 생물발생 및 crRNA 기능의 간섭 단계에 관여되는 엔도뉴클레아제를 인코딩한다. 일부 Cas 유전자는 상동성 2차 및/또는 3차 구조를 갖는다.
II형 CRISPR 시스템
자연에서 II형 CRISPR 시스템에서의 crRNA 생물발생은 트랜스-활성화 CRISPR RNA(tracrRNA)를 요구한다. tracrRNA는 내인성 RNaseIII에 의해 변형되고, 이어서 프레-crRNA 어레이의 crRNA 반복부로 혼성화한다. 내인성 RNaseIII은 동원되어 프레-crRNA를 절단한다. 절단된 crRNA는 엑소리보뉴클레아제 트리밍을 겪어 성숙 crRNA 형태(예를 들어, 5' 트리밍)를 생성한다. tracrRNA는 crRNA에 혼성화되어 유지되고, tracrRNA 및 crRNA는 부위-지정 폴리펩티드(예를 들어, Cas9)와 회합된다. crRNA-tracrRNA-Cas9 복합체의 crRNA는 복합체를 crRNA가 혼성화할 수 있는 표적 핵산으로 가이드한다. 표적 핵산으로의 crRNA의 혼성화는 표적화된 핵산 절단을 위하여 Cas9를 활성화시킨다. II형 CRISPR 시스템에서 표적 핵산은 프로토스페이서 인접 모티프(PAM)로서 지칭된다. 자연에서, PAM은 표적 핵산으로의 부위-지정 폴리펩티드(예를 들어, Cas9)의 결합을 용이하게 하는 데 필수적이다. II형 시스템(Nmeni 또는 CASS4로도 지칭됨)은 II-A(CASS4) 및 II-B(CASS4a)형으로 추가로 분류된다. 문헌[Jinek et al., Science, 337(6096):816-821 (2012)]은 CRISPR/Cas9 시스템이 RNA-프로그래밍 가능한 게놈 편집에 유용하다는 것을 보여주었으며, 국제 특허 출원 공개 제WO 2013/176772호는 부위-특이적 유전자 편집을 위한 CRISPR/Cas 엔도뉴클레아제 시스템의 다수의 예 및 적용을 제공한다.
V형 CRISPR 시스템
V형 CRISPR 시스템은 II형 시스템과 몇몇 중요한 차이를 갖는다. 예를 들어, Cpf1은 II형 시스템과 대조적으로, tracrRNA가 결여된 단일의 RNA-가이드된 엔도뉴클레아제이다. 사실상, Cpf1-연관 CRISPR 어레이는 추가의 트랜스-활성화 tracrRNA의 요구 없이 성숙 crRNA로 가공된다. V형 CRISPR 어레이는 42개 내지 44개의 뉴클레오티드 길이의 짧은 성숙 crRNA로 가공되고, 각각의 성숙 crRNA는 19개의 뉴클레오티드의 직접 반복부로 시작하여 23개 내지 25개의 뉴클레오티드의 스페이서 서열로 이어진다. 이에 반해서, II형 시스템의 성숙 crRNA는 20개 내지 24개의 뉴클레오티드의 스페이서 서열로 시작하여 약 22개 뉴클레오티드의 직접 반복부로 이어진다. 또한, Cpf1은 T-풍부 프로토스페이서-인접 모티프를 사용하여 Cpf1-crRNA 복합체가 II형 시스템에 대한 표적 DNA 이후의 G-풍부 PAM과 대조적으로, 짧은 T-풍부 PAM 이후의 표적 DNA를 효율적으로 절단하게 한다. 따라서, V형 시스템은 PAM로부터 원위인 점에서 절단하는 반면, II형 시스템은 PAM에 인접한 점에서 절단한다. 또한, II형 시스템과 대조적으로, Cpf1은 4 또는 5개 뉴클레오티드의 5' 오버행을 갖는 엇갈린 DNA 이중-가닥 파단을 통해 DNA를 절단한다. II형 시스템은 블런트(blunt) 이중-가닥 파단을 통해 절단한다. II형 시스템과 유사하게, Cpf1은 예측된 RuvC-유사 엔도뉴클레아제 도메인을 함유하지만, 제2 HNH 엔도뉴클레아제 도메인이 결여되는데, 이는 II형 시스템과 대조적이다.
Cas 유전자/폴리펩티드 및 프로토스페이서 인접 모티프
예시적인 CRISPR/Cas 폴리펩티드는 문헌[Fonfara et al., Nucleic Acids Research, 42: 2577-2590 (2014)]의 도 1에서의 Cas9 폴리펩티드를 포함한다. CRISPR/Cas 유전자 명명 시스템은 과도한 재기록을 겪었는데, 그 이유는 Cas 유전자가 발견되었기 때문이다. 상기 문헌[Fonfara]의 도 5는 다양한 종으로부터의 Cas9 폴리펩티드에 대한 PAM 서열을 제공한다.
게놈-표적화 핵산과 부위-지정 폴리펩티드의 복합체
게놈-표적화 핵산은 부위-지정 폴리펩티드(예를 들어, 핵산-가이드된 뉴클레아제, 예컨대 Cas9)와 상호작용하고, 그에 의해 복합체를 형성한다. 게놈-표적화 핵산(예를 들어, gRNA)은 부위-지정 폴리펩티드를 표적 핵산으로 가이드한다.
이전에 언급된 바와 같이, 일부 구현예에서, 부위-지정 폴리펩티드 및 게놈-표적화 핵산은 각각 세포 또는 환자에 개별적으로 투여될 수 있다. 다른 한편, 일부 다른 구현예에서, 부위-지정 폴리펩티드는 하나 이상의 가이드 RNA, 또는 tracrRNA와 함께 하나 이상의 crRNA와 사전-복합체화될 수 있다. 그 다음, 사전-복합체화된 물질을 세포 또는 환자에게 투여할 수 있다. 이러한 사전-복합체화된 물질은 리보핵단백질 입자(RNP)로 알려져 있다.
게놈 편집을 위한 시스템
게놈 편집을 위한, 특히 인자 VIII(FVIII) 유전자 또는 그의 기능적 유도체를 세포의 게놈 내로 삽입하기 위한 시스템이 본원에 제공된다. 이들 시스템은 본원에 기술된 방법에서, 예컨대 세포의 게놈을 편집하기 위하여, 그리고 대상체, 예를 들어, A형 혈우병 환자를 치료하기 위하여 사용될 수 있다.
일부 구현예에서, (a) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) 세포의 게놈 내의 알부민 유전자좌를 표적화하는 가이드 RNA(gRNA); 및 (c) 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형을 포함하는 시스템이 본원에 제공된다. 일부 구현예에서, gRNA는 알부민 유전자의 인트론 1을 표적화한다. 일부 구현예에서, gRNA는 SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함한다.
일부 구현예에서, (a) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA); 및 (c) 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형을 포함하는 시스템이 본원에 제공된다. 일부 구현예에서, gRNA는 SEQ ID NO: 21, 22, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, 본원에 기술된 시스템 중 임의의 것에 따라, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, 본원에 기술된 시스템 중 임의의 것에 따라, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 숙주 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 인간 세포에서의 발현을 위해 코돈 최적화된다.
일부 구현예에서, 본원에 기술된 시스템 중 임의의 것에 따라, 시스템은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 인간 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예컨대 DNA 플라스미드이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예컨대 mRNA이다.
일부 구현예에서, 본원에 기술된 시스템 중 임의의 것에 따라, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다. 일부 구현예에서, 공여자 주형은 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, gRNA 표적 부위는 시스템 내의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여자 주형의 gRNA 표적 부위는 시스템 내의 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역 상보물이다.
일부 구현예에서, 본원에 기술된 시스템 중 임의의 것에 따라, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자로 제형화된다. 일부 구현예에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 구현예에서, 리포좀 또는 지질 나노입자는 지질 나노입자이다. 일부 구현예에서, 시스템은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기술된 시스템 중 임의의 것에 따라, DNA 엔도뉴클레아제는 gRNA와 복합체화되어, 리보핵단백질(RNP) 복합체를 형성한다.
게놈 편집의 방법
게놈 편집, 특히 세포의 게놈 내로의 인자 VIII(FVIII) 유전자 또는 그의 기능적 유도체의 삽입 방법이 본원에 제공된다. 이러한 방법을 사용하여 대상체, 예를 들어, A형 혈우병의 환자를 치료할 수 있으며, 이러한 경우에, 세포는 환자 또는 개별 공여자로부터 단리될 수 있다. 그 다음, 세포의 염색체 DNA를 본원에 기술된 물질 및 방법을 사용하여 편집한다.
일부 구현예에서, 낙-인(knock-in) 전략은 FVIII-인코딩 서열, 예를 들어, 야생형 FVIII 유전자(예를 들어, 야생형 인간 FVIII 유전자), FVIII cDNA, 미니유전자(천연 또는 합성 인핸서 및 프로모터, 하나 이상의 엑손 및 천연 또는 합성 인트론 및 천연 또는 합성 3'UTR 및 폴리아데닐화 신호를 가짐) 또는 변형된 FVIII 유전자를 게놈 서열 내로 낙-인시키는 것을 포함한다. 일부 구현예에서, FVIII-인코딩 서열이 삽입되는 게놈 서열은 알부민 유전자좌에, 그 내에 또는 그 근처에 존재한다.
FVIII 유전자 또는 그의 기능적 유도체를 게놈 내로 낙-인시키는 방법이 본원에 제공된다. 일 양태에서, 본 개시는 세포의 게놈 내로의 FVIII 유전자의 핵산 서열, 즉, FVIII 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열의 삽입을 제공한다. 구현예들에서, FVIII 유전자는 야생형 FVIII 단백질을 인코딩할 수 있다. FVIII 단백질의 기능적 유도체는 야생형 FVIII 단백질의 실질적인 활성, 예를 들어, 야생형 FVIII 단백질이 나타내는 활성의 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 또는 약 100%를 갖는 펩티드를 포함할 수 있다. 일부 구현예에서, 당업자는 해당 분야에 알려져 있는 다수의 방법을 사용하여, 화합물, 예를 들어, 펩티드 또는 단백질의 기능 또는 활성을 시험할 수 있다. 일부 구현예에서, FVIII 단백질의 기능적 유도체는 또한 야생형 FVIII 단백질의 임의의 단편, 또는 전장, 야생형 FVIII 단백질 내의 아미노산 잔기 중 하나 이상에 보존적 변형을 갖는 변형된 FVIII 단백질의 단편을 포함할 수 있다. 일부 구현예에서, FVIII 단백질의 기능적 유도체는 또한 야생형 FVIII 단백질의 기능에 실질적으로 부정적으로 영향을 미치지 않는 하나 이상의 아미노산의 임의의 변형(들), 예를 들어, 결실, 삽입 및/또는 돌연변이를 포함할 수 있다. 따라서, 일부 구현예에서, FVIII 유전자의 핵산 서열의 기능적 유도체는 FVIII 유전자에 대하여 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 핵산 서열 동일성을 가질 수 있다.
일부 구현예에서, FVIII 유전자 또는 그의 기능적 유도체는 세포 내의 게놈 서열 내로 삽입된다. 일부 구현예에서, 삽입 부위는 세포의 게놈 내의 알부민 유전자좌에 또는 그 내에 존재한다. 삽입 방법은 알부민 유전자의 제1 인트론(또는 인트론 1)을 표적화하는 하나 이상의 gRNA를 사용한다. 일부 구현예에서, 공여자 DNA는 FVIII 유전자 또는 그의 기능적 유도체를 갖는 단일 또는 이중 가닥 DNA이다.
일부 구현예에서, 게놈 편집 방법은 DNA 엔도뉴클레아제, 예컨대 CRISPR/Cas 시스템을 사용하여, FVIII 유전자 또는 그의 기능적 유도체를 유전적으로 도입(낙-인)한다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제, 그의 동족체, 자연 발생 분자의 재조합체, 그의 코돈-최적화된 또는 변형된 버전 및 상기 중 임의의 것의 조합이다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, 게놈-편집을 겪는 세포는 게놈 내에 하나 이상의 돌연변이(들)를 가지며, 이는 이러한 돌연변이(들)를 갖지 않는 정상에서의 발현에 비하여, 내인성 FVIII 유전자의 발현의 감소를 초래한다. 정상의 세포는 FVIII 유전자 결함을 갖지 않는 상이한 대상체로부터 기원한(또는 단리된) 건강한 또는 대조군 세포일 수 있다. 일부 구현예에서, 게놈-편집을 겪는 세포는 FVIII 유전자 관련 질환 또는 장애, 예를 들어, A형 혈우병의 치료를 필요로 하는 대상체로부터 기원할(또는 단리될) 수 있다. 따라서, 일부 구현예에서, 이러한 세포에서의 내인성 FVIII 유전자의 발현은 정상 세포에서의 내인성 FVIII 유전자 발현의 발현에 비하여 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100% 감소된다.
일부 구현예에서, 게놈 편집 방법은 공급된 프로모터에 작동 가능하게 연결된 기능적 FVIII 유전자, 예를 들어, FVIII 코딩 서열의 게놈의 비-코딩 영역에서의 표적화된 통합을 행하여, 생체내에서 FVIII 단백질을 안정하게 생성한다. 일부 구현예에서, FVIII 코딩 서열의 표적화된 통합은 관심 세포 유형, 예를 들어, 간세포 또는 동모양혈관 내피 세포에서 고도로 발현되는 알부민 유전자의 인트론에서 발생한다. 일부 구현예에서, 삽입될 FVIII 코딩 서열은 야생형 FVIII 코딩 서열, 예를 들어, 야생형 인간 FVIII 코딩 서열일 수 있다. 일부 구현예에서, FVIII 코딩 서열은 야생형 FVIII 코딩 서열, 예컨대 야생형 인간 FVIII 코딩 서열의 기능적 유도체일 수 있다.
일 양태에서, 본 개시는 세포의 게놈 내로의 FVIII 유전자 또는 그의 기능적 유도체의 핵산 서열의 삽입을 제안한다. 구현예들에서, 삽입될 FVIII 코딩 서열은 변형된 FVIII 코딩 서열이다. 일부 구현예에서, 변형된 FVIII 코딩 서열에서, 야생형 FVIII 코딩 서열의 B-도메인은 결실되고, "SQ 링크"(아미노산 서열 SFSQNPPVLKRHQR - SEQ ID NO: 1)로 지칭되는 링커 펩티드로 대체된다. 이러한 B-도메인 결실된 FVIII(FVIII-BDD)는 해당 분야에 널리 알려져 있으며, 전장 FVIII와 동등한 생물학적 활성을 갖는다. 일부 구현예에서, B-도메인 결실된 FVIII은 그의 더 작은 크기(4371 bp 대 7053 bp) 때문에 전장 FVIII에 비하여 바람직하다. 따라서, 일부 구현예에서, FVIII 신호 펩티드가 결여되고 그의 5' 말단(FVIII 코딩 서열의 N-말단)에 스플라이스 수여자 서열을 함유하는 FVIII-BDD 코딩 서열은 인간을 비롯한 포유동물의 간세포 내의 알부민 유전자의 인트론 1 내로 특이적으로 통합된다. 알부민 프로모터로부터의 이러한 변형된 FVIII 코딩 서열의 전사는 알부민의 엑손 1, 인트론 1의 일부 및 통합된 FVIII-BDD 유전자 서열을 함유하는 프레-mRNA를 초래할 수 있다. 이러한 프레-mRNA가 인트론을 제거하도록 천연 스플라이싱 과정을 겪는 때, 스플라이싱 기구는 알부민 엑손 1의 3' 측의 스플라이스 공여자를 삽입된 DNA 공여자의 FVIII-BDD 코딩 서열의 5' 말단에서의 스플라이스 수여자일 다음의 이용 가능한 스플라이스 수여자에 연결할 수 있다. 이는 FVIII-BDD에 대한 성숙 코딩 서열에 융합된 알부민 엑손 1을 함유하는 성숙 mRNA를 초래할 수 있다. 알부민의 엑손 1은 신호 펩티드에 더하여 2개의 추가의 아미노산 및 인간에서 알부민의 N-말단에 단백질 서열 DAH를 정상적으로 인코딩하는 코돈의 1/3을 인코딩한다. 따라서, 일부 구현예에서, 세포로부터의 분비 동안 알부민 신호 펩티드의 예측된 절단 후에, N-말단에 부가되는 3개의 추가의 아미노산 잔기를 갖는 FVIII-BDD 단백질을 생성하여, FVIII-BDD 단백질의 N-말단에 아미노산 서열 -DAHATRRYY(SEQ ID NO: 98)-를 초래할 수 있다. 이들 3개의 아미노산 중 제3의 것(밑줄)이 부분적으로 엑손 1의 말단에 의해, 그리고 부분적으로 FVIII-BDD DNA 공여자 주형에 의해 인코딩되기 때문에, 제3의 추가의 아미노산 잔기의 아이덴티티가 Leu, Pro, His, Gln 또는 Arg 중 어느 하나이도록 선택할 수 있다. 이들 옵션 중에, Leu이 일부 구현예에서 바람직한데, 그 이유는 Leu이 분자적 복잡성이 최소이고, 이에 따라 새로운 T-세포 에피토프를 형성할 가능성이 가장 낮기 때문이며, 이는 FVIII-BDD 단백질의 N-말단에 아미노산 서열 -DALATRRYY-를 초래한다. 대안적으로, DNA 공여자 주형은 제3 잔기를 결실시켜, FVIII-BDD 단백질의 N-말단에 아미노산 서열 DALTRRYY를 초래하도록 설계될 수 있다. 일부 경우에, 고유 단백질의 서열에 추가의 아미노산을 부가하는 것은 면역원성 위험을 증가시킬 수 있다. 따라서, FVIII-BDD의 N-말단에 대한 2가지 가능한 옵션의 잠재적인 면역원성을 예측하기 위한 인 실리코 분석에 의해, 1개의 잔기의 결실(DALTRRYY)이 더 낮은 면역원성 점수를 갖는 것이 입증되는 일부 구현예에서, 이것은 적어도 일부 구현예에서 바람직한 설계일 수 있다.
일부 구현예에서, 코돈 사용이 최적화된 FVIII-BDD를 인코딩하는 DNA 서열을 사용하여, 포유동물 세포에서 발현을 개선시킬 수 있다(소위 코돈 최적화). 코돈 최적화를 수행하기 위한 상이한 컴퓨터 알고리즘은 또한 당업계에서 이용 가능하며, 이들은 별개의 DNA 서열을 생성한다. 상업적으로 이용 가능한 코돈 최적화 알고리즘의 예는 ATUM 및 GeneArt 회사(Thermo Fisher scientific(Thermo Fisher Scientific)의 파트)에 의해 사용되는 것들이다. FVIII 코딩 서열의 코돈 최적화는 마우스로의 유전자 기반의 운반 후에 FVIII의 발현을 유의미하게 개선시키는 것으로 입증되었다(문헌[Nathwani AC, Gray JT, Ng CY, et al. Blood. 2006;107(7):2653-2661.]; 문헌[Ward NJ, Buckley SM, Waddington SN, et al. Blood. 2011; 117(3):798-807.]; 문헌[Radcliffe PA, Sion CJ, Wilkes FJ, et al. Gene Ther. 2008;15(4):289-297]).
일부 구현예에서, 상이한 알고리즘에 의해 코돈 최적화시킨 FVIII-BDD 코딩 서열과 고유 FVIII 서열(인간 게놈에 존재하는 바와 같음) 간의 서열 상동성 또는 동일성은 범위가 약 30%로부터, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100%일 수 있다. 일부 구현예에서, 코돈-최적화된 FVIII-BDD 코딩 서열은 고유 FVIII 서열에 대하여 약 75% 내지 약 79%의 서열 상동성 또는 동일성을 갖는다. 일부 구현예에서, 코돈-최적화된 FVIII-BDD 코딩 서열은 고유 FVIII 서열에 대하여 약 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 78%, 약 79% 또는 약 80%의 서열 상동성 또는 동일성을 갖는다.
일부 구현예에서, 공여자 주형 또는 공여자 구축물은 FVIII-BDD를 인코딩하는 DNA 서열을 함유하도록 제조된다. 일부 구현예에서, DNA 공여자 주형은 코돈 최적화된 인간 FVIII-BDD 코딩 서열을 함유하도록 설계된다. 일부 구현예에서, 코돈-최적화는 FVIII의 신호 펩티드를 인코딩하는 5' 말단의 서열이 결실되고, 스플라이스 수여자 서열로 대체되며, 또한 폴리아데닐화 신호가 FVIII 정지 코돈 이후 3' 말단에 부가되는 방식으로 행해진다(MAB8A - SEQ ID NO: 87). 스플라이스 수여자 서열은 공지된 유전자로부터의 공지된 스플라이스 수여자 서열 중으로부터 선택될 수 있거나, 또는 해당 분야에 알려져 있는 많은 스플라이스 수여자 서열의 정렬로부터 유래되는 공통 스플라이스 수여자 서열이 사용될 수 있다. 일부 구현예에서, 고도로 발현되는 유전자로부터의 스플라이스 수여자 서열이 사용되는데, 그 이유는 이러한 서열이 최적의 스플라이싱 효율을 제공하는 것으로 생각되기 때문이다. 일부 구현예에서, 공통 스플라이싱 수여자 서열은 공통 서열 T/CNC/TT/CA/GAC/T(SEQ ID NO: 99)에 이어서 20 bp 내에 10개 내지 12개 염기의 폴리피리미딘 트랙트(C 또는 T)에 이어서 AG>G/A를 갖는 분지 부위로 구성되며, 여기서, >는 인트론/엑손 경계의 위치이다. 바람직한 일 구현예에서, 합성 스플라이스 수여자 서열(ctgacctcttctcttcctcccacag - SEQ ID NO: 2)이 사용된다. 또 다른 바람직한 구현예에서, 인간(TTAACAATCCTTTTTTTTCTTCCCTTGCCCAG- SEQ ID NO: 3) 또는 마우스(ttaaatatgttgtgtggtttttctctccctgtttccacag- SEQ ID NO: 4)의 알부민 유전자 인트론 1/엑손 2 경계로부터의 고유 스플라이스 수여자 서열이 사용된다.
폴리아데닐화 서열은 세포 내의 mRNA의 안정성에 필수적인 폴리A 테일을 부가하는 신호를 세포에 제공한다. DNA-공여자 주형이 AAV 입자 내로 패키징될 일부 구현예에서, 패키징되는 DNA의 크기를 바람직하게 약 5 Kb 미만, 이상적으로 약 4.7 Kb 이하인 AAV에 대한 패키징 제한 내로 유지하는 것이 바람직하다. 따라서, 일부 구현예에서, 가능한 한 짧은 폴리A 서열, 예를 들어, 약 10-mer, 약 20-mer, 약 30-mer, 약 40-mer, 약 50-mer 또는 약 60-mer 또는 임의의 개재하는 수의 상기의 뉴클레오티드를 사용하는 것이 바람직하다. 공통 합성 폴리 A 신호 서열은 서열 AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTG(SEQ ID NO: 5)와 함께 문헌(Levitt N, Briggs D, Gil A, Proudfoot NJ. Genes Dev. 1989;3(7):1019-1025.)에 기재된 바 있으며, 수많은 발현 벡터에서 통상적으로 사용된다.
일부 구현예에서, 추가의 서열 요소를 DNA 공여자 주형에 부가하여, 통합 빈도를 개선시킬 수 있다. 이러한 하나의 요소는 HDR에 의한 통합을 가능하게 하도록 통합이 표적화된 게놈 내의 이중 가닥 파단부의 어느 하나의 측의 DNA 서열과 동일한 서열인 상동성 아암이다. 이중 가닥 파단부의 좌측으로부터의 서열(LHA)을 DNA 공여자 주형의 5'(FVIII 코딩 서열에 대하여 N-말단) 말단에 첨부하고, 이중 가닥 파단부의 우측으로부터의 서열(RHA)을 DNA 공여자 주형, 예를 들어, MAB8B(SEQ ID NO: 88)의 3'(FVIII 코딩 서열의 C-말단) 말단에 첨부한다.
일부 구현예에서 제공되는 대안적인 DNA 공여자 주형 설계는 게놈 부위를 절단하기 위해 사용될 sgRNA에 대한 인식 서열과 상보성인 서열을 갖는다. MAB8C(SEQ ID NO: 89)는 이러한 유형의 DNA 공여자 주형의 일 예를 나타낸다. sgRNA 인식 부위를 포함시킴으로써, DNA 공여자 주형은 DNA 공여자 주형 및 sgRNA/Cas9가 운반되는 세포의 핵 내측에서 sgRNA/Cas9 복합체에 의해 절단될 것이다. 선형 단편으로의 공여자 DNA 주형의 절단은 이중 가닥 파단부에서 비-상동성 말단 연결 메커니즘에 의한 또는 HDR 메커니즘에 의한 통합 빈도를 증가시킬 수 있다. 이것은 AAV에 패키징된 공여자 DNA 주형을 운반하는 경우에 특히 유리할 수 있는데, 그 이유는 핵으로의 운반 후에, AAV 게놈이 연쇄체화되어, 더 큰 원형의 이중 가닥 DNA 분자를 형성하는 것으로 알려져 있기 때문이다(문헌[Nakai et al JOURNAL OF VIROLOGY 2001, vol75 p. 6969-6976]). 따라서, 일부 경우에, 원형 연쇄체는 특히 NHEJ 메커니즘에 의한 이중 가닥 파단부에서의 통합을 위한 덜 효율적인 공여자일 수 있다. 플라스미드 내에 아연 핑거 뉴클레아제 절단 부위를 포함시킴으로써 원형 플라스미드 DNA 공여자 주형을 사용한 표적화된 통합의 효율이 증가될 수 있는 것이 이전에 보고되었다(문헌[Cristea et al Biotechnol. Bioeng. 2013;110: 871-880]). 더욱 최근에, 또한, CRISPR/Cas9 뉴클레아제를 사용하여 이러한 방법을 적용하였다(문헌[Suzuki et al 2017, Nature 540,144-149]). sgRNA 인식 서열은 이중 가닥 DNA 공여자 주형의 어느 하나의 가닥에 존재하는 경우에 활성이지만, 게놈에 존재하는 sgRNA 인식 서열의 역 상보물의 이용은 안정한 통합에 유리한 것으로 예측되는데, 그 이유는 역 배향의 통합이 sgRNA 인식 서열을 재생성하며, 이는 재절단되어 그에 의해 삽입된 공여자 DNA 주형을 방출할 수 있기 때문이다. NHEJ에 의한 정방향 배향으로의 게놈 내의 이러한 공여자 DNA 주형의 통합은 sgRNA 인식 서열을 재생성하지 않아서, 통합된 공여자 DNA 주형이 게놈으로부터 절제될 수 없게 하는 것으로 예측된다. FVIII 공여자 DNA 주형의 통합의 효율에 대한 상동성 아암이 존재하거나 이것이 존재하지 않는 공여자 내의 sgRNA 인식 서열의 포함의 이익을 예를 들어, 공여자의 운반을 위해 AAV를 사용하고, CRISPR-Cas9 성분의 운반을 위해 LNP를 사용하여, 마우스에서 시험하고 결정할 수 있다.
일부 구현예에서, 공여자 DNA 주형은 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된 본원에 기술된 구현예 중 임의의 것에 따른 공여자 카세트 내의 FVIII 유전자 또는 그의 기능적 유도체를 포함한다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및/또는 공여자 카세트의 3'에 gRNA 표적 부위를 포함한다. 일부 구현예에서, 공여자 주형은 2개의 플랭킹 gRNA 표적 부위를 포함하며, 2개의 gRNA 표적 부위는 동일한 서열을 포함한다. 일부 구현예에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 알부민 유전자의 제1 인트론을 표적화하는 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위이다. 일부 구현예에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 알부민 유전자의 제1 인트론 내의 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위의 역 상보물이다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 알부민 유전자의 제1 인트론을 표적화하는 하나 이상의 gRNA에 의해 표적화된다. 일부 구현예에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 알부민 유전자의 제1 인트론 내의 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위의 역 상보물이다.
표적 부위, 즉, FVIII-인코딩 유전자가 삽입되는 게놈 위치 내로의 FVIII-인코딩 유전자의 삽입은 내인성 알부민 유전자 좌 또는 그의 이웃 서열에서 이루어질 수 있다. 일부 구현예에서, FVIII-인코딩 유전자는 삽입된 유전자의 발현이 알부민 유전자의 내인성 프로모터에 의해 제어되는 방식으로 삽입된다. 일부 구현예에서, FVIII-인코딩 유전자는 알부민 유전자의 인트론 중 하나에 삽입된다. 일부 구현예에서, FVIII-인코딩 유전자는 알부민 유전자의 엑손 중 하나에 삽입된다. 일부 구현예에서, FVIII-인코딩 유전자는 인트론:엑손의 연접부(또는 그의 역)에 삽입된다. 일부 구현예에서, FVIII-인코딩 유전자의 삽입은 알부민 유전자좌의 제1 인트론(또는 인트론 1) 내에서 이루어진다. 일부 구현예에서, FVIII-인코딩 유전자의 삽입은 알부민 유전자의 발현에 유의미하게 영향을 미치지 않으며, 예를 들어, 상향조절하거나 하향조절하지 않는다.
구현예들에서, FVIII-인코딩 유전자의 삽입을 위한 표적 부위는 내인성 알부민 유전자에, 그 내에 또는 그 근처에 존재한다. 일부 구현예에서, 표적 부위는 게놈 내의 알부민 유전자 좌의 프로모터의 상류인 유전자간 영역에 존재한다. 일부 구현예에서, 표적 부위는 알부민 유전자좌 내에 존재한다. 일부 구현예에서, 표적 부위는 알부민 유전자좌의 인트론 중 하나에 존재한다. 일부 구현예에서, 표적 부위는 알부민 유전자좌의 엑손 중 하나에 존재한다. 일부 구현예에서, 표적 부위는 알부민 유전자좌의 인트론과 엑손(또는 그의 역) 사이의 연접부 중 하나에 존재한다. 일부 구현예에서, 표적 부위는 알부민 유전자좌의 제1 인트론(또는 인트론 1)에 존재한다. 특정 구현예에서, 표적 부위는 알부민 유전자의 제1 엑손의(즉, 제1 엑손의 마지막 핵산으로부터) 적어도, 약 또는 최대 0, 1, 5, 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450 또는 500 또는 550 또는 600 또는 650 bp 하류이다. 일부 구현예에서, 표적 부위는 알부민 유전자의 제1 인트론의 적어도, 약 또는 최대 0.1 kb, 약 0.2 kb, 약 0.3 kb, 약 0.4 kb, 약 0.5 kb, 약 1 kb, 약 1.5 kb, 약 2 kb, 약 2.5 kb, 약 3 kb, 약 3.5 kb, 약 4 kb, 약 4.5 kb 또는 약 5 kb 상류이다. 일부 구현예에서, 표적 부위는 알부민 유전자의 제2 엑손의 약 0 bp 내지 약 100 bp 상류, 약 101 bp 내지 약 200 bp 상류, 약 201 bp 내지 약 300 bp 상류, 약 301 bp 내지 약 400 bp 상류, 약 401 bp 내지 약 500 bp 상류, 약 501 bp 내지 약 600 bp 상류, 약 601 bp 내지 약 700 bp 상류, 약 701 bp 내지 약 800 bp 상류, 약 801 bp 내지 약 900 bp 상류, 약 901 bp 내지 약 1000 bp 상류, 약 1001 bp 내지 약 1500 bp 상류, 약 1501 bp 내지 약 2000 bp 상류, 약 2001 bp 내지 약 2500 bp 상류, 약 2501 bp 내지 약 3000 bp 상류, 약 3001 bp 내지 약 3500 bp 상류, 약 3501 bp 내지 약 4000 bp 상류, 약 4001 bp 내지 약 4500 bp 상류 또는 약 4501 bp 내지 약 5000 bp 상류 내의 임의의 곳이다. 일부 구현예에서, 표적 부위는 게놈 내의 인간 알부민 유전자의 제1 엑손의 말단(즉, 3' 말단)의 적어도 37 bp 하류이다. 일부 구현예에서, 표적 부위는 게놈 내의 인간 알부민 유전자의 제2 엑손의 개시부(즉, 5' 개시부)의 적어도 330 bp 상류이다.
일부 구현예에서, 세포 내의 게놈의 편집 방법이 본원에 제공되며, 상기 방법은 하기의 것을 세포에 제공하는 단계를 포함한다: (a) 세포 게놈 내의 알부민 유전자좌를 표적화하는 가이드 RNA(gRNA); (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 구현예에서, gRNA는 알부민 유전자의 인트론 1을 표적화한다. 일부 구현예에서, gRNA는 SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함한다.
일부 구현예에서, 세포 내의 게놈의 편집 방법이 본원에 제공되며, 상기 방법은 하기의 것을 세포에 제공하는 단계를 포함한다: (a) SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA; (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 구현예에서, gRNA는 SEQ ID NO: 21, 22, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포이다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포이다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 사용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예컨대 DNA 플라스미드이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예컨대 mRNA이다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다. 일부 구현예에서, 공여자 주형은 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여자 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역 상보물이다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자로 제형화된다. 일부 구현예에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 구현예에서, 리포좀 또는 지질 나노입자는 지질 나노입자이다. 일부 구현예에서, 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 사용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, DNA 엔도뉴클레아제는 gRNA와 사전-복합체화되어, 리보핵단백질(RNP) 복합체를 형성한다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한 후에 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 4일보다 긴 시간 후에 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 적어도 14일 후에 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 적어도 17일 후에 세포에 제공된다. 일부 구현예에서, (a) 및 (b)는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자로서 세포에 제공된다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다. 일부 구현예에서, (c)는 공여자 주형을 인코딩하는 AAV 벡터로서 세포에게 제공된다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공된다. 일부 구현예에서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공된다.
일부 구현예에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 임의의 것에 따라, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, (a) Cas DNA 엔도뉴클레아제(예를 들어, Cas9) 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산, (b) gRNA 또는 gRNA를 인코딩하는 핵산으로서, gRNA는 Cas DNA 엔도뉴클레아제가 알부민 유전자좌 내의 표적 폴리뉴클레오티드 서열을 절단하도록 가이드할 수 있는 gRNA 또는 gRNA를 인코딩하는 핵산, 및 (c) FVIII 유전자 또는 그의 기능적 유도체를 포함하는 본원에 기술된 구현예 중 어느 하나에 따른 공여자 주형을 세포 내로 도입하는 단계를 포함하는 세포 게놈의 알부민 유전자좌 내로의 FVIII 유전자 또는 그의 기능적 유도체의 삽입 방법이 본원에 제공된다. 일부 구현예에서, 상기 방법은 Cas DNA 엔도뉴클레아제를 인코딩하는 mRNA를 세포 내로 도입하는 단계를 포함한다. 일부 구현예에서, 상기 방법은 i) Cas DNA 엔도뉴클레아제를 인코딩하는 mRNA 및 ii) gRNA를 포함하는 본원에 기술된 구현예 중 어느 하나에 따른 LNP를 세포 내로 도입하는 단계를 포함한다. 일부 구현예에서, 공여자 주형은 AAV 공여자 주형이다. 일부 구현예에서, 공여자 주형은 FVIII 유전자 또는 그의 기능적 유도체를 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA의 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트를 플랭킹하는 gRNA 표적 부위는 알부민 유전자좌 내의 gRNA 표적 부위의 역 상보물이다. 일부 구현예에서, Cas DNA 엔도뉴클레아제 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 gRNA를 인코딩하는 핵산은 세포 내로의 공여자 주형의 도입 후에 세포 내로 도입된다. 일부 구현예에서, Cas DNA 엔도뉴클레아제 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 gRNA를 인코딩하는 핵산은 공여자 주형을 세포 내로 도입한지 충분한 시간 후에 세포 내로 도입되어, 공여자 주형이 세포 핵에 유입되게 한다. 일부 구현예에서, Cas DNA 엔도뉴클레아제 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 gRNA를 인코딩하는 핵산은 공여자 주형을 세포 내로 도입한지 충분한 시간 후에 세포 내로 도입되어, 공여자 주형이 세포 핵 내에서 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로 전환되게 한다. 일부 구현예에서, Cas DNA 엔도뉴클레아제는 Cas9이다.
일부 구현예에서, 본원에 기술된 세포 게놈의 알부민 유전자좌 내로의 FVIII 유전자 또는 그의 기능적 유도체의 삽입 방법 중 어느 하나에 따라, 표적 폴리뉴클레오티드 서열은 알부민 유전자의 인트론 1 내에 존재한다. 일부 구현예에서, gRNA는 표 3 또는 표 4에 열거된 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21, 22, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다.
일부 구현예에서, (a) i) Cas9 DNA 엔도뉴클레아제를 인코딩하는 mRNA 및 ii) gRNA로서, gRNA는 Cas9 DNA 엔도뉴클레아제가 알부민 유전자좌 내의 표적 폴리뉴클레오티드 서열을 절단하도록 가이드할 수 있는 gRNA를 포함하는 본원에 기술된 구현예 중 어느 하나에 따른 LNP, 및 (b) FVIII 유전자 또는 그의 기능적 유도체를 포함하는 본원에 기술된 구현예 중 어느 하나에 따른 AAV 공여자 주형을 세포 내로 도입하는 단계를 포함하는 세포 게놈의 알부민 유전자좌 내로의 FVIII 유전자 또는 그의 기능적 유도체의 삽입 방법이 본원에 제공된다. 일부 구현예에서, 공여자 주형은 FVIII 유전자 또는 그의 기능적 유도체를 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA의 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트를 플랭킹하는 gRNA 표적 부위는 알부민 유전자좌 내의 gRNA 표적 부위의 역 상보물이다. 일부 구현예에서, LNP는 세포 내로의 AAV 공여자 주형의 도입 후에 세포 내로 도입된다. 일부 구현예에서, LNP는 AAV 공여자 주형을 세포 내로 도입한지 충분한 시간 후에 세포 내로 도입되어, 공여자 주형이 세포 핵에 유입되게 한다. 일부 구현예에서, LNP는 AAV 공여자 주형을 세포 내로 도입한지 충분한 시간 후에 세포 내로 도입되어, 공여자 주형이 세포 핵 내에서 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로 전환되게 한다. 일부 구현예에서, 세포 내로의 LNP의 처음의 도입 후 세포 내로의 LNP의 1회 이상(예컨대 2, 3, 4, 5회 이상)의 추가의 도입이 수행된다. 일부 구현예에서, gRNA는 SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21, 22, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다.
표적 서열 선택
일부 구현예에서, 특정 참조 유전자좌에 관한 5' 경계 및/또는 3' 경계의 위치의 이동(shift)을 사용하여 유전자 편집의 특정 적용을 용이하게 하거나 향상시키는데, 이는 본원에 추가로 기술되고 예시된 바와 같이, 편집을 위하여 선택된 엔도뉴클레아제 시스템에 부분적으로 좌우된다.
이러한 표적 서열 선택의 첫 번째 비제한적인 예에서, 다수의 엔도뉴클레아제 시스템은 절단을 위한 잠재적인 표적 부위의 초기 선택을 가이드하는 규칙 또는 기준, 예컨대 CRISPR II형 또는 V형 엔도뉴클레아제의 경우에 DNA 절단 부위에 인접한 특정 위치 내의 PAM 서열 모티프의 요건을 갖는다.
표적 서열 선택 또는 최적화의 또 다른 비제한적인 예에서, 표적 서열 및 유전자 편집 엔도뉴클레아제의 특정 조합에 대한 오프-표적 활성의 빈도(즉, 선택된 표적 서열이 아닌 부위에서 일어나는 DSB의 빈도)는 온-표적 활성의 빈도에 대하여 평가된다. 일부 경우에, 목적하는 유전자좌에서 정확하게 편집된 세포는 다른 세포에 비하여 선택 유리성을 가질 수 있다. 선택 유리성의 예시적인 비제한적인 예는 속성, 예컨대 향상된 복제율, 지속성, 특정 조건에 대한 내성, 환자 내로의 도입 후에 생체 내에서의 향상된 성공적인 이식률 또는 지속성, 및 이러한 세포의 유지 또는 증가된 수 또는 생존력과 연관된 다른 속성의 획득을 포함한다. 다른 경우에, 목적하는 유전좌에서 정확하게 편집된 세포는 정확하게 편집된 세포를 식별, 분류 또는 달리 선택하기 위하여 사용되는 하나 이상의 스크리닝 방법에 의해 양성으로 선택될 수 있다. 선택 유리성 및 유도된 선택 방법 둘 모두는 교정과 연관된 표현형을 이용할 수 있다. 일부 구현예에서, 세포는 세포의 의도된 집단을 선택 또는 정제하기 위하여 사용되는 새로운 표현형을 생성하는 제2 변형을 생성하기 위하여 2회 이상 편집될 수 있다. 이러한 제2 변형은 선택 가능하거나 또는 스크리닝 가능한 마커를 위하여 제2 gRNA를 부가함으로써 생성될 수 있다. 일부 경우에, 세포는 cDNA 및 또한 선택 가능한 마커를 함유하는 DNA 단편을 사용하여 요망되는 유전자좌에서 정확하게 편집될 수 있다.
구현예들에서, 임의의 선택 유리성이 적용 가능하든 또는 임의의 유도되는 선택이 특정 경우에 적용될 것이든 간에, 표적 서열 선택은 또한 적용 효과를 향상시키고/향상시키거나 목적하는 표적 이외의 부위에서 요망되지 않는 변경의 가능성을 감소시키기 위하여 오프-표적 빈도를 고려하여 가이드된다. 본원 및 해당 분야에서 추가로 기술 및 예시된 바와 같이, 오프-표적 활성의 발생은 표적 부위와 다양한 오프-표적 부위 간의 유사성 및 비유사성, 뿐만 아니라 사용된 특정 엔도뉴클레아제를 비롯한 다수의 인자에 의해 영향을 받는다. 오프-표적 활성의 예측을 보조하는 생물정보학 도구가 이용 가능하며, 빈번하게는 이러한 도구를 또한 사용하여 오프-표적 활성의 가장 가능한 부위를 식별할 수 있고, 이어서 이를 실험 환경에서 평가하여 오프-표적 대 온-표적 활성의 상대적인 빈도를 평가하고, 이에 의해 더 높은 상대적인 온-표적 활성을 갖는 서열의 선택이 가능할 수 있다. 이러한 기법의 예시적인 실시예가 본원에 제공되며, 다른 것은 해당 분야에 공지되어 있다.
표적 서열 선택의 또 다른 양태는 상동성 재조합 사건에 관한 것이다. 상동성 영역을 공유하는 서열은 개재 서열의 결실을 야기하는 상동성 재조합 사건을 위한 중심점으로서 기능할 수 있다. 이러한 재조합 사건은 염색체 및 다른 DNA 서열의 정상 복제 과정 동안 일어나고, 또한 DNA 서열이 합성되는 다른 시간에, 예컨대 이중-가닥 파단(DSB)의 수선의 경우에 일어나는데, 이것은 정상 세포 복제 사이클 동안 정기적으로 일어나지만, 다양한 사건(예컨대 UV광 및 DNA 파단의 다른 유도자)의 발생 또는 특정 작용제(예컨대 다양한 화학적 유도자)의 존재에 의해 또한 향상될 수 있다. 다수의 이러한 유도자는 DSB가 게놈에서 무차별적으로 발생하게 하고, DSB는 정상 세포에서 정기적으로 유도되고 수선된다. 수선 동안, 원래 서열은 완전한 정확도로 재구축될 수 있지만, 일부 경우에, 작은 삽입 또는 결실("indel"으로 지칭됨)이 DSB 부위에 도입된다.
DSB는 또한 선택된 염색체 위치에서 유도되는 또는 우선적인 유전자 변형 사건을 유발하는 데 사용될 수 있는, 본원에 기술된 엔도뉴클레아제 시스템의 경우에서와 같이, 특정 위치에서 특이적으로 유도될 수 있다. DNA 수선(뿐만 아니라 복제)과 관련하여 상동성 서열이 재조합을 겪을 경향은 다수의 환경에서 이용될 수 있고, 유전자 편집 시스템, 예컨대 CRISPR의 한 응용을 위한 기반인데, 여기서 상동성 유도 수선을 사용하여 관심 서열을 삽입하되, "공여자" 폴리뉴클레오티드의 사용을 통하여 요망되는 염색체 위치 내로 삽입한다.
10개 또는 그보다 적은 염기쌍을 가질 수 있는 "미세상동성"의 작은 영역일 수 있는, 특정 서열 간의 상동성 영역을 또한 사용하여 요망되는 결실을 야기할 수 있다. 예를 들어, 단일의 DSB는 근처 서열과 미세상동성을 나타내는 부위에 도입된다. 이러한 DSB의 정상 수선 과정 동안, 높은 빈도로 일어나는 결과는 DSB 및 동시의 세포 수선 과정에 의하여 용이해지는 재조합의 결과로서의 개재 서열의 결실이다.
그러나, 일부 환경에서, 상동성의 영역 내에서 표적 서열을 선택하는 것은 또한 유전자 융합(결실이 코딩 영역에 존재하는 경우)을 포함하여 훨씬 더 큰 결실을 생성시킬 수 있고, 이는 특정 환경을 고려하여 바람직하거나 바람직하지 않을 수 있다.
본원에 제공된 예는 FVIII-인코딩 유전자를 삽입하도록 설계된 DSB의 생성을 위한 다양한 표적 영역의 선택, 뿐만 아니라 온-표적 사건에 비하여 오프-표적 사건을 최소화하도록 설계된 이러한 영역 내의 특정 표적 서열의 선택을 추가로 예시한다.
표적화된 통합
일부 구현예에서, 본원에 제공되는 방법은 간세포의 게놈 내의 특정 위치에 FVIII 인코딩 유전자 또는 기능적 FVIII 유전자를 통합하는 것이며, 이는 "표적화된 통합"으로 지칭된다. 일부 구현예에서, 표적화된 통합은 서열 특이적인 뉴클레아제를 사용하여, 게놈 DNA 내의 이중 가닥 파단부를 생성함에 의해 가능하게 된다.
일부 구현예에서 사용되는 CRISPR-Cas 시스템은 다수의 게놈 표적을 신속하게 스크리닝하여, 최적의 CRISPR-Cas 설계를 확인할 수 있는 이점을 갖는다. CRISPR-Cas 시스템은 연관된 Cas 뉴클레아제(예를 들어, Cas9 뉴클레아제)를 DNA 내의 특정 서열에 표적화시키는 단일의 가이드 RNA(sgRNA)로 지칭되는 RNA 분자를 이용한다. 이러한 표적화는 sgRNA와 sgRNA의 서열을 표적화하는 대략 20 bp 이내의 게놈의 서열 사이의 왓슨-크릭 기반의 쌍형성에 의해 발생한다. 일단 표적 부위에 결합되면, Cas 뉴클레아제가 게놈 DNA의 양 가닥을 절단하여, 이중 가닥 파단부를 생성한다. 특이적인 DNA 서열을 표적화하기 위하여 sgRNA를 설계하기 위한 유일한 요건은 표적 서열이 게놈 서열에 상보성인 sgRNA 서열의 3' 말단에 프로토스페이서 인접 모티프(PAM) 서열을 함유해야 하는 것이다. Cas9 뉴클레아제의 경우에, PAM 서열은 NRG(R은 A 또는 G이며, N은 임의의 염기임) 또는 더욱 제한된 PAM 서열 NGG이다. 따라서, 게놈의 임의의 영역을 표적화하는 sgRNA 분자는 모든 PAM 모티프에 인접하게 20 bp 서열을 위치시킴으로써 인 실리코 설계될 수 있다. PAM 모티프는 진핵생물의 게놈 내에 평균 15 bp로 존재한다. 그러나, 인 실리코 방법에 의해 설계되는 sgRNA는 세포에서 상이한 효율로 이중 가닥 파단부를 생성할 것이며, 인 실리코 방법을 사용하여 일련의 sgRNA 분자의 절단 효율을 예측하는 것은 가능하지 않다. sgRNA가 시험관 내에서 신속하게 합성될 수 있기 때문에, 이는 가장 효율적인 절단을 초래하는 sgRNA를 확인하기 위하여 주어진 게놈 영역에서 모든 가능한 sgRNA 서열을 신속하게 스크리닝할 수 있게 한다. 전형적으로, 주어진 게놈 영역 내의 일련의 sgRNA를 세포에서 시험하는 경우, 0% 내지 90%의 절단 효율의 범위가 관찰된다. 또한, 인 실리코 알고리즘 및 실험실 검사를 사용하여, 임의의 주어진 sgRNA의 오프-표적 가능성을 결정할 수 있다. sgRNA의 20 bp 인식 서열에 대한 완벽한 일치가 대부분의 진핵 게놈에서 주로 오직 1회만 존재할 것이지만, 게놈 내의 다수의 추가의 부위가 sgRNA에 대하여 1개 이상의 염기쌍 불일치를 가질 것이다. 이들 부위는 불일치의 수 또는 위치에 기초하여 종종 예측 가능하지 않은 다양한 빈도로 절단될 수 있다. 인 실리코 분석에 의해 확인되지 않은 추가의 오프-표적 부위에서의 절단이 또한 발생할 수 있다. 따라서, 관련 세포 유형에서 다수의 sgRNA를 스크리닝하여 가장 바람직한 오프-표적 프로파일을 갖는 sgRNA를 확인하는 것은 치료적 이용을 위하여 최적의 sgRNA를 선택하는 것의 결정적인 요소이다. 바람직한 오프 표적 프로파일은 이들 부위에서 실제 오프-표적 부위의 수와 절단의 빈도뿐 아니라, 이들 부위의 게놈 내의 위치를 고려할 것이다. 예를 들어, 기능적으로 중요한 유전자, 특히 종양유전자 또는 항-종양유전자 근처의 또는 그 내의 오프-표적 부위는 기능이 알려져 있지 않은 유전자간 영역 내의 부위보다 덜 바람직한 것으로서 고려될 것이다. 따라서, 최적의 sgRNA의 확인은 단순히 유기체의 게놈 서열의 인 실리코 분석에 의해 예측될 수 없고, 실험적 검사를 필요로 한다. 인 실리코 분석이 시험하기 위한 가이드의 수를 줄이는 데 도움이 될 수 있지만, 그것은 높은 온 표적 절단을 갖는 가이드를 예측하거나 낮은 바람직한 오프-표적 절단을 갖는 가이드를 예측할 수 없다. 실험적 데이터에 의해, 각각 관심 영역(예컨대 알부민 인트론 1) 내의 게놈과 완벽한 일치를 갖는 sgRNA의 절단 효율이 절단 부재로부터 90% 초과의 절단으로 달라지며, 임의의 공지된 알고리즘에 의해 예측 가능하지 않음이 나타난다. Cas 효소에 의한 절단을 촉진하기 위한 주어진 sgRNA의 능력은 상기 영역 내의 염색질 구조에 의해 결정될 수 있는 게놈 DNA 내의 특정 부위의 접근 가능성과 관련될 수 있다. 분화된 휴지기 세포, 예컨대 간세포에서 대다수의 게놈 DNA가 고도로 응축된 이질염색질에 존재하지만, 활성적으로 전사되는 영역은 거대 분자, 예컨대 Cas 단백질과 같은 단백질에 더욱 접근 가능한 것으로 알려져 있는 더욱 개방된 염색질 상태로 존재한다. 심지어 활성적으로 전사되는 유전자 내에서, DNA의 일부 특정 영역은 결합된 전사 인자 또는 다른 조절 단백질의 존재 또는 부재로 인하여 다른 것들보다 더욱 접근 가능하다. 게놈 내의 또는 특정 게놈 유전자좌 또는 게놈 유전자좌의 영역, 예컨대 인트론 및 예컨대 알부민 인트론 1 내에서 부위를 예측하는 것은 가능하지 않으며, 이에 따라 관련 세포 유형에서 실험적으로 결정할 필요가 있을 것이다. 일단 일부 부위가 삽입을 위한 가능한 부위로서 선택되면, 예를 들어, 실험적 검사와 함께 또는 이것 없이, 선택된 부위로부터 소수 뉴클레오티드를 상류 또는 하류로 이동시킴으로써 일부 변이를 이러한 부위에 부가하는 것이 가능할 수 있다.
일부 구현예에서, 본원에 개시된 방법에 사용될 수 있는 gRNA는 하나 이상의 표 3에 열거된 것들 또는 표 3으로부터의 것들에 대하여 적어도 약 85% 뉴클레오티드 서열 동일성을 갖는 그의 임의의 유도체이다.
핵산 변형
일부 구현예에서, 세포 내로 도입된 폴리뉴클레오티드는, 본원에 추가로 기술되고 해당 분야에 공지된 바와 같이, 예를 들어, 활성, 안정성 또는 특이성을 향상시키거나, 운반을 변경하거나, 숙주 세포에서 선천적 면역 반응을 감소시키거나 또는 다른 향상을 위하여 개별적으로 또는 조합하여 사용될 수 있는 하나 이상의 변형을 갖는다.
특정 구현예에서, 변형된 폴리뉴클레오티드는 CRISPR/Cas9/Cpf1 시스템에서 사용되며, 이 경우 가이드 RNA(단일-분자 가이드 또는 이중-분자 가이드) 및/또는 세포 내로 도입된 Cas 또는 Cpf1 엔도뉴클레아제를 인코딩하는 DNA 또는 RNA가 하기에 기술되고 예시된 바와 같이 변형될 수 있다. 이러한 변형된 폴리뉴클레오티드를 CRISPR/Cas9/Cpf1 시스템에서 사용하여 임의의 하나 이상의 게놈 유전자좌를 편집할 수 있다.
이러한 사용의 비제한적인 예시의 목적을 위하여 CRISPR/Cas9/Cpf1 시스템을 사용하여, 가이드 RNA의 변형을 사용하여 단일-분자 가이드 또는 이중-분자일 수 있는 가이드 RNA, 및 Cas 또는 Cpf1 엔도뉴클레아제를 갖는 CRISPR/Cas9/Cpf1 게놈 편집 복합체의 형성 또는 안정성을 향상시킬 수 있다. 가이드 RNA의 변형을 또한 또는 대안적으로 사용하여 게놈 편집 복합체와 게놈 내의 표적 서열 간의 상호작용의 개시, 안정성 또는 속도론을 향상시킬 수 있는데, 이를 사용하여 예를 들어 온-표적 활성을 향상시킬 수 있다. 가이드 RNA의 변형을 또한 또는 대안적으로 사용하여 특이성, 예를 들어 다른(오프-표적) 부위에서의 효과에 비하여 온-표적 부위에서 게놈 편집의 상대적인 속도를 향상시킬 수 있다.
변형을 또한 또는 대안적으로 사용하여 예를 들어, 세포에 존재하는 리보뉴클레아제(RNase)에 의한 분해에 대한 내성을 증가시키고, 그에 의해 세포에서의 반감기가 증가되게 함으로써, 가이드 RNA의 안정성을 증가시킬 수 있다. 가이드 RNA 반감기를 향상시키는 변형은 특히 엔도뉴클레아제를 생성하기 위하여 번역될 필요가 있는 RNA를 통해 편집될 세포 내로 Cas 또는 Cpf1 엔도뉴클레아제가 도입되는 구현예에서 유용할 수 있는데, 그 이유는 엔도뉴클레아제를 인코딩하는 RNA와 동시에 도입된 가이드 RNA의 반감기의 증가를 사용하여 가이드 RNA 및 인코딩된 Cas 또는 Cpf1 엔도뉴클레아제가 세포에서 함께 존재하는 시간을 증가시킬 수 있기 때문이다.
변형을 또한 또는 대안적으로 사용하여 세포 내로 도입된 RNA가 선천적 면역 반응을 유발할 가능성 또는 정도를 감소시킬 수 있다. 하기 및 해당 분야에 기술된 바와 같이, 작은-간섭 RNA(siRNA)를 포함하는 RNA 간섭(RNAi)과 관련하여 잘 특성화된 이러한 반응은, RNA의 감소된 반감기 및/또는 사이토카인 또는 면역 반응과 연관된 다른 인자의 유발과 연관되는 경향이 있다.
RNA의 안정성을 향상시키는 변형(예컨대 세포에 존재하는 RNAse에 의한 분해를 증가시킴으로써), 생성된 생성물(즉 엔도뉴클레아제)의 번역을 향상시키는 변형, 및/또는 세포 내로 도입된 RNA가 선천적 면역 반응을 유발할 가능성 또는 정도를 감소시키는 변형을 포함하지만 이들로 제한되지 않는 하나 이상의 유형의 변형이 또한, 세포 내로 도입되는 엔도뉴클레아제를 인코딩하는 RNA에 대하여 이루어질 수 있다.
변형, 예컨대 상기 및 다른 것들의 조합이 마찬가지로 사용될 수 있다. CRISPR/Cas9/Cpf1의 경우에, 예를 들어, 하나 이상의 유형의 변형이 가이드 RNA에 대하여 이루어질 수 있고/있거나(상기에 예시된 것들 포함) 하나 이상의 유형의 변형이 Cas 엔도뉴클레아제를 인코딩하는 RNA에 대하여 이루어질 수 있다(상기에 예시된 것들 포함).
예시로서, CRISPR/Cas9/Cpf1 시스템에서 사용되는 가이드 RNA 또는 다른 더 작은 RNA는 화학적 수단에 의해 용이하게 합성될 수 있으며, 이는 하기에 예시되고, 해당 분야에 기술된 바와 같이, 다수의 변형이 용이하게 혼입되게 한다. 화학적 합성 절차는 계속적으로 확장되지만, 고성능 액체 크로마토그래피(HPLC, 이것은 겔, 예컨대 PAGE을사용하지 않음)와 같은 절차에 의한 이러한 RNA의 정제는 보다 난제가 되는 경향이 있는데, 그 이유는 폴리뉴클레오티드 길이가 수백개를 초과하는 뉴클레오티드로 상당히 증가하기 때문이다. 더 큰 길이의 화학적으로-변형된 RNA를 생성하기 위하여 사용되는 한 접근법은 함께 라이게이션되는 2개 이상의 분자를 생성하는 것이다. 훨씬 더 긴 RNA, 예컨대 Cas9 엔도뉴클레아제를 인코딩하는 것들이 효소적으로 보다 용이하게 생성된다. 더 적은 유형의 변형이 일반적으로 효소적으로 생성된 RNA에서 사용될 수 있지만, 하기에 및 해당 분야에 추가로 기술된 바와 같이, 예를 들어, 안정성을 향상시키고/향상시키거나, 선천적 면역 반응의 가능성 또는 정도를 감소시키고/감소시키거나 다른 속성을 향상시키는 데 사용될 수 있는 변형이 여전히 존재하고; 새로운 유형의 변형이 정기적으로 개발되고 있다.
다양한 유형의 변형, 특히 더 작은 화학적으로 합성된 RNA와 함께 빈번하게 사용되는 것들의 예시로, 변형은 당의 2' 위치에서 변형된 하나 이상의 뉴클레오티드, 일부 구현예에서, 2'-O-알킬, 2'-O-알킬-O-알킬 또는 2'-플루오로-변형된 뉴클레오티드를 가질 수 있다. 일부 구현예에서, RNA 변형은 RNA의 3' 말단에서 피리미딘, 무염기 잔기 또는 역위 염기의 리보스 상에 2'-플루오로, 2'-아미노 또는 2' O-메틸 변형을 포함한다. 이러한 변형은 일상적으로 올리고뉴클레오티드 내로 혼입되며, 이들 올리고뉴클레오티드는 주어진 표적에 대한 2'-데옥시올리고뉴클레오티드보다 더 높은 Tm(즉, 더 높은 표적 결합 친화성)을 갖는 것으로 나타났다.
다수의 뉴클레오티드 및 뉴클레오시드 변형은 그들이 혼입된 올리고뉴클레오티드를 고유 올리고뉴클레오티드보다 뉴클레아제 분해에 대하여 더욱 내성이 되게 하는 것으로 나타났고; 이들 변형된 올리고는 비변형된 올리고뉴클레오티드보다 더 긴 시간 동안 온전하게 살아 남는다. 변형된 올리고뉴클레오티드의 구체적인 예는 변형된 백본, 예를 들어, 포스포로티오에이트, 포스포트리에스테르, 메틸 포스포네이트, 단쇄 알킬 또는 사이클로알킬 당간(intersugar) 결합 또는 단쇄 헤테로원자 또는 헤테로사이클릭 당간 결합을 갖는 것들을 포함한다. 일부 올리고뉴클레오티드는 포스포로티오에이트 백본을 갖는 올리고뉴클레오티드 및 헤테로원자 백본, 특히 CH2-NH-O-CH2, CH,~N(CH3)~O~CH2(메틸렌(메틸이미노) 또는 MMI 백본으로 알려져 있음), CH2--O--N(CH3)-CH2, CH2-N(CH3)-N(CH3)-CH2 및 O-N(CH3)-CH2-CH2 백본을 갖는 것들이며, 고유 포스포디에스테르 백본은 O- P-- O- CH,); 아미드 백본[문헌[De Mesmaeker et al., Ace. Chem. Res., 28:366-374 (1995)] 참조]; 모르폴리노 백본 구조(Summerton 및 Weller, 미국 특허 제5,034,506호 참조); 펩티드 핵산(PNA) 백본(올리고뉴클레오티드의 포스포디에스테르 백본은 폴리아미드 백본으로 대체되며, 뉴클레오티드는 폴리아미드 백본의 아자 질소 원자에 직접적으로 또는 간접적으로 결합되며, 문헌[Nielsen et al., Science 1991, 254, 1497] 참조)으로 표기된다. 인-함유 결합은 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'알킬렌 포스포네이트 및 키랄 포스포네이트를 갖는 메틸 및 기타 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 갖는 포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르 및 정상 3'-5' 결합을 갖는 보라노포스페이트, 이들의 2'-5' 결합된 유사체 및 역위된 극성을 갖는 것들을 포함하나 이들에 제한되지 않으며, 뉴클레오시드 단위의 인접 쌍은 3'-5'에서 5'-3' 또는 2'-5'에서 5'-2' 연결되며; 미국 특허 제3,687,808호; 제4,469,863호; 제4,476,301호; 제5,023,243호; 제5,177,196호; 제5,188,897호; 제5,264,423호; 제5,276,019호; 제5,278,302호; 제5,286,717호; 제5,321,131호; 제5,399,676호; 제5,405,939호; 제5,453,496호; 제5,455,233호; 제5,466,677호; 제5,476,925호; 제5,519,126호; 제5,536,821호; 제5,541,306호; 제5,550,111호; 제5,563,253호; 5,571,799호; 제5,587,361호; 및 제5,625,050호를 참조한다.
모르폴리노계 올리고머 화합물은 문헌[Braasch and David Corey, Biochemistry, 41(14): 4503-4510 (2002)]; 문헌[Genesis, Volume 30, Issue 3, (2001)]; 문헌[Heasman, Dev. Biol., 243: 209-214 (2002)]; 문헌[Nasevicius et al., Nat. Genet., 26:216-220 (2000)]; 문헌[Lacerra et al., Proc. Natl. Acad. Sci., 97: 9591-9596 (2000)]; 및 1991년 7월 23일자 허여된 미국 특허 제5,034,506호에 기술되어 있다.
사이클로헥세닐 핵산 올리고뉴클레오티드 모방체는 문헌[Wang et al., J. Am. Chem. Soc., 122: 8595-8602 (2000)]에 기술되어 있다.
내부에 인 원자를 포함하지 않는 변형된 올리고뉴클레오티드 백본은 단쇄 알킬 또는 사이클로알킬 뉴클레오시드간 결합, 혼합된 헤테로원자 및 알킬 또는 사이클로알킬 뉴클레오시드간 결합 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로사이클릭 뉴클레오시드간 결합에 의해 형성된 백본을 갖는다. 이들은 (뉴클레오시드의 당 부분으로부터 부분적으로 형성된) 모르폴리노 결합; 실록산 백본; 술피드, 술폭시드 및 술폰 백본; 포름아세틸 및 티오포름아세틸 백본; 메틸렌 포름아세틸 및 티오포름아세틸 백본; 알켄 함유 백본; 술파메이트 백본; 메틸렌이미노 및 메틸렌하이드라지노 백본; 술포네이트 및 술폰아미드 백본; 아미드 백본; 및 혼합된 N, O, S 및 CH2 성분 부분을 갖는 다른 것을 갖는 것들을 가지며; 미국 특허 제5,034,506호; 제5,166,315호; 제5,185,444호; 제5,214,134호; 제5,216,141호; 제5,235,033호; 제5,264,562호; 제5,264,564호; 제5,405,938호; 제5,434,257호; 제5,466,677호; 제5,470,967호; 제5,489,677호; 제5,541,307호; 제5,561,225호; 제5,596,086호; 제5,602,240호; 제5,610,289호; 제5,602,240호; 제5,608,046호; 제5,610,289호; 제5,618,704호; 제5,623,070호; 제5,663,312호; 제5,633,360호; 제5,677,437호; 및 제5,677,439호를 참조하며, 이의 각각은 본원에 참조로 포함된다.
하나 이상의 치환된 당 모이어티, 예를 들어, 하기 중 하나가 2' 위치에 포함될 수 있다: OH, SH, SCH3, F, OCN, OCH3 OCH3, OCH3 O(CH2)n CH3, O(CH2)n NH2, 또는 O(CH2)n CH3(여기서 n은 1 내지 약 10임); C1 내지 C10 저급 알킬, 알콕시알콕시, 치환된 저급 알킬, 알크아릴 또는 아르알킬; Cl; Br; CN; CF3; OCF3; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; SOCH3; SO2 CH3; ONO2; NO2; N3; NH2; 헤테로사이클로알킬; 헤테로사이클로알크아릴; 아미노알킬아미노; 폴리알킬아미노; 치환된 실릴; RNA 절단 기; 리포터 기; 인터칼레이터; 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기; 또는 올리고뉴클레오티드의 약력학적 특성을 개선시키기 위한 기 및 유사한 특성을 갖는 다른 치환기. 일부 구현예에서, 변형은 2'-메톡시에톡시(2'-0-CH2CH2OCH3, 2'-O-(2-메톡시에틸)로도 공지되어 있음)를 포함한다(문헌[Martin et al, HeIv. Chim. Acta, 1995, 78, 486]). 다른 변형은 2'-메톡시(2'-0-CH3), 2'-프로폭시(2'-OCH2 CH2CH3) 및 2'-플루오로(2'-F)를 포함한다. 유사한 변형이 또한 올리고뉴클레오티드 상의 다른 위치, 특히 3' 말단 뉴클레오티드 상의 당의 3' 위치 및 5' 말단 뉴클레오티드의 5' 위치 상에서 이루어질 수 있다. 올리고뉴클레오티드는 또한 펜토푸라노실기 대신에 당 모방체, 예컨대 사이클로부틸을 가질 수 있다.
일부 구현예에서, 뉴클레오티드 단위의 당 및 뉴클레오시드간 결합, 즉, 백본은 신규한 기로 대체된다. 염기 단위는 적절한 핵산 표적 화합물과의 혼성화를 위하여 유지된다. 뛰어난 혼성화 특성을 갖는 것으로 나타난 이러한 하나의 올리고머 화합물인 올리고뉴클레오티드 모방체는 펩티드 핵산(PNA)으로 지칭된다. PNA 화합물에서, 올리고뉴클레오티드의 당-백본은 아미드 함유 백본, 예를 들어 아미노에틸글리신 백본으로 대체된다. 핵염기는 유지되며, 백본의 아미드 부분의 아자 질소 원자에 직접적으로 또는 간접적으로 결합된다. PNA 화합물의 제조를 교시하는 대표적인 미국 특허는 미국 특허 제5,539,082호; 제5,714,331호; 및 제5,719,262호를 갖지만 이들에 제한되지 않는다. PNA 화합물의 추가의 교시는 문헌[Nielsen et al, Science, 254: 1497-1500 (1991)]에서 찾을 수 있다.
일부 구현예에서, 가이드 RNA는 또한 추가로 또는 대안적으로, 핵염기(흔히 해당 분야에서 단순히 "염기"로 지칭함) 변형 또는 치환을 포함할 수 있다. 본원에 사용되는 바와 같이, "비변형된" 또는 "천연" 핵염기는 아데닌(A), 구아닌(G), 티민(T), 시토신(C), 및 우라실(U)을 포함한다. 변형된 핵염기는 천연 핵산에서 단지 드물게 또는 일시적으로 발견되는 핵염기, 예를 들어, 하이포잔틴, 6-메틸아데닌, 5-Me 피리미딘, 특히 5-메틸시토신(5-메틸-2' 데옥시시토신으로도 지칭되고, 해당 분야에 흔히 5-Me-C로 지칭됨), 5-하이드록시메틸시토신(HMC), 글리코실 HMC 및 젠토비오실 HMC, 뿐만 아니라 합성 핵염기, 예를 들어, 2-아미노아데닌, 2-(메틸아미노)아데닌, 2-(이미다졸릴알킬)아데닌, 2-(아미노알킬아미노)아데닌 또는 다른 헤테로치환된 알킬아데닌, 2-티오우라실, 2-티오티민, 5-브로모우라실, 5-하이드록시메틸우라실, 8-아자구아닌, 7-데아자구아닌, N6 (6-아미노헥실)아데닌, 및 2,6-디아미노퓨린을 포함한다(문헌[Kornberg, A., DNA Replication, W. H. Freeman & Co., San Francisco, pp75-77 (1980)]; 문헌[Gebeyehu et al., Nucl. Acids Res. 15:4513 (1997)]). 해당 분야에 공지된 "보편적" 염기, 예를 들어, 이노신이 또한 포함될 수 있다. 5-Me-C 치환은 핵산 듀플렉스 안정성을 0.6℃ 내지 1.2℃ 증가시키는 것으로 나타났고(문헌[Sanghvi, Y. S., in Crooke, S. T. and Lebleu, B., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278]), 염기 치환의 구현예이다.
일부 구현예에서, 변형된 핵염기는 다른 합성 및 천연 핵염기, 예컨대 5-메틸시토신(5-me-C), 5-하이드록시메틸 시토신, 잔틴, 하이포잔틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 기타 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실(슈도-우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-하이드록실 및 기타 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다.
또한, 핵염기는 미국 특허 제3,687,808호에 개시된 것들, 문헌['The Concise Encyclopedia of Polymer Science And Engineering', pages 858-859], 문헌[Kroschwitz, J.I., ed. John Wiley & Sons, 1990]에 의해 개시된 것들, 문헌[Englisch et al., Angewandle Chemie, International Edition', 1991, 30, page 613]에 의해 개시된 것들 및 문헌[Sanghvi, Y. S., Chapter 15, Antisense Research and Applications', pages 289- 302], 문헌[Crooke, S.T. and Lebleu, B. ea., CRC Press, 1993]에 의해 개시된 것들을 포함한다. 이들 특정 핵염기는 본 개시의 올리고머 화합물의 결합 친화성을 증가시키는 데 특히 유용하다. 이들은 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 0-6 치환된 퓨린, 예컨대 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신을 갖는다. 5-메틸시토신 치환은 핵산 듀플렉스 안정성을 0.6℃ 내지 1.2℃ 증가시키는 것으로 나타났으며(문헌[Sanghvi, Y.S., Crooke, S.T. and Lebleu, B., eds, 'Antisense Research and Applications', CRC Press, Boca Raton, 1993, pp. 276-278]), 훨씬 더 구체적으로는 2'-O-메톡시에틸 당 변형과 조합되는 경우 염기 치환의 구현예가다. 변형된 핵염기는 미국 특허 제3,687,808호 및 제4,845,205호; 제5,130,302호; 제5,134,066호; 제5,175,273호; 제5,367,066호; 제5,432,272호; 제5,457,187호; 제5,459,255호; 제5,484,908호; 제5,502,177호; 제5,525,711호; 제5,552,540호; 제5,587,469호; 제5,596,091호; 제5,614,617호; 제5,681,941호; 제5,750,692호; 제5,763,588호; 제5,830,653호; 제6,005,096호; 및 미국 특허 출원 공개 제2003/0158403호에 기술되어 있다.
일부 구현예에서, 가이드 RNA 및/또는 엔도뉴클레아제를 인코딩하는 mRNA(또는 DNA)는 올리고뉴클레오티드의 활성, 세포 분포 또는 세포 흡수를 향상시키는 하나 이상의 모이어티 또는 컨쥬게이트에 화학적으로 연결된다. 이러한 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티[문헌[Letsinger et al., Proc. Natl. Acad. Sci. USA, 86: 6553-6556 (1989)]]; 콜산[문헌[Manoharan et al., Bioorg. Med. Chem. Let., 4: 1053-1060 (1994)]]; 티오에테르, 예를 들어, 헥실-S-트리틸티올[문헌[Manoharan et al, Ann. N. Y. Acad. Sci., 660: 306-309 (1992)] 및 문헌[Manoharan et al., Bioorg. Med. Chem. Let., 3: 2765-2770 (1993)]]; 티오콜레스테롤[문헌[Oberhauser et al., Nucl. Acids Res., 20: 533-538 (1992)]]; 지방족 쇄, 예를 들어, 도데칸디올 또는 운데실 잔기[문헌[Kabanov et al., FEBS Lett., 259: 327-330 (1990)] 및 문헌[Svinarchuk et al., Biochimie, 75: 49- 54 (1993)]]; 인지질, 예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트[문헌[Manoharan et al., Tetrahedron Lett., 36: 3651-3654 (1995)] 및 문헌[Shea et al., Nucl. Acids Res., 18: 3777-3783 (1990)]]; 폴리아민 또는 폴리에틸렌 글리콜 쇄[문헌[Mancharan et al., Nucleosides & Nucleotides, 14: 969-973 (1995)]]; 아다만탄 아세트산[문헌[Manoharan et al., Tetrahedron Lett., 36: 3651-3654 (1995)]]; 팔미틸 모이어티[문헌[Mishra et al., Biochim. Biophys. Acta, 1264: 229-237 (1995)]]; 또는 옥타데실아민 또는 헥실아미노-카보닐-t 옥시콜레스테롤 모이어티[문헌[Crooke et al., J. Pharmacol. Exp. Ther., 277: 923-937 (1996)]]를 포함하지만, 이들에 제한되지 않는다. 또한, 미국 특허 제4,828,979호; 제4,948,882호; 제5,218,105호; 제5,525,465호; 제5,541,313호; 제5,545,730호; 제5,552,538호; 제5,578,717호, 제5,580,731호; 제5,580,731호; 제5,591,584호; 제5,109,124호; 제5,118,802호; 제5,138,045호; 제5,414,077호; 제5,486,603호; 제5,512,439호; 제5,578,718호; 제5,608,046호; 제4,587,044호; 제4,605,735호; 제4,667,025호; 제4,762,779호; 제4,789,737호; 제4,824,941호; 제4,835,263호; 제4,876,335호; 제4,904,582호; 제4,958,013호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,245,022호; 제5,254,469호; 제5,258,506호; 제5,262,536호; 제5,272,250호; 제5,292,873호; 제5,317,098호; 제5,371,241호, 제5,391,723호; 제5,416,203호, 제5,451,463호; 제5,510,475호; 제5,512,667호; 제5,514,785호; 제5,565,552호; 제5,567,810호; 제5,574,142호; 제5,585,481호; 제5,587,371호; 제5,595,726호; 제5,597,696호; 제5,599,923호; 제5,599,928호 및 제5,688,941호를 참조한다.
일부 구현예에서, 당 및 기타 모이어티를 사용하여 뉴클레오티드를 갖는 단백질 및 복합체, 예컨대 양이온성 폴리솜 및 리포좀을 특정 부위에 표적화할 수 있다. 예를 들어, 간세포 유도 전달은 아시알로당단백질 수용체(ASGPR)를 통해 매개될 수 있으며; 예를 들어, 문헌[Hu, et al., Protein Pept Lett. 21(10):1025-30 (2014)]을 참조한다. 해당 분야에 알려져 있으며, 정기적으로 개발된 다른 시스템을 사용하여, 본 경우에 사용되는 생체분자 및/또는 그의 복합체를 특정한 관심 표적 세포에 표적화할 수 있다.
일부 구현예에서, 이들 표적화 모이어티 또는 컨쥬게이트는 작용기, 예컨대 일차 또는 이차 하이드록실기에 공유적으로 결합되는 컨쥬게이트 기를 포함할 수 있다. 본 개시의 컨쥬게이트 기는 인터칼레이터, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약력학적 특성을 향상시키는 기 및 올리고머의 약동학적 특성을 향상시키는 기를 포함한다. 전형적인 컨쥬게이트 기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 엽산염, 펜안트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함한다. 본 개시의 맥락에서 약력학적 특성을 향상시키는 기는 흡수를 개선시키고/개선시키거나 분해에 대한 내성을 향상시키고/향상시키거나 표적 핵산과의 서열-특이적인 혼성화를 강화시키는 기를 포함한다. 본 개시의 맥락에서 약동학적 특성을 향상시키는 기는 본 개시의 화합물의 흡수, 분포, 대사 또는 배출을 개선시키는 기를 포함한다. 대표적인 컨쥬게이트 기는 1992년 10월 23일자 출원된 국제 특허 출원 제PCT/US92/09196호 및 미국 특허 제6,287,860호에 개시되어 있으며, 이들은 본원에 참조로 포함된다. 컨쥬게이트 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티, 콜산, 티오에테르, 예를 들어, 헥실-5-트리틸티올, 티오콜레스테롤, 지방족 쇄, 예를 들어, 도데칸디올 또는 운데실 잔기, 인지질, 예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트, 폴리아민 또는 폴리에틸렌 글리콜 쇄, 또는 아다만탄 아세트산, 팔미틸 모이어티, 또는 옥타데실아민 또는 헥실아미노-카보닐-옥시 콜레스테롤 모이어티를 포함하지만, 이들에 제한되지 않는다. 예를 들어, 미국 특허 제4,828,979호; 제4,948,882호; 제5,218,105호; 제5,525,465호; 제5,541,313호; 제5,545,730호; 제5,552,538호; 제5,578,717호, 제5,580,731호; 제5,580,731호; 제5,591,584호; 제5,109,124호; 제5,118,802호; 제5,138,045호; 제5,414,077호; 제5,486,603호; 제5,512,439호; 제5,578,718호; 제5,608,046호; 제4,587,044호; 제4,605,735호; 제4,667,025호; 제4,762,779호; 제4,789,737호; 제4,824,941호; 제4,835,263호; 제4,876,335호; 제4,904,582호; 제4,958,013호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,245,022호; 제5,254,469호; 제5,258,506호; 제5,262,536호; 제5,272,250호; 제5,292,873호; 제5,317,098호; 제5,371,241호, 제5,391,723호; 제5,416,203호, 제5,451,463호; 제5,510,475호; 제5,512,667호; 제5,514,785호; 제5,565,552호; 제5,567,810호; 제5,574,142호; 제5,585,481호; 제5,587,371호; 제5,595,726호; 제5,597,696호; 제5,599,923호; 제5,599,928호 및 제5,688,941호를 참조한다.
화학적 합성에 덜 적합하고, 전형적으로 효소적 합성에 의해 생성되는 더 긴 폴리뉴클레오티드가 또한 다양한 수단에 의해 변형될 수 있다. 이러한 변형은 예를 들어, 특정 뉴클레오티드 유사체의 도입, 분자의 5' 또는 3' 말단에 특정 서열 또는 다른 모이어티의 혼입 및 다른 변형을 포함할 수 있다. 예시로, Cas9를 인코딩하는 mRNA는 대략 4 kb 길이이고, 시험관내 전사에 의해 합성될 수 있다. mRNA에 대한 변형이 적용되어 예를 들어, 그의 번역 또는 안정성을 증가시키거나(예컨대 세포를 사용한 분해에 대한 내성을 증가시킴으로써) 또는 외인성 RNA, 특히 예컨대 Cas9를 인코딩하는 더 긴 RNA의 도입 이후에 세포에서 흔히 관찰되는 선천적 면역 반응을 유발하는 RNA의 경향을 감소시킬 수 있다.
다수의 이러한 변형, 예컨대 폴리A 테일, 5' 캡 유사체(예를 들어, 항 역전사 캡 유사체(Anti Reverse Cap Analog; ARCA) 또는 m7G(5')ppp(5')G(mCAP)), 변형된 5' 또는 3' 비번역 영역(UTR), 변형된 염기(예컨대 슈도-UTP, 2-티오-UTP, 5-메틸시티딘-5'-트리포스페이트(5-메틸-CTP) 또는 N6-메틸-ATP)의 사용 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리는 해당 분야에 기술되어 있다. 이들 변형 및 다른 변형이 해당 분야에 공지되어 있고, RNA의 새로운 변형은 정기적으로 개발되고 있다.
예를 들어, 트라이링크 바이오테크(TriLink Biotech), 액소랩스(AxoLabs), 바이오-신쎄시스 인코포레이티드(Bio-Synthesis Inc.), 다마콘(Dharmacon) 및 다수의 다른 회사를 비롯한, 변형된 RNA의 다수의 상업적인 공급원이 존재한다. 트라이링크에 의해 기술된 바와 같이, 예를 들어, 5-메틸-CTP를 사용하여 바람직한 특징, 예컨대 증가된 뉴클레아제 안정성, 증가된 번역 또는 선천적 면역 수용체와 시험관 내 전사된 RNA의 감소된 상호작용을 부여할 수 있다. 5-메틸시티딘-5'-트리포스페이트(5-메틸-CTP), N6-메틸-ATP, 및 슈도-UTP 및 2-티오-UTP는 또한 하기에 언급된 Kormann 등 및 Warren 등에 의한 간행물에 예시된 바와 같이, 번역을 향상시키면서, 배양 중에서 그리고 생체 내에서 선천적 면역 자극을 감소시키는 것으로 나타났다.
생체 내에 운반된 화학적으로 변형된 mRNA를 사용하여 개선된 치료적 효과를 달성할 수 있음이 나타났으며; 예를 들어, 문헌[Kormann et al., Nature Biotechnology 29, 154-157 (2011)]을 참조한다. 이러한 변형을 사용하여 예를 들어, RNA 분자의 안정성을 증가시키고/증가시키거나 그의 면역원성을 감소시킬 수 있다. 화학적 변형, 예컨대 슈도-U, N6-메틸-A, 2-티오-U 및 5-메틸-C를 사용하여, 유리딘 잔기 및 시티딘 잔기의 단지 1/4을 각각 2-티오-U 및 5-메틸-C로 치환하여, 마우스에서 mRNA의 톨-유사 수용체(TLR) 매개된 인식의 상당한 감소를 야기하였음이 관찰되었다. 선천적 면역계의 활성화를 감소시킴으로써, 이들 변형을 사용하여 생체내에서 mRNA의 안정성 및 지속성을 효율적으로 증가시킬 수 있으며; 예를 들어, 상기 문헌[Kormann et al.]을 참조한다.
또한, 선천적인 항-바이러스 반응을 우회하도록 설계된 변형을 혼입시킨 합성 메신저 RNA의 반복된 투여는 분화된 인간 세포를 만능성으로 리프로그래밍할 수 있는 것으로 나타났다. 예를 들어, 문헌[Warren, et al., Cell Stem Cell, 7(5):618-30 (2010)]을 참조한다. 주요 리프로그래밍 단백질로서 작용하는 이러한 변형된 mRNA는 다수의 인간 세포 유형을 리프로그래밍하는 효율적인 수단일 수 있다. 이러한 세포는 유도된 만능성 줄기 세포(iPSC)로 지칭되며, 5-메틸-CTP, 슈도-UTP 및 항 역전사 캡 유사체(ARCA)를 혼입시킨 효소적으로 합성된 RNA를 사용하여 세포의 항바이러스 반응을 효율적으로 회피할 수 있는 것이 관찰되었으며; 예를 들어, 상기 문헌[Warren et al.]을 참조한다.
해당 분야에 기술된 폴리뉴클레오티드의 다른 변형은 예를 들어, 폴리A 테일의 이용, 5' 캡 유사체(예컨대 m7G(5')ppp(5')G (mCAP))의 부가, 5' 또는 3' 비번역 영역(UTR)의 변형, 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리를 포함하며, 새로운 접근법은 정기적으로 개발되고 있다.
본원에 사용하기 위한 변형된 RNA의 생성에 적용 가능한 수많은 조성물 및 기법이 작은 간섭 RNA(siRNA)를 포함하는 RNA 간섭(RNAi)의 변형과 관련하여 개발된 바 있다. siRNA는 mRNA 간섭을 통한 유전자 침묵화에서의 그들의 효과가 일반적으로 일시적이며, 이는 반복 투여를 필요로 할 수 있기 때문에, 시험관 내에서 특정 난제를 제시한다. 또한, siRNA는 이중-가닥 RNA(dsRNA)이며, 포유동물 세포는 종종 바이러스 감염의 부산물인 dsRNA를 검출하고 이를 중화시키기 위해 발달된 면역 반응을 갖는다. 따라서, 포유동물 효소, 예컨대 PKR(dsRNA-반응성 키나제), 및 dsRNA에 대한 세포 반응을 매개할 수 있는 잠재적 레티노산-유도성 유전자 I(RIG-I), 및 이러한 분자에 반응하여 사이토카인의 유도를 촉발시킬 수 있는 톨-유사 수용체(예컨대 TLR3, TLR7 및 TLR8)가 존재하며; 예를 들어, 문헌[Angart et al., Pharmaceuticals (Basel) 6(4): 440-468 (2013)]; 문헌[Kanasty et al., Molecular Therapy 20(3): 513-524 (2012)]; 문헌[Burnett et al., Biotechnol J. 6(9):1130-46 (2011)]; 문헌[Judge and MacLachlan, Hum Gene Ther 19(2):111-24 (2008)]에 의한 검토 및 상기 문헌에 인용된 참고문헌을 참조한다.
본원에 기술된 바와 같이, RNA 안정성을 향상시키고/향상시키거나 선천적 면역 반응을 감소시키고/감소시키거나 폴리뉴클레오티드를 인간 세포 내로 도입하는 것과 관련하여 유용할 수 있는 다른 이점을 달성하기 위하여 매우 다양한 변형이 개발되고 적용된 바 있으며; 예를 들어, 문헌[Whitehead KA et al., Annual Review of Chemical and Biomolecular Engineering, 2: 77-96 (2011)]; 문헌[Gaglione and Messere, Mini Rev Med Chem, 10(7):578-95 (2010)]; 문헌[Chernolovskaya et al, Curr Opin Mol Ther., 12(2):158-67 (2010)]; 문헌[Deleavey et al., Curr Protoc Nucleic Acid Chem Chapter 16:Unit 16.3 (2009)]; 문헌[Behlke, Oligonucleotides 18(4):305-19 (2008)]; 문헌[Fucini et al., Nucleic Acid Ther 22(3): 205-210 (2012)]; 문헌[Bremsen et al., Front Genet 3:154 (2012)]의 검토를 참조한다.
상기에 주목된 바와 같이, 변형된 RNA의 다수의 상업적인 공급처가 존재하며, 이들 중 다수는 siRNA의 효율성을 개선시키도록 설계된 변형에서 특수화되었다. 다양한 접근법이 문헌에 보고된 다양한 발견에 기초하여 제공된다. 예를 들어, Dharmacon은 비-브릿징 산소의 황(포스포로티오에이트, PS)으로의 대체를 광범위하게 사용하여 문헌[Kole, Nature Reviews Drug Discovery 11:125-140 (2012)]에 의해 보고된 바와 같이, siRNA의 뉴클레아제 내성을 개선시켰다는 것을 주목한다. 리보스의 2'-위치의 변형은 듀플렉스 안정성(Tm)을 증가시키면서 뉴클레오티드간 포스페이트 결합의 뉴클레아제 내성을 개선시킨다고 보고되어 있는데, 이것은 또한 면역 활성화로부터의 보호를 제공하는 것으로 나타났다. 중등의 PS 백본 변형과 널리-용인되는 작은 2'-치환(2'-O-메틸, 2'-플루오로, 2'-하이드로)의 조합은 문헌[Soutschek et al. Nature 432:173-178 (2004)]에 의해 보고된 바와 같이, 생체 내에 적용하기 위하여 고도로 안정한 siRNA와 회합된 바 있고; 2'-O-메틸 변형은 문헌[Volkov, Oligonucleotides 19:191-202 (2009)]에 보고된 바와 같이 안정성을 개선시키는 데 효율적인 것으로 보고되어 있다. 선천적 면역 반응의 유도를 감소시키는 것과 관련하여, 특정 서열을 2'-O-메틸, 2'-플루오로, 2'-하이드로로 변형시키는 것은 일반적으로 침묵화 활성을 유지하면서, TLR7/TLR8 상호작용을 감소시키는 것으로 보고되어 있으며; 예를 들어, 문헌[Judge et al., Mol. Ther. 13:494-505 (2006)]; 및 문헌[Cekaite et al., J. Mol. Biol. 365:90-108 (2007)]을 참조한다. 추가 변형, 예컨대 2-티오우라실, 슈도우라실, 5-메틸시토신, 5-메틸우라실, 및 N6-메틸아데노신은 또한 TLR3, TLR7 및 TLR8에 의해 매개된 면역 효과를 최소화하는 것으로 나타났으며; 예를 들어, 문헌[Kariko, K. et al., Immunity 23:165-175 (2005)]을 참조한다.
또한 해당 분야에 공지된 바와 같이, 그리고 상업적으로 입수 가능한 바와 같이, 세포에 의한 운반 및/또는 흡수를 향상시킬 수 있는 본원에 사용하기 위한, 폴리뉴클레오티드, 예컨대 RNA에 예를 들어, 콜레스테롤, 토코페롤 및 엽산, 지질, 펩티드, 중합체, 링커 및 압타머를 비롯한, 다수의 컨쥬게이트를 적용할 수 있으며; 예를 들어, 문헌[Winkler, Ther. Deliv. 4:791-809 (2013)]의 검토 및 여기에 인용된 참고문헌을 참조한다.
운반
일부 구현예에서, 본원에 제공되는 방법에 사용되는 임의의 핵산 분자, 예를 들어, 본 개시의 게놈-표적화 핵산 및/또는 부위-지정 폴리펩티드를 인코딩하는 핵산은 세포로의 운반을 위하여 운반 비히클 내에 또는 그의 표면 상에 패키징된다. 고려되는 운반 비히클은 나노구체, 리포좀, 양자점, 나노입자, 폴리에틸렌 글리콜 입자, 하이드로겔 및 미셀(micelle)을 포함하지만, 이들로 제한되지 않는다. 해당 분야에 기술된 바와 같이, 다양한 표적화 모이어티를 사용하여 이러한 비히클과 목적하는 세포 유형 또는 위치의 우선적인 상호작용을 향상시킬 수 있다.
본 개시의 복합체, 폴리펩티드 및 핵산을 세포 내로 도입하는 것은 바이러스 또는 박테리오파지 감염, 트랜스펙션, 컨쥬게이션, 원형질체 융합, 리포펙션, 전기천공법, 뉴클레오펙션, 인산칼슘 침전, 폴리에틸렌이민(PEI)-매개의 트랜스펙션, DEAE-덱스트란 매개 트랜스펙션, 리포좀-매개 트랜스펙션, 입자 총 기술, 인산칼슘 침전, 직접 미세-주사, 나노입자-매개의 핵산 운반 등에 의해 발생할 수 있다.
구현예들에서, 가이드 RNA 폴리뉴클레오티드(RNA 또는 DNA) 및/또는 엔도뉴클레아제 폴리뉴클레오티드(들)(RNA 또는 DNA)는 해당 분야에 공지된 바이러스 또는 비-바이러스 운반 비히클에 의해 운반될 수 있다. 대안적으로, 엔도뉴클레아제 폴리펩티드(들)는 해당 분야에 공지된 바이러스 또는 비-바이러스 운반 비히클, 예컨대 전기천공법 또는 지질 나노입자에 의해 운반될 수 있다. 일부 구현예에서, DNA 엔도뉴클레아제는 단독으로, 또는 하나 이상의 가이드 RNA 또는 tracrRNA와 함께 하나 이상의 crRNA와 사전-복합체화되어, 하나 이상의 폴리펩티드로서 운반될 수 있다.
구현예들에서, 폴리뉴클레오티드는 나노입자, 리포좀, 리보핵단백질, 양으로 하전된 펩티드, 소분자 RNA-컨쥬게이트, 압타머-RNA 키메라, 및 RNA-융합 단백질 복합체를 포함하지만 이들로 제한되지 않는 비-바이러스 운반 비히클에 의해 운반될 수 있다. 일부 예시적인 비-바이러스 운반 비히클은 문헌[Peer and Lieberman, Gene Therapy, 18: 1127-1133 (2011)](이것은 다른 폴리뉴클레오티드의 운반에 또한 유용한 siRNA를 위한 비-바이러스 운반 비히클에 초점을 두고 있음)에 기술되어 있다.
구현예들에서, 폴리뉴클레오티드, 예컨대 가이드 RNA, sgRNA 및 엔도뉴클레아제를 인코딩하는 mRNA는 지질 나노입자(LNP)에 의해 세포 또는 환자에 운반될 수 있다.
핵산을 위한 몇몇의 비-바이러스 운반 방법이 동물 모델 및 인간 둘 모두에서 시험된 바 있지만, 가장 잘 개발된 시스템은 지질 나노입자이다. 지질 나노입자(LNP)는 일반적으로 이온화 가능한 양이온성 지질 및 3가지 이상의 추가의 성분, 전형적으로 콜레스테롤, DOPE 및 폴리에틸렌 글리콜(PEG) 함유 지질로 구성되며, 예를 들어, 실시예 2를 참조한다. 양이온성 지질은 양으로 하전된 핵산에 결합하여 핵산을 분해로부터 보호하는 밀집한 복합체를 형성할 수 있다. 마이크로 유체 시스템을 통과하는 동안, 성분은 자가-조립하여, 50 nM 내지 150 nM의 입자 크기로 입자를 형성하며, 여기서, 핵산은 양이온성 지질과 복합체화되고 지질 이중층 유사 구조에 의해 둘러싸인 코어 내에 캡슐화된다. 대상체의 순환계로의 주사 후에, 이들 입자는 아포지질단백질 E(apoE)에 결합할 수 있다. ApoE는 LDL 수용체에 대한 리간드이며, 수용체 매개의 내포작용을 통해 간의 간세포로의 흡수를 매개한다. 이러한 유형의 LNP는 mRNA 및 siRNA를 설치류, 영장류 및 인간의 간의 간세포로 효율적으로 운반하는 것으로 나타난 바 있다. 내포작용 후에, LNP는 엔도솜에 존재한다. 캡슐화된 핵산은 양이온성 지질의 이온화 가능한 성질에 의해 매개되는 엔도솜 회피의 과정을 겪는다. 이것은 핵산을 세포질 내로 운반하며, 여기서, mRNA는 인코딩된 단백질로 번역될 수 있다. 따라서, 일부 구현예에서, LNP 내로의 gRNA 및 Cas9를 인코딩하는 mRNA의 캡슐화를 사용하여, 정맥내 주사 후에 두 성분 모두를 간세포에 효율적으로 운반한다. 엔도솜 회피 후에, Cas9 mRNA는 Cas9 단백질로 번역되며, gRNA와 복합체를 형성할 수 있다. 일부 구현예에서, Cas9 단백질 서열 내에 핵 국소화 신호를 포함시키면, 핵으로의 Cas9 단백질/gRNA 복합체의 전좌가 촉진된다. 대안적으로, 작은 gRNA는 핵 포어 복합체를 가로질러, 핵 내의 Cas9 단백질과 복합체를 형성한다. 일단 gRNA/Cas9 복합체가 핵 내에 존재하면, 이는 상동성 표적 부위에 대하여 게놈을 스캐닝하여, 게놈 내의 요망되는 표적 부위에서 우선적으로 이중 가닥 파단부를 생성한다. 생체내에서 RNA 분자의 반감기는 대략 수시간 내지 수일로 짧다. 유사하게, 단백질의 반감기는 대략 수시간 내지 수일로 짧은 경향이 있다. 따라서, 일부 구현예에서, LNP를 사용한 gRNA 및 Cas9 mRNA의 운반은 gRNA/Cas9 복합체의 오직 일시적인 발현 및 활성만을 초래할 수 있다. 이는 오프-표적 절단의 빈도를 감소시키는 이점을 제공할 수 있으며, 이에 따라 일부 구현예에서 유전독성의 위험을 최소화시킨다. LNP는 일반적으로 바이러스 입자보다 면역원성이 더 적다. 많은 인간은 AAV에 대한 기존의 면역성을 갖지만, LNP에 대한 기존의 면역성은 존재하지 않는다. LNP에 대한 추가의 및 적응 면역 반응은 발생할 가능성이 적으며, 이는 LNP의 반복 투여를 가능하게 한다.
LNP에 사용하기 위하여 몇몇의 상이한 이온화 가능한 양이온성 지질이 개발된 바 있다. 이들은 다른 것들 중 특히, C12-200(문헌[Love et al (2010), PNAS vol. 107, 1864-1869]), MC3, LN16, MD1을 포함한다. 한 유형의 LNP에서, GalNac 모이어티가 LNP의 외측에 부착되며, 아시알로당단백질 수용체를 통하여 간으로의 흡수를 위한 리간드로서 작용한다. 이들 양이온성 지질 중 임의의 것을 사용하여 간으로의 gRNA 및 Cas9 mRNA의 운반을 위하여 LNP를 제형화한다.
일부 구현예에서, LNP는 1000 ㎚, 500 ㎚, 250 ㎚, 200 ㎚, 150 ㎚, 100 ㎚, 75 ㎚, 50 ㎚ 또는 25 ㎚ 미만의 직경을 갖는 임의의 입자를 지칭한다. 대안적으로, 나노입자는 1 ㎚ 내지 1000 ㎚, 1 ㎚ 내지 500 ㎚, 1 ㎚ 내지 250 ㎚, 25 ㎚ 내지 200 ㎚, 25 ㎚ 내지 100 ㎚, 35 ㎚ 내지 75 ㎚ 또는 25 ㎚ 내지 60 ㎚ 크기 범위일 수 있다.
LNP는 양이온성, 음이온성 또는 중성 지질로부터 제조될 수 있다. 중성 지질, 예컨대 융합생성 인지질 DOPE 또는 막 성분 콜레스테롤을 '헬퍼 지질'로서 LNP에 포함시켜 트랜스펙션 활성 및 나노입자 안정성을 향상시킬 수 있다. 양이온성 지질의 한계는 불량한 안정성 및 신속한 제거, 뿐만 아니라 염증 또는 항-염증 반응의 생성으로 인한 낮은 효능을 포함한다. LNP는 또한 소수성 지질, 친수성 지질 또는 소수성 지질 및 친수성 지질 둘 모두를 가질 수 있다.
당 분야에 공지된 임의의 지질 또는 지질의 조합을 사용하여 LNP를 생성할 수 있다. LNP를 생성하는 데 사용되는 지질의 예는 DOTMA, DOSPA, DOTAP, DMRIE, DC-콜레스테롤, DOTAP-콜레스테롤, GAP-DMORIE-DPyPE 및 GL67A-DOPE-DMPE-폴리에틸렌 글리콜(PEG)이다. 양이온성 지질의 예는 98N12-5, C12-200, DLin-KC2-DMA(KC2), DLin-MC3-DMA(MC3), XTC, MD1 및 7C1이다. 중성 지질의 예는 DPSC, DPPC, POPC, DOPE 및 SM이다. PEG-변형된 지질의 예는 PEG-DMG, PEG-CerC14 및 PEG-CerC20이다.
구현예들에서, 지질을 임의의 수의 몰비로 조합하여 LNP를 생성할 수 있다. 또한, 폴리뉴클레오티드(들)를 다양한 범위의 몰비로 지질(들)과 조합하여 LNP를 생성할 수 있다.
구현예들에서, 부위-지정 폴리펩티드 및 게놈-표적화 핵산은 각각 세포 또는 환자로 개별적으로 투여될 수 있다. 다른 한편, 부위-지정 폴리펩티드를 하나 이상의 가이드 RNA 또는 tracrRNA와 함께 하나 이상의 crRNA와 사전-복합체화시킬 수 있다. 이어서, 사전-복합체화된 물질을 세포 또는 환자에게 투여할 수 있다. 이러한 사전-복합체화된 물질은 리보핵단백질 입자(RNP)로서 공지되어 있다.
RNA는 RNA 또는 DNA와 특이적 상호작용을 형성할 수 있다. 이의 특성은 많은 생물학적 과정에서 활용되지만, 그것은 또한 핵산-풍부 세포 환경에서 무차별적인 상호작용의 위험이 따른다. 이러한 문제에 대한 하나의 해결책은 리보핵단백질 입자(RNP)를 형성하는 것인데, 여기서 RNA는 엔도뉴클레아제와 사전-복합체화된다. RNP의 또 다른 이익은 분해로부터의 RNA의 보호이다.
일부 구현예에서, RNP 내의 엔도뉴클레아제는 변형되거나 또는 비변형될 수 있다. 마찬가지로, gRNA, crRNA, tracrRNA 또는 sgRNA는 변형되거나 또는 비변형될 수 있다. 다수의 변형이 해당 분야에 공지되어 있고, 사용될 수 있다.
엔도뉴클레아제 및 sgRNA는 일반적으로 1:1 몰비로 조합될 수 있다. 대안적으로, 엔도뉴클레아제, crRNA 및 tracrRNA는 일반적으로 1:1:1 몰비로 조합될 수 있다. 그러나 매우 다양한 몰비를 사용하여 RNP를 생성할 수 있다.
일부 구현예에서, 재조합 아데노-연관 바이러스(AAV) 벡터가 운반을 위하여 사용될 수 있다. 전달될 폴리뉴클레오티드, rep 및 cap 유전자, 및 헬퍼 바이러스 기능을 포함하는 패키징될 AAV 게놈이 세포에 제공되는 rAAV 입자를 생성하기 위한 기법은 해당 분야의 표준 기법이다. rAAV의 생성은 하기 성분이 단일 세포(본원에서 패키징 세포로 지칭됨) 내에 존재하는 것을 필요로 한다: rAAV 게놈, rAAV 게놈으로부터 분리된(즉, 그 내에 존재하지 않는) AAV rep 및 cap 유전자 및 헬퍼 바이러스 기능. AAV rep 및 cap 유전자는 재조합 바이러스가 유래될 수 있는 임의의 AAV 혈청형으로부터 유래할 수 있고, AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAV-13 및 AAV rh.74를 포함하지만 이들로 제한되지 않는, rAAV 게놈 ITR과 상이한 AAV 혈청형으로부터 유래할 수 있다. 위형 rAAV의 생성은 예를 들어, 국제 특허 출원 공개 제WO 01/83692호에 개시되어 있다. 표 1을 참조한다.
Figure pct00002
일부 구현예에서, 패키징 세포를 생성하는 방법은 AAV 입자 생성을 위한 필수 성분 모두를 안정하게 발현하는 세포주를 생성하는 것을 포함한다. 예를 들어, AAV rep 및 cap 유전자가 결여된 rAAV 게놈, rAAV 게놈으로부터 분리된 AAV rep 및 cap 유전자, 및 선택 가능한 마커, 예컨대 네오마이신 내성 유전자를 갖는 플라스미드(또는 다수의 플라스미드)가 세포의 게놈 내에 통합된다. AAV 게놈을 GC 테일링(tailing)(문헌[Samulski et al., 1982, Proc. Natl. Acad. S6. USA, 79:2077-2081]), 제한 엔도뉴클레아제 절단 부위를 함유하는 합성 링커의 부가(문헌[Laughlin et al., 1983, Gene, 23:65-73]) 또는 직접 블런트-말단 라이게이션(문헌[Senapathy & Carter, 1984, J. Biol. Chem., 259:4661-4666])과 같은 절차에 의해 박테리아 플라스미드 내로 도입시킨 바 있다. 이어서, 패키징 세포주를 헬퍼 바이러스, 예컨대 아데노바이러스로 감염시킨다. 이러한 방법의 이점은 세포가 선택 가능하고, rAAV의 대규모 생성에 적합하는 것이다. 적합한 방법의 다른 예는 플라스미드가 아니라 아데노바이러스 또는 배큘로바이러스를 사용하여 패키징 세포 내로 rAAV 게놈 및/또는 rep 및 cap 유전자를 도입한다.
rAAV 생성의 일반적인 원칙은 예를 들어, 문헌[Carter, 1992, Current Opinions in Biotechnology, 1533-539]; 및 [Muzyczka, 1992, Curr. Topics in Microbial. and Immunol., 158:97-129)]에 검토되어 있다. 다양한 접근법이 문헌[Ratschin et al., Mol. Cell. Biol. 4:2072 (1984)]; [Hermonat et al., Proc. Natl. Acad. Sci. USA, 81:6466 (1984)]; [Tratschin et al., Mo1. Cell. Biol. 5:3251 (1985)]; [McLaughlin et al., J. Virol., 62:1963 (1988)]; 및 [Lebkowski et al., 1988 Mol. Cell. Biol., 7:349 (1988)], [Samulski et al. (1989, J. Virol., 63:3822-3828)]; 미국 특허 제5,173,414호; 국제 특허 제WO 95/13365호 및 상응하는 미국 특허 제5,658,776호; 국제 특허 제WO 95/13392호; 국제 특허 제WO 96/17947호; 국제 특허 제PCT/US98/18600호; 국제 특허 제WO 97/09441호(PCT/US96/14423); 국제 특허 제WO 97/08298호(PCT/US96/13872); 국제 특허 제WO 97/21825호(PCT/US96/20777); 국제 특허 제WO 97/06243호(PCT/FR96/01064); 국제 특허 제WO 99/11764호; 문헌[Perrin et al. (1995) Vaccine 13:1244-1250]; [Paul et al. (1993) Human Gene Therapy 4:609-615]; [Clark et al. (1996) Gene Therapy 3:1124-1132]; 미국 특허 제5,786,211호; 미국 특허 제5,871,982호; 및 미국 특허 제6,258,595호에 기술되어 있다.
AAV 벡터 혈청형은 표적 세포 유형과 일치할 수 있다. 예를 들어, 하기 예시적인 세포 유형은 특히 표기된 AAV 혈청형에 의해 형질도입될 수 있다. 예를 들어, 간 조직/세포 유형에 적합한 AAV 벡터의 혈청형은 AAV3, AAV5, AAV8 및 AAV9를 포함하지만 이들에 한정되지 않는다.
아데노-연관 바이러스 벡터에 더하여, 다른 바이러스 벡터가 사용될 수 있다. 이러한 바이러스 벡터는 렌티바이러스, 알파바이러스, 엔테로바이러스, 페스티바이러스, 배큘로바이러스, 헤르페스바이러스, 엡스타인 바 바이러스, 파포바바이러스, 폭스바이러스, 백시니아 바이러스 및 단순 헤르페스 바이러스를 포함하지만, 이에 제한되지 않는다.
일부 구현예에서, Cas9 mRNA, 알부민 유전자 내의 1 또는 2개의 유전자좌를 표적화하는 sgRNA 및 공여자 DNA는 각각 개별적으로 지질 나노입자로 제형화되거나, 모두 하나의 지질 나노입자로 동시-제형화되거나, 2개 이상의 지질 나노입자로 동시-제형화된다.
일부 구현예에서, Cas9 mRNA는 지질 나노입자로 제형화되는 한편, sgRNA 및 공여자 DNA는 AAV 벡터에서 운반된다. 일부 구현예에서, Cas9 mRNA 및 sgRNA는 지질 나노입자로 동시-제형화되는 한편, 공여자 DNA는 AAV 벡터에서 운반된다.
Cas9 뉴클레아제를 DNA 플라스미드로서, mRNA로서, 또는 단백질로서 운반하기 위한 옵션이 이용 가능하다. 가이드 RNA는 동일한 DNA로부터 발현될 수 있거나, RNA로서 운반될 수도 있다. RNA를 화학적으로 변형시켜, 반감기를 변경시키거나 개선시키거나, 면역 반응의 가능성 또는 정도를 감소시킬 수 있다. 엔도뉴클레아제 단백질을 운반 이전에 gRNA와 복합체화시킬 수 있다. 바이러스 벡터는 효율적인 운반을 가능하게 하며; 분할 버전의 Cas9 및 더 작은 Cas9의 오솔로그(ortholog)는 HDR을 위하여 공여자와 같이, AAV에 패키징될 수 있다. 이들 성분의 각각을 운반할 수 있는 다양한 비-바이러스 운반 방법도 또한 존재하거나, 비-바이러스 및 바이러스 방법이 동시에 사용될 수 있다. 예를 들어, 나노-입자를 사용하여, 단백질 및 가이드 RNA를 운반할 수 있는 한편, AAV를 사용하여, 공여자 DNA를 운반할 수 있다.
치료적 처치를 위한 게놈-편집 성분의 운반과 관련된 일부 구현예에서, 적어도 2가지 성분: 서열 특이적 뉴클레아제 및 DNA 공여자 주형이, 형질전환될 세포, 예를 들어, 간세포의 핵 내로 운반된다. 일부 구현예에서, 공여자 DNA 주형은 간에 대한 향성을 갖는 아데노 연관 바이러스(AAV) 내로 패키징된다. 일부 구현예에서, AAV는 혈청형 AAV8, AAV9, AAVrh10, AAV5, AAV6 또는 AAV-DJ로부터 선택된다. 일부 구현예에서, AAV 패키징된 DNA 공여자 주형이 먼저 말초 정맥내 주사에 의해 대상체, 예를 들어, 환자에게 투여된 후, 서열 특이적 뉴클레아제로 이어진다. AAV 패키징된 공여자 DNA 주형을 먼저 운반하는 이점은 운반된 공여자 DNA 주형이 형질도입된 간세포의 핵에서 안정적으로 유지될 것이며, 이는 게놈 내에 이중 가닥 파단과 함께 HDR 또는 NHEJ에 의한 DNA 공여자의 이후의 통합을 생성할 서열 특이적 뉴클레아제의 이후의 투여를 가능하게 한다는 점이다. 일부 구현예에서, 서열 특이적 뉴클레아제가 표적 세포에서 트랜스유전자의 표적화된 통합을 촉진시키는 데 필요한 시간 동안만 요망되는 치료적 효과에 충분한 수준으로 활성으로 남아 있는 것이 바람직하다. 서열 특이적 뉴클레아제가 연장된 기간 동안 세포에서 활성으로 남아 있다면, 이는 오프-표적 부위에서 증가된 빈도의 이중 가닥 파단을 초래할 것이다. 구체적으로, 오프 표적 절단의 빈도는 오프-표적 절단 효능을 뉴클레아제가 활성인 시간과 곱한 함수이다. mRNA의 형태의 서열 특이적 뉴클레아제의 운반은 대략 수시간 내지 수일 범위의 짧은 뉴클레아제 활성 기간을 초래하는데, 그 이유는 mRNA 및 번역된 단백질이 세포에서 수명이 짧기 때문이다. 따라서, 공여자 주형을 이미 함유하는 세포 내로의 서열 특이적 뉴클레아제의 운반은 가능한 가장 높은 오프-표적 통합에 비한 표적화된 통합의 비를 초래할 것으로 예상된다. 또한, 말초 정맥내 주사 후에 간세포의 핵으로의 공여자 DNA 주형의 AAV 매개된 운반은, 바이러스가 세포를 감염시키고 엔도솜을 회피한 다음, 핵으로 수송되 위한 요건, 및 숙주 성분에 의한 단일 가닥 AAV 게놈에서 이중 가닥 DNA 분자로의 전환으로 인하여, 전형적으로 대략 1일 내지 14일의 시간이 걸린다. 따라서, 적어도 일부 구현예에서, CRISPR-Cas9 성분을 공급하기 전에, 공여자 DNA 주형을 핵으로 운반하는 과정이 완료되게 하는 것이 바람직한데, 그 이유는 이들 뉴클레아제 성분이 약 1일 내지 3일 동안만 활성일 것이기 때문이다.
일부 구현예에서, 서열 특이적 뉴클레아제는 Cas9 뉴클레아제와 함께 알부민 유전자의 인트론 1 내의 DNA 서열에 대하여 유도된 sgRNA로 구성된 CRISPR-Cas9이다. 일부 구현예에서, Cas9 뉴클레아제는 하나 이상의 핵 국소화 신호(NLS)에 작동 가능하게 융합된 Cas9 단백질을 인코딩하는 mRNA로서 운반된다. 일부 구현예에서, sgRNA 및 Cas9 mRNA는 지질 나노입자 내로 패키징시킴으로써 간세포로 운반된다. 일부 구현예에서, 지질 나노입자는 지질 C12-200(문헌[Love et al 2010, PNAS vol 107 1864-1869])을 함유한다. 일부 구현예에서, LNP 내에 패키징되는 sgRNA 대 Cas9 mRNA의 비는 1:1(질량비)이며, 이는 마우스 생체내에서 최대 DNA 절단을 초래한다. 대안적인 구현예에서, LNP 내에 패키징되는 상이한 중량비, 예를 들어, 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, 4:1, 3:1 또는 2:1 또는 역의 비의 sgRNA 대 Cas9 mRNA가 사용될 수 있다. 일부 구현예에서, Cas9 mRNA 및 sgRNA는 개별 LNP 제형 내로 패키징되며, Cas9 mRNA 함유 LNP는 sgRNA를 함유하는 LNP 이전 약 1시간 내지 약 8시간에 환자로 운반되어, sgRNA의 운반 이전에 Cas9 mRNA가 번역되기 위한 최적의 시간을 가능하게 한다.
일부 구현예에서, gRNA 및 Cas9 mRNA를 캡슐화하는 LNP 제형("LNP-뉴클레아제 제형")은 AAV 내로 패키징된 DNA 공여자 주형을 이전에 투여하였던 대상체, 예를 들어, 환자에게 투여된다. 일부 구현예에서, LNP-뉴클레아제 제형은 AAV-공여자 DNA 주형의 투여 이후 1일 내지 28일 이내 또는 7일 내지 28일 이내 또는 7일 내지 14일 이내에 대상체에게 투여된다. AAV-공여자 DNA 주형에 비한 LNP-뉴클레아제 제형의 최적의 운반 시기는 해당 분야에 알려져 있는 기법, 예를 들어, 마우스 및 원숭이를 포함하는 동물 모델에서 행해지는 연구를 사용하여 결정될 수 있다.
일부 구현예에서, DNA-공여자 주형은 비-바이러스 운반 방법을 사용하여 대상체, 예를 들어, 환자의 간세포에 운반된다. 일부 환자(전형적으로 30%)가 상기 AAV에 의한 효율적인 유전자 운반을 방지하는 가장 흔히 사용되는 AAV 혈청형에 대해 유도된 기존의 중화 항체를 갖지만, 모든 환자는 비-바이러스 운반 방법으로 치료 가능할 것이다. 몇몇의 비-바이러스 운반 방법은 해당 분야에 알려져 있다. 특히 지질 나노입자(LNP)는 동물 및 인간에서 정맥내 주사 후에 그들의 캡슐화된 카고(cargo)를 간세포의 세포질로 효율적으로 운반하는 것으로 알려져 있다. 이들 LNP는 수용체 매개의 내포작용의 과정을 통해 간에 의해 능동적으로 흡수되어, 간으로의 우선적인 흡수를 초래한다.
일부 구현예에서, 공여자 주형의 핵 국소화를 촉진시키기 위하여, 예를 들어, 유인원 바이러스 40(SV40) 복제 원점의 366 bp 영역 및 조기 프로모터를 공여자 주형에 부가할 수 있다. 세포 단백질에 결합하는 다른 DNA 서열도 또한 사용하여, DNA의 핵 유입을 개선시킬 수 있다.
일부 구현예에서, 도입된 FVIII 유전자의 발현 또는 활성의 수준은 예를 들어, AAV-공여자 DNA 주형 이후, gRNA 및 Cas9 뉴클레아제 또는 Cas9 뉴클레아제를 인코딩하는 mRNA를 함유하는 LNP-뉴클레아제 제형의 처음의 투여 후에, 대상체, 예를 들어, 환자의 혈중에서 측정된다. FVIII 수준이 예를 들어, 정상 수준의 적어도 5% 내지 50%, 특히 5% 내지 20%의 FVIII 수준으로서 정의된 바와 같이 질병을 치유하기에 충분하지 않다면, 제2 또는 제3의 LNP-뉴클레아제 제형의 투여를 제공하여 알부민 인트론 1 부위 내로의 추가의 표적화된 통합을 촉진시킬 수 있다. 요망되는 FVIII의 치료적 수준을 수득하기 위한 다중 용량의 LNP-뉴클레아제 제형을 사용하는 것의 실행 가능성은 해당 분야에 알려져 있는 기법, 예를 들어, 마우스 및 원숭이를 포함하는 동물 모델을 사용하는 검사를 사용하여 시험되고 최적화될 수 있다.
일부 구현예에서, 대상체로의 i) 공여자 카세트를 포함하는 AAV-공여자 DNA 주형 및 ii) LNP-뉴클레아제 제형의 투여를 포함하는 본원에 기술된 방법 중 임의의 것에 따라, 초기 용량의 LNP-뉴클레아제 제형은 대상체로의 AAV-공여자 DNA 주형의 투여 후 1일 내지 28일 이내에 대상체에게 투여된다. 일부 구현예에서, 초기 용량의 LNP-뉴클레아제 제형은 표적 세포의 핵으로의 공여자 DNA 주형의 운반을 가능하게 하기에 충분한 시간 후에 대상체에게 투여된다. 일부 구현예에서, 초기 용량의 LNP-뉴클레아제 제형은 표적 세포의 핵에서 이중 가닥 DNA 분자로의 단일 가닥 AAV 게놈의 전환을 가능하게 하기에 충분한 시간 후에 대상체에게 투여된다. 일부 구현예에서, 초기 용량의 투여 후에 1회 이상(예컨대 2, 3, 4, 5회 이상)의 추가의 용량의 LNP-뉴클레아제 제형이 대상체에게 투여된다. 일부 구현예에서, 1회 이상의 용량의 LNP-뉴클레아제 제형은 표적 수준의 공여자 카세트의 표적화된 통합 및/또는 표적 수준의 공여자 카세트의 발현이 달성될 때까지 대상체에게 투여된다. 일부 구현예에서, 상기 방법은 LNP-뉴클레아제 제형의 각각의 투여 후에 공여자 카세트의 표적화된 통합의 수준 및/또는 공여자 카세트의 발현의 수준을 측정하는 단계 및 표적 수준의 공여자 카세트의 표적화된 통합 및/또는 표적 수준의 공여자 카세트의 발현이 달성되지 않는다면 추가의 용량의 LNP-뉴클레아제 제형을 투여하는 단계를 추가로 포함한다. 일부 구현예에서, 1회 이상의 추가의 용량의 LNP-뉴클레아제 제형 중 적어도 하나의 양은 초기 용량과 동일하다. 일부 구현예에서, 1회 이상의 추가의 용량의 LNP-뉴클레아제 제형 중 적어도 하나의 양은 초기 용량보다 더 적다. 일부 구현예에서, 1회 이상의 추가의 용량의 LNP-뉴클레아제 제형 중 적어도 하나의 양은 초기 용량보다 더 크다.
유전적으로 변형된 세포 및 세포 집단
일 양태에서, 본 개시는 세포 내의 게놈을 편집하여, 그에 의해 유전적으로 변형된 세포를 생성하는 방법을 제공한다. 일부 양태에서, 유전적으로 변형된 세포의 집단이 제공된다. 따라서, 유전적으로 변형된 세포는 (예를 들어, CRISPR/Cas9/Cpf1 시스템을 사용하여) 게놈 편집에 의해 도입된 적어도 하나의 유전적 변형을 갖는 세포를 지칭한다. 일부 구현예에서, 유전적으로 변형된 세포는 유전적으로 변형된 간세포이다. 외인성 게놈-표적화 핵산 및/또는 게놈 표적화 핵산을 인코딩하는 외인성 핵산을 갖는 유전적으로 변형된 세포가 본원에서 고려된다.
일부 구현예에서, FVIII 유전자 또는 그의 기능적 유도체의 핵산 서열을 세포의 게놈 서열 내로 삽입함으로써 세포의 게놈은 편집될 수 있다. 일부 구현예에서, 게놈-편집을 겪는 세포는 게놈 내에 하나 이상의 돌연변이(들)를 가지며, 이는 이러한 돌연변이(들)를 갖지 않는 정상에서의 발현에 비하여, 내인성 FVIII 유전자의 발현의 감소를 초래한다. 정상 세포는 FVIII 유전자 결함을 갖지 않는 상이한 대상체로부터 기원한(또는 단리된) 건강한 또는 대조군 세포일 수 있다. 일부 구현예에서, 게놈-편집을 겪는 세포는 FVIII 유전자 관련 질환 또는 장애의 치료를 필요로 하는 대상체로부터 기원할(또는 단리될) 수 있다. 따라서, 일부 구현예에서, 이러한 세포에서의 내인성 FVIII 유전자의 발현은 정상 세포에서의 내인성 FVIII 유전자 발현의 발현에 비하여, 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100% 감소된다.
트랜스유전자, 예를 들어, FVIII 유전자 또는 그의 기능적 단편을 인코딩하는 핵산의 성공적인 삽입 시에, 세포에서의 도입된 FVIII 유전자 또는 그의 기능적 유도체의 발현은 세포의 내인성 FVIII 유전자의 발현에 비하여 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% , 약 100%, 약 200%, 약 300%, 약 400%, 약 500%, 약 600%, 약 700%, 약 800%, 약 900%, 약 1,000%, 약 2,000%, 약 3,000%, 약 5,000%, 약 10,000% 이상일 수 있다. 일부 구현예에서, 게놈-편집된 세포에서의 FVIII의 기능적 단편을 포함하는 도입된 FVIII 유전자 산물의 활성은 세포의 내인성 FVIII 유전자의 발현에 비하여 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% , 약 100%, 약 200%, 약 300%, 약 400%, 약 500%, 약 600%, 약 700%, 약 800%, 약 900%, 약 1,000%, 약 2,000%, 약 3,000%, 약 5,000%, 약 10,000% 이상일 수 있다. 일부 구현예에서, 세포에서의 도입된 FVIII 유전자 또는 그의 기능적 유도체의 발현은 세포의 내인성 FVIII 유전자의 발현의 적어도 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 15배, 약 20배, 약 30배, 약 50배, 약 100배, 약 1000배 이상이다. 또한, 일부 구현예에서, 게놈-편집된 세포에서의 FVIII의 기능적 단편을 포함하는 도입된 FVIII 유전자 산물의 활성은 정상의 건강한 세포에서의 FVIII 유전자 산물의 활성과 유사하거나 그보다 더 높을 수 있다.
A형 혈우병의 치료 또는 개선이 고려되는 구현예들에서, 유전자 편집을 위한 주요 표적은 인간 세포이다. 예를 들어, 생체외 방법 및 생체내 방법에서, 인간 세포는 간세포이다. 일부 구현예에서, 필요로 하는 환자로부터 유래되고, 이에 따라, 필요로 하는 환자와 이미 완벽하게 일치되는 자가 세포에서 유전자 편집을 수행함으로써, 환자 내로 안전하게 재도입될 수 있는 세포를 생성하고, 환자의 질병과 연관된 하나 이상의 임상적 질환을 개선하는 데 효율적일 세포의 집단이 효율적으로 생기게 하는 것이 가능하다. 이러한 치료에 대한 일부 구현예에서, 간세포는 해당 분야에 알려져 있는 임의의 방법에 따라 단리되고, 유전적으로 변형된, 치료적으로 유효한 세포를 생성하기 위하여 사용될 수 있다. 일 구현예에서, 간 줄기 세포는 생체 외에서 유전적으로 변형된 다음, 환자 내로 재도입되며, 여기서, 그들은 삽입된 FVIII 유전자를 발현하는 유전적으로 변형된 간세포 또는 동모양혈관 내피 세포가 생기게 할 것이다.
치료적 접근법
일 양태에서, 환자의 게놈을 편집함으로써 환자에서 A형 혈우병을 치료하기 위한 유전자 요법 접근법이 본원에 제공된다. 일부 구현예에서, 유전자 요법 치료법은 환자에서 관련 세포 유형의 게놈 내로 기능적 FVIII 유전자를 통합시키며, 이는 A형 혈우병에 대한 영구적인 치유를 제공할 수 있다. 일부 구현예에서, FVIII 유전자를 통합시키는 유전자 요법 치료법으로 처리되는 세포 유형은 간세포인데, 그 이유는 이들 세포가 많은 단백질을 효율적으로 발현하고 혈중에 분비하기 때문이다. 또한, 간세포를 사용한 이러한 통합 접근법은 간이 완전히 성장하지 않은 소아 환자를 위하여 고려될 수 있는데, 그 이유는 간세포가 분열하는 경우 통합된 유전자가 딸 세포로 전달될 것이기 때문이다.
또 다른 양태에서, FVIII-인코딩 유전자 또는 그의 기능적 유도체를 게놈 내의 유전자 좌 내로 낙-인시키고, FVIII 단백질 활성을 복구함으로써 게놈에 영구적인 변화를 생성하기 위하여 게놈 엔지니어링 툴을 사용하기 위한 세포적, 생체외 및 생체내 방법이 본원에 제공된다. 이러한 방법은 엔도뉴클레아제, 예컨대 CRISPR-연관(CRISPR/Cas9, Cpf1 등) 뉴클레아제를 사용하여 게놈으로부터 임의의 서열을 영구적으로 결실시키거나, 삽입하거나, 편집하거나, 교정하거나, 대체하거나, 외인성 서열, 예를 들어, FVIII-인코딩 유전자를 게놈 유전자좌 내에 삽입한다. 이러한 방식으로, 본 개시에 제시된 실시예는 (환자의 일생동안 잠재적인 치료법을 운반하는 것보다는) 단일의 처리로 FVIII 유전자의 활성을 복구한다.
일부 구현예에서, 생체외 세포-기반의 치료법을 환자로부터 단리된 간세포를 사용하여 행한다. 다음으로, 이들 세포의 염색체 DNA를 본원에 기술된 물질 및 방법을 사용하여 편집한다. 마지막으로, 편집된 세포를 환자 내로 이식한다.
생체외 세포 요법 접근법의 하나의 이점은 투여 이전에 치료제의 종합적인 분석을 행하는 능력이다. 모든 뉴클레아제-기반의 치료제는 어느 정도의 오프-표적 효과를 갖는다. 생체 외에서 유전자 교정을 수행하는 것은 이식 이전에 교정된 세포 집단이 완전히 특성화되게 한다. 본 개시의 양태는 교정된 세포의 전체 게놈을 시퀀싱하여, 오프-표적 절단이 존재한다면, 환자에 대한 최소의 위험과 연관된 게놈 위치 내에 존재하는 것을 보장하는 것을 포함한다. 또한, 클론 집단을 포함하는 특정 세포의 집단은 이식 이전에 단리될 수 있다.
이러한 방법의 또 다른 구현예는 생체 내 기반의 치료법이다. 이러한 방법에서, 환자 내의 세포의 염색체 DNA는 본원에 기술된 물질 및 방법을 사용하여 교정된다. 일부 구현예에서, 세포는 간세포이다.
생체 내 유전자 요법의 이점은 치료제 생성 및 투여가 용이하다는 것이다. 동일한 치료적 방법 및 치료법을 사용하여 1명 초과의 환자, 예를 들어, 동일한 또는 유사한 유전형 또는 대립형질을 공유하는 다수의 환자를 치료할 수 있다. 대조적으로, 생체 외 세포 요법은 전형적으로 환자 자신의 세포를 사용하는데, 이는 단리되고, 조작되고, 동일한 환자로 복귀된다.
일부 구현예에서, 본 개시에 따른 치료 방법을 필요로 하는 대상체는 A형 혈우병의 증상을 갖는 환자이다. 일부 구현예에서, 대상체는 A형 혈우병을 갖는 것으로 의심되는 인간일 수 있다. 대안적으로, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받은 인간일 수 있다. 일부 구현예에서, 치료를 필요로 하는 대상체는 내인성 FVIII 유전자 또는 그의 조절 서열 내에 하나 이상의 유전 결함(예를 들어, 결실, 삽입 및/또는 돌연변이)을 가져, FVIII 단백질의 발현 수준 또는 기능을 포함하는 활성이 건강한 정상의 대상체에 비하여 실질적으로 감소되게 할 수 있다.
일부 구현예에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공되며, 상기 방법은 하기의 것을 대상체 내의 세포에게 제공하는 단계를 포함한다: (a) 세포 게놈 내의 알부민 유전자좌를 표적화하는 가이드 RNA(gRNA); (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 구현예에서, gRNA는 알부민 유전자의 인트론 1을 표적화한다. 일부 구현예에서, gRNA는 SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함한다.
일부 구현예에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공되며, 상기 방법은 하기의 것을 대상체 내의 세포에게 제공하는 단계를 포함한다: (a) SEQ ID NO: 18 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA; (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 구현예에서, gRNA는 SEQ ID NO: 21, 22, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 21로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 22로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 28로부터의 스페이서 서열을 포함한다. 일부 구현예에서, gRNA는 SEQ ID NO: 30으로부터의 스페이서 서열을 포함한다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포이다. 일부 구현예에서, 대상체는 A형 혈우병을 갖거나, 이를 갖는 것으로 의심받는 환자이다. 일부 구현예에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받는다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택된다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스로부터의 것이다(spCas9). 일부 구현예에서, Cas9는 스타필로코커스 루그두넨시스로부터의 것이다(SluCas9).
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포이다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, 상기 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 사용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 세포는 인간 세포, 예를 들어, 인간 간세포이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예컨대 DNA 플라스미드이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예컨대 mRNA이다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, 공여자 주형은 아데노 연관 바이러스(AAV) 벡터에 인코딩된다. 일부 구현예에서, 공여자 주형은 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 의해 플랭킹된다. 일부 구현예에서, gRNA 표적 부위는 (a)의 gRNA에 대한 표적 부위이다. 일부 구현예에서, 공여자 주형의 gRNA 표적 부위는 (a)의 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역 상보물이다. 일부 구현예에서, 공여자 주형을 세포에게 제공하는 것은 공여자 주형을 대상체에게 투여하는 것을 포함한다. 일부 구현예에서, 투여는 정맥내 경로를 통해 이루어진다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자로 제형화된다. 일부 구현예에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 구현예에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계는 리포좀 또는 지질 나노입자를 대상체에게 투여하는 것을 포함한다. 일부 구현예에서, 투여는 정맥내 경로를 통해 이루어진다. 일부 구현예에서, 상기 방법은 리포좀 또는 지질 나노입자는 지질 나노입자이다. 일부 구현예에서, 상기 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 사용한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, DNA 엔도뉴클레아제는 gRNA와 사전-복합체화되어 리보핵단백질(RNP) 복합체를 형성한다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한 후에 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 4일보다 긴 시간 후에 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 적어도 14일 후에 세포에 제공된다. 일부 구현예에서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 적어도 17일 후에 세포에 제공된다. 일부 구현예에서, (a) 및 (b)를 세포에 제공하는 단계는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 (예컨대 정맥내 경로에 의해) 대상체에게 투여하는 것을 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다. 일부 구현예에서, (c)를 세포에 제공하는 단계는 AAV 벡터에 인코딩된 공여자 주형을 (예컨대 정맥내 경로에 의해) 대상체에게 투여하는 것을 포함한다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공된다. 일부 구현예에서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공된다. 일부 구현예에서, (a) 및 (b)를 세포에 제공하는 단계는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 (예컨대 정맥내 경로에 의해) 대상체에게 투여하는 것을 포함한다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.
일부 구현예에서, 본원에 기술된 A형 혈우병의 치료 방법 중 임의의 것에 따라, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열은 대상체의 간 내에서 발현된다.
대상체로의 세포의 이식
일부 구현예에서, 본 개시의 생체 외 방법은 게놈-편집된 세포를 이러한 방법을 필요로 하는 대상체 내로 이식하는 단계를 포함한다. 이러한 이식 단계는 해당 분야에 알려져 있는 임의의 이식 방법을 사용하여 달성될 수 있다. 예를 들어, 유전적으로 변형된 세포는 대상체의 혈액에 직접 주입되거나, 다르게는 대상체에게 투여될 수 있다.
일부 구현예에서, 본원에 개시된 방법은 요망되는 효과(들)가 생성되도록 요망되는 부위에서 도입된 세포의 적어도 부분적인 국소화를 초래하는 방법 또는 경로에 의해 유전적으로-변형된 치료적 세포를 대상체 내로 투여하는 단계를 포함하며, 이는 "도입하는" 및 "이식하는"과 상호교환 가능하게 사용될 수 있다. 치료적 세포 또는 그들의 분화된 자손은 임의의 적절한 경로에 의해 투여될 수 있으며, 이는 이식된 세포 또는 세포의 성분의 적어도 일부가 생존 가능하게 남아 있는 대상체 내의 요망되는 위치로의 운반을 초래한다. 대상체로의 투여 이후 세포의 생존가능 기간은 수시간, 예를 들어, 24시간 내지 수일만큼 짧거나, 수년 또는 심지어 환자의 일생, 즉, 장기간 생착만큼 길 수 있다.
예방적으로 제공되는 경우, 본원에 기술된 치료적 세포는 A형 혈우병의 임의의 증상에 앞서 대상체에게 투여될 수 있다. 따라서, 일부 구현예에서, 유전적으로 변형된 간세포 집단의 예방적 투여는 A형 혈우병 증상의 발생을 예방하기 위해 제공된다.
일부 구현예에서, 치료적으로 제공되는 경우, 유전적으로 변형된 간세포는 A형 혈우병의 증상 또는 적응증의 발병 시에(또는 그 이후에), 예를 들어, 질병의 발병 시에 제공된다.
일부 구현예에서, 본원에 기술된 방법에 따라 투여되는 치료적 간세포 집단은 하나 이상의 공여자로부터 수득되는 동종이계 간세포를 갖는다. "동종이계"는 동일한 종의 하나 이상의 상이한 공여자로부터 수득되는 간세포 또는 간세포를 갖는 생물학적 시료를 지칭하며, 하나 이상의 유전자좌에서 유전자는 동일하지 않다. 예를 들어, 대상체에게 투여되는 간세포 집단은 하나 이상의 비관련된 공여자 대상체로부터 또는 하나 이상의 비-동일한 형제자매로부터 유래될 수 있다. 일부 구현예에서, 동계 간세포 집단, 예컨대 유전적으로 동일한 동물로부터 또는 동일한 쌍둥이로부터 수득되는 것들이 사용될 수 있다. 다른 구현예에서, 간세포는 자가 세포이며; 다시 말하면, 간세포는 대상체로부터 수득되거나 단리되고, 동일한 대상체에게 투여되며, 즉, 공여자 및 수여자가 동일하다.
일 구현예에서, 유효량은 A형 혈우병의 적어도 하나 이상의 증후 또는 증상을 예방하거나 완화시키는 데 필요한 치료적 세포의 집단의 양을 지칭하며, 요망되는 효과를 제공하기 위한, 예를 들어, A형 혈우병을 갖는 대상체를 치료하기 위한 조성물의 충분한 양에 관한 것이다. 구현예들에서, 치료적 유효량은 이에 따라 전형적인 대상체, 예컨대 A형 혈우병을 갖거나, 이의 위험이 있는 대상체에게 투여되는 경우 특정 효과를 촉진시키기에 충분한 치료적 세포 또는 치료적 세포를 포함하는 조성물의 양을 지칭한다. 유효량은 또한 질병의 증상의 발생을 예방하거나 지연시키기 위한, 질병의 증상의 과정을 변경(예를 들어, 비제한적으로 질병의 증상의 진행을 둔화)시키거나, 질병의 증상을 역행시키기에 충분한 양을 포함할 것이다. 임의의 주어진 경우에, 적절한 유효량이 일상적인 실험을 사용하여 당업자에 의해 결정될 수 있는 것이 이해된다.
본원에 기술된 다양한 구현예에서 사용하기 위하여, 치료적 세포, 예를 들어, 게놈-편집된 간세포의 유효량은 적어도 102개의 세포, 적어도 5 X 102개의 세포, 적어도 103개의 세포, 적어도 5 X 103개의 세포, 적어도 104개의 세포, 적어도 5 X 104개의 세포, 적어도 105개의 세포, 적어도 2 X 105개의 세포, 적어도 3 X 105개의 세포, 적어도 4 X 105개의 세포, 적어도 5 X 105개의 세포, 적어도 6 X 105개의 세포, 적어도 7 X 105개의 세포, 적어도 8 X 105개의 세포, 적어도 9 X 105개의 세포, 적어도 1 X 106개의 세포, 적어도 2 X 106개의 세포, 적어도 3 X 106개의 세포, 적어도 4 X 106개의 세포, 적어도 5 X 106개의 세포, 6 X 106개의 세포, 적어도 7 X 106개의 세포, 적어도 8 X 106개의 세포, 적어도 9 X 106개의 세포 또는 그의 배수일 수 있다. 치료적 세포는 하나 이상의 공여자로부터 유래될 수 있거나, 자가 공급원으로부터 수득된다. 본원에 기술된 일부 구현예에서, 치료적 세포는 그를 필요로 하는 대상체로의 투여 이전에 배양물에서 증량된다.
일부 구현예에서, A형 혈우병을 갖는 환자의 세포에서 발현되는 기능적 FVIII의 수준의 보통의 및 점증적인 증가는 질병의 하나 이상의 증상을 개선하기 위해, 장기간 생존을 증가시키기 위해 및/또는 다른 치료와 관련된 부작용을 감소시키기 위해 유리할 수 있다. 인간 환자로의 이러한 세포의 투여 시에, 증가된 수준의 기능적 FVIII를 생성하는 치료적 세포의 존재가 유리하다. 일부 구현예에서, 유효량의 대상체는 치료되는 대상체에서 총 FVIII에 비하여 적어도 약 1%, 3%, 5% 또는 7%의 기능적 FVIII를 초래한다. 일부 구현예에서, 기능적 FVIII는 총 FVIII의 적어도 약 10%이다. 일부 구현예에서, 기능적 FVIII는 총 FVIII의 적어도, 약 또는 최대 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%이다. 유사하게, 유의미하게 상승된 기능적 FVIII의 수준을 갖는 상대적으로 제한된 세포의 하위집단의 도입이 다양한 환자에서 유리할 수 있는데, 그 이유는 일부 상황에서 정규화된 세포가 이환된 세포에 비하여 선택 이점을 가질 것이기 때문이다. 그러나, 상승된 수준의 기능적 FVIII를 갖는 중등의 수준의 치료적 세포가 환자에서 A형 혈우병의 하나 이상의 양태를 개선시키는 데 유리할 수 있다. 일부 구현예에서, 이러한 세포가 투여되는 환자에서 치료제의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 이상이 증가된 수준의 기능적 FVIII을 생성한다.
구현예들에서, 방법 또는 경로에 의한 대상체 내로의 치료적 세포 조성물의 운반은 요망되는 부위에서 세포 조성물의 적어도 부분적인 국소화를 초래한다. 세포 조성물은 대상체에서 유효한 치료를 초래하는 임의의 적절한 경로에 의해 투여될 수 있으며, 즉, 투여는 조성물의 적어도 일부가 운반되는 대상체 내의 요망되는 위치로의 운반을 초래하며, 즉, 적어도 1 x 104개의 세포가 소정의 기간 동안 요망되는 부위로 운반된다. 투여 방식은 주사, 주입, 점적 또는 섭취를 포함한다. "주사"는 비제한적으로 정맥내, 근육내, 동맥내, 척추강내, 뇌실내, 낭내, 안와내, 심장내, 피내, 복강내, 기관경유(transtracheal), 피하, 표피하, 관절내, 피막하, 지주막하(subarachnoid), 척수내, 뇌척수내 및 흉골내 주사 및 주입을 포함한다. 일부 구현예에서, 경로는 정맥내이다. 세포의 운반을 위하여, 주사 또는 주입에 의한 투여가 이루어질 수 있다.
일부 구현예에서, 세포는 전신 투여되며, 다시 말하면, 치료적 세포의 집단은 표적 부위, 조직 또는 기관 내로 직접 투여되지 않아서, 대신에 그것이 대상체의 순환계로 유입되고, 이에 따라, 대사 및 다른 유사 과정을 겪게 한다.
A형 혈우병의 치료를 위한 조성물을 갖는 치료의 효능은 숙련자에 의해 결정될 수 있다. 그러나, 질환의 징후 또는 증상 중 임의의 것 또는 모두, 단지 하나의 예로서, 기능적 FVIII의 수준이 유리한 방식으로 변경되거나(예를 들어, 적어도 10% 증가되거나), 또는 질환의 다른 임상적으로 허용되는 증상 또는 마커가 개선 또는 완화되면, 치료는 유효한 치료로 간주된다. 효능은 또한 의학적 개입을 위한 필요성 또는 입원에 의해 평가되는 경우 개체의 악화 실패에 의해 측정될 수 있다(예를 들어, 질환의 진행은 중단되거나 적어도 둔화된다). 이들 지표의 측정 방법은 당업자에 공지되고/공지되거나 본원에 기술된다. 치료는 개체 또는 동물(일부 비-제한적인 예는 인간, 또는 포유동물을 포함함)에서의 질환의 임의의 치료를 포함하고, 하기를 포함한다: (1) 질환의 저해, 예를 들어, 증상의 진행의 저지, 또는 둔화; 또는 (2) 질환의 완화, 예를 들면, 증상의 퇴행 야기; 및 (3) 증상의 발생의 예방 또는 가능성 감소.
조성물
일 양태에서, 본 개시는 본원에 개시된 방법을 수행하기 위한 조성물을 제공한다. 조성물은 하기의 것 중 하나 이상을 포함할 수 있다: 게놈-표적화 핵산(예를 들어, gRNA); 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제) 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열; 및 본원에 개시된 방법의 요망되는 유전적 변형을 시행하기 위한 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형).
일부 구현예에서, 조성물은 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오티드 서열을 갖는다.
일부 구현예에서, 조성물은 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제)를 갖는다. 일부 구현예에서, 조성물은 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 갖는다.
일부 구현예에서, 조성물은 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.
일부 구현예에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오티드 서열 및 (ii) 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제) 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 갖는다.
일부 구현예에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오티드 서열 및 (ii) 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.
일부 구현예에서, 조성물은 (i) 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제) 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열 및 (ii) 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.
일부 구현예에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오티드 서열, (ii) 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제) 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열 및 (iii) 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.
상기 조성물 중 임의의 것의 일부 구현예에서, 조성물은 단일-분자 가이드 게놈-표적화 핵산을 갖는다. 상기 조성물 중 임의의 것의 일부 구현예에서, 조성물은 이중-분자 게놈-표적화 핵산을 갖는다. 상기 조성물 중 임의의 것의 일부 구현예에서, 조성물은 둘 이상의 이중-분자 가이드 또는 단일-분자 가이드를 갖는다. 일부 구현예에서, 조성물은 핵산 표적화 핵산을 인코딩하는 벡터를 갖는다. 일부 구현예에서, 게놈-표적화 핵산은 DNA 엔도뉴클레아제, 특히, Cas9이다.
일부 구현예에서, 조성물은 게놈-편집, 특히 세포의 게놈 내로의 FVIII 유전자 또는 그의 유도체의 삽입을 위해 사용될 수 있는 하나 이상의 gRNA를 포함하는 조성물을 함유할 수 있다. 조성물을 위한 gRNA는 내인성 알부민 유전자의, 그 내의 또는 그 근처의 게놈 부위를 표적화할 수 있다. 따라서, 일부 구현예에서, gRNA는 알부민 유전자의, 그 내의 또는 그 근처의 게놈 서열에 상보성인 스페이서 서열을 가질 수 있다.
일부 구현예에서, 조성물을 위한 gRNA는 표 3에 열거된 것들로부터 선택되는 서열 및 표 3에 열거된 것들 중 임의의 것에 대하여 적어도 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90% 또는 약 95% 동일성 또는 상동성을 갖는 그의 변이체이다. 일부 구현예에서, 키트를 위한 gRNA의 변이체는 표 3에 열거된 것들 중 임의의 것에 대하여 적어도 약 85% 상동성을 갖는다.
일부 구현예에서, 조성물을 위한 gRNA는 게놈 내의 표적 부위에 상보성인 스페이서 서열을 갖는다. 일부 구현예에서, 스페이서 서열은 15개 염기 내지 20개 염기 길이이다. 일부 구현예에서, 스페이서 서열과 게놈 서열 간의 상보성은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 100%이다.
일부 구현예에서, 조성물은 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및/또는 FVIII 유전자 또는 그의 기능적 유도체의 핵산 서열을 갖는 공여자 주형을 가질 수 있다. 일부 구현예에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 또는 RNA이다.
일부 구현예에서, 키트를 위한 임의의 올리고뉴클레오티드 또는 핵산 서열 중 하나 이상은 아데노 연관 바이러스(AAV) 벡터에 인코딩될 수 있다. 따라서, 일부 구현예에서, gRNA는 AAV 벡터에 인코딩될 수 있다. 일부 구현예에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 AAV 벡터에 인코딩될 수 있다. 일부 구현예에서, 공여자 주형은 AAV 벡터에 인코딩될 수 있다. 일부 구현예에서, 둘 이상의 올리고뉴클레오티드 또는 핵산 서열은 단일의 AAV 벡터에 인코딩될 수 있다. 따라서, 일부 구현예에서, gRNA 서열 및 DNA 엔도뉴클레아제-인코딩 핵산은 단일의 AAV 벡터에 인코딩될 수 있다.
일부 구현예에서, 조성물은 리포좀 또는 지질나노입자를 가질 수 있다. 따라서, 일부 구현예에서, 조성물의 임의의 화합물(예를 들어, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형)은 리포좀 또는 지질 나노입자로 제형화될 수 있다. 일부 구현예에서, 하나 이상의 이러한 화합물은 공유 결합 또는 비-공유 결합을 통해 리포좀 또는 지질 나노입자와 회합된다. 일부 구현예에서, 화합물 중 임의의 것은 리포좀 또는 지질 나노입자 내에 개별적으로 또는 함께 함유될 수 있다. 따라서, 일부 구현예에서, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형의 각각은 리포좀 또는 지질 나노입자로 개별적으로 제형화된다. 일부 구현예에서, DNA 엔도뉴클레아제는 gRNA와 함께 리포좀 또는 지질 나노입자로 제형화된다. 일부 구현예에서, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형은 리포좀 또는 지질 나노입자로 함께 제형화된다.
일부 구현예에서, 상기 기재된 조성물은 추가로 하나 이상의 추가의 시약을 가지며, 이러한 추가의 시약은 완충제, 폴리펩티드 또는 폴리뉴클레오티드를 세포에 도입하기 위한 완충제, 세척 완충제, 대조군 시약, 대조군 벡터, 대조군 RNA 폴리뉴클레오티드, DNA로부터 폴리펩티드를 시험관 내에서 생성하기 위한 시약, 시퀀싱을 위한 어댑터 등으로부터 선택된다. 완충제는 안정화 완충제, 재구성 완충제, 희석 완충제 등일 수 있다. 일부 구현예에서, 키트는 온-표적 결합 또는 엔도뉴클레아제에 의한 DNA의 절단을 용이하게 하거나 또는 향상시키거나, 또는 표적화의 특이성을 개선시키기 위하여 사용될 수 있는 하나 이상의 성분도 또한 포함할 수 있다.
일부 구현예에서, 조성물의 임의의 성분은 특정 투여 방식 및 투여형에 따라, 약제학적으로 허용 가능한 부형제, 예컨대 담체, 용매, 안정화제, 애쥬번트, 희석제 등과 함께 제형화된다. 구현예들에서, 가이드 RNA 조성물은 일반적으로 생리학적으로 상용성인 pH 및 제형 및 투여 경로에 따라, 약 3의 pH 내지 약 11의 pH, 약 pH 3 내지 약 pH 7 범위를 달성하도록 제형화된다. 일부 구현예에서, pH는 약 pH 5.0 내지 약 pH 8 범위로 조정된다. 일부 구현예에서, 조성물은 하나 이상의 약제학적으로 허용 가능한 부형제와 함께, 본원에 기술된 바와 같은 치료적 유효량의 적어도 하나의 화합물을 포함한다. 선택적으로, 조성물은 본원에 기술된 화합물의 조합을 포함하거나 또는 박테리아 성장의 치료 또는 예방에 유용한 제2 활성 성분(예를 들어, 비제한적으로 항-박테리아제 또는 항-미생물제)을 포함할 수 있거나 또는 본 개시의 시약의 조합을 포함할 수 있다. 일부 구현예에서, gRNA는 다른 하나 이상의 올리고뉴클레오티드, 예를 들어, DNA 엔도뉴클레아제를 인코딩하는 핵산 및/또는 공여자 주형과 함께 제형화된다. 대안적으로, DNA 엔도뉴클레아제를 인코딩하는 핵산 및 공여자 주형은 개별적으로 또는 다른 올리고뉴클레오티드와 조합하여 gRNA 제형에 대하여 상기 기재된 방법으로 제형화된다.
적합한 부형제는 예를 들어, 서서히 대사되는 큰 거대분자, 예컨대 단백질, 다당류, 폴리락트산, 폴리글리콜산, 중합체 아미노산, 아미노산 공중합체, 및 불활성 바이러스 입자를 포함하는 담체 분자를 포함할 수 있다. 다른 예시적인 부형제는 항산화제(예를 들어 비제한적으로, 아스코르브산), 킬레이트화제(예를 들어 비제한적으로, EDTA), 탄수화물(예를 들어 비제한적으로, 덱스트린, 하이드록시알킬셀룰로스 및 하이드록시알킬메틸셀룰로스), 스테아르산, 액체(예를 들어 비제한적으로 오일, 물, 염수, 글리세롤 및 에탄올), 습윤제 또는 유화제, pH 완충 물질 등을 포함한다.
일부 구현예에서, 조성물의 임의의 화합물(예를 들어, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형)은 트랜스펙션, 예컨대 전기천공법을 통해 운반될 수 있다. 일부 예시적인 구현예에서, DNA 엔도뉴클레아제는 세포로의 제공 이전에, gRNA와 사전복합체화되어, 리보핵단백질(RNP) 복합체를 형성할 수 있으며, RNP 복합체는 전기천공될 수 있다. 이러한 구현예에서, 공여자 주형은 전기천공법을 통해 운반될 수 있다.
일부 구현예에서, 조성물은 생체외 치료 방법에 사용되는 치료적 세포를 갖는 치료적 조성물을 나타낸다.
구현예들에서, 치료적 조성물은 세포 조성물 및 선택적으로 활성 성분으로서 그 안에 용해 또는 분산된 본원에 기술된 바와 같은 적어도 하나의 추가의 생물활성제와 함께 생리학적으로 용인되는 담체를 함유한다. 일부 구현예에서, 치료적 조성물은 달리 요망되지 않는 한 치료적 목적을 위하여 포유동물 또는 인간 환자에게 투여될 때 실질적으로 면역원성이 아니다.
일반적으로, 본원에 기술된 유전적으로 변형된, 치료적 세포는 약제학적으로 허용 가능한 담체와 함께 현탁물로서 투여된다. 당업자는 세포 조성물 중에서 사용될 약제학적으로 허용 가능한 담체가 완충제, 화합물, 저온보존제, 보존제 또는 다른 작용제를 대상체에 운반될 세포의 생존력을 실질적으로 방해하는 양으로 포함하지 않을 것이라는 것을 인식할 것이다. 세포를 갖는 제형은 예를 들어, 세포막 온전성이 유지되게 하는 삼투성 완충제, 및 선택적으로 투여 시 세포 생존력을 유지시키거나 생착을 향상시키기 위한 영양제를 포함할 수 있다. 이러한 제형 및 현탁물은 당업자에게 공지되어 있고/있거나 일상적인 실험을 사용하여, 본원에 기술된 바와 같이, 전구 세포와 함께 사용하기 위하여 조정될 수 있다.
일부 구현예에서, 세포 조성물은 또한 리포좀 조성물로서 유화 또는 존재할 수 있되, 단 유화 절차는 세포 생존력에 악영향을 주지 않아야 한다. 세포 및 임의의 다른 활성 성분을 약제학적으로 허용 가능하고, 활성 성분과 상용성인 부형제와, 본원에 기술된 치료 방법에서 사용하기에 적합한 양으로 혼합할 수 있다.
세포 조성물 중에 포함되는 추가의 작용제는 그 중에 성분의 약제학적으로 허용 가능한 염을 포함할 수 있다. 약제학적으로 허용 가능한 염은, 예컨대 염화수소산 또는 인산과 같은 무기산, 또는 아세트산, 타르타르산, 만델산 등과 같은 유기산을 사용하여 형성되는 산 부가염(폴리펩티드의 유리 아미노기를 사용하여 형성됨)을 포함한다. 유리 카복실기를 사용하여 형성된 염은 또한, 예컨대 나트륨, 칼륨, 암모늄, 칼슘 또는 제2철 수산화물과 같은 무기 염기, 및 아이소프로필아민, 트리메틸아민, 2-에틸아미노 에탄올, 히스티딘, 프로카인 등과 같은 유기 염기로부터 유래될 수 있다.
생리학적으로 용인되는 담체는 해당 분야에 널리 공지되어 있다. 예시적인 액체 담체는 활성 성분 및 물에 더하여 물질을 함유하지 않거나 또는 완충제, 예컨대 생리학적 pH 값의 인산나트륨, 생리 식염수 또는 둘 모두, 예컨대 인산염-완충 염수를 함유하는 멸균 수성 용액이다. 더 추가로, 수성 담체는 1가지 초과의 완충제 염뿐만 아니라 염, 예컨대 염화나트륨 및 염화칼륨, 덱스트로스, 폴리에틸렌 글리콜 및 다른 용질을 함유할 수 있다. 액체 조성물은 또한 물에 더하여 그리고 물을 배제하고 액체 상을 또한 함유할 수 있다. 이러한 추가 액체 상의 예는 글리세린, 식물유, 예컨대 면실유, 및 수-유 에멀전이다. 특정 장애 또는 병증의 치료에 효과적인 세포 조성물에서 사용되는 활성 화합물의 양은 장애 또는 병증의 성질에 좌우될 것이고, 표준 임상 기법에 의해 결정될 수 있다.
키트
일부 구현예는 상기 기술된 조성물, 예를 들어, 게놈 편집용 조성물 또는 치료적 세포 조성물 및 하나 이상의 추가의 성분 중 임의의 것을 함유하는 키트를 제공한다.
일부 구현예에서, 키트는 요망되는 목적, 예를 들어, 게놈 편집 또는 세포 요법을 위하여 조성물과 동시에 또는 순차적으로 투여될 수 있는 하나 이상의 추가의 치료제를 가질 수 있다.
일부 구현예에서, 키트는 방법을 실시하기 위하여 키트의 성분을 사용하기 위한 설명서를 추가로 포함할 수 있다. 상기 방법을 실시하기 위한 설명서는 일반적으로 적합한 기록 매체에 기록된다. 예를 들어, 설명서는 기재, 예컨대 종이 또는 플라스틱 등에 인쇄될 수 있다. 설명서는 키트 내에 패키지 삽입물로서, 키트 또는 그의 성분의 용기의 표지(즉, 패키징 또는 하위패키징과 연관됨) 등에 존재할 수 있다. 설명서는 적합한 컴퓨터 판독 가능한 저장 매체, 예를 들어, CD-ROM, 디스켓, 플래시 드라이브 등에 존재하는 전자 저장 데이터 파일로서 존재할 수 있다. 일부 예에서, 실제 설명서는 키트 내에 존재하지 않지만, 원격 공급원으로부터(예를 들어, 인터넷을 통해서) 설명서를 입수하기 위한 수단이 제공될 수 있다. 이러한 구현예의 예는 설명서를 볼 수 있는 웹 주소 및/또는 설명서를 다운로드할 수 있는 웹 주소를 포함하는 키트이다. 설명서와 관련하여, 설명서를 입수하기 위한 이러한 수단은 적합한 기재 상에 기록될 수 있다.
다른 가능한 치료적 접근법
유전자 편집은 특정 서열을 표적화하도록 엔지니어링된 뉴클레아제를 사용하여 행해질 수 있다. 현재까지, 4가지 주요 유형의 뉴클레아제가 존재한다: 메가뉴클레아제 및 그들의 유도체, 아연 핑거 뉴클레아제(ZFN), 전사 활성자 유사 이펙터 뉴클레아제(TALEN) 및 CRISPR-Cas9 뉴클레아제 시스템. 특히 ZFN 및 TALEN의 특이성이 단백질-DNA 상호작용을 통해 이루어지는 한편, RNA-DNA 상호작용은 주로 Cas9를 가이드하기 때문에, 뉴클레아제 플랫폼은 설계의 어려움, 표적화 밀도 및 작용 방식이 달라진다. Cas9 절단은 또한 상이한 CRISPR 시스템 간에 상이한, 인접 모티프, PAM을 필요로 한다. 스트렙토코커스 피오게네스로부터의 Cas9는 NRG PAM을 이용하여 절단하고, 나이세리아 메닌지티디스(Neisseria meningitidis)로부터의 CRISPR은 NNNNGATT(SEQ ID NO: 101), NNNNNGTTT(SEQ ID NO: 102) 및 NNNNGCTT(SEQ ID NO: 103)를 포함하는 PAM를 가진 부위에서 절단할 수 있다. 수많은 다른 Cas9 오솔로그는 대안적인 PAM에 인접한 프로토스페이서를 표적화한다.
본 개시의 방법의 다양한 구현예에서, CRISPR 엔도뉴클레아제, 예컨대 Cas9가 사용될 수 있다. 그러나, 본원에 기술된 교시, 예컨대 치료적 표적 부위는 다른 형태의 엔도뉴클레아제, 예컨대 ZFN, TALEN, HE, 또는 MegaTAL에, 또는 뉴클레아제의 조합을 이용하여 적용될 수 있다. 그러나, 상기 엔도뉴클레아제에 본 개시의 교시를 적용하기 위해, 특히 특정 표적 부위에 대해 유도된 단백질을 엔지니어링하는 것이 필요할 것이다.
추가의 결합 도메인은 특이성을 증가시키기 위해 Cas9 단백질에 융합될 수 있다. 이들 구축물의 표적 부위는 확인된 gRNA 특이적 부위에 대하여 맵핑될 것이지만, 예컨대 아연 핑거 도메인에 있어서, 추가의 결합 모티프가 필요할 것이다. Mega-TAL의 경우에서, 메가뉴클레아제는 TALE DNA-결합 도메인에 융합될 수 있다. 메가뉴클레아제 도메인은 특이성을 증가시킬 수 있고 절단을 제공할 수 있다. 유사하게, 불활성화된 또는 데드(dead) Cas9(dCas9)는 절단 도메인에 융합될 수 있고 융합된 DNA-결합 도메인에 대한 sgRNA/Cas9 표적 부위 및 인접 결합 부위를 필요로 할 수 있다. 이것은 아마도 촉매적 불활성화에 더하여, 추가의 결합 부위 없이 결합을 감소시키기 위해, dCas9의 일부 단백질 엔지니어링을 필요로 할 것이다.
일부 구현예에서, 본 개시에 따른 조성물 및 게놈 편집 방법(예를 들어, 알부민 유전자좌 내로의 FVIII-인코딩 서열의 삽입)은 하기의 방법 중 임의의 것을 활용할 수 있거나, 이를 사용하여 행해질 수 있다.
아연 핑거 뉴클레아제
아연 핑거 뉴클레아제(ZFN)는 II형 엔도뉴클레아제 FokI의 촉매적 도메인에 연결된 엔지니어링된 아연 핑거 DNA 결합 도메인을 갖는 모듈형 단백질이다. FokI은 이량체로서만 기능하기 때문에, 한 쌍의 ZFN은 반대 DNA 가닥 상의 동족 표적 "절반-부위" 서열에 결합하고, 촉매적으로 활성인 FokI 이량체가 형성될 수 있도록 그들 사이에 정확한 간격을 갖도록 엔지니어링되어야 한다. 그 자체가 서열 특이성을 갖지 않는 FokI 도메인의 이량체화 시, DNA 이중-가닥 파단은 게놈 편집에서 개시 단계로서 ZFN 절반-부위 사이에 생성된다.
각각의 ZFN의 DNA 결합 도메인은 전형적으로 풍부한 Cys2-His2 구조의 3개 내지 6개의 아연 핑거를 갖고, 각각의 핑거는 주로 표적 DNA 서열의 하나의 가닥 상에서 3중의 뉴클레오티드를 인식하지만, 제4 뉴클레오티드와의 교차-가닥 상호작용이 또한 중요할 수 있다. DNA와 중요하게 접촉하는 위치에서 핑거의 아미노산의 변경은 주어진 핑거의 서열 특이성을 변경시킨다. 따라서, 4-핑거 아연 핑거 단백질은 12bp의 표적 서열을 선택적으로 인식할 것이고, 여기서 표적 서열은 각각의 핑거에 의해 기여된 3중의 선호의 복합물이지만, 3중의 선호는 이웃하는 핑거에 의해 다양한 정도로 영향을 받을 수 있다. ZFN의 중요한 양태는 그들이 개별 핑거를 단순히 변형시킴으로써 거의 모든 게놈 주소로 용이하게 재-표적화될 수 있다는 것이지만, 이를 잘 수행하기 위하여는 상당한 전문지식이 필요하다. ZFN의 대부분의 적용에서, 4개 내지 6개의 핑거의 단백질이 사용되어, 각각 12 bp 내지 18 bp를 인식한다. 따라서, 한 쌍의 ZFN는 전형적으로 절반-부위 사이에 5 bp 내지 7 bp의 스페이서를 포함하지 않는, 24 bp 내지 36 bp의 조합된 표적 서열을 인식할 것이다. 결합 부위는 15 bp 내지 17 bp를 포함하여 더 큰 스페이서로 추가로 분리될 수 있다. 반복부 서열 또는 유전자 상동체가 설계 과정 동안 배제되는 것을 가정하여, 이러한 길이의 표적 서열은 인간 게놈에서 독특할 것이다. 그럼에도 불구하고, ZFN 단백질-DNA 상호작용은 그들의 특이성이 절대적이지 않아서, 오프-표적 결합 및 절단 사건이 2개의 ZFN 사이의 이종이량체로서 또는 ZFN 중 하나 또는 다른 것의 동종이량체로서 일어난다. 후자 가능성은 FokI 도메인의 이량체화 계면을 엔지니어링하여 절대적(obligate) 이종이량체 변이체(이것은 그들 자체와 함께가 아니라 단지 서로와 이량체화할 수 있음)로서도 공지된 "플러스" 및 "마이너스" 변이체를 생성함으로써 효과적으로 제거되었다. 절대적 이종이량체를 강요하는 것은 동종이량체의 형성을 예방한다. 이것은 ZFN뿐만 아니라 이들 FokI 변이체를 채택하는 임의의 다른 뉴클레아제의 크게 향상된 특이성을 갖는다.
다양한 ZFN-기반 시스템은 해당 분야에 기술되어 있고, 그의 변형은 정식으로 보고되어 있으며, 다수의 참고문헌은 ZFN의 설계를 가이드하는 데 사용되는 규칙 및 파라미터를 기술하며; 예를 들어, 문헌[Segal et al., Proc Natl Acad Sci USA 96(6):2758-63 (1999)]; 문헌[Dreier B et al., J Mol Biol. 303(4):489-502 (2000)]; 문헌[Liu Q et al., J Biol Chem. 277(6):3850-6 (2002); 문헌[Dreier et al., J Biol Chem 280(42):35588-97 (2005)]; 및 문헌[Dreier et al., J Biol Chem. 276(31):29466-78 (2001)]을 참조한다.
전사 활성자-유사 이펙터 뉴클레아제(TALEN)
TALEN은 모듈형 뉴클레아제의 또 다른 포맷을 나타내며, 그에 의해 ZFN에서와 같이, 엔지니어링된 DNA 결합 도메인이 FokI 뉴클레아제 도메인에 연결되고, 한쌍의 TALEN이 동시에 작동하여 표적화된 DNA 절단을 달성한다. ZFN과의 주요 차이점은 DNA 결합 도메인의 성질 및 관련된 표적 DNA 서열 인식 특성이다. TALEN DNA 결합 도메인은 TALE 단백질로부터 유래하는데, 이것은 원래 식물 박테리아 병원균 잔토모나스 종(Xanthomonas sp)에서 기술되었다. TALE는 33개 내지 35개의 아미노산 반복부의 탠덤 어레이를 가지며, 각각의 반복부는 전형적으로 최대 20 bp 길이인 표적 DNA 서열에서 단일 염기쌍을 인식하여, 최대 40 bp의 총 표적 서열 길이를 제공한다. 각각의 반복부의 뉴클레오티드 특이성은 반복 가변 이중잔기(repeat variable diresidue: RVD)에 의해 결정되는데, 이것은 위치 12 및 13에서 단지 2개의 아미노산을 포함한다. 염기 구아닌, 아데닌, 시토신 및 티민은 대개 4개의 RVD: 각각 Asn-Asn, Asn-Ile, His-Asp 및 Asn-Gly에 의해 인식된다. 이것은 아연 핑거에 대하여가 아니라 훨씬 더 단순한 인식 코드를 구성하고, 따라서 뉴클레아제 설계를 위하여 후자보다 이점을 나타낸다. 그럼에도 불구하고, ZFN에서와 같이, TALEN의 단백질-DNA 상호작용은 그들의 특이성이 절대적이지 않고, TALEN은 또한 FokI 도메인의 절대적 이종이량체 변이체의 사용으로부터 이익을 얻어 오프-표적 활성을 감소시킨다.
촉매적 기능이 불활성화된 FokI 도메인의 추가의 변이체가 생성된 바 있다. TALEN 또는 ZFN 쌍 중 어느 하나의 하나의 절반부가 불활성 FokI 도메인을 함유하는 경우, 단지 단일-가닥 DNA 절단(닉킹)이 DSB보다는 표적 부위에서 일어날 것이다. 그 결과는 Cas9 절단 도메인 중 하나가 불활성화된 CRISPR/Cas9/Cpf1 "닉카아제" 돌연변이체의 사용과 유사하다. DNA 닉을 사용하여 DSB에서보다 더 낮은 효율로 HDR에 의해 게놈 편집을 유도할 수 있다. 주요 이점은 오프-표적 닉이 NHEJ-매개 수선-오류가 일어나기 쉬운 DSB와 달리 신속하고 정확하게 수선된다는 것이다.
다양한 TALEN-기반 시스템이 해당 분야에 기술되어 있고, 그의 변형은 정기적으로 보고되고 있으며; 예를 들어, 문헌[Boch, Science 326(5959):1509-12 (2009)]; 문헌[Mak et al., Science 335(6069):716-9 (2012)]; 및 문헌[Moscou et al., Science 326(5959):1501 (2009)]을 참조한다. "골든 게이트(Golden Gate)" 플랫폼 또는 클로닝 계획에 기초한 TALEN의 사용이 다수의 그룹에 의해 기술되어 있으며; 예를 들어, 문헌[Cermak et al., Nucleic Acids Res. 39(12):e82 (2011)]; 문헌[Li et al., Nucleic Acids Res. 39(14):6315-25(2011)]; 문헌[Weber et al., PLoS One. 6(2):e16765 (2011)]; 문헌[Wang et al., J Genet Genomics 41(6):339-47, Epub 2014 Can 17 (2014)]; 및 문헌[Cermak T et al., Methods Mol Biol. 1239:133-59 (2015)]을 참조한다.
호밍 엔도뉴클레아제
호밍 엔도뉴클레아제(HE)는 긴 인식 서열(14개 내지 44개의 염기쌍)을 갖고, 높은 특이성으로 DNA를 절단하는(흔히 게놈에서 독특한 부위에서) 서열-특이적 엔도뉴클레아제이다. 진핵생물, 원생생물, 박테리아, 고세균, 시아노박테리아 및 파지를 비롯한, 광범위한 숙주로부터 유래된 LAGLIDADG(SEQ ID NO: 6), GIY-YIG, His-Cis 박스, H-N-H, PD-(D/E)xK 및 Vsr-유사를 비롯하여, 그들의 구조에 의해 분류되는 바와 같은 HE의 적어도 6개의 공지된 과가 존재한다. ZFN 및 TALEN에서와 같이 HE를 사용하여 게놈 편집에서 초기 단계로서 표적 유전자좌에서 DSB를 생성할 수 있다. 또한, 일부 천연 HE 및 엔지니어링된 HE는 DNA의 단일 가닥 만을 절단하고, 그에 의해 부위-특이적 닉카아제로서 기능한다. HE의 큰 표적 서열 및 그들이 제공하는 특이성은 그들을 부위-특이적 DSB를 생성하기 위한 매력적인 후보로 만들었다.
다양한 HE-기반의 시스템이 해당 분야에 기술되어 있고, 그의 변형은 정기적으로 보고되어 있으며; 예를 들어, 문헌[Steentoft et al., Glycobiology 24(8):663-80 (2014)]; 문헌[Belfort and Bonocora, Methods Mol Biol. 1123:1-26 (2014)]; 문헌[Hafez and Hausner, Genome 55(8):553-69 (2012)]; 및 그것들에 인용된 참고문헌의 검토를 참조한다.
MegaTAL / Tev-mTALEN / MegaTev
하이브리드 뉴클레아제의 추가의 예로서, MegaTAL 플랫폼 및 Tev-mTALEN 플랫폼은 TALE DNA 결합 도메인 및 촉매적으로 활성인 HE의 융합을 사용하여, 조정 가능한 DNA 결합 및 TALE의 특이성 둘 모두, 뿐만 아니라 HE의 절단 서열 특이성을 이용하며; 예를 들어, 문헌[Boissel et al., NAR 42: 2591-2601 (2014)]; [Kleinstiver et al., G3 4:1155-65 (2014)]; 및 문헌[Boissel and Scharenberg, Methods Mol. Biol. 1239: 171-96 (2015)]을 참조한다.
추가의 변이에서, MegaTev 구조는 메가뉴클레아제(Mega)와 GIY-YIG 호밍 엔도뉴클레아제 I-TevI(Tev)로부터 유래된 뉴클레아제 도메인의 융합이다. 2개의 활성 부위는 DNA 기질 상에서 약 30 bp 이격되어 위치하며, 비-상용성 응집 말단을 갖는 2개의 DSB를 생성하며; 예를 들어, 문헌[Wolfs et al., NAR 42, 8816-29 (2014)]을 참조한다. 기존의 뉴클레아제-기반 접근법의 다른 조합이 발전될 것이고, 본원에 기술된 표적화된 게놈 변형을 달성하는 데 유용할 것이라는 것이 예상된다.
dCas9-FokI 또는 dCpf1-Fok1 및 다른 뉴클레아제
상기 기술된 뉴클레아제 플랫폼의 구조적 및 기능적 특성의 조합은 내재하는 결핍 중 일부를 잠재적으로 극복할 수 있는 게놈 편집에 대한 추가 접근법을 제공한다. 예로서, CRISPR 게놈 편집 시스템은 전형적으로 단일 Cas9 엔도뉴클레아제를 사용하여 DSB를 생성한다. 표적화의 특이성은 표적 DNA와의 왓슨-크릭 염기-쌍형성(또한 스트렙토코커스 피오게네스로부터의 Cas9의 경우에 인접 NAG 또는 NGG PAM 서열에서 추가 2개의 염기)을 겪은 가이드 RNA에서 20개 또는 22개의 뉴클레오티드 서열에 의해 유도된다. 이러한 서열은 인간 게놈에서 독특하기에 충분히 길지만, RNA/DNA 상호작용의 특이성은 절대적이지 않고, 특히 표적 서열의 5' 절반부에서 상당한 불규칙성이 때때로 용인되어, 특이성을 유도하는 염기의 수를 효과적으로 감소시킨다. 이에 대한 하나의 해결책은 Cas9 또는 Cpf1 촉매적 기능을 완전히 불활성화시켰고(RNA-가이드된 DNA 결합 기능만을 보유함) 대신에 불활성화된 Cas9에 FokI 도메인을 융합시키며; 예를 들어, 문헌[Tsai et al., Nature Biotech 32: 569-76 (2014)]; 및 문헌[Guilinger et al., Nature Biotech. 32: 577-82 (2014)]을 참조한다. FokI은 촉매적으로 활성이 되기 위하여 이량체화되어야 하기 때문에, 근접하게 2개의 FokI 융합부를 테더링하여 이량체를 형성하고, DNA를 절단하기 위하여 2가지의 가이드 RNA가 필요하다. 이는 조합된 표적 부위에서 염기의 수를 본질적으로 배가시키고, 그에 의해 CRISPR-기반 시스템에 의한 표적화의 엄격성을 증가시킨다.
추가의 예로서, 촉매적으로 활성인 HE, 예컨대 I-TevI로의 TALE DNA 결합 도메인의 융합은 조정 가능한 DNA 결합 및 TALE의 특이성 둘 모두, 뿐만 아니라 I-TevI의 절단 서열 특이성을 이용하며, 오프-표적 절단이 추가로 감소될 수 있다고 예상된다.
본 발명의 하나 이상의 구현예의 상세내용은 하기 첨부된 도면에 기재되어 있다. 본원에 기술된 것과 유사한 또는 동등한 임의의 재료 및 방법이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 바람직한 재료 및 방법은 이제 기재된다. 본 개시의 다른 특징, 목적 및 이점은 설명으로부터 명백해질 것이다. 설명에서, 단수 형태는 또한, 문맥이 명확히 달리 기술하지 않는 한, 복수를 포함한다. 달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자가 이해하는 것과 동일한 의미를 갖는다. 상충하는 경우에, 본 설명이 좌우할 것이다.
본원에 기술된 실시예 및 구현예가 예시적인 목적을 위한 것일 뿐이며, 그의 견지에서 다양한 변형 또는 변경이 당업자에게 제안될 것이며, 본 출원의 목적 및 범위 및 첨부된 첨구범위의 범주 내에 포함될 것이 이해된다. 본원에 언급된 모든 공보, 특허 및 특허 출원은 모든 목적을 위하여 그 전문이 참고로 본원에 포함된다.
본 개시과 함께 제공되는 본 개시의 일부 구현예는 하기의 비-제한적인 실시예에 의해 추가로 예시된다.
예시적인 구현예
구현예 1. 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산;
SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA); 및
인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형을 포함하는 시스템.
구현예 2. gRNA가 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함하는 구현예 1의 시스템.
구현예 3. gRNA가 SEQ ID NO: 22로부터의 스페이서 서열을 포함하는 구현예 2의 시스템.
구현예 4. gRNA가 SEQ ID NO: 21로부터의 스페이서 서열을 포함하는 구현예 2의 시스템.
구현예 5. gRNA가 SEQ ID NO: 28로부터의 스페이서 서열을 포함하는 구현예 2의 시스템.
구현예 6. gRNA가 SEQ ID NO: 30으로부터의 스페이서 서열을 포함하는 구현예 2의 시스템.
구현예 7. 상기 DNA 엔도뉴클레아제가 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택되는 구현예 1 내지 6 중 어느 한 구현예의 시스템.
구현예 8. 상기 DNA 엔도뉴클레아제가 Cas9인 구현예 1 내지 7 중 어느 한 구현예의 시스템.
구현예 9. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 숙주 세포에서의 발현을 위해 코돈 최적화된 구현예 1 내지 8 중 어느 한 구현예의 시스템.
구현예 10. 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 구현예 1 내지 9 중 어느 한 구현예의 시스템.
구현예 11. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 구현예 1 내지 10 중 어느 한 구현예의 시스템.
구현예 12. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 구현예 1 내지 10 중 어느 한 구현예의 시스템.
구현예 13. 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 구현예 12의 시스템.
구현예 14. 공여자 주형이 아데노 연관 바이러스(AAV) 벡터에 인코딩되는 구현예 1 내지 13 중 어느 한 구현예의 시스템.
구현예 15. 공여자 주형이 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된 구현예 14의 시스템.
구현예 16. 공여자 카세트가 양 측에서 gRNA 표적 부위에 의해 플랭킹된 구현예 15의 시스템.
구현예 17. gRNA 표적 부위가 시스템 내의 gRNA에 대한 표적 부위인 구현예 15 또는 16의 시스템.
구현예 18. 공여자 주형의 gRNA 표적 부위가 시스템 내의 gRNA에 대한 게놈 gRNA 표적 부위의 역 상보물인 구현예 17의 시스템.
구현예 19. 상기 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자로 제형화되는 구현예 1 내지 18 중 어느 한 구현예의 시스템.
구현예 20. 상기 리포좀 또는 지질 나노입자가 gRNA를 또한 포함하는 구현예 19의 시스템.
구현예 21. gRNA와 사전복합체화되어, 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 포함하는 구현예 1 내지 20 중 어느 한 구현예의 시스템.
구현예 22. 세포 내의 게놈의 편집 방법으로서, 상기 방법이 하기의 것을 세포에 제공하는 단계를 포함하는 방법:
(a) SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA;
(b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
(c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형.
구현예 23. gRNA가 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함하는 구현예 22의 방법.
구현예 24. gRNA가 SEQ ID NO: 21로부터의 스페이서 서열을 포함하는 구현예 23의 방법.
구현예 25. gRNA가 SEQ ID NO: 22로부터의 스페이서 서열을 포함하는 구현예 23의 방법.
구현예 26. gRNA가 SEQ ID NO: 28로부터의 스페이서 서열을 포함하는 구현예 23의 방법.
구현예 27. gRNA가 SEQ ID NO: 30으로부터의 스페이서 서열을 포함하는 구현예 23의 방법.
구현예 28. 상기 DNA 엔도뉴클레아제가 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제; 또는 그의 기능적 유도체로 이루어진 군으로부터 선택되는 구현예 22 내지 27 중 어느 한 구현예의 방법.
구현예 29. 상기 DNA 엔도뉴클레아제가 Cas9인 구현예 22 내지 28 중 어느 한 구현예의 방법.
구현예 30. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 세포에서의 발현을 위해 코돈 최적화된 구현예 22 내지 29 중 어느 한 구현예의 방법.
구현예 31. 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 세포에서의 발현을 위해 코돈 최적화된 구현예 22 내지 30 중 어느 한 구현예의 방법.
구현예 32. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 구현예 22 내지 31 중 어느 한 구현예의 방법.
구현예 33. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 구현예 22 내지 31 중 어느 한 구현예의 방법.
구현예 34. 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 구현예 33의 방법.
구현예 35. 공여자 주형이 아데노 연관 바이러스(AAV) 벡터에 인코딩되는 구현예 22 내지 34 중 어느 한 구현예의 방법.
구현예 36. 공여자 주형이 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹되는 구현예 22 내지 35 중 어느 한 구현예의 방법.
구현예 37. 공여자 카세트가 양 측에서 gRNA 표적 부위에 의해 플랭킹되는 구현예 36의 방법.
구현예 38. gRNA 표적 부위가 (a)의 gRNA에 대한 표적 부위인 구현예 36 또는 37의 방법.
구현예 39. 공여자 주형의 gRNA 표적 부위가 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 구현예 38의 방법.
구현예 40. 상기 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자로 제형화되는 구현예 22 내지 39 중 어느 한 구현예의 방법.
구현예 41. 상기 리포좀 또는 지질 나노입자가 gRNA를 또한 포함하는 구현예 40의 방법.
구현예 42. gRNA와 사전복합체화되어, 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 세포에 제공하는 단계를 포함하는 구현예 22 내지 41 중 어느 한 구현예의 방법.
구현예 43. (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에게 제공한지 4일보다 긴 시간 후에 세포에 제공되는 구현예 22 내지 42 중 어느 한 구현예의 방법.
구현예 44. (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)를 세포에 제공한지 적어도 14일 후에 세포에 제공되는 구현예 22 내지 43 중 어느 한 구현예의 방법.
구현예 45. 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공되는 구현예 43 또는 44의 방법.
구현예 46. 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공되는 구현예 45의 방법.
구현예 47. 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열이 내인성 알부민 프로모터의 제어 하에 발현되는 구현예 22 내지 46 중 어느 한 구현예의 방법.
구현예 48. 상기 세포가 간세포인 구현예 22 내지 47 중 어느 한 구현예의 방법.
구현예 49. 세포의 게놈이 구현예 22 내지 48 중 어느 한 구현예의 방법에 의해 편집되는 유전적으로 변형된 세포.
구현예 50. 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열이 내인성 알부민 프로모터의 제어 하에 발현되는 구현예 49의 유전적으로 변형된 세포.
구현예 51. 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 세포에서의 발현을 위해 코돈 최적화된 구현예 49 또는 50의 유전적으로 변형된 세포.
구현예 52. 상기 세포가 간세포인 구현예 49 내지 51 중 어느 한 구현예의 유전적으로 변형된 세포.
구현예 53. 대상체에서의 A형 혈우병의 치료 방법으로서, 상기 방법이 하기의 것을 대상체 내의 세포에 제공하는 단계를 포함하는 방법:
(a) SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA;
(b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
(c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형.
구현예 54. gRNA가 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함하는 구현예 53의 방법.
구현예 55. gRNA가 SEQ ID NO: 22로부터의 스페이서 서열을 포함하는 구현예 54의 방법.
구현예 56. gRNA가 SEQ ID NO: 21로부터의 스페이서 서열을 포함하는 구현예 54의 방법.
구현예 57. gRNA가 SEQ ID NO: 28로부터의 스페이서 서열을 포함하는 구현예 54의 방법.
구현예 58. gRNA가 SEQ ID NO: 30으로부터의 스페이서 서열을 포함하는 구현예 54의 방법.
구현예 59. 상기 대상체가 A형 혈우병을 갖거나, 이를 갖는 것으로 의심되는 환자인 구현예 53 내지 58 중 어느 한 구현예의 방법.
구현예 60. 상기 대상체가 A형 혈우병의 위험이 있는 것으로 진단받는 구현예 53 내지 58 중 어느 한 구현예의 방법.
구현예 61. 상기 DNA 엔도뉴클레아제가 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제; 또는 그의 기능적 유도체로 이루어진 군으로부터 선택되는 구현예 53 내지 60 중 어느 한 구현예의 방법.
구현예 62. 상기 DNA 엔도뉴클레아제가 Cas9인 구현예 53 내지 61 중 어느 한 구현예의 방법.
구현예 63. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 세포에서의 발현을 위해 코돈 최적화된 구현예 53 내지 62 중 어느 한 구현예의 방법.
구현예 64. 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 세포에서의 발현을 위해 코돈 최적화된 구현예 53 내지 63 중 어느 한 구현예의 방법.
구현예 65. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 구현예 53 내지 64 중 어느 한 구현예의 방법.
구현예 66. 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 구현예 53 내지 64 중 어느 한 구현예의 방법.
구현예 67. 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 구현예 66의 방법.
구현예 68. (a)의 gRNA, (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산, 및 (c)의 공여자 주형 중 하나 이상이 리포좀 또는 지질 나노입자로 제형화되는 구현예 53 내지 67 중 어느 한 구현예의 방법.
구현예 69. 공여자 주형이 아데노 연관 바이러스(AAV) 벡터에 인코딩되는 구현예 53 내지 68 중 어느 한 구현예의 방법.
구현예 70. 공여자 주형이 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된 구현예 53 내지 69 중 어느 한 구현예의 방법.
구현예 71. 공여자 카세트가 양 측에서 gRNA 표적 부위에 의해 플랭킹된 구현예 70의 방법.
구현예 72. gRNA 표적 부위가 (a)의 gRNA에 대한 표적 부위인 구현예 70 또는 71의 방법.
구현예 73. 공여자 주형의 gRNA 표적 부위가 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 구현예 72의 방법.
구현예 74. 공여자 주형을 세포에 제공하는 단계가 공여자 주형을 대상체에게 투여하는 것을 포함하는 구현예 53 내지 73 중 어느 한 구현예의 방법.
구현예 75. 투여가 정맥내 경로를 통해 이루어지는 구현예 74의 방법.
구현예 76. 상기 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자로 제형화되는 구현예 53 내지 75 중 어느 한 구현예의 방법.
구현예 77. 상기 리포좀 또는 지질 나노입자가 gRNA를 또한 포함하는 구현예 76의 방법.
구현예 78. gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 리포좀 또는 지질 나노입자를 대상체에게 투여하는 것을 포함하는 구현예 77의 방법.
구현예 79. 투여가 정맥내 경로를 통해 이루어지는 구현예 78의 방법.
구현예 80. gRNA와 사전복합체화되어 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 세포에 제공하는 단계를 포함하는 구현예 53 내지 79 중 어느 한 구현예의 방법.
구현예 81. (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한지 4일보다 긴 시간 후에 세포에 제공되는 구현예 53 내지 80 중 어느 한 구현예의 방법.
구현예 82. (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 (c)의 공여자 주형을 세포에 제공한지 적어도 14일 후에 세포에 제공되는 구현예 53 내지 81 중 어느 한 구현예의 방법.
구현예 83. 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공되는 구현예 81 또는 82의 방법.
구현예 84. 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공되는 구현예 83의 방법.
구현예 85. (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 대상체에게 투여하는 것을 포함하는 구현예 81 내지 84 중 어느 한 구현예의 방법.
구현예 86. (c)의 공여자 주형을 세포에 제공하는 단계가 AAV 벡터에 인코딩된 공여자 주형을 대상체에게 투여하는 것을 포함하는 구현예 81 내지 85 중 어느 한 구현예의 방법.
구현예 87. 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열이 내인성 알부민 프로모터의 제어 하에 발현되는 구현예 53 내지 86 중 어느 한 구현예의 방법.
구현예 88. 상기 세포가 간세포인 구현예 53 내지 87 중 어느 한 구현예의 방법.
구현예 89. 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산이 대상체의 간에서 발현되는 구현예 53 내지 88 중 어느 한 구현예의 방법.
구현예 90. 구현예 49 내지 52 중 어느 한 구현예의 유전적으로 변형된 세포를 대상체에게 투여하는 단계를 포함하는 대상체에서의 A형 혈우병의 치료 방법.
구현예 91. 상기 유전적으로 변형된 세포가 대상체의 자가 세포인 구현예 90의 방법.
구현예 92. 대상체로부터 생물학적 시료를 수득하는 단계로서, 생물학적 시료가 간세포를 포함하며, 유전적으로 변형된 세포가 간세포로부터 제조되는 단계를 추가로 포함하는 구현예 90 또는 91의 방법.
구현예 93. 구현예 1 내지 21 중 어느 한 구현예의 시스템의 하나 이상의 요소를 포함하며, 사용 설명서를 추가로 포함하는 키트.
실시예
실시예 1: 시험관 내에서 Hepa1-6 세포 내의 마우스 알부민 유전자의 인트론 1에서의 Cas9 뉴클레아제에 의한 절단을 유도하는 gRNA의 확인
관련 있는 전임상 동물 모델에서의 평가를 위하여, 관련 있는 전-임상 동물 종으로부터의 알부민의 인트론 1에서 Cas9 뉴클레아제에 의한 효율적인 절단을 유도하는 gRNA 분자를 시험하였다. A형 혈우병의 마우스 모델이 널리 확립되어 있다(문헌[Bi L, Lawler AM, Antonarakis SE, High KA, Gearhart JD, Kazazian HH., Jr]). 마우스 인자 VIII 유전자의 표적화된 붕괴는 A형 혈우병의 모델을 생성하며(문헌[Nat Genet. 1995;10:119-21. doi: 10.1038/ng0595-119]), 이러한 질병에 대한 새로운 치료적 접근법을 시험하기 위한 가치 있는 모델 시스템을 나타낸다. 마우스 알부민의 인트론 1 내를 절단할 가능성을 갖는 gRNA를 확인하기 위하여, 인트론의 서열을 관심 서열 및 마우스 게놈 내의 모든 관련 서열에서 스트렙토코커스 피오게네스 Cas9(spCas9)에 의한 절단에 대한 잠재적인 표적일 NGG PAM 서열을 사용하는 모든 가능한 gRNA 표적 서열을 확인하는 알고리즘(예를 들어, CCTOP; https://crispr.cos.uni-heidelberg.de/)을 사용하여 분석하였다. 그 다음, 각각의 gRNA를 마우스 게놈 내의 정확한 또는 관련 서열의 빈도에 기초하여 순위화하여, 이론적으로 최소의 오프-표적 절단 위험을 갖는 gRNA를 확인하였다. 이러한 유형의 분석에 기초하여, mALbgRNA_T1로 지칭되는 gRNA를 시험을 위해 선택하였다.
mAlbgRNA_T1은 마우스 게놈 내의 오직 4개의 다른 부위에 대해서만 상동성을 나타내었으며, 이의 각각은 하기 표 2에 나타낸 바와 같이 4개의 뉴클레오티드 불일치를 나타낸다.
Figure pct00003
마우스 세포에서 Cas9에 의한 절단을 촉진시키기 위한 mALbgRNA_T1의 효능을 평가하기 위하여, 마우스 간 세포 유래 세포주 Hepa1-6을 사용하였다. Hepa1-6 세포를 5% CO2 인큐베이터에서 DMEM+10% FBS 중에 배양하였다. 2.4 ㎕의 spCas9(0.8 ㎍/㎕) 및 3 ㎕의 합성 gRNA(20 마이크로몰) 및 7 ㎕의 PBS(1:5 spCas9:gRNA 비)를 혼합하고, 실온에서 10분 동안 인큐베이션시킴으로써 스트렙토코커스 피오게네스 Cas9(spCas9) 단백질에 결합된 gRNA로 구성된 리보핵-단백질 복합체(RNP)를 예비-형성하였다. 뉴클레오펙션을 위하여, 전체 바이얼의 SF 보충 시약(Lonza)을 SF 뉴클레오펙터(Nucleofector) 시약(Lonza)에 첨가하여, 완전한 뉴클레오펙션 시약을 제조하였다. 각 뉴클레오펙션을 위하여, 1x105개의 Hepa1-6 세포를 20 ㎕의 완전 뉴클레오펙션 시약 중에 재현탁화시키고, RNP에 첨가한 다음, 뉴클레오펙션 큐벳(16 웰 스트립)에 옮기고, 이를 4D 뉴클레펙션 디바이스(Lonza)에 배치하고, 프로그램 EH-100을 사용하여 뉴클레오펙션시켰다. 세포가 10분 동안 휴지되게 한 후에, 그들을 신선한 완전 배지를 갖는 적절한 크기의 플레이트로 옮겼다. 뉴클레오펙션 48시간 후에, 세포를 수집하고, 게놈 DNA를 추출하고, Qiagen DNeasy 키트(카탈로그 69506)를 사용하여 정제하였다.
알부민 인트론 1 내의 표적 부위에서 Cas9/gRNA 매개된 절단의 빈도를 평가하기 위하여, 표적 부위를 플랭킹하는 프라이머의 쌍(MALBF3; 5' TTATTACGGTCTCATAGGGC 3'(SEQ ID NO: 11) 및 MALBR5: AGTCTTTCTGTCAATGCACAC 3'(SEQ ID NO: 12))을 52℃ 어닐링 온도를 사용하는 중합효소 연쇄 반응(PCR)에서 사용하여, 게놈 DNA로부터 609 bp 영역을 증폭하였다. PCR 산물을 Qiagen PCR 정제 키트(카탈로그 번호 28106)를 사용하여 정제하고, PCR 반응을 위해 사용된 것과 동일한 프라이머와 함께 생거(Sanger) 시퀀싱을 사용하여 직접 시퀀싱하였다. 서열 데이터를 gRNA/Cas9 복합체에 대한 예측된 절단 부위에 존재하는 삽입 및 결실(INDELS)의 빈도를 결정하는 TIDES(Tracking of Indels by Decomposition)로 지칭되는 알고리즘에 의해 분석하였다(문헌[Brinkman et al (2104); Nucleic Acids Research, 2014, 1]). mAlbgRNA_T1에 대한 INDEL 생성의 전체 빈도는 3개의 독립적일 실험에서 시험되는 경우 85% 내지 95%였으며, 이는 이들 세포의 게놈에서의 gRNA/Cas9에 의한 효율적인 절단을 나타낸다. mAlb gRNA-T1을 뉴클레오펙션시킨 Hepa1-6 세포에서의 TIDES 분석의 일 예는 도 3에 나타나 있다. 대부분의 삽입 및 결실은 1 bp 삽입 및 1 bp 결실로 이루어져 있으며, 최대 6 bp의 더 적은 수의 결실이 존재한다.
실시예 2: 마우스 생체내에서 mAlbgRNA_T1의 절단 효율의 평가
Cas9 및 mAlbgRNA-T1을 마우스의 간세포로 운반하기 위하여, 지질 나노입자(LNP) 운반 비히클을 사용하였다. 화학적으로 변형된 뉴클레오티드를 혼입시킨 sgRNA를 화학적으로 합성하여, 뉴클레아제에 대한 내성을 개선시켰다. 일 예에서 gRNA는 하기의 구조: 5' usgscsCAGUUCCCGAUCGUUACGUUUUAGAgcuaGAAAuagcAAGUUAAAAUAAGGCUAGUCCGUUAUCaacuuGAAAaaguggcaccgagucggugcusususU-3'(SEQ ID NO: 13)로 구성되며, "A, G, U, C"는 고유 RNA 뉴클레오티드이며, "a, g, u, c"는 2'-O-메틸 뉴클레오티드이며, "s"는 포스포로티오에이트 백본을 나타낸다. gRNA의 마우스 알부민 표적화 서열에 밑줄 표시되어 있으며, gRNA 서열의 나머지는 공통의 스캐폴드 서열이다. 게놈 DNA의 절단이 발생할 수 있는 핵 구획 내로 spCas9 단백질을 수송하는 데 필요한 핵 국소화 도메인(NLS)에 융합된 spCas9 단백질을 인코딩하도록 spCas9 mRNA를 설계하였다. Cas9 mRNA의 추가의 성분은 리보솜 결합을 촉진시키기 위한 제1 코돈 이전의 5' 말단의 KOZAK 서열 및 일련의 A 잔기로 구성된 3' 말단의 폴리A 테일이다. NLS 서열을 갖는 spCas9 mRNA의 서열의 일 예는 SEQ ID NO: 81에 나타나 있다. mRNA는 해당 분야에 널리 알려져 있는 상이한 방법에 의해 생성될 수 있다. 본원에 사용되는 이러한 방법 중 하나는 T7 중합효소를 사용하는 시험관 내 전사이며, mRNA의 서열은 T7 중합효소 프로모터를 함유하는 플라스미드에 인코딩된다. 약술하면, T7 중합효소 및 리보뉴클레오티드를 함유하는 적절한 완충제 중에서의 플라스미드의 인큐베이션 시에, 요망되는 단백질의 아미노산 서열을 인코딩하는 RNA 분자를 생성하였다. 반응 혼합물 중 천연 리보뉴클레오티드 또는 화학적으로 변형된 리보뉴클레오티드를 사용하여 천연의 화학 구조를 갖거나, 발현, 안정성 또는 면역원성에 관하여 이점을 가질 수 있는 변형된 화학 구조를 갖는 mRNA 분자를 생성하였다. 또한, spCas9 코딩 서열의 서열을 각 아미노산에 대하여 가장 빈번하게 사용되는 코돈을 사용함으로써 코돈 사용에 대해 최적화시켰다. 또한, 코딩 서열을 최적화시켜, 잠재(cryptic) 리보솜 결합 부위 및 업스트림 오픈 리딩 프레임을 제거하여, mRNA에서 spCas9 단백질로의 가장 효율적인 번역을 촉진시켰다.
이들 연구에 사용되는 LNP의 주요 성분은 지질 C12-200이다(문헌[Love et al (2010), PNAS vol. 107, 1864-1869]). C12-200 지질은 고도로-하전된 RNA 분자와 복합체를 형성한다. C12-200을 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE), DMPE-mPEG2000 및 콜레스테롤과 조합하였다. 예를 들어, NanoAssemblr 디바이스(Precision NanoSystems)에서 제어된 조건 하에서 핵산, 예컨대 gRNA 및 mRNA와 혼합되는 경우, LNP의 자가-어셈블리가 발생하였으며, 핵산은 LNP 내측에 캡슐화되었다. gRNA 및 Cas9 mRNA를 LNP 내에 어셈블시키기 위하여, 에탄올 및 지질 원액을 적절한 경우 유리 바이얼 내로 피펫팅하였다. C12-200 대 DOPE, DMPE-mPEG2000 및 콜레스테롤의 비를 조정하여, 제형을 최적화시켰다. 전형적인 비는 50:10:38.5:1.5의 몰비의 C12-200, DOPE, 콜레스테롤 및 mPEG2000-DMG로 구성된다. gRNA 및 mRNA를 RNase 부재 튜브에서 100 mM 시트르산나트륨 pH 3.0 및 300 mM NaCl 중에 희석하였다. NanoAssemblr 카트리지(Precision NanoSystems)를 지질 측에서 에탄올로, 그리고 RNA 측에서 물로 세척하였다. 지질의 작업 원액을 주사기 내로 뽑아내고, 주사기로부터 공기를 제거하고, 카트리지에 삽입하였다. 동일한 절차를 주사기에 gRNA 및 Cas9 mRNA의 혼합물을 로딩하기 위해 사용하였다. 그 다음, Nanoassemblr 시행을 표준 조건 하에서 수행하였다. 그 다음, LNP 현탁액을 20 Kd 컷오프 투석 카트리지를 사용하여 4 리터의 PBS 중에서 4시간 동안 투석한 다음, 원심분리 동안 PBS 중 3회의 세척을 포함하여, 20 Kd 컷오프 회전 카트리지(아미콘(Amicon))를 통한 원심분리를 사용하여 농축하였다. 마지막으로, LNP 현탁액을 0.2 μM 시린지 필터(syringe filter)를 통해 멸균 여과하였다. 상용의 내독소 키트(LAL 검정)를 사용하여 내독소 수준을 점검하고, 입자 크기 분포를 동적 광 산란에 의해 결정하였다. 캡슐화된 RNA의 농도를 리보그린(ribogreen) 검정(Thermo Fisher)을 사용하여 결정하였다. 대안적으로, gRNA 및 Cas9 mRNA를 개별적으로 LNP로 제형화한 다음, 함께 혼합한 다음, 배양 중 세포를 처리하거나, 동물 내로 주사하였다. 개별적으로 제형화된 gRNA 및 Cas9 mRNA의 사용은 특정 비의 gRNA 및 Cas9 mRNA가 시험되게 하였다.
대안적인 양이온성 지질 분자를 사용한 대안적인 LNP 제형을 또한 gRNA 및 Cas9 mRNA의 생체 내 운반을 위해 사용하였다. mALB gRNA T1 및 Cas9 mRNA를 캡슐화하는 신선하게 제조된 LNP를 1:1 질량비의 RNA로 혼합하고, A형 혈우병 마우스의 꼬리 정맥 내로 주사하였다(TV 주사). 대안적으로, LNP를 안와후방(RO) 주사에 의해 투여하였다. 마우스에 제공되는 LNP의 용량은 0.5 mg 내지 2 ㎎의 RNA/㎏(체중)의 범위였다. LNP를 주사한지 3일 후에, 마우스를 희생시키고, 좌측 및 우측 간엽의 조각 및 비장의 조각을 수집하고, 각각으로부터 게놈 DNA를 정제하였다. 그 다음, 게놈 DNA를 TIDES 분석으로 처리하여, 알부민 인트론 1 내의 표적 부위에서 절단 빈도 및 절단 프로파일을 측정하였다. 결과의 일 예는 도 4에 나타나 있으며, 평균 25%의 대립형질이 2 ㎎/㎏의 용량에서 절단되었다. 0.5 ㎎/㎏ 용량이 약 5% 절단을 초래하고, 1 ㎎/㎏이 약 10% 절단을 초래하는 용량 반응이 관찰되었다. 단독의 PBS 완충제를 주사한 마우스는 TIDES 검정에서 약 1% 내지 2%의 낮은 신호를 보였으며, 이는 TIDES 검정 그 자체의 백그라운드의 측정치이다.
실시예 3: 인간 알부민의 인트론 1에 표적화된 SGRNA의 INDEL 빈도의 평가
인간 알부민 유전자의 인트론 1 내의 스트렙토코커스 피오게네스 Cas9(spCas9)에 의한 절단을 위한 표적일 NGG PAM 서열을 사용하는 모든 가능한 gRNA 서열을 "CCTop"(예를 들어, https://crispr.cos.uni-heidelberg.de/ 참조)로 지칭되는 공개된 알고리즘에 기초한 "Guido"로 지칭되는 전매 알고리즘을 사용하여 확인하였다. 이러한 알고리즘은 인간 게놈 내의 가능한 오프-표적 부위를 식별하고, 예측된 오프-표적 절단 가능성에 기초하여 각각의 gRNA를 순위화시킨다. 식별된 gRNA 서열은 하기 표에 제공되어 있다.
Figure pct00004
5 ㎍/㎕의 Cas9 뉴클레아제 단백질(Platinum™, GeneArt™)을 Thermo Fisher Scientific(카탈로그 번호 A27865, 미국 캘리포니아주 칼스배드 소재)으로부터 구입한 다음, 0.83 ㎍/㎕ 또는 5.2 μM의 작업 농도로 1:6 희석하였다. 화학적으로 변형된 합성 단일 가이드 RNA(sgRNA)(미국 캘리포니아주 멘로 파크 소재의 Synthego Corp)를 원액으로서 TE 완충제를 사용하여 100 μM로 재현탁화시켰다. 대안적으로, 사용되는 gRNA는 시험관 내 전사(IVT)에 의해 생성될 수 있다. 이러한 용액을 뉴클레아제-비함유 물을 사용하여 20 μM의 작업 농도로 희석하였다.
리보핵단백질 복합체를 제조하기 위하여, Cas9 단백질(12.5 pmol) 및 sgRNA(60 pmol)를 실온에서 10분 내지 20분 동안 인큐베이션시켰다. 이러한 인큐베이션 동안, HepG2 세포(미국 버지니아주 머내서스 소재의 American Type Culture Collection) 또는 HuH7 세포(미국 버지니아주 머내서스 소재의 American Type Culture Collection)를 37℃에서 5분 동안 0.25%의 트립신-EDTA(Thermo Fisher scientific)를 사용하여 분리시켰다. 각각의 트랜스펙션 시약은 1 x 105개의 세포를 함유하였으며, 실험마다 적절한 수의 세포를 350xG에서 3분 동안 원심분리한 다음, 트랜스펙션 반응마다 20 ㎕의 Lonza SF 뉴클레오펙션 + 보충 용액(카탈로그 번호 V4XC-2032, 스위스 바젤 소재) 중에 재현탁화시켰다. 20 ㎕의 뉴클레오펙션 용액 중 재현탁화된 세포를 RNP의 각 튜브에 첨가하고, 전체 부피를 16-웰 뉴클레오펙션 스트립의 하나의 웰로 옮겼다. HepG2 또는 HuH7 세포를 Amaxa 4D-뉴클레오펙터 시스템(Lonza)에서 EH-100 프로그램을 사용하여 트랜스펙션시켰다. HepG2 및 HuH7은 간 내의 유전자를 절단하기 위해 사용되는 gRNA의 평가와 관련이 있는 인간 간세포주이다. 트랜스펙션 후에, 세포를 뉴클레오펙션 스트립에서 10분 동안 인큐베이션시키고, 10% 우태아혈청(카탈로그 번호 10438026, Thermo Fisher scientific)이 보충된 이글스(Eagle's) 최소 필수 배지(카탈로그 번호 10-009-CV, 미국 뉴욕주 코닝 소재의 Corning)로 이루어진 가온 배지를 함유하는 48-웰 플레이트 내로 옮겼다. 다음날, 세포에 신선한 배지를 재공급하였다.
트랜스펙션한지 48시간 후에, HepG2 또는 HuH7 세포를 분리하고, Qiagen DNeasy 키트(카탈로그 번호 69506, 독일 힐덴 소재)를 사용하여 게놈 DNA를 추출하였다. PCR을 플래티늄(Platinum) SuperFi 그린(Green) PCR 마스터 믹스(Master Mix)(Thermo Fisher scientific) 및 0.2 μM의 하기의 프라이머: 알부민 정방향: 5'-CCCTCCGTTTGTCCTAGCTT-3'(SEQ ID NO: 14); 알부민 역방향: 5'-TCTACGAGGCAGCACTGTT-3'(SEQ ID NO: 15); AAVS1 정방향: 5'-AACTGCTTCTCCTCTTGGGAAGT-3'(SEQ ID NO: 16); AAVS1 역방향: 5'-CCTCTCCATCCTCTTGCTTTCTTTG-3'(SEQ ID NO: 17)와 함께 추출된 게놈 DNA를 사용하여 수행하였다. PCR 조건은 98℃에서 2분(1회)에 이어서, 98℃에서 30초, 62.5℃에서 30초 및 72℃에서 1분(35회)이었다. 올바른 PCR 산물을 1.2% E-Gel(Thermo Fisher scientific)을 사용하여 확인하고, Qiagen PCR 정제 키트(카탈로그 번호 28106)를 사용하여 정제하였다. 정제된 PCR 산물을 상응하는 PCR 산물에 대한 정방향 또는 역방향 프라이머를 사용하여 생거 시퀀싱으로 처리하였다. gRNA/Cas9에 대한 예측된 절단 부위에서의 삽입 또는 결실의 빈도를 문헌[Brinkman, et al. (Brinkman, E.K., Chen, T., Amendola, M, and van Steensel, B. Easy quantitative assessment of genome editing by sequence trace decomposition. Nucleic Acids Research, 2014, Vol. 42, No. 22  e168 )]에 기재된 바와 같이 TIDE 분석 알고리즘을 사용하였다. 약술하면, 크로마토그램 시퀀싱 파일을 비-처리된 세포로부터 유래된 대조군 크로마토그램과 비교하여, 비정상 뉴클레오티드의 상대적 존재비를 결정하였다. 결과는 표 4에 요약되어 있다. 또한, 관련 전-임상 종, 예컨대 비-인간 영장류에서 상동성인 인간 내의 gRNA 서열을 식별하는 것이 관심 대상이다. 영장류 마카카 파시쿨라리스(Macaca fascicularis) 및 마카카 물라타(Macaca mulatta)의 알부민 인트론 1 서열을 갖는 인간 알부민 인트론 1 내에서 확인된 잠재적인 gRNA 서열의 정렬에 의해, 표 4에 나타낸 바와 같이 완벽한 일치 또는 1개 내지 2개의 뉴클레오티드 불일치를 갖는 몇몇의 gRNA 분자가 식별되었다. IVT 가이드를 사용하여 생성된 INDEL 빈도를 HuH7 세포에서 측정하였으며, 합성 가이드로 생성된 INDEL 빈도를 HepG2 세포에서 측정하였다. HuH7 세포에서 상이한 가이드에 의해 생성된 INDEL 빈도는 0.3% 내지 64% 범위였으며, 이는 알부민의 인트론 1 내를 효율적으로 절단하는 gRNA가 순전히 서열 기반의 인 실리코 알고리즘에 기초하여 선택될 수 없었음을 나타낸다. HuH7 내의 IVT gRNA 및 HepG2 세포 내의 합성 gRNA의 INDEL 빈도에 기초하여, 40% 초과의 절단 빈도를 갖는 몇몇의 gRNA를 식별하였다. 합성 가이드로서 46% 및 43% 절단을 나타내며, 인간 및 영장류에서 100% 동일한 gRNA T5 및 T12가 특히 관심 대상이다.
Figure pct00005
실시예 4: 마우스 알부민 인트론 1에서의 관심 치료적 유전자의 표적화된 통합
질병을 치료하기 위해 필요한 치료적 단백질을 발현하기 위한 접근법은 생체 내에서 간 내의 알부민 유전자좌 내로의, 상기 단백질을 인코딩하는 유전자의 cDNA 또는 코딩 서열의 표적화된 통합이다. 표적화된 통합은 공여자 DNA 주형이 이중 가닥 파단 부위에서 유기체의 게놈 내로 통합되는 과정이며, 이러한 통합은 HDR 또는 NHEJ에 의해 발생한다. 이러한 접근법은 유기체의 세포 내로의 서열 특이적 DNA 뉴클레아제 및 치료적 유전자를 인코딩하는 공여자 DNA 주형의 도입을 사용한다. 본 발명자들은 알부민 인트론 1에 표적화된 CRISPR-Cas9 뉴클레아제가 공여자 DNA 주형의 표적화된 통합을 촉진시킬 수 있었는지를 평가하였다. 공여자 DNA 주형은 AAV 마우스, 바람직하게는 마우스의 경우에 AAV8 바이러스에서 운반되며, 이는 정맥내 주사 후에 간의 간세포를 우선적으로 형질도입시킨다. 서열 특이적인 gRNA mAlb_T1 및 Cas9 mRNA는 gRNA 및 Cas9 mRNA를 캡슐화하는 LNP 제형의 정맥내 또는 RO 주사에 의해 동일한 마우스의 간의 간세포에 운반된다. 하나의 경우에, AAV8-공여자 주형을 LNP 이전에 마우스 내로 주사하는데, 그 이유는 AAV에 의한 간세포의 형질도입이 수시간 내일 수일이 걸리며, 운반된 공여자 DNA가 간세포의 핵에서 수주 내지 수개월 동안 안정적으로 유지되는 것으로 알려져 있기 때문이다. 대조적으로, LNP에 의해 운반되는 gRNA 및 mRNA는 RNA 분자의 내재한 불안정성으로 인하여 간세포에서 오직 1일 내지 4일 동안만 지속될 것이다. 또 다른 경우에, LNP를 AAV-공여자 주형 이후 1일 내지 7일에 마우스 내로 주사한다. 공여자 DNA 주형은 (i) 통합을 최대화시키고, (ii) 인코딩된 치료적 단백질의 발현을 최대화시키려는 목적으로 몇몇의 설계 특징이 혼입된다.
HDR을 통해 통합이 발생하게 하기 위하여, 상동성 아암이 치료적 유전자 카세트의 어느 하나의 측에 포함될 필요가 있다. 이들 상동성 아암은 마우스 알부민 인트론 1 내의 gRNA 절단 부위의 어느 하나의 측의 서열로 구성된다. 더 긴 상동성 아암이 일반적으로 더욱 효율적인 HDR을 촉진시키지만, 상동성 아암의 길이는 약 4.7 Kb 내지 5.0 Kb의 AAV 바이러스에 대한 패키징 한계에 의해 제한될 수 있다. 따라서, c상동성 아암의 최적의 길이의 확인은 시험을 필요로 한다. 통합은 또한 NHEJ 메커니즘을 통해 발생할 수 있으며, 이중 가닥 DNA 공여자의 자유 말단이 이중 가닥 파단부의 말단에 연결된다. 이러한 경우에 상동성 아암은 필요하지 않다. 그러나, 유전자 카세트의 어느 하나의 측에 gRNA 절단 부위를 혼입시키는 것은 선형 이중 가닥 단편을 생성함으로써 통합의 효율을 개선시킬 수 있다. gRNA 절단 부위를 역 배향으로 사용함으로써, 요망되는 정방향 배향의 통합이 유리할 수 있다. FVIII의 푸린 절단 부위 내의 돌연변이의 도입은 단백질의 발현 동안 푸린에 의해 절단될 수 없는 FVIII 단백질을 생성할 수 있으며, 이는 완전한 기능을 유지하면서, 혈장에서 개선된 안정성을 나타내는 것으로 보이는 단일 쇄 FVIII 폴리펩티드를 초래한다.
알부민 인트론 1에서 FVIII 유전자를 통합시키기 위해 설계된 예시적인 DNA 공여자는 도 5에 나타나 있다. 특이적인 공여자 설계의 서열은 순서대로 SEQ ID NO: 87 내지 92이다.
FVIII 공여자 DNA와 함께 패키징된 AAV8 또는 다른 AAV 혈청형 바이러스의 생성은 널리 확립된 바이러스 패키징 방법을 사용하여 달성된다. 이러한 하나의 방법에서, HEK293 세포를 3가지 플라스미드로 트랜스펙션시키는데, 하나는 AAV 패키징 단백질을 인코딩하며, 제2의 것은 아데노바이러스 헬퍼 단백질을 인코딩하며, 제3의 것은 AAV ITR 서열에 의해 플랭킹된 FVIII 공여자 DNA 서열을 함유한다. 트랜스펙션된 세포는 제1 플라스미드 상에 인코딩된 AAV 캡시드 단백질의 조성물에 의해 특정된 혈청형의 AAV 입자를 야기한다. 이들 AAV 입자를 세포 상청액 또는 상청액 및 용해된 세포로부터 수집하고, CsCl 기울기 또는 이오딕사놀(Iodixanol) 기울기에 걸쳐 또는 원하는 대로 다른 방법에 의해 정제한다. 정제된 바이러스 입자는 정량적 PCR(Q-PCR)에 의해 공여자 DNA의 게놈 카피의 수를 측정함으로써 정량화된다.
gRNA 및 Cas9 mRNA의 생체 내 운반은 다양한 방법에 의해 달성된다. 제1 경우에, gRNA 및 Cas9 단백질은 AAV 바이러스 벡터로부터 발현된다. 이러한 경우에, gRNA의 전사는 U6 프로모터로부터 주도되며, Cas9 mRNA 전사는 EF1-알파 또는 바람직하게는 간 특이적인 프로모터와 같은 편재성 프로모터 및 인핸서, 예컨대 트랜스티레틴 프로모터/인핸서로부터 주도된다. spCas9 유전자의 크기(4.4 Kb)는 단일의 AAV 내의 spCas9 및 gRNA 카세트의 포함을 불가능하게 하며, 그에 의해, gRNA 및 spCas9를 운반하기 위하여 개별 AAV가 필요하다. 제2의 경우에, 바이러스 게놈의 자가-불활성화를 촉진시키는 서열 요소를 갖는 AAV 벡터가 사용된다. 이러한 경우에, 벡터 DNA 내에 gRNA에 대한 절단 부위를 포함시키면 생체 내에서 벡터 DNA의 절단이 초래된다. 절단되는 경우 Cas9의 발현을 차단하는 위치에 절단 부위를 포함시킴으로써 Cas9 발현은 더 짧은 기간으로 제한된다. 제3의 경우에, 생체 내에서 gRNA 및 Cas9를 세포로 운반하기 위한 대안적인 접근법인 비-바이러스 운반 방법이 이용된다. 일 예에서, 지질 나노입자(LNP)가 비-바이러스 운반 방법으로서 사용된다. LNP에 사용하기 위하여 몇몇의 상이한 이온화 가능한 양이온성 지질이 이용 가능하다. 이들은 다른 것들 중 특히 C12-200(문헌[Love et al (2010), PNAS vol. 107, 1864-1869]), MC3, LN16, MD1을 포함한다. 하나의 유형의 LNP에서, GalNac 모이어티는 LNP의 외측에 부착되며, 아시알로당단백질 수용체를 통한 간 내로의 흡수를 위한 리간드로서 작용한다. 이들 양이온성 지질 중 임의의 것을 사용하여 간으로의 gRNA 및 Cas9 mRNA의 운반을 위한 LNP를 제형화한다.
FVIII의 표적화된 통합 및 발현을 평가하기 위하여, A형 혈우병 마우스에 먼저 FVIII 공여자 DNA 주형을 캡슐화하는 AAV 바이러스, 바람직하게는 AAV8 바이러스를 정맥내 주사한다. AAV의 용량은 마우스당 1010 내지 1012 벡터 게놈(VG)의 범위이며, 이는 4x1011 내지 4 x1013 VG/㎏과 등가이다. AAV-공여자를 주사한지 1시간 내지 7일 후에, 동일한 마우스에 gRNA 및 Cas9 mRNA를 캡슐화하는 LNP의 정맥내 주사를 제공한다. Cas9 mRNA 및 gRNA를 개별 LNP 내로 캡슐화한 다음, 주사 이전에 1:1의 RNA 질량비로 혼합한다. 주어진 LNP의 용량은 체중 ㎏당 0.25 mg 내지 2 ㎎의 RNA의 범위이다. LNP를 꼬리 정맥 주사에 의해 또는 안와후방 주사에 의해 투여한다. 표적화된 통합 및 FVIII 단백질 발현의 효율에 대한, AAV 주사에 비한 LNP 주사 시간의 영향은 AAV 투여 후 1시간, 24시간, 48시간, 72시간, 96시간, 120시간, 144시간 및 168시간의 시간을 시험함으로써 평가한다.
또 다른 예에서, 공여자 DNA 주형은 생체 내에서 LNP인 비-바이러스 운반 시스템을 사용하여 운반된다. DNA 분자는 상기 기재된 것들과 유사한 LNP 입자 내로 캡슐화되고, 정맥내 주사 후에 간 내의 간세포로 운반된다. 엔도솜에서 세포질로의 DNA의 회피가 상대적으로 효율적으로 발생하지만, 하전된 거대 DNA 분자의 핵 내로의 전좌는 효율적이지 않다. 하나의 경우에, 핵으로의 DNA의 운반을 개선하기 위한 방법은 공여자 DNA 주형 내로의 AAV ITR의 혼입에 의해 AAV 게놈을 모방하는 것이다. 이러한 경우에, ITR 서열은 DNA를 안정화시키거나 다르게는 핵 전좌를 개선시킨다. 공여자 DNA 주형 서열로부터의 CG 디뉴클레오티드(CpG 서열)의 제거는 또한 핵 운반을 개선시킨다. CG 디뉴클레오티드를 함유하는 DNA는 고유 면역계에 의해 인식되고 제거된다. 인공 DNA 서열에 존재하는 CpG 서열의 제거에 의해, 비-바이러스 및 바이러스 벡터에 의해 운반되는 DNA의 지속성이 개선된다. 코돈 최적화 과정은 전형적으로 CG 디뉴클레오티드의 함량을 증가시키는데, 그 이유는 많은 경우에 가장 빈번한 코돈이 3번째 위치에 C 잔기를 가지며, 이는 다음 코돈이 G로 시작하는 경우에 CG를 생성하는 기회를 증가시키기 때문이다. 공여자 DNA 주형의 LNP 운반에 이어서 1시간 내지 5일 후의 gRNA 및 Cas9 mRNA를 함유하는 LNP의 조합을 A형 혈우병 마우스에서 평가한다.
gRNA/Cas9 및 공여자 DNA 주형의 생체 내 운반의 효율성을 평가하기 위하여, 주사된 혈우병 마우스를 제2 성분을 투여한지 약 7일 후에 시작하는 상이한 시간에 혈중 FVIII 수준에 대하여 평가한다. 혈액 시료를 RO 출혈에 의해 수집하고, 혈장을 분리하고, 발색 검정(Diapharma)을 사용하여 FVIII 활성에 대하여 검정한다. FVIII 단백질 표준물질을 사용하여 검정을 캘리브레이션하고, ㎖당 혈중 FVIII 활성의 유닛을 계산한다.
또한, FVIII mRNA의 발현을 연구의 마지막에 마우스의 간에서 측정한다. 마우스의 간으로부터 추출된 전체 RNA를 Q-PCR을 사용하여 알부민 mRNA 및 FVIII mRNA의 수준에 대하여 검정한다. 미처리 마우스와 비교하는 경우 FVIII mRNA 대 알부민 mRNA의 비는 하이브리드 알부민-FVIII mRNA를 생성하기 위하여 공동-선택된 알부민 전사물의 %를 나타낸다.
처리된 마우스의 간 유래의 게놈 DNA를 특히 알부민 인트론 1 내의 gRNA의 표적 부위에서 표적화된 통합 사건에 대하여 평가한다. PCR 프라이머 쌍을 설계하여, 예측되는 표적화된 통합의 어느 하나의 말단에서 연접부 단편을 증폭시킨다. 이들 프라이머를 설계하여, 정방향 및 역방향 배향 둘 모두에서 통합을 검출한다. PCR 산물의 시퀀싱에 의해, 예상되는 통합 사건이 발생하는지를 확인한다. 표적화된 통합을 겪는 알부민 대립형질의 백분율을 정량화하기 위하여, 예상되는 연접부 단편에 상응하는 표준물질을 합성한다. 미처리 마우스 유래의 게놈 DNA 내로 상이한 농도로 스파이킹시킨 다음, 동일한 PCR 반응으로 처리하는 경우, 표준 곡선을 생성하고, 이를 사용하여 처리된 마우스 유래의 시료 내의 통합 사건과 함께 대립형질의 카피수를 계산한다.
실시예 5: 영장류 알부민 인트론 1 내로의 표적화된 통합
마우스에 대하여 실시예 4에 기재된 동일한 방법을 영장류의 알부민 인트론 1을 표적화하는 gRNA를 사용하여 영장류 종에 적용한다. AAV8 또는 LNP 중 어느 하나를 사용하여 정맥내 주사에 의해 공여자 DNA 주형을 먼저 운반한다. 사용되는 용량은 마우스에서 성공적인 것으로 관찰되는 것들에 기초한다. 이후에, 동일한 영장류에 gRNA 및 Cas9 mRNA를 캡슐화하는 LNP의 정맥내 주사를 제공한다. 마우스에서 유효한 것으로 관찰된 동일한 LNP 제형 및 용량을 사용한다. 영장류의 혈우병 모델이 존재하지 않기 때문에, 인간 FVIII 특이적 ELISA 검정을 사용하여 FVIII 단백질을 측정할 필요가 있다. 실시예 4에 기재된 표적화된 통합 및 FVIII mRNA 수준의 동일한 분자적 분석을 영장류에서 수행한다. 영장류는 임상적 평가로의 번역을 가능하게 하는 우수한 전-임상 모델이다.
실시예 6: GRNA/CAS9에 의한 온 및 오프-표적 절단 및 인간 영장류 간세포 내의 표적화된 통합의 평가
일차 인간 간세포는 환자의 간으로 운반될 gRNA/Cas9의 효력 및 오프-표적 절단의 평가를 위한 가장 적절한 세포 유형이다. 이들 세포를 제한된 기간 동안 부착성 단층으로서 배양물에서 성장시킨다. 부착성 세포를 mRNA로 트랜스펙션시키기 위한 방법, 예를 들어, Message Max(Thermo Fisher)가 확립된 바 있다. Cas9 mRNA 및 gRNA의 혼합물로의 트랜스펙션 후에, 온-표적 절단 효능을 TIDES 분석을 사용하여 측정한다. 게놈 DNA의 동일한 시료를 오프-표적 분석으로 처리하여, gRNA/Cas9 복합체에 의해 절단되는 게놈 내의 추가의 부위를 식별한다. 이러한 하나의 방법은 "GuideSeq"(문헌[Tsai et al Nat Biotechnol. 2015 Feb;33(2):187-197])이다. 다른 방법은 딥 시퀀싱, 전체 게놈 시퀀싱, ChIP-seq(문헌[Nature Biotechnology 32,677-683 2014]), BLESS(문헌[2013 Crosetto et al. doi:10.1038/nmeth.2408]), 문헌[2015 Frock et al. doi:10.1038/nbt.3101]에 기재된 바와 같은 고효율, 게놈-와이드 전좌 시퀀싱(HTGTS), Digenome-seq(문헌[2015 Kim et al. doi:10.1038/nmeth.3284]) 및 IDLV(문헌[2014 Wang et al. doi:10.1038/nbt.3127])를 포함한다.
일차 인간 간세포를 또한 공여자 DNA 주형을 함유하는 AAV 바이러스에 의해 형질도입한다. 특히, AAV6 또는 AAVDJ 혈청형이 배양 중 세포를 형질도입하는 데 특히 효율적이다. AAV-DNA 공여자에 의한 형질도입 후 1시간 내지 48시간에, 세포를 이어서 gRNA 및 Cas9 mRNA로 트랜스펙션시켜, 표적화된 통합을 유도한다. 표적화된 통합 사건을 실시예 4에 기재된 동일한 PCR 기반의 접근법을 사용하여 측정한다.
실시예 7: 배양 중 일차 인간 간세포 내의 인간 알부민 인트론 1에서 효율적으로 절단하는 가이드 RNA의 확인 및 선택
일차 인간 간세포에서 절단 효율의 평가를 위하여, 비-영장류에 대하여 완벽한 상동성을 갖는 것, 및 HuH7 및 HepG2 세포에서의 절단 효율에 대한 스크리닝에 기초하여(표 4), 4가지 gRNA(T4, T5, T11, T13)를 선택하였다. (BioIVT로부터 수득되는) 일차 인간 간세포를 해동시키고, 동결보호된 간세포 회복 배지(CHRM)(Gibco)로 옮기고, 저속으로 펠렛화시킨 다음, 콜라겐 IV(코닝(Corning))가 사전-코팅된 24-웰 플레이트에서, InVitroGRO™ CP 배지(BioIVT) + Torpedo™ 항생제 믹스(BioIVT) 중에 0.7x106개 세포/㎖의 밀도로 플레이팅하였다. 플레이트를 37℃에서 5% CO2에 인큐베이션시켰다. 세포가 부착된 후에(플레이팅 3시간 내지 4시간 후에), 플레이트에 부착되지 않은 사멸 세포를 신선한 가온 완전한 배지를 첨가하여 세척한 다음, 세포를 37℃에서 5% CO2에 인큐베이션시켰다. 세포를 트랜스펙션시키기 위하여, Cas9 mRNA(Trilink) 및 가이드 RNA(미국 캘리포니아주 멘로 파크 소재의 Synthego Corp)를 얼음 위에서 해동시킨 다음, 웰당 0.6 ㎍의 mRNA 및 0.2 ㎍의 가이드로, 30 ㎕의 OptiMem 배지(Gibco)에 첨가하였다. 총 핵산 중량에 대하여 2:1 부피로 OptiMem 30 ㎕ 중에 희석된 MessengerMax(ThermoFisher)를 실온에서 20분 동안 Cas9 mRNA/gRNA OptiMem 용액과 인큐베이션시켰다. 이러한 혼합물을 24-웰 플레이트에서 배양된 간세포 웰당 500 ㎕의 간세포 플레이팅 배지에 적가하고, 세포를 37℃에서 5% CO2에 인큐베이션시켰다. 다음날 아침에 세포를 세척하고, 다시 피딩(re-fed)하고, 트랜스펙션 48시간 후에, 200 ㎕의 가온 0.25% 트립신-EDTA(Gibco)를 각 웰에 첨가하고 37℃에서 5분 내지 10분 인큐베이션시킴으로써 세포를 게놈 DNA 추출을 위하여 수집하였다. 일단 세포가 제거되면, 200 ㎕의 FBS(Gibco)를 첨가하여, 트립신을 불활성화시켰다. 1 ㎖의 PBS(Gibco)에 첨가한 후에, 세포를 1200 rpm에서 3분 동안 펠렛화시킨 다음, 50 ㎕의 PBS 중에 재현탁화시켰다. 게놈 DNA를 키트 내의 설명서에 따라 MagMAX DNA Multi-Sample Ultra 2.0 키트(Applied Biosytems)를 사용하여 추출하였다. 게놈 DNA 품질 및 농도를 분광광도계를 사용하여 분석하였다. TIDE 분석을 위하여, 게놈 DNA를 35 사이클의 PCR 및 55℃의 어닐링 시간을 사용하여 플래티늄(Platinum) PCR 슈퍼믹스 하이 피델리티(SuperMix High Fidelity)(Invitrogen) 및 예측된 온-표적 절단 부위에 플랭킹된 프라이머(AlbF: CCCTCCGTTTGTCCTAGCTTTTC, SEQ ID NO: 178 및 AlbR: CCAGATACAGAATATCTTCCTCAACGCAGA, SEQ ID NO: 179)를 사용해 PCR 증폭시켰다. PCR 산물을 먼저 아가로스 겔 전기영동에 의해 분석하여, 올바른 크기의 산물(1053bp)이 생성된 것을 확인한 다음, 정제하고, 프라이머(정방향: CCTTTGGCACAATGAAGTGG, SEQ ID NO: 180, 역방향: GAATCTGAACCCTGATGACAAG, SEQ ID NO: 181)를 사용하여 시퀀싱하였다. 그 다음, 서열 데이터를 Tsunami로 지칭되는 변형된 버전의 TIDES 알고리즘(문헌[Brinkman et al (2104); Nucleic Acids Research, 2014, 1])을 사용하여 분석하였다. 이에 의해, gRNA/Cas9 복합체에 대한 예측된 절단 부위에 존재하는 삽입 및 결실(INDELS)의 빈도가 결정된다.
T4, T5, T11 및 T13 가이드(독일 쿨름바흐 소재의 AxoLabs 또는 미국 캘리포니아주 멘로 파크 소재의 Synthego Corp에서 화학적으로 합성됨)의 표준 20개 뉴클레오티드 표적 서열 또는 (5' 말단에서 1 bp 더 짧은) 19개 뉴클레오티드 표적 서열 중 어느 하나를 함유하는 가이드 RNA를 시험하였다. 19개 뉴클레오티드 gRNA는 더욱 서열 특이적일 수 있지만, 더 짧은 가이드는 더 낮은 효력을 가질 수 있다. 인간 보체 인자 및 인간 AAVS1 유전자좌를 표적화하는 대조군 가이드를 공여자 간의 비교를 위하여 포함시켰다. 알부민 인트론 1 내의 표적 부위에서의 INDEL 빈도를 TIDES 방법을 사용하여 트랜스펙션한지 48시간 후에 측정하였다. 도 6에는 4명의 상이한 인간 공여자 유래의 일차 간세포의 트랜스펙션으로부터의 결과가 요약되어 있다. 결과에 의해, 상이한 가이드에 대하여 20% 내지 80% 범위인 절단 효율이 입증된다. 20개 뉴클레오티드 버전의 각각의 알부민 gRNA는 19개 뉴클레오티드 변이체보다 지속적으로 더욱 강력하였다. 20개 뉴클레오티드 gRNA의 뛰어난 효력은 19개 뉴클레오티드 gRNA가 오프-표적 절단에 관하여 가질 수 있는 임의의 가능한 이익을 상쇄시킬 수 있다. 가이드 RNA T4는 4명의 세포 공여자 간에 가장 지속적인 절단을 나타내었으며, INDEL 빈도는 약 60%였다. gRNA T4, T5, T11 및 T13을 오프-표적 분석을 위해 선택하였다.
실시예 8: 인간 알부민 가이드 RNA에 대한 오프-표적 부위의 확인
CRISPR/Cas9에 대한 오프-표적 부위의 확인을 위한 2가지 접근법은 애초의(ab initio) 예측 및 실험적 검출이다. Cas9 절단이 가이드 RNA 서열과 게놈 간의 불일치를 용인하기 때문에, 가이드 RNA에 의한 Cas9 절단 부위의 특정은 불완전한 과정이다. 상이한 가이드의 안전성 위험을 이해하고, 가장 바람직한 오프-표적 프로파일을 갖는 가이드를 선택하기 위하여 Cas9 절단 부위의 스펙트럼을 아는 것은 중요하다. 예측 방법은 Guido, 오프-표적 예측을 위하여 CCTop 알고리즘으로부터 조정된 소프트웨어 툴에 기초한다(문헌[Stemmer et al., 2015]). Guido는 Bowtie 1 알고리즘을 사용하여, 가이드 RNA와 인간 게놈의 전체 GRCh38/hg38 구축물 간의 상동성을 검색함으로써 가능한 오프-표적 절단 부위를 확인한다(문헌[Langmead et al., 2009]). Guido는 PAM-근위 상동성 및 올바르게 위치된 NGG PAM에 우선 순위를 두고, 가이드 RNA에 대하여 최대 5개의 불일치를 갖는 서열을 검출한다. 부위를 그들의 불일치의 수와 위치에 의해 순위결정하였다. 각각의 시행을 위하여, 가이드 서열 및 게놈 PAM을 연관시키고, 디폴트 파라미터를 사용하여 시행하였다. 3개 이하의 불일치를 갖는 상위 힛트는 알부민 가이드 T4, T5, T11 및 T13에 대하여 하기 표 5 내지 표 8에 나타나 있다. 각 표의 첫줄은 인간 게놈 내의 온-표적 부위를 보여주며, 그 아래의 선은 예측된 오프-표적 부위를 보여준다.
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
또한, 인간 간 세포 내의 인간 알부민 gRNA T4, T5, T11, T13에 대한 오프-표적 부위를 GUIDE-seq로 지칭되는 방법을 사용하여 확인하였다. GUIDE-seq(문헌[Tsai et al. 2015])는 오프-표적 절단 부위를 찾기 위한 실험적 방법이다. GUIDE-seq는 염색체 DNA 내의 이중-가닥 파단 부위에서의 올리고뉴클레오티드의 자발적인 포획에 의존한다. 약술하면, gRNA/Cas9 복합체 및 이중 가닥 올리고뉴클레오티드로의 적절한 세포의 트랜스펙션 후에, 게놈 DNA를 세포로부터 정제하고, 초음파분해하고, 일련의 어댑터 라이게이션을 수행하여 라이브러리를 생성한다. 올리고뉴클레오티드-함유 라이브러리를 고-처리율 DNA 시퀀싱으로 처리하고, 출력물을 디폴트 GUIDE-seq 소프트웨어로 처리하여 올리고뉴클레오티드 포획의 부위를 확인하였다.
상세하게, 89℃로 가열한 다음 실온으로 천천히 냉각시킴으로써 2개의 상보적인 단일 가닥 올리고뉴클레오티드를 어닐링시켜 이중 가닥 GUIDEseq 올리고를 생성하였다. 240 pmol의 가이드 RNA(미국 캘리포니아주 멘로 파크 소재의 Synthego Corp) 및 48 pmol의 20 마이크로몰 Cas9 TruCut(써모피셔 scientific)를 4.8 ㎕의 최종 부피 중에서 혼합함으로써 리보핵 단백질 복합체(RNP)를 제조하였다. 개별 튜브 내에서 4 ㎕의 10 마이크로몰 GUIDeseq 이중 가닥 올리고뉴클레오티드를 1.2 ㎕의 RNP 믹스와 혼합한 다음, 뉴클레오펙션 카세트(Lonza)에 첨가하였다. 이에 16.4 ㎕의 뉴클레오펙터 SF 용액(Lonza) 및 3.6 ㎕의 보충제(Lonza)를 첨가하였다. 부착 배양물로서 성장한 HepG2 세포를 트립신으로 처리하여, 그들을 플레이트로부터 방출시킨 다음, 트립신의 불활성화 후에, 펠렛화시키고, 뉴클레오펙터 용액 중에 12.5 e6개 세포/㎖로 재현탁화시키고, 20 ㎕(2.5 e5개 세포)를 각 뉴클레오펙션 큐벳에 첨가하였다. 뉴클레오펙션을 4-D 뉴클레오펙터 유닛(4-D Nucleofector Unit)(Lonza)에서 EH-100 세포 프로그램을 사용하여 수행하였다. 실온에서 10분 동안 인큐베이션시킨 후에, 80 ㎕의 완전한 HepG2 배지를 첨가하고, 세포 현탁액을 24 웰 플레이트의 웰에 배치하고, 48시간 동안 37℃에서 5% CO2에 인큐베이션시켰다. 세포를 트립신으로 방출시키고, 원심분리(300 g 10분)에 의해 펠렛화시킨 다음, DNAeasy 혈액 및 조직 키트(Blood and Tissue Kit)(Qiagen)를 사용하여 게놈 DNA를 추출하였다. 인간 알부민 인트론 1 영역을 35 사이클의 PC 및 55℃의 어닐링 시간을 사용하여 플래티늄 PCR 슈퍼믹스 하이 피델리티(Invitrogen) 및 프라이머 AlbF(CCCTCCGTTTGTCCTAGCTTTTC, SEQ ID NO: 178) 및 AlbR(CCAGATACAGAATATCTTCCTCAACGCAGA, SEQ ID NO: 179)를 사용해 PCR 증폭시켰다. PCR 산물을 먼저 아가로스 겔 전기영동에 의해 분석하여, 올바른 크기의 산물(1053bp)이 생성된 것을 확인한 다음, 프라이머(정방향: CCTTTGGCACAATGAAGTGG, SEQ ID NO: 180, 역방향: GAATCTGAACCCTGATGACAAG, SEQ ID NO: 181)를 사용하여 바로 시퀀싱하였다. 그 다음, 서열 데이터를 Tsunami로 지칭되는 변형된 버전의 TIDES 알고리즘(문헌[Brinkman et al (2104); Nucleic Acids Research, 2014, 1])을 사용하여 분석하였다. 이에 의해, gRNA/Cas9 복합체에 대한 예측된 절단 부위에 존재하는 삽입 및 결실(INDELS)의 빈도가 결정된다. 문헌[Tsai et al.]에 의해 기재된 프로토콜에 비하여, 본 발명자들은 40 pmol(약 1.67 μM) 포획 올리고뉴클레오티드를 사용하여 GUIDE-seq를 수행하여, 오프-표적 절단 부위 확인의 민감도를 증가시켰다. 대략 0.01%의 민감도를 달성하기 위하여, 본 발명자들은 최소 50%의 온-표적 절단과 함께 트랜스펙션당 최소 10,000개의 독특한 온-표적 서열 판독물을 정의하였다. RNP의 트랜스펙션이 없는 시료를 병행하여 처리하였다. RNP-함유 및 RNP-나이브 시료 둘 모둘에서 관찰되는 부위(+/-1 kb)를 추가의 분석에서 배제한다.
GUIDE-seq를 인간 간세포주 HepG2에서 수행하였다. HepG2에서, 온-표적 부위에서의 GUIDE-seq 올리고뉴클레오티드의 포획은 NHEJ 빈도가 70% 내지 200% 범위였으며, 이는 효율적인 올리고 포획을 입증한다.
8-mer 분자 인덱스를 함유하는 샘플 바코드 어댑터(A01 내지 A16)의 각각에 공통의 어댑터(Common dapter)를 어닐링시킴으로써 Y-어댑터를 제조하였다. RNP 및 GUIDEDseq 올리고로 뉴클레오펙션시킨 HepG2 세포로부터 추출된 게놈 DNA를 120 ㎕ 부피의 TE 완충제 중 400 ng으로 정규화된 모든 시료 및 Qubit을 사용하여 정량화하였다. 게놈 DNA를 코바리스(Covaris) S220 초음파분해기를 위한 표준 작동 절차에 따라 200 bp의 평균 길이로 전단하였다. 평균 단편 길이를 확인하기 위하여, 1 ㎕의 시료를 제조업체 프로토콜에 따라 테이프스테이션(TapeStation)에서 분석하였다. 전단된 DNA의 시료를 제조업체 프로토콜에 따라 AMPure XP SPRI 비드를 사용하여 정화하고, 17 ㎕의 TE 완충제 중에 용리하였다. 튜브당 22.5 ㎕의 총 부피를 위하여, 1.2 ㎕의 dNTP 믹스(5 mM 각각의 dNTP), 3 ㎕의 10 x T4 DNA 리가제 완충제, 2.4 ㎕의 말단-수선 믹스, 2.4 ㎕의 10x 플래티늄 Taq 완충제(Mg2+ 부재) 및 0.6 ㎕의 Taq 중합효소(비-핫스타트(hotstart)) 및 14 ㎕의 전단된 DNA 시료(이전의 단계 유래)를 혼합함으로써 말단 수선 반응을 게놈 DNA에서 수행하였으며, 써모사이클러(thermocycler)(12℃ 15분; 37℃ 15분; 72℃ 15분; 4℃ 유지)에서 인큐베이션시켰다. 이에 1 ㎕의 어닐링된 Y 어댑터(10 uM), 2 ㎕의 T4 DNA 리가제를 첨가하고, 혼합물을 써모사이클러(16℃, 30분; 22℃, 30분; 4℃ 유지)에서 인큐베이션시켰다. 시료를 제조업체 프로토콜에 따라 AMPure XP SPRI 비드를 사용하여 정화하고, 23 ㎕의 TE 완충제 중에 용리하였다. 1 ㎕의 시료를 제조업체의 프로토콜에 따라 테이프스테이션에서 전개시켜, 단편으로의 어댑터의 라이게이션을 확인하였다. GUIDEseq 라이브러리를 제조하기 위하여, 14 ㎕의 뉴클레아제-부재 H2O, 3.6 ㎕의 10 x 플래티늄 Taq 완충제, 0.7 ㎕의 dNTP 믹스(각각 10 mM), 1.4 ㎕의 MgCl2, 50 mM, 0.36 ㎕의 플래티늄 Taq 중합효소, 1.2 ㎕의 센스 또는 안티센스 유전자 특이적 프라이머(10 uM), 1.8 ㎕의 TMAC(0.5 M), 0.6 ㎕의 P5_1(10 uM) 및 10 ㎕의 이전의 단계로부터의 시료를 함유하는 반응물을 제조하였다. 이러한 믹스를 써모사이클러(95℃ 5분에 이어서, 95℃ 30초, 2분 동안 70℃(사이클마다 마이너스 1℃), 72℃ 30초의 15 사이클에 이어서, 95℃ 30초, 55℃ 1분, 72℃ 30초에 이어서, 72℃ 5분의 10 사이클)에서 인큐베이션시켰다. PCR 반응물을 제조업체 프로토콜에 따라 AMPure XP SPRI 비드를 사용하여 정화하고, 15 ㎕의 TE 완충제 중에 용리하였다. 1 ㎕의 시료를 제조업체의 프로토콜에 따라 테이프스테이션에서 점검하여, 시료 진행을 추적하였다. 6.5 ㎕의 뉴클레아제-부재 H2O, 3.6 ㎕의 10x 플래티늄 Taq 완충제(Mg2+ 부재), 0.7 ㎕의 dNTP 믹스(각각 10 mM), 1.4 ㎕의 MgCl2(50 mM), 0.4 ㎕의 플래티늄 Taq 중합효소, 1.2 ㎕의 유전자 특이적 프라이머(GSP) 2(센스; + 또는 안티센스; -), 1.8 ㎕의 TMAC(0.5 M), 0.6 ㎕의 P5_2(10 uM) 및 15 ㎕의 이전의 단계로부터의 PCR 산물을 혼합함으로써 제2 PCR을 수행하였다. GSP1+를 제1 PCR에서 사용하면, GSP2+를 PCR2에서 사용하였다. GSP1- 프라이머를 제1 PCR 반응에서 사용하면, GSP2- 프라이머를 제2 PCR 반응에서 사용하였다. 1.5 ㎕의 P7(10 uM)을 첨가한 후에, 반응물을 하기의 프로그램을 사용하여 써모사이클러에서 인큐베이션시켰다: 95℃ 5분에 이어서, 95℃ 30초, 2분 동안 70℃(사이클마다 마이너스 1℃), 72℃ 30초의 15 사이클에 이어서, 95℃ 30초, 55℃ 1분, 72℃ 30초에 이어서, 72℃ 5분의 10 사이클. PCR 반응물을 제조업체 프로토콜에 따라 AMPure XP SPRI 비드를 사용하여 정화하고, 30 ㎕의 TE 완충제 중에 용리하고, 1 ㎕를 제조업체의 프로토콜에 따라 테이프스테이션에서 분석하여, 증폭을 확인하였다. PCR 산물의 라이브러리를 제조업체 공급된 프로토콜에 따라 일루미나(Illumina) 라이브러리 정량화를 위한 카파 바이오시스템즈(Kapa Biosystems) 키트를 사용하여 정량화하고, 일루미나 시스템에서 차세대 시퀀싱으로 처리하여, 올리고뉴클레오티드가 통합되는 부위를 결정하였다.
GUIDE-seq의 결과는 표 9 내지 표 12에 열거되어 있다. GUIDE-seq에 의해 확인되는 예측된 표적 서열을 고려하는 것이 중요하다. 예측되는 표적 서열에 PAM이 결여되거나, gRNA에 대하여 유의미한 상동성이 결여되면, 예를 들어, 5개 초과의 불일치(mm)를 가지면, 이들 게놈 부위는 실제 오프-표적 부위인 것으로 고려되지 않고, 검정으로부터의 백그라운드 신호이다. GUIDE-seq 접근법은 HepG2 세포에서 높은 빈도의 올리고 포획을 초래하였으며, 이는 이러한 방법이 이러한 세포 유형에서 적절한 것을 나타낸다. 온-표적 판독물 계수는 4개의 가이드 중 3개에 있어서, 최소 10,000개의 온 표적 판독물의 사전-설정된 기준을 만족하였다. 4개의 선도 gRNA 후보물질에 대하여 소수의 오프-표적 부위를 확인하였다. 실제 오프-표적 부위(PAM을 함유하고, gRNA에 대하여 유의미한 상동성을 갖는 것을 의미함)의 수는 4개의 gRNA에 대하여 0 내지 6의 범위였다. T4 가이드는 실제로 나타나는 2개의 오프-표적 부위를 나타내었다. 시퀀싱 판독물 계수에 의해 판단시 GUIDE-seq에서의 이들 사건의 빈도는 2% 및 0.6%의 온-표적 절단 빈도였다. gRNA에 대한 상동성을 가지며 PAM을 함유하는 T13 및 T5 가이드는 둘 모두 GUIDE-seq에 의해 오프-표적 부위를 나타내지 않았으며, 이에 따라 시험된 4개의 가이드 중 가장 바람직한 오프-표적 프로파일을 갖는 것으로 나타났다. gRNA T11은 온-표적 판독물 계수의 23%인 상대적으로 높은 판독물 계수와 함께, 하나의 오프-표적 부위를 나타내었으며, 이는 이러한 가이드가 치료적 이용을 위하여 덜 매력적인 것을 뒷받침한다.
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
치료적 약물 후보물질을 종종 비-인간 영장류에서 평가하여, 인간 사용을 위한 그들의 효력 및 안전성을 예측한다. CRISPR-Cas9 시스템을 사용하는 유전자 편집의 경우에, 가이드 RNA의 서열 특이성은 잠재적으로 인간에서 사용될 가이드를 시험하기 위하여 동일한 표적 서열이 인간 및 비-인간 영장류 둘 모두에 존재해야 함을 나타낸다. 인간 알부민 인트론 1을 표적화하는 가이드를 인 실리코 스크리닝하여, 사이노몰구스 마카크 내의 상응하는 게놈 서열과 일치하는 것들을 확인하였다(표 4 참조). 그러나, 비-인간 영장류의 게놈을 절단하기 위한 이들 가이드의 능력 및 그들이 예측된 비-표적 부위에서 절단하는 상대적 효율을 관련 세포 시스템에서 결정할 필요가 있다. 시노몰구스 원숭이(미국 뉴욕주 웨스트버리 소재의 BioIVT로부터 수득)로부터의 일차 간세포를 일차 인간 간세포에 대하여 상기 기재된 동일한 실험 프로토콜을 사용하여 알부민 가이드 RNA T4, T5, T11 또는 T13 및 spCas9 mRNA로 트랜스펙션시켰다. 그 다음, INDELS의 빈도를 상기 기재된 동일한 TIDES 프로토콜을 사용하지만, 시노몰구스 원숭이 인트론 1에 특이적인 PCR 프라이머를 사용하여 결정하였다. 결과는 도 7에 요약되어 있다. 인간 일차 간세포 내의 가이드 RNA T4에 대한 상응하는 데이터는 비교를 위하여 동일한 도면에 나타나 있다. 모든 4개의 가이드는 2마리의 상이한 동물 공여자 유래의 시노몰구스 간세포에서 알부민 인트론 1 내의 예상되는 부위에서 10% 내지 25% 범위의 빈도로 절단을 촉진시켰다. 절단 효율의 순위 순서는 T5>T4>T11=T13이었다. T5 가이드 RNA가 4개의 가이드 중 가장 강력하였으며, 2명의 공여자에서 표적 대립형질의 20% 및 25%를 절단하였다. 절단 효율은 인간 세포에서 상응하는 가이드보다 더 낮았으며, 이는 트랜스펙션 효율의 차이로 인한 것일 수 있다. 대안적으로, 이들 가이드 및/또는 spCas9 효소는 선천적으로 영장류 세포에서 덜 강력할 수 있다. 그럼에도 불구하고, T5가 GUIDEseq에 의한 그의 바람직한 오프-표적 프로파일과 함께 4개의 가이드 중 가장 강력하였다는 관찰에 의해, T5가 NHP 및 인간에서 시험하기에 매력적이게 된다.
실시예 9: CRISPR/Cas9에 의해 매개되는 마우스 알부민 인트론 1 내로의 SEAP 리포터 유전자 공여자의 표적화된 통합은 SEAP의 발현 및 혈액 내로의 분비를 초래한다
Cas9/gRNA 복합체에 의해 생성되는 이중 가닥 파단부에서 관심 유전자를 인코딩하는 공여자 주형 서열의 통합을 매개하기 위하여 CRISPR/Cas9에 의한 서열 특이적 절단을 사용하는 가능성을 평가하기 위하여, 본 발명자들은 리포터 유전자 쥣과 분비된 알칼리성 포스파타제(mSEAP)를 인코딩하는 공여자 주형을 설계하고 구축하였다. mSEAP 유전자는 마우스에서 비-면역원성이어서, 인코딩된 mSEAP 단백질의 발현이 단백질에 대한 면역 반응의 간섭 없이 모니터링되게 한다. 또한, mSEAP는 적절한 신호 펩티드가 코딩 서열의 5' 말단에 포함되는 경우 혈액 내로 용이하게 분비되며, 단백질은 단백질의 활성을 측정하는 검정을 사용하여 용이하게 검출 가능하다. 아데노 연관 바이러스(AAV) 내로의 패키징을 위한 mSEAP 구축물을 spCas9 및 가이드 RNA mALbT1(tgccagttcccgatcgttacagg, SEQ ID NO: 80)을 사용한 절단을 통한 마우스 알부민의 인트론 1 내로의 표적화된 통합을 위하여 도 8에 나타낸 바와 같이 설계하였다. 신호 펩티드를 제거한 mSEAP 코딩 서열을 마우스에 대하여 코돈 최적화시켰으며, 내인성 마우스 알부민 엑손 1로의 스플라이싱 후에 정확한 리딩 프레임을 유지하는 데 필요한 2개의 염기쌍(TG)이 선행된다. 공통 스플라이스 수여자 서열 및 폴리피리미딘 트랙트(CTGACCTCTTCTCTTCCTCCCACAG, SEQ ID NO: 2)로 구성된 스플라이스 수여자를 코딩 서열의 5' 말단에 첨가하고, 폴리아데닐화 신호(sPA)를 코딩 서열의 3' 말단에 첨가하였다(AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTG, SEQ ID NO: 5). 게놈에 존재하는 mAlbT1 가이드 RNA에 대한 표적 부위의 역 상보물(TGCCAGTTCCCGATCGTTACAGG, SEQ ID NO: 80)을 이러한 카세트의 어느 하나의 측에 포함시켰다. 본 발명자들은 가이드 RNA에 대한 절단 부위를 첨가함으로써 AAV 게놈이 생체 내에서 그것이 운반되는 세포의 핵 내측에서 절단되어, 그에 의해, 비-상동성 말단 연결(NHEJ) 경로에 의한 이중 가닥 파단부에서의 통합을 위하여 최적의 주형인 선형 DNA 단편을 생성할 것임을 가정하였다. AAV 캡시드 내로의 효율적인 패키징을 가능하게 하기 위하여, 인간 미소부수체 서열로부터 유래된 스터퍼(stuffer) 단편을 첨가하여 4596 bp의 ITR을 포함하여 전체 크기로 달성하였다. 이러한 공여자 카세트가 Cas9/mALbT1 가이드 RNA 복합체에 의해 생성된 알부민 인트론 1 내의 이중 가닥 파단부 내로 정방향 배향으로 통합되면, 알부민 프로모터로부터의 전사는 일차 전사물을 생성하는 것으로 예측되며, 이는 알부민 엑손 1의 스플라이스 공여자로부터 컨센서스 스플라이스 수여자로의 스플라이싱을 겪을 수 있으며, 성숙 mRNA를 생성하며, 여기서, 알부민 엑손 1은 mSEAP 코딩 서열에 프레임내 융합된다. 이러한 mRNA의 번역은 (알부민 엑손 1 내에 인코딩된) 마우스 알부민의 신호 펩티드가 선행된 mSEAP 단백질을 생성할 것이다. 신호 펩티드는 순환계 내로의 mSEAP의 분비를 유도할 것이며, 분비의 과정에서 절단되어, 성숙 mSEAP 단백질을 남길 것이다. 마우스 알부민 엑손 1이 신호 펩티드 및 프로-펩티드에 이어서 성숙 알부민 단백질의 N-말단을 인코딩하는 7 bp(Glu-Ala + 1 bp(C) 인코딩)를 인코딩하기 때문에, 프로-펩티드의 절단 후에, SEAP 단백질은 N-말단에서 3개의 추가의 아미노산, 즉 Glu-Ala-Leu(Leu은 통합된 SEAP 유전자 카세트로부터 TG로 스플라이싱되는 알부민 엑손 1의 마지막 C 염기에 의해 생성됨)을 함유하는 것으로 예측된다. 본 발명자들은 N-말단에 부가되는 3개의 추가의 아미노산의 제3의 것으로서 류신(Leu)을 인코딩하도록 선택하는데, 그 이유는 류신이 비하전되고 비-극성이며, 이에 따라, SEAP 단백질의 기능을 간섭할 가능성이 적기 때문이다. pCB0047로 표기되는 이러한 SEAP 공여자 카세트를 HEK293 기반의 트랜스펙션 시스템 및 바이러스 정제를 위한 표준 방법(벡터 바이오랩스 인코포레이티드(Vector Biolabs Inc))을 사용하여 AAV8 혈청형 캡시드 내로 패키징하였다. 바이러스를 mSEAP 코딩 서열 내에 위치된 프라이머 및 프로브와 함께 정량적 PCR을 사용하여 적정하였다.
pCB0047 바이러스를 제0일에 2e12 vg/kg의 용량으로 마우스의 꼬리 정맥 내로 주사한 다음, 4일 이후에 mALbT1 가이드 RNA(가이드 RNA 서열 5' TGCCAGTTCCCGATCGTTACAGG 3', PAM 밑줄, SEQ ID NO: 80) 및 spCas9 mRNA를 인코딩하는 지질 나노입자(LNP)로 이어졌다. 단일의 가이드 RNA를 화학적으로 합성하였으며, 본질적으로 기재된 바와 같이 화학적으로 변형된 염기를 혼입시켰으며(문헌[Hendel et al, Nat Biotechnol. 2015 33(9): 985-989]) 표준 tracr RNA 서열을 사용하였다. spCas9 mRNA를 표준 기법을 사용하여 합성하였으며, 단백질의 N-말단 및 C-말단 둘 모두에 핵 국소화 신호를 부가하는 뉴클레오티드 서열을 포함하였다. 핵 국소화 신호는 mRNA가 LNP에 의해 관심 세포의 세포질로 운반된 다음, spCas9 단백질로 번역된 후에 spCas9 단백질을 핵으로 유도하기 위하여 필요하다. Cas9 단백질을 핵으로 유도하기 위한 NLS 서열의 용도가 해당 분야에 널리 알려져 있으며, 예를 들어, 문헌[Jinek et al (eLife 2013;2:e00471. DOI: 10.7554/eLife.00471)]을 참조한다. spCas9 mRNA는 폴리A 테일을 함유하였으며, 5' 말단에서 캡핑하여, 안정성 및 번역 효율을 개선시켰다. gRNA 및 Cas9 mRNA를 LNP에 패키징시키기 위하여, 본 발명자들은 본질적으로 문헌[Kaufmann et al (Nano Lett. 15(11):7300-6)]에 기재된 바와 같은 프로토콜을 사용하여, 이온화 가능한 지질 C12-200(AxoLabs로부터 구입)에 기초하여 LNP를 조립하였다. LNP의 다른 성분은 시스-4,7,10,13,16,19-도코사헥사엔산(DHA, Sigma로부터 구입), 1,2-디리놀레오일-sn-글리세로-3-포스포콜린(DLPC, Avanti로부터 구입), 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000](DMPE-mPEG200, 아반티로부터 구입) 및 콜레스테롤(Avanti로부터 구입)이다. LNP를 나노어셈블러 벤치탑(Nanoassembler Benchtop) 기기(Precision Nanosystems)를 사용하여 생성하였으며, 여기서, LNP는 지질 및 핵산 성분이 미세유체 챔버 내에서 제어된 조건 하에 혼합되는 경우 자가-조립된다. spCas9 mRNA 및 가이드 RNA를 개별 LNP에 캡슐화시켰다. LNP를 인산염 완충 염수 내로의 투석에 의해 농축하고, 사용 전에 4℃에서 최대 1주 동안 보관하였다. LNP를 동적 광 산란을 사용하여 특성화시켰으며, 전형적으로 50 nM 내지 60 nM 범위의 크기를 가졌다. LNP 내의 RNA의 농도를 리보그린(Ribogreen) 검정 키트(Thermofisher Scientific)를 사용하여 측정하였으며, 이를 사용하여 마우스에 제공되는 용량을 결정하였다. 마우스에 투여하기 위하여, spCas9 및 가이드 RNA LNP를 주사 직전에 1:1 질량비의 RNA로 혼합하였다. 마우스에 다야한 LNP 용량을 정맥내 주사하고, TIDES 절차(문헌[Brinkman et al, Nucleic Acids Res. 2014 Dec 16; 42(22): e168])를 사용하여 간에서 알부민 인트론 1 내의 온-표적 부위에서의 마우스 게놈의 절단을 측정함으로써 spCas9 mRNA 및 가이드 RNA를 마우스의 간에 운반하기 위한 이들 LNP의 능력을 입증하였다. 전형적인 결과에 대하여 실시예 2(도 4)를 참조하며, 여기서, 대립형질의 최대 25%가 온-표적 부위에서 절단되었다.
5마리의 마우스의 2개의 코호트에 2e12 vg/kg의 AAV8-CB0047 바이러스를 꼬리 정맥에 주사하였다. 3일 이후에, 코호트 중 하나에 spCas9 mRNA 및 mAlbT1 가이드 RNA를 캡슐화하는 LNP를 2 ㎎/㎏(1:1 비의 spCas9 대 gRNA)의 총 RNA 용량으로 주사하였다. 혈액 시료를 주마다 수집하고, 혈장을 상용의 키트(InvivoGen)를 사용하여 SEAP 활성에 대하여 검정하였다. 결과(표 13 참조)에 의해, SEAP 활성이 오직 AAV8-pCB0047 바이러스만을 제공한 마우스에서 검출 가능하지 않았음이 입증된다. AAV8-pCB0047 바이러스에 이어서 LNP를 제공한 마우스는 혈장에서 SEAP 활성을 가졌으며, 이는 투여 후 4주에 마지막 시점까지 안정하게 유지된다. 마우스에 AAV8 공여자 SEAP 유전자 및 CRISPR-Cas9 유전자 편집 성분 둘 모두를 제공하는 경우에만 SEAP가 발현된다는 관찰에 의해, SEAP 단백질이 알부민 인트론 1 내의 표적 부위 내로 통합된 SEAP 유전자의 카피로부터 발현되는 것이 뒷받침된다. pCB047 내의 SEAP 유전자에, 신호 펩티드 또는 프로모터가 결여되기 때문에, 그것이 SEAP 코딩 서열과 프레임-내인 프로모터 및 신호 펩티드에 작동 가능하게 연결되지 않는 한, 그것은 발현되고 분비될 수 없다. 이것은 pCB047 유전자 카세트가 게놈 내의 무작위 부위 내로 통합되었다면, 이것이 일어날 가능성은 적다.
pCB0047로부터 SEAP 유전자 카세트가 알부민의 인트론 1 내에 통합되었음을 확인하기 위하여, 본 발명자들은 드롭렛 디지털(Droplet Digital) PCR(DD-PCR)을 사용하여, 연구의 마지막에 마우스의 간으로부터 추출된 게놈 DNA 내의 통합 빈도를 측정하였다. DD-PCR은 복잡한 혼합물 중 핵산 서열의 카피의 수를 정확하게 정량화하는 방법이다. PCR 프라이머의 쌍을 설계하였으며, 하나는 mAlbT1 가이드에 대한 표적 부위(표적화된 통합을 위한 예측된 부위)의 5' 측의 마우스 알부민 게놈 서열 내에 위치하며, 다른 프라이머는 pCB0047 내의 SEAP 유전자의 5' 말단에 위치한다. 이러한 "인-아웃(in-out)" PCR은 SEAP 카세트가 요망되는 정방향 배향으로 통합되는 경우, 마우스 알부민 게놈 서열과 통합된 SEAP 카세트 사이의 연접부를 증폭시킬 것이다. 이들 2개의 프라이머에 의해 증폭되는 DNA 서열에 혼성화하는 형광 프로브를 설계하였다. DD-PCR 검정을 위한 내부 대조군으로서, 마우스 알부민 유전자를 검출하는 프라이머 프로브 세트를 사용하였다. 이러한 DD-PCR 검정을 사용하여, 본 발명자들은 0.24 +/-0.07%(알부민 유전자 100 카피당 0.24 카피)의 표적화된 통합 빈도를 측정하여, 그에 의해, SEAP 카세트가 알부민 인트론 1에서 통합되었음을 확인하였다.
Figure pct00014
실시예 10: CRISPR/Cas9에 의해 매개되는 마우스 알부민 인트론 1 내의 인간 FVIII 유전자 공여자의 표적화된 통합은 혈중 FVIII의 발현을 초래한다
A형 혈우병은 광범위하게 연구된 질병이며(문헌[Coppola et al, J Blood Med. 2010; 1: 183-195]), 여기서, 환자는 그들의 혈중 낮은 수준의 기능적 인자 VIII 단백질을 초래하는 인자 VIII 유전자 내의 돌연변이를 갖는다. 인자 VIII은 응고 캐스케이드의 결정적인 성분이며, 충분한 양의 FVIII의 부재 하에, 혈액은 손상 부위에서 안정한 혈전을 형성하지 못하여, 과도한 출혈을 초래한다. 효율적으로 치료되지 않는 A형 혈우병 환자는 관절 내로의 출혈을 경험하여, 관절 파괴를 초래한다. 두개내 출혈도 또한 발생할 수 있으며, 때때로 치명적일 수 있다.
이러한 유전자 편집 전략을 사용하여 A형 혈우병을 치료할 수 있는지를 평가하기 위하여, 본 발명자들은 마우스 FVIII 유전자가 불활성화된 마우스 모델을 사용하였다. 이들 A형 혈우병 마우스는 그들의 혈중 검출 가능한 FVIII을 갖지 않으며, 이는 FVIII 활성 검정 검정(Diapharma, Chromogenix Coatest SP Factor FVIII, 카탈로그 번호 K824086kit)을 사용하여 외인적으로 공급된 FVIII를 측정할 수 있게 한다. 이러한 검정에서 표준물질로서, 본 발명자들은 Kogenate(바이엘(Bayer)), 혈우병 환자의 치료에 사용되는 재조합 인간 FVIII을 사용하였다. 검정의 결과는 1 IU/㎖로 정의되는 정상 인간 FVIII 활성의 백분율로서 기록된다. 인간 FVIII 공여자 주형을 강력한 간 특이적 프로모터의 제어 하의 AAV 벡터를 사용하여 마우스로 운반되는 경우 기능하는 것으로 나타난 B-도메인 결실된 FVIII 코딩 서열에 기초하여 구축하였다(문헌[McIntosh et al, 2013; Blood;121(17):3335-3344]). 고유 신호 펩티드를 인코딩하는 DNA 서열을 이러한 FVIII 코딩 서열로부터 제거하고, 마우스 알부민 엑손 1로의 스플라이싱 후에 정확한 리딩 프레임을 유지하는 데 필요한 2개의 염기쌍(TG)으로 대체하였다. 마우스 알부민 인트론 1로부터 유래된 스플라이스 수여자 서열을 이러한 FVIII 코딩 서열의 바로 5'에 삽입하였다. 인간 글로빈 유전자로부터의 3' 비번역 서열에 이어서 합성 폴리아데닐화 신호 서열을 FVIII 코딩 서열의 3' 측에 삽입하였다. 합성 폴리아데닐화 신호는 폴리아데닐화를 효율적으로 유도하는 것으로 나타난 짧은 49 bp 서열이다(문헌[Levitt et al, 1989; GENES & DEVELOPMENT 3:1019-1025]). 3' UTR 서열을 B-글로빈 유전자로부터 취하였으며, 이는 폴리아데닐화 효율을 추가로 개선하는 기능을 할 수 있다. mAlbT1 가이드 RNA에 대한 표적 부위의 역 상보물을 이러한 FVIII 유전자 카세트의 어느 하나의 측에 배치하여, 도 9에 나타낸 바와 같이 AAV2의 ITR 서열을 함유하는 pCB056으로 지칭되는 벡터를 생성하였다. 이러한 플라스미드를 AAV8 캡시드 내로 패키징하여, AAV8-pCB056 바이러스를 생성하였다.
5마리의 A형 혈우병 마우스의 하나의 코호트(그룹 2; G2)에 AAV8-pCB056 바이러스를 1 e13 vg/kg의 용량으로 꼬리 정맥에 주사하고, 19일 후에, 동일한 마우스에 꼬리 정맥에 spCas9 mRNA 및 mAlbT1 가이드 RNA를 캡슐화하는 2개의 C12-200 기반의 LNP의 혼합물을 각각 1 ㎎ RNA/㎏의 용량으로 주사하였다. LNP를 상기 실시예 2에 기재된 바와 같이 제형화하였다. 5마리의 A형 혈우병 마우스의 개별 코호트(그룹 6; G6)에 꼬리 정맥에 AAV8-pCB056 바이러스를 1 e13 vg/kg의 용량으로 주사하였으며, FVIII 활성을 다음 4주에 걸쳐 모니터링하였다. 오직 AAV만을 주사하는 경우, FVIII 활성은 마우스의 혈중에서 검출 가능하지 않았다(도 9에서 G6). AAV8-pCB056 바이러스에 이어서 LNP 내의 CRISPR/Cas9 유전자 편집 성분을 제공한 마우스는 그들의 혈중 FVIII 활성이 FVIII 활성의 정상 인간 수준의 25% 내지 60% 범위였다. 중증 혈우병 환자는 정상의 1% 미만의 FVIII 활성 수준을 가지며, 중등의 A형 혈우병 환자는 정상의 1% 내지 5%의 FVIII 수준을 가지며, 경증 환자는 정상의 6% 내지 30%의 수준을 갖는다. FVIII 대체 단백질 요법을 받는 A형 혈우병 환자의 분석에 의해, 3%, 5%, 10%, 15% 및 20%의 예측된 FVIII 최저 수준에서, 출별이 발생하지 않는 빈도는 각각 71%, 79%, 91%, 97% 및 100%였음이 보고되었으며(문헌[Spotts et al Blood 2014 124:689]), 이는 FVIII 수준이 15% 내지 20%의 최소 수준을 초과하여 유지되는 경우 출혈 사건의 비가 0에 가까이 감소되었음을 뒷받침한다. A형 혈우병을 치유하는 데 필요한 정밀한 FVIII 수준이 정의되지 않고, 환자 간에 달라질 가능성이 있지만, 5% 내지 30%의 수준은 출혈 사건의 유의미한 감소를 제공할 가능성이 크다. 따라서, 상기 기재된 A형 혈우병 마우스 모델에서, 달성되었던 FVIII 수준(25% 내지 60%)은 치유 가능한 것으로 예상되는 치료적으로 관련 있는 범위로 존재한다.
도 10에서 5마리의 마우스 중 4마리는 제36일에 연구의 마지막까지 (검정의 정상 가변성 및 마우스 생리학적 변이 이내의) 안정한 FVIII 수준을 나타내었다. 마우스(2-3) 중 하나에서 FVIII 활성은 제36일에 검출 가능하지 않은 수준으로 떨어졌으며, 이는 아마도 마우스 내에서 외래 단백질로서 인식될 수 있는 인간 FVIII 단백질에 대한 면역 반응 때문일 가능성이 크다(문헌[Meeks et al, 2012 Blood 120(12): 2512-2520]). 오직 AAV-FVIII 공여자 주형만을 주사하는 경우 FVIII 단백질이 마우스에서 발현되지 않았다는 관찰은 FVIII의 발현이 CRISPR/Cas9 유전자 편집 성분의 제공을 필요로 한다는 것을 입증한다. FVIII 공여자 카세트는 프로모터 또는 신호 펩티드를 갖지 않기 때문에, FVIII은 게놈 내의 무작위 부위 내로의 카세트의 통합에 의해 또는 일부 다른 정의되지 않은 메커니즘에 의해 제조될 가능성이 적다. FVIII 공여자 카세트가 알부민의 인트론 1 내로 통합되었는지를 확인하기 위하여, 본 발명자들은 DD-PCR 형식으로 인-아웃 PCR을 사용하였다. 그룹 2에서 마우스의 전체 간을 균질화시키고, 게놈 DNA를 추출하고, 온-표적 통합이 발생하는 것으로 예측되는 mAlbT1 gRNA에 대한 절단 부위의 5' 위치에서 마우스 알부민 유전자 내에 위치한 하나의 프라이머를 사용하여 DD-PCR에 의해 검정하였다. 제2 PCR 프라이머는 pCB056 카세트 내의 FVIII 코딩 서열의 5' 말단에 위치하였다. 검출을 위해 사용되는 형광 프로브가 2개의 PCR 프라이머 사이의 서열에 혼성화하도록 설계하였다. 이들 2개의 프라이머를 사용한 PCR은 통합 사건의 5' 연접부를 증폭시킬 것이며, 여기서, FVIII 카세트는 mAlbT1 gRNA 절단 부위에 정방향 배향으로 통합되었으며, 이는 FVIII 단백질을 발현할 수 있을 것이다. 마우스 알부민 유전자 내의 영역에 대한 DD-PCR 검정을 대조군으로서 사용하여 검정에서 마우스 게놈의 카피수를 측정하였다. 이러한 검정은 100개의 반수체 마우스 게놈당 0.46 내지 1.28(평균 1.0)의 표적화된 통합 사건을 검출하였다. FVIII이 통합된 FVIII 유전자 카세트로부터 생성되는 것과 일치하게, 표적화된 통합 빈도와 피크 FVIII 수준 사이에 상관관계가 존재하였다. 마우스 간 내의 세포의 약 70%가 간세포이며, AAV8 및 LNP 둘 모두가 주로 간세포에 의해 흡수되는 것을 가정하여, 간세포 알부민 대립형질의 1.4%(1.0 *(1/0.7))가 통합된 FVIII 카세트를 정방향 배향으로 함유한다고 추산될 수 있다. 이들 결과는 CRSIPR/Cas9를 사용하여 적절하게 설계된 FVIII 유전자 카세트를 마우스의 알부민 인트론 1 내로 통합하여 치료적 수준의 기능적 FVIII 단백질의 발현 및 혈액 내로의 분비를 초래할 수 있음을 입증한다. 이러한 연구에 사용되는 운반 양상, 즉, FVIII 공여자 주형을 운반하는 AAV 바이러스 및 CRISPR/Cas9 성분을 운반하는 LNP는 잠재적으로 환자에게 생체내 운반될 수 있다. Cas9가 생체 내에서 짧은 반감기(1일 내지 3일 범위)를 갖는 mRNA로서 운반되기 때문에, CRISPR/Cas9 유전자 편집 복합체는 오직 단시간 동안만 활성일 것이며, 이는 오프-표적 절단 사건이 발생할 시간을 제한하여, 그에 따라 예측되는 안전성 이익을 제공한다. 이들 데이터는 CRISPR/Cas9가 오직 단시간 동안만 활성이었지만, 이것은 마우스에서 치료적으로 관련 있는 수준의 FVIII 활성을 생성하기에 충분한 빈도로 표적화된 통합을 유도하는 데 충분하였음을 입증한다.
Figure pct00015
실시예 11: AAV 공여자에 비한 LNP 내의 가이드 RNA 및 Cas9 mRNA의 투여 시기는 유전자 발현의 수준에 영향을 미친다
AAV 공여자 주형의 주사와 Cas9 mRNA 및 가이드 RNA를 캡슐화하는 LNP의 투여 사이의 시간이 공여자 주형 상에 인코딩된 유전자의 발현의 수준에 영향을 갖는지 여부를 평가하기 위하여, 본 발명자들은 mSEAP를 인코딩하는 AAV8-pCB0047을 5마리의 마우스의 2개의 코호트에 각각 주사하였다. AAV를 주사한지 4일 후에, 마우스의 하나의 코호트(그룹 3)에 spCas9 mRNA 및 mAlbT1 gRNA를 캡슐화하는 C12-200 기반의 LNP를 주사하고(각각 1 ㎎/㎏), 다음 4주 동안 혈장에서 SEAP 활성을 주마다 측정하였다. SEAP 활성을 제2 코호트의 마우스에서 4주 동안 모니터링하였으며, 그 동안 SEAP가 검출되지 않았다. AAV를 주사한지 28일 후에, 그룹 4의 마우스에 spCas9 mRNA 및 mAlbT1 gRNA를 캡슐화하는 C12-200 기반의 LNP를 투여하고(각각 1 ㎎/㎏), 다음 3주 동안 혈장에서 SEAP 활성을 주마다 측정하였다. SEAP 데이터는 표 15에 요약되어 있다. AAV 4일 후에 spCas9/gRNA를 캡슐화시킨 LNP를 제공한 그룹 3에서, SEAP 활성은 평균 3306 마이크로유닛/㎖이었다. AAV 28일 후에 spCas9/gRNA를 캡슐화시킨 LNP를 제공한 그룹 4에서, SEAP 활성은 평균 13389 마이크로유닛/㎖이었으며, 이는 그룹 3의 것보다 4배 더 높은 것이다. 이들 데이터는 LNP 이후 28일에 spCas9/gRNA를 캡슐화시킨 LNP를 투여하는 것이 AAV-공여자 주형 이후 단지 4일 후에 spCas9/gRNA를 캡슐화시킨 LNP를 투여하는 경우보다 게놈 내로 통합되는 유전자로부터 4배 더 높은 발현을 초래하는 것을 보여주었다. 이러한 개선된 발현은 알부민 인트론 1 내로의 전장 공여자 인코딩된 유전자 카세트의 통합의 더 높은 빈도로 인한 것일 가능성이 크다.
Figure pct00016
AAV-공여자 및 LNP 캡슐화된 Cas9/gRNA 투여의 시기의 영향을 또한 치료적으로 관련 있는 유전자의 일 예로서 인자 VIII 유전자를 사용하여 평가하였다. 2개의 코호트의 A형 혈우병 마우스에 제0일에 인간 FVIII 공여자 카세트를 인코딩하는 AAV8-pCB056을 2e12 vg/kg의 용량으로 주사하였다. 코소트 중 하나에는 4일 이후에 spCas9 mRNA 및 mAlbT1 gRNA를 캡슐화하는 C12-200 기반의 LNP를 주사하는 한편(각각 1 ㎎/㎏), 제2 코호트에는 17일 이후에 spCas9 mRNA 및 mAlbT1 gRNA를 캡슐화하는 C12-200 기반의 LNP를 투여하였다(각각 1 ㎎/㎏). AAV8-pCB056의 투여는 시차를 두어, spCas9 mRNA 및 가이드 RNA를 캡슐화하는 LNP의 동일한 회분이 같은 날에 두 그룹 모두에 대하여 사용되게 하였다. 마우스의 혈중 FVIII 활성을 LNP를 투여한지 10일 및 17일 후에 측정하였으며, 결과는 도 11에 나타나 있다. AAV 4일 후에 LNP를 제공한 마우스는 그들의 혈중에 검출 가능한 FVIII을 갖지 않은 한편, AAV 17일 후에 LNP를 주사한 그룹 내의 모든 4마리의 마우스는 제17일에 정상의 2% 내지 30%의 범위의 검출 가능한 FVIII 활성을 가졌다. 이들 결과에 의해, FVIII을 인코딩하는 AAV 공여자에 있어서, AAV 공여자 이후 적어도 17일에 CRISPR/Cas9 성분의 투여가 치료적으로 적절한 FVIII의 수준을 초래하는 한편, AAV 이후 4일의 투여는 FVIII 발현을 야기하지 않았음이 입증된다.
AAV가 간의 세포를 포함한 세포를 감염시키는 과정은 엔도솜으로부터의 회피, 바이러스 탈외피 및 핵으로의 AAV 게놈의 수송을 포함한다. 단일 가닥 게놈이 바이러스에 패키징되는 이들 연구에 사용되는 AAV의 경우에, 단일 가닥 게놈은 제2 가닥 DNA 합성의 과정을 겪어, 이중 가닥 DNA 게놈을 형성한다. 단일 가닥 게놈에서 이중 가닥 게놈으로의 완전한 전환에 필요한 시간은 널리 확립되지 않지만, 속도 제한 단계인 것으로 고려된다(문헌[Ferrari et al 1996; J Virol. 70: 3227-3234]). 그 다음, 이중 가닥 선형 게놈은 헤드 투 테일(head to tail)로, 그리고 테일 투 헤드(tail to head)로 연결되는 단량체로 구성된 다량체 원형 형태로 연쇄체화된다(문헌[Sun et al 2010; Human Gene Therapy 21:750-762]). 본 발명자들의 연구에 사용되는 AAV 공여자 주형이 상동성 아암을 함유하지 않기 때문에, 그들은 HDR에 대한 주형이 아닐 것이며, 이에 따라 오직 NEHJ 경로를 통해서만 통합될 수 있다. 이중 가닥 선형 DNA 단편만이 이중 가닥 파단부에서 NHEJ 매개의 통합을 위한 주형이다. 따라서, 본 발명자들은 AAV 공여자 직후 간 세포로의 CRISPR-Cas9 성분의 운반이 낮은 빈도의 통합을 야기할 수 있으며, 그 이유는 AAV 게놈의 대부분이 단일 가닥 형태로 존재하며, 이들 환경 하에서 게놈 내의 이중 가닥 파단부의 대부분이 공여자 주형의 통합 없이 작은 삽입 및 결실과 함께 수선될 것이기 때문임을 가정하였다. AAV-공여자 주형 이후 나중에 CRISPR/Cas9 유전자 편집 성분을 운반하는 것은 NHEJ 매개의 표적화된 통합을 위한 주형인 이중 가닥 AAV 게놈의 형성을 위한 시간을 허용한다. 그러나, AAV 공여자를 운반한 후 너무 길게 기다리면, 이중 가닥 선형 형태에서 원형(연쇄체) 형태로의 전환을 초래할 수 있으며, 이는 NHEJ 매개의 표적화된 통합을 위한 주형이 아닐 것이다. 공여자 주형 내의 가이드 RNA/Cas9에 대한 절단 부위의 포함은 원형 형태의 절단을 초래하여, 선형 형태를 생성할 것이다. 임의의 남아 있는 선형 형태를 또한 절단하여 AAV ITR 서열을 함유하는 짧은 단편을 방출시킬 것이다. AAV 공여자 주형 내의 1개 또는 2개의 가이드 RNA 절단 부위의 포함에 의해, AAV 게놈의 연쇄체 형태로부터 다양한 선형 단편이 생성될 것이다. 선형 단편의 유형은 AAV 게놈 내의 절단 부위의 수 및 각 연쇄체 내의 다량체의 수에 따라, 그리고 그들의 상대적인 배향에 따라 달라질 것이며, 이에 따라 예측하기 어렵다. AAV 내의 카세트의 5' 말단에 배치된 단일의 gRNA 부위는 단량체 원형 및 헤드 투 테일 연쇄체 둘 모두로부터 단량체 이중 가닥 주형을 방출시킬 것이다(헤드 투 테일은 하나의 AAV 게놈의 5' 말단이 다음의 AAV 게놈의 3' 말단에 연결된 것을 의미한다). 그러나, 5' 말단에서의 단일의 gRNA 부위는 헤드 투 헤드 연쇄체로부터 단량체 이중 가닥 선형 주형을 방출시키지 않을 것이다(헤드 투 헤드 연쇄체는 다음의 AAV 게놈의 5' 말단에 연결된 하나의 AAV 게놈의 5' 말단으로 이루어진다). 5' 말단에서 단일의 gRNA 부위를 사용하는 것의 가능한 이점은 그것이 헤드 투 테일 연쇄체로부터가 아닌 헤드 투 헤드 연쇄체로부터 이중 가닥 단편을 함유하는 짧은 ITR을 방출시킬 것이라는 점이다. AAV 게놈의 5' 말단에서 단일의 gRNA 절단 부위를 사용하여, ITR은 선형 단량체 유전자 카세트의 3' 말단에서 유지될 것이며, 이에 따라 게놈 내에 통합될 것이다. AAV 내의 공여자 카세트가 (카세트를 플랭킹하는) 2개의 gRNA 부위를 함유하는 경우, 이것은 모든 형태의 이중 가닥 DNA로부터 단량체 이중 가닥 주형의 방출을 초래할 것이며, 이에 따라 특히 헤드 투 테일 및 테일 투 헤드 연쇄체의 믹스가 존재한다면, 표적화된 통합을 위하여 더 많은 주형을 유리시킬 수 있다. 카세트를 플랭킹하는 2개의 gRNA 표적 부위를 포함하는 것의 잠재적인 단점은 이것이 AAV ITR 서열을 함유하는 작은(약 150 염기쌍) 이중 가닥 선형 단편을 방출시킬 것이라는 점이다. 이들 작은(약 150 염기쌍) 단편 중 2개는 관심 치료적 유전자를 함유하는 유전자 카세트의 각 카피에 대하여 생성될 것이다. 짧은 ITR 함유 단편은 또한 게놈 내의 이중 가닥 파단부에서의 NHEJ 매개의 표적화된 통합을 위한 주형인 것으로 예상되며, 이에 따라 게놈 내의 이중 가닥 파단부에서의 통합을 위하여 유전자 카세트를 함유하는 단편과 경쟁하고, 그에 의해 숙주 세포의 게놈 내로의 요망되는 치료적 유전자 카세트의 통합 사건이 발생하는 빈도를 감소시킬 것이다. 많은 파라미터, 예컨대 연쇄체 형성의 동역학 및 연쇄체의 분자 조성(헤드 투 테일 및 테일 투 헤드 연쇄체의 함량 및 연쇄체 내의 단량체 단위 수)이 알려져 있지 않은 이러한 생물학적 시스템의 복잡성을 고려해볼 때, 임의의 확실성으로 공여자 카세트 내의 0, 1 또는 2개의 가이드 절단 부위가 치료적 유전자를 함유하는 요망되는 공여자 카세트의 가장 높은 표적화된 통합을 달성할지 여부 또는 이것이 CRISPR/Cas9 유전자 편집 성분의 운반의 시기에 의해 어떻게 영향을 받는지를 예측하는 것은 가능하지 않다. 본 발명자들의 데이터는 2개의 가이드 RNA 절단 부위의 포함에 의해, CRISPR/Cas9 유전자 편집 성분이 AAV-공여자 카세트를 투여한지 적어도 17일 후에 투여되는 spCas9 mRNA 및 가이드 RNA를 캡슐화하는 LNP에 의해 운반되는 환경에서 측정 가능한 표적화된 통합이 야기되지만, LNP를 AAV-공여자 카세트 4일 후에 투여하는 경우에는 그렇지 않은 것을 뒷받침한다.
실시예 12: FVIII 발현에 대한 상이한 폴리아데닐화 신호의 영향
마우스 알부민 인트론 1 내로의 표적화된 통합 후에 FVIII 유전자의 발현시의 상이한 폴리아데닐화 신호 서열의 영향을 평가하기 위하여, 본 발명자들은 도 12에 나타낸 일련의 플라스미드를 구축하였다. 5' 말단에 mALbT1 gRNA에 대한 단일의 표적 부위를 갖는 이들 플라스미드를 설계하였으며, 이는 유체역학적 주입(HDI)을 사용하여 마우스로의 운반 후에 생체 내에서 원형 플라스미드 DNA로의 선형화를 초래할 것이다. HDI는 마우스의 간으로 플라스미드 DNA를 운반하기 위한 확립된 기법이며(문헌[Budker et al, 1996; Gene Ther., 3, 593-598]), 여기서 염수 중 네이키드(naked) 플라스미드 DNA를 마우스의 꼬리 내로 신속하게 주사한다(5초 내지 7초 내에 2 ㎖ 내지 3 ㎖ 부피).
6마리의 A형 혈우병 마우스의 코호트에 마우스당 25 ㎕의 pCB065, pCB076 또는 pCB077을 유체역학적으로 주사하였다. 24시간 후에, 마우스에 1 ㎎/㎏의 각 RNA의 용량으로 spCas9 mRNA 및 mAlbT1 gRNA를 캡슐화하는 C12-200 LNP를 안와후방 주사에 의해 투여하였다. 마우스의 혈중 FVIII 활성을 LNP 투여 후 10일에 측정하였다. 제10일에 마우스를 희생시키고, 전체 간을 균질화시키고, 균질물로부터 게놈 DNA를 추출하였다. 알부민 인트론 1 내의 정방향 배향으로의 FVIII 공여자 카세트의 표적화된 통합의 빈도를 정량적 실시간 PCR을 사용하여 정량화하였다. 이러한 실시간 PCR 검정에서, 하나의 프라이머는 예상되는 통합 부위(mAlbT1 gRNA에 대한 절단 부위)의 5'의 마우스 알부민 유전자의 게놈 서열 내에 위치하였으며, 제2 PCR 프라이머는 공여자 플라스미드의 FVIII 코딩 서열의 5' 말단에 위치하였다. 형광 프로브는 2개의 프라이머 사이에 위치하였다. 이러한 검정은 통합이 정방향 배향으로 발생하는 경우(FVIII 유전자가 게놈 마우스 알부민 유전자와 동일한 배향으로 존재함) 마우스 게놈과 공여자 카세트 사이의 연접부를 특이적으로 검출할 것이다. 나이브 마우스 간 게놈 DNA 내로 스파이킹된 연접부 단편의 예측되는 서열로 구성된 합성 DNA 단편을 카피수 표준으로서 사용하여, 간 게놈 DNA 내의 통합 사건의 절대 카피를 계산하였다. 그룹 2(pCB065 주사), 3(pCB076 주사) 및 4(pCB077 주사)에서 마우스의 FVIII 활성은 각각 5.5%, 4.2% 및 11.4%였다. pCB077를 주사한 그룹 4는 가장 높은 FVIII 활성을 가졌다. 유체역학적 주입에 의한 간으로의 DNA의 운반이 마우스 간에 매우 가변적이기 때문에, 본 발명자들은 각 개별 마우스에 대하여 도 13에 나타낸 바와 같이 표적화된 통합 빈도로 나눈 FVIII 활성을 계산하였다. 이러한 비는 FVIII 유전자의 통합된 카피당 FVIII 발현을 나타내며, 그에 의해, pCB065 및 pCB076에 비하여 pCB077(그룹 4)로부터의 뛰어난 발현이 입증되었다. 본 발명자들이 어떠한 FVIII도 발현하지 않았던 마우스를 배제한 경우에, 각각 pCB065, pCB076 및 pCB077에 대한 평균 FVIII/TI 비는 42, 8 및 57이었다. 이들 데이터는 pCB077 내의 aPA+ 폴리아데닐화 신호가 pCB076 내의 sPA 폴리아데닐화 신호에 비해 FVIII의 뛰어난 발현을 가능하게 하는 것을 나타낸다. sPA+ 폴리아데닐화 신호를 사용한 FVIII의 발현은 소 성장 호르몬(bGH) 폴리아데닐화 신호를 사용하는 것과 유사하였다. 공여자를 AAV 바이러스를 사용하여 운반하는 경우, 특히 AAV에 대한 패키징 제한(ITR을 배제하여 4.4 Kb)에 가까운 4.3Kb 크기인 FVIII 유전자의 경우에, bGH 폴리A(225 bp)에 비하여 짧은 폴리아데닐화 신호 서열, 예컨대 sPA(49 bp) 또는 sPA+(54 bp)를 사용하는 것에 이점이 존재한다. sPA+ 폴리아데닐화 신호는 FVIII 유전자의 정지 코돈과 합성 폴리아데닐화 신호 서열(aataaaagatctttattttcattagatctgtgtgttggttttttgtgtg, SEQ ID NO: 5) 사이의 오직 5 bp 스페이서(tcgcg, SEQ ID NO: 212)의 존재만이 sPA 폴리아데닐화 신호와 상이하다. 이러한 합성 폴리아데닐화 신호 서열은 이전에 설명되어 있고(문헌[Levitt et al, 1989; Genes Dev. (7):1019-25]), 다른 이들에 의해 AAV 기반의 유전자 요법 벡터에서 사용된 바 있고(문헌[McIntosh et al,2013; Blood 121:3335-3344]), 스페이서 서열의 포함의 이점은 명백하게 입증된 바 없다. 본 발명자들의 데이터에 의해, 5 bp의 짧은 스페이서가 게놈 내의 강력한 알부민 프로모터에 의해 전사가 유도되는 알부민 인트론 1 내로 통합된 FVIII 유전자의 발현을 개선시켰음이 입증된다. 스페이서의 이점은 게놈 내의 고도로 발현되는 유전자좌 내로의 표적화된 통합의 환경에 독특한 것일 수 있다.
실시예 13: LNP를 사용한 CRISPR/Cas9 성분의 반복 투여는 마우스 알부민 인트론 1에 표적화된 AAV 운반된 공여자 카세트의 발현의 증분식 증가를 초래한다
치료적 유전자가 알부민의 인트론 1 내로 통합되는 유전자 편집 기반의 유전자 요법을 환자에게 투여하는 환경에서, 환자에게 최적의 치료적 이익을 제공하는 유전자 발현의 수준을 달성하는 것이 유리할 것이다. 예를 들어, A형 혈우병에서, 혈중 가장 바람직한 수준의 FVIII 단백질은 20% 내지 100% 또는 30% 내지 100% 또는 40% 내지 100% 또는 가장 바람직하게는 50% 내지 100%의 범위일 것이다. 100%를 초과하는 FVIII 수준은 혈전 사건의 위험을 증가시킴에 따라(문헌[Jenkins et al, 2012; Br J Haematol. 157:653-63]), 바람직하지 않다. AAV 게놈의 에피솜 카피로부터 치료적 유전자의 발현을 유도하기 위하여 강력한 프로모터를 사용하는 표준 AAV 기반의 유전자 요법은 달성되는 발현의 수준의 어떠한 조절도 가능하지 않은데, 그 이유는 AAV 바이러스가 오직 1회만 투여될 수 있으며, 달성되는 발현의 수준은 환자 간에 유의미하게 달라지기 때문이다(문헌[Rangarajan et al, 2017; N Engl J Med 377:2519-2530]). 환자에 AAV 바이러스를 투여한 후에, 그들에는 바이러스 캡시드 단백질에 대하여 높은 역가의 항체가 발생하며, 이는 전임상 모델에 기초하여 바이러스의 효율적인 재-투여를 방지할 것으로 예상된다(문헌[Petry et al, 2008; Gene Ther. 15:54-60]). AAV 바이러스에 의해 운반되는 치료적 유전자가 안전한 하버(harbor) 유전자좌, 예컨대 알부민 인트론 1에서 게놈 내로 통합되며, 이러한 표적화된 통합이 게놈 내의 이중 가닥 파단부의 생성을 통해 발생하는 접근법은 표적화된 통합의 수준 및 이에 따라 치료적 유전자 산물의 수준을 조절하는 기회를 제공한다. 관심 치료적 유전자를 인코딩하는 공여자 DNA 카세트를 함유하는 AAV 게놈을 캡슐화하는 AAV에 의해 간이 형질도입된 후에, AAV 게놈은 형질도입된 세포의 핵 내에 에피솜으로 유지될 것이다. 이들 에피솜 AAV 게놈은 시간이 지남에 따라 상대적으로 안정하며, 이에 따라 CRISPR/Cas9에 의해 생성되는 이중 가닥 파단부에서의 표적화된 통합을 위한 공여자 주형의 풀을 제공한다. AAV 운반되는 공여자 주형 상에 인코딩되는 단백질의 발현의 단계적 증가를 유도하는 비-면역원성 LNP에서 운반되는 CRISPR/Cas9 성분의 반복 용량을 사용하는 능력을 AAV8-pCB0047 및 C12-200 LNP 내에 캡슐화된 spCas9 mRNA 및 mALbT1 gRNA를 사용하여 평가하였다. 5마리의 마우스의 코호트에 AAV8-pCB0047를 2e12 vg/㎏으로 꼬리 정맥에 주사하고, 4일 후에, 1 ㎎/㎏의 spCas9 mRNA 및 1 ㎎/㎏의 mAlbT1 gRNA를 캡슐화하는 C12-200 기반의 LNP를 정맥내 주사하였다. 혈중 SEAP 수준을 다음 4주 동안 주마다 측정하였으며, 평균 3306 마이크로유닛/㎖이었다(표 16). 제4주의 마지막 SEAP 측정 후에, 동일한 마우스에 각각 1 ㎎/㎏의 spCas9 mRNA 및 mALbT1 gRNA를 캡슐화하는 C12-200 LNP를 재-투여하였다. 혈중 SEAP 수준을 다음 3주 동안 주마다 측정하였으며, 평균 6900 마이크로유닛/㎖이었으며, 제1 LNP 용량 이후의 주마다의 평균 수준에 비하여 2배 더 높았다. 그 다음, 동일한 5마리의 마우스에 각각 1 ㎎/㎏의 spCas9 mRNA 및 mALbT1 gRNA를 캡슐화하는 C12-200 LNP의 제3 주사를 제공하였다. 혈중 SEAP 수준을 다음 4주 동안 주마다 측정하였으며, 평균 13117 마이크로유닛/㎖이었으며, 제2 LNP 용량 이후의 주마다의 평균 수준보다 2배 더 높았다. 이들 데이터에 의해, LNP에 캡슐화된 spCas9 mRNA 및 gRNA를 포함하는 CRISPR/Cas9 유전자 편집 성분의 반복 투여가 AAV 운반되는 공여자 주형으로부터 유전자 발현의 단계적 증가를 초래할 수 있음이 입증된다. 공여자 주형 상에 인코딩된 SEAP 유전자가 발현을 위하여 프로모터로의 공유적 결합 및 신호 펩티드 서열에 의존적이라는 사실은 증가된 발현이 알부민 인트론 1 내로의 증가된 표적화된 통합으로 인한 것임을 강력하게 뒷받침한다. 제12주에, 마우스를 희생시키고, 전체 간을 균질화시키고, 게놈 DNA를 추출하고, 정방향 배향(기능적 SEAP 단백질을 생성하는 데 필요한 배향)의 예측된 5' 연접부를 플랭킹하는 프라이머와 함께 DD-PCR을 사용하여 알부민 인트론 1에서의 표적화된 통합에 대하여 검정하였다. 통합 빈도는 평균 0.3%였다(100개의 알부민 대립형질당 0.3 카피).
Figure pct00017
실시예 14: CRISPR/Cas9에 의해 매개되는 일차 인간 간세포에서 알부민 인트론 1 내로의 FVIII 또는 SEAP 공여자의 표적화된 통합은 FVIII 또는 SEAP의 발현을 초래한다
CRISPR/Cas9 절단에 의해 매개되는 알부민 인트론 1 내로의 유전자 카세트의 표적화된 통합의 개념이 인간 게놈에 특이적인 가이드 RNA를 사용하여 인간 세포에서도 작동하는 것을 입증하기 위하여, 본 발명자들은 일차 인간 간세포에서 실험을 수행하였다. 일차 인간 간세포는 그들의 정상의 표현형을 유지하기 위하여 최소의 시험관내 조작을 겪는 인간 공여자의 간으로부터 수집된 인간 간세포이다. 2개의 공여자 주형을 도 14에 나타낸 바와 같이 구축하고, 시험관내에서 간세포를 형질도입하는 데 특히 효율적인 AAV-DJ 혈청형(문헌[Grimm et al, 2008; J Virol. 82: 5887-5911]) 내로 패키징하였다. AAV-DJ 바이러스를 관련 유전자(FVIII 또는 mSEAP)의 코딩 서열 내에 위치한 프라이머 및 프로브를 사용하여 정량적 PCR에 의해 적정하여, 역가를 ㎖당 게놈 카피(GC)로 표현한다.
일차 인간 간세포(미국 뉴욕주 웨스트베리 소재의 BioIVT로부터 수득)를 해동시키고, 간세포 회복 배지(CHRM)(Gibco)로 옮기고, 저속으로 펠렛화시킨 다음, 콜라겐 IV(코닝)가 사전-코팅된 24-웰 플레이트에서, InVitroGRO™ CP 배지(BioIVT) + Torpedo™ 항생제 믹스(BioIVT) 중에 0.7x106개 세포/㎖의 밀도로 플레이팅하였다. 플레이트를 37℃에서 5% CO2에 인큐베이션시켰다. 세포가 부착된 후에(플레이팅 3시간 내지 4시간 후에), 플레이트에 부착되지 않은 사멸 세포를 세척하고, 신선한 가온 완전한 배지를 세포에 첨가하였다. RNA를 0.02 ㎍/㎕ mRNA 및 0.2 마이크로몰 가이드의 최종 농도로 OptiMem 배지(Gibco)에 첨가함으로써 spCas9 mRNA(Trilink에서 제조) 및 hAlb T4 가이드 RNA(미국 캘리포니아주 멘로 파크 소재의 Synthego Corp에서 제조)의 지질계 트랜스펙션 혼합물을 제조하였다. Optimem 중에 30배 희석된 동일한 부피의 리포펙타민을 이에 첨가하고, 실온에서 20분 인큐베이션시켰다. AAV-DJ-pCB0107 또는 AAV-DJ-pCB0156 중 어느 하나를 세포당 1,000 GC 내지 세포당 100,000 GC 범위의 다양한 감염 다중도로 관련 있는 웰에 첨가한 직후(5분 이내), spCas9 mRNA/gRNA 지질 트랜스펙션 혼합물을 첨가하였다. 그 다음, 플레이트를 37℃에서 5% CO2에 72시간 동안 인큐베이션시키고, 그 후에 배지를 수집하고, 발색 검정(Diapharma, Chromogenix Coatest SP Factor FVIII, 카탈로그 번호 K824086kit)을 사용하여 FVIII 활성에 대하여 또는 상용의 키트(InvivoGen)를 사용하여 SEAP 활성에 대하여 검정하였다. 결과는 도 15 및 도 16에 요약되어 있다. 세포를 spCas9 mRNA 및 gRNA로 단독으로 또는 SEAP 바이러스로 단독으로 또는 FVIII 바이러스로 단독으로 트랜스펙션시킨 대조군은 낮은 수준의 SEAP 활성을 가졌으며, 이는 세포 내의 백그라운드 활성을 나타낸다. AAV-DJ-pCB0107 바이러스 및 Cas9 mRNA/hAlbT4 gRNA 둘 모두를 트랜스펙션시킨 경우, SEAP 활성은 50,000 및 100,000의 더 높은 MOI에서 백그라운드 수준보다 유의미하게 높았다. 이들 데이터는 CRISPR/Cas9 유전자 편집 성분 및 동일한 gRNA에 대한 절단 부위를 함유하는 AAV 운반되는 공여자의 조합이 공여자 인코딩된 트랜스유전자의 발현을 초래할 수 있음을 나타낸다. AAV 공여자에 인코딩된 SEAP 유전자가 프로모터 또는 신호 펩티드가 결여되고, SEAP 발현이 유전자 편집 성분을 필요로 하기 때문에, SEAP가 인간 알부민 인트론 1 내로 통합된 공여자의 카피로부터 발현되었을 가능성이 크다. 인-아웃 PCR은 인간 알부민의 인트론 1 내로의 SEAP 공여자의 통합을 확인하기 위해 사용될 수 있는 방법이다.
세포를 100, 000 MOI의 AAV-DJ-pCB0107 또는 AAV-DJ-pCB0156 바이러스로 단독으로(Cas9 mRNA 또는 gRNA 부재)로 트랜스펙션시킨 대조군은 72시간에 배지 중 낮은 또는 검출 가능하지 않은 수준의 FVIII 활성을 나타내었다(도 16). spCas9 mRNA 및 hAlbT4 gRNA와 함께 AAV-DJ-pCB0156 바이러스로 다양한 MOI로 트랜스펙션시킨 세포는 72시간에 배지에서 검출 가능한 수준의 FVIII 활성을 가졌으며, 이는 0.2 mIU/㎖ 내지 0.6 mIU/㎖ 범위였다. 이들 데이터는 CRISPR/Cas9 유전자 편집 성분 및 동일한 gRNA에 대한 절단 부위를 함유하는 AAV 전달된 공여자의 조합이 공여자 인코딩된 FVIII 트랜스유전자의 발현을 초래할 수 있음을 나타낸다. AAV 공여자에 인코딩된 FVIII 유전자에 프로모터 또는 신호 펩티드가 결여되고, FVIII 발현이 유전자 편집 성분을 필요로 하기 때문에, FVIII가 인간 알부민 인트론 1 내로 통합된 공여자의 카피로부터 발현하였을 가능성이 크다. 인-아웃 PCR은 인간 알부민의 인트론 1 내로의 FVIII 공여자의 통합을 확인하기 위해 사용될 수 있는 방법이다.
본 개시는 몇몇의 기재된 구현예와 관련하여 일부 길이로, 다소 자세하게 기재되었지만, 임의의 이러한 특정 사항 또는 구현예 또는 임의의 특정한 구현예로 제한되어야 하는 것으로 의도된 것은 아니고, 선행 기술의 관점에서 이러한 청구범위의 가장 광범위한 가능한 해석을 제공하고, 따라서 본 개시의 의도된 범위를 효과적으로 포함하도록 첨부된 청구범위를 참조하여 해석되어야 한다.
서열 목록
본 개시의 다른 부분에 개시된 서열에 더하여, 하기의 서열은 그들이 본 개시의 다양한 예시적인 구현예에 언급되거나 사용되는 바와 같이 제공되며, 이는 예시의 목적을 위해 제공된다.
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
SEQUENCE LISTING <110> Casebia Therapeutics Limited Liability Partnership <120> Compositions and Methods for Gene Editing for Hemophilia A <130> 052984-507001WO <140> PCT/US2018/056390 <141> 2018-10-17 <150> US 62/573,633 <151> 2017-10-17 <160> 105 <170> PatentIn version 3.5 <210> 1 <211> 14 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <220> <221> misc_feature <223> linker peptide <400> 1 Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg 1 5 10 <210> 2 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> synthetic splice acceptor <400> 2 ctgacctctt ctcttcctcc cacag 25 <210> 3 <211> 32 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, human <400> 3 ttaacaatcc ttttttttct tcccttgccc ag 32 <210> 4 <211> 40 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, mouse <400> 4 ttaaatatgt tgtgtggttt ttctctccct gtttccacag 40 <210> 5 <211> 49 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> consensus synthetic poly A signal sequence <400> 5 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtg 49 <210> 6 <211> 9 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 6 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 7 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 7 tgcctttacc ccatcgttac 20 <210> 8 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 8 tgcctcctcc cgatagttac 20 <210> 9 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 9 ggacagttcc tgattgttac 20 <210> 10 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target site <400> 10 tgccttttcc cgattgttaa 20 <210> 11 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MALBF3 primer <400> 11 ttattacggt ctcatagggc 20 <210> 12 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MALBR5 primer <400> 12 agtctttctg tcaatgcaca c 21 <210> 13 <211> 100 <212> RNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> gRNA <220> <221> misc_feature <222> (1)..(2) <223> phosphorothioate linkage <220> <221> modified_base <222> (1)..(1) <223> um <220> <221> misc_feature <222> (2)..(3) <223> phosphorothioate linkage <220> <221> modified_base <222> (2)..(2) <223> gm <220> <221> modified_base <222> (3)..(3) <223> cm <220> <221> misc_feature <222> (3)..(4) <223> phosphorothioate linkage <220> <221> modified_base <222> (29)..(29) <223> gm <220> <221> modified_base <222> (30)..(30) <223> cm <220> <221> modified_base <222> (31)..(31) <223> um <220> <221> modified_base <222> (32)..(32) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (37)..(37) <223> um <220> <221> modified_base <222> (38)..(38) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (39)..(39) <223> gm <220> <221> modified_base <222> (40)..(40) <223> cm <220> <221> modified_base <222> (68)..(69) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (70)..(70) <223> cm <220> <221> modified_base <222> (71)..(72) <223> um <220> <221> modified_base <222> (77)..(78) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (79)..(79) <223> gm <220> <221> modified_base <222> (80)..(80) <223> um <220> <221> modified_base <222> (81)..(82) <223> gm <220> <221> modified_base <222> (83)..(83) <223> cm <220> <221> modified_base <222> (84)..(84) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (85)..(85) <223> cm <220> <221> modified_base <222> (86)..(86) <223> cm <220> <221> modified_base <222> (87)..(87) <223> gm <220> <221> modified_base <222> (88)..(88) <223> 2'-O-methyladenosine <220> <221> modified_base <222> (89)..(89) <223> gm <220> <221> modified_base <222> (90)..(90) <223> um <220> <221> modified_base <222> (91)..(91) <223> cm <220> <221> modified_base <222> (92)..(93) <223> gm <220> <221> modified_base <222> (94)..(94) <223> um <220> <221> modified_base <222> (95)..(95) <223> gm <220> <221> modified_base <222> (96)..(96) <223> cm <220> <221> misc_feature <222> (97)..(98) <223> phosphorothioate linkage <220> <221> modified_base <222> (97)..(99) <223> um <220> <221> misc_feature <222> (98)..(99) <223> phosphorothioate linkage <220> <221> misc_feature <222> (99)..(100) <223> phosphorothioate linkage <400> 13 ugccaguucc cgaucguuac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 14 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Albumin forward primer <400> 14 ccctccgttt gtcctagctt 20 <210> 15 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Albumin reverse primer <400> 15 tctacgaggc agcactgtt 19 <210> 16 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AAVS1 forward primer <400> 16 aactgcttct cctcttggga agt 23 <210> 17 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AAVS1 reverse primer <400> 17 cctctccatc ctcttgcttt ctttg 25 <210> 18 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T1 <400> 18 taattttctt ttgcgcacta agg 23 <210> 19 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T2 <400> 19 tagtgcaatg gataggtctt tgg 23 <210> 20 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T3 <400> 20 agtgcaatgg ataggtcttt ggg 23 <210> 21 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T4 <400> 21 taaagcatag tgcaatggat agg 23 <210> 22 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T5 <400> 22 atttatgaga tcaacagcac agg 23 <210> 23 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T6 <400> 23 tgattcctac agaaaaactc agg 23 <210> 24 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T7 <400> 24 tgtatttgtg aagtcttaca agg 23 <210> 25 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T8 <400> 25 gactgaaact tcacagaata ggg 23 <210> 26 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T9 <400> 26 aatgcataat ctaagtcaaa tgg 23 <210> 27 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T10 <400> 27 tgactgaaac ttcacagaat agg 23 <210> 28 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T11 <400> 28 ttaaataaag catagtgcaa tgg 23 <210> 29 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T12 <400> 29 gatcaacagc acaggttttg tgg 23 <210> 30 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T13 <400> 30 taataaaatt caaacatcct agg 23 <210> 31 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T14 <400> 31 ttcattttag tctgtcttct tgg 23 <210> 32 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T15 <400> 32 attatctaag tttgaatata agg 23 <210> 33 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T16 <400> 33 atcatcctga gtttttctgt agg 23 <210> 34 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T17 <400> 34 gcatctttaa agaattattt tgg 23 <210> 35 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T18 <400> 35 tactaaaact ttattttact ggg 23 <210> 36 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T19 <400> 36 tgaattattc ttctgtttaa agg 23 <210> 37 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T20 <400> 37 aatttttaaa atagtattct tgg 23 <210> 38 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T21 <400> 38 atgcatttgt ttcaaaatat tgg 23 <210> 39 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T22 <400> 39 tttggcattt atttctaaaa tgg 23 <210> 40 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T23 <400> 40 aaagttgaac aatagaaaaa tgg 23 <210> 41 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T24 <400> 41 ttactaaaac tttattttac tgg 23 <210> 42 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T26 <400> 42 tgcatttgtt tcaaaatatt ggg 23 <210> 43 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T27 <400> 43 tgggcaaggg aagaaaaaaa agg 23 <210> 44 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T28 <400> 44 tcctaggtaa aaaaaaaaaa agg 23 <210> 45 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 45 taattttctt ttgcccacta agg 23 <210> 46 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 46 tagtgcaatg gataggtctt agg 23 <210> 47 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 47 agtgcaatgg ataggtctta ggg 23 <210> 48 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 48 taaagcatag tgcaatggat agg 23 <210> 49 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 49 atttatgaga tcaacagcac agg 23 <210> 50 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 50 tgattcctac agaaaaagtc agg 23 <210> 51 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 51 aatgcataat ctaagtcaaa tgg 23 <210> 52 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 52 ttaaataaag catagtgcaa tgg 23 <210> 53 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 53 atttatgaga tcaacagcac agg 23 <210> 54 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 54 taataaaatt caaacatcct agg 23 <210> 55 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 55 attatcctga ctttttctgt agg 23 <210> 56 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 56 tactaaaact ttattttact tgg 23 <210> 57 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 57 tgaattattc ctctgtttaa agg 23 <210> 58 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 58 atgcatttgt ttcaaaatat tgg 23 <210> 59 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 59 tttggcattt atttctaaaa tgg 23 <210> 60 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 60 aaagttgaac aatagaaaaa tgg 23 <210> 61 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 61 tgcatttgtt tcaaaatatt ggg 23 <210> 62 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 62 taattttctt ttgcccacta agg 23 <210> 63 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 63 tagtgcaatg gataggtctt agg 23 <210> 64 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 64 agtgcaatgg ataggtctta ggg 23 <210> 65 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 65 taaagcatag tgcaatggat agg 23 <210> 66 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 66 atttatgaga tcaacagcac agg 23 <210> 67 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 67 tgattcctac agaaaaagtc agg 23 <210> 68 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 68 aatgcataat ctaagtcaaa tgg 23 <210> 69 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 69 ttaaataaag catagtgcaa tgg 23 <210> 70 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 70 atttatgaga tcaacagcac agg 23 <210> 71 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 71 taataaaatt caaacatcct agg 23 <210> 72 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 72 attatcctga ctttttctgt agg 23 <210> 73 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 73 tactaaaact ttattttact tgg 23 <210> 74 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 74 tgaattattc ctctgtttaa agg 23 <210> 75 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 75 atgcatttgt ttcaaaatat tgg 23 <210> 76 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 76 tttggcattt atttctaaaa tgg 23 <210> 77 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 77 aaagttgaac aatagaaaaa tgg 23 <210> 78 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 78 tgcatttgtt tcaaaatatt ggg 23 <210> 79 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 79 tggggaaggg gagaaaaaaa agg 23 <210> 80 <211> 23 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> Mouse albumin intron 1 gRNA sequence, mALbgRNA_T1 <400> 80 tgccagttcc cgatcgttac agg 23 <210> 81 <211> 4438 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> spCas9 mRNA <400> 81 ggaaataaga gagaaaagaa gagtaagaag aaatataaga gccaccatgg ccccaaagaa 60 gaagcggaag gtcggtatcc acggagtccc agcagccgac aagaagtaca gcatcggcct 120 ggacatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca aggtgcccag 180 caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga acctgatcgg 240 agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga gaaccgccag 300 aagaagatac accagacgga agaaccggat ctgctatctg caagagatct tcagcaacga 360 gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc tggtggaaga 420 ggacaagaag cacgagagac accccatctt cggcaacatc gtggacgagg tggcctacca 480 cgagaagtac cccaccatct accacctgag aaagaaactg gtggacagca ccgacaaggc 540 cgacctgaga ctgatctacc tggccctggc ccacatgatc aagttcagag gccacttcct 600 gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca tccagctggt 660 gcagacctac aaccagctgt tcgaggaaaa ccccatcaac gccagcggcg tggacgccaa 720 ggctatcctg tctgccagac tgagcaagag cagaaggctg gaaaatctga tcgcccagct 780 gcccggcgag aagaagaacg gcctgttcgg caacctgatt gccctgagcc tgggcctgac 840 ccccaacttc aagagcaact tcgacctggc cgaggatgcc aaactgcagc tgagcaagga 900 cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt acgccgacct 960 gttcctggcc gccaagaacc tgtctgacgc catcctgctg agcgacatcc tgagagtgaa 1020 caccgagatc accaaggccc ccctgagcgc ctctatgatc aagagatacg acgagcacca 1080 ccaggacctg accctgctga aagctctcgt gcggcagcag ctgcctgaga agtacaaaga 1140 aatcttcttc gaccagagca agaacggcta cgccggctac atcgatggcg gcgctagcca 1200 ggaagagttc tacaagttca tcaagcccat cctggaaaag atggacggca ccgaggaact 1260 gctcgtgaag ctgaacagag aggacctgct gagaaagcag agaaccttcg acaacggcag 1320 catcccccac cagatccacc tgggagagct gcacgctatc ctgagaaggc aggaagattt 1380 ttacccattc ctgaaggaca accgggaaaa gatcgagaag atcctgacct tcaggatccc 1440 ctactacgtg ggccccctgg ccagaggcaa cagcagattc gcctggatga ccagaaagag 1500 cgaggaaacc atcaccccct ggaacttcga ggaagtggtg gacaagggcg ccagcgccca 1560 gagcttcatc gagagaatga caaacttcga taagaacctg cccaacgaga aggtgctgcc 1620 caagcacagc ctgctgtacg agtacttcac cgtgtacaac gagctgacca aagtgaaata 1680 cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc gagcagaaaa aggccatcgt 1740 ggacctgctg ttcaagacca acagaaaagt gaccgtgaag cagctgaaag aggactactt 1800 caagaaaatc gagtgcttcg actccgtgga aatctccggc gtggaagata gattcaacgc 1860 ctccctgggc acataccacg atctgctgaa aattatcaag gacaaggact tcctggataa 1920 cgaagagaac gaggacattc tggaagatat cgtgctgacc ctgacactgt ttgaggaccg 1980 cgagatgatc gaggaaaggc tgaaaaccta cgctcacctg ttcgacgaca aagtgatgaa 2040 gcagctgaag agaaggcggt acaccggctg gggcaggctg agcagaaagc tgatcaacgg 2100 catcagagac aagcagagcg gcaagacaat cctggatttc ctgaagtccg acggcttcgc 2160 caaccggaac ttcatgcagc tgatccacga cgacagcctg acattcaaag aggacatcca 2220 gaaagcccag gtgtccggcc agggcgactc tctgcacgag catatcgcta acctggccgg 2280 cagccccgct atcaagaagg gcatcctgca gacagtgaag gtggtggacg agctcgtgaa 2340 agtgatgggc agacacaagc ccgagaacat cgtgatcgag atggctagag agaaccagac 2400 cacccagaag ggacagaaga actcccgcga gaggatgaag agaatcgaag agggcatcaa 2460 agagctgggc agccagatcc tgaaagaaca ccccgtggaa aacacccagc tgcagaacga 2520 gaagctgtac ctgtactacc tgcagaatgg ccgggatatg tacgtggacc aggaactgga 2580 catcaacaga ctgtccgact acgatgtgga ccatatcgtg cctcagagct ttctgaagga 2640 cgactccatc gataacaaag tgctgactcg gagcgacaag aacagaggca agagcgacaa 2700 cgtgccctcc gaagaggtcg tgaagaagat gaagaactac tggcgacagc tgctgaacgc 2760 caagctgatt acccagagga agttcgataa cctgaccaag gccgagagag gcggcctgag 2820 cgagctggat aaggccggct tcatcaagag gcagctggtg gaaaccagac agatcacaaa 2880 gcacgtggca cagatcctgg actcccggat gaacactaag tacgacgaaa acgataagct 2940 gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg gtgtccgatt tccggaagga 3000 tttccagttt tacaaagtgc gcgagatcaa caactaccac cacgcccacg acgcctacct 3060 gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct aagctggaaa gcgagttcgt 3120 gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg agcaggaaat 3180 cggcaaggct accgccaagt acttcttcta cagcaacatc atgaactttt tcaagaccga 3240 aatcaccctg gccaacggcg agatcagaaa gcgccctctg atcgagacaa acggcgaaac 3300 cggggagatc gtgtgggata agggcagaga cttcgccaca gtgcgaaagg tgctgagcat 3360 gccccaagtg aatatcgtga aaaagaccga ggtgcagaca ggcggcttca gcaaagagtc 3420 tatcctgccc aagaggaaca gcgacaagct gatcgccaga aagaaggact gggaccccaa 3480 gaagtacggc ggcttcgaca gccctaccgt ggcctactct gtgctggtgg tggctaaggt 3540 ggaaaagggc aagtccaaga aactgaagag tgtgaaagag ctgctgggga tcaccatcat 3600 ggaaagaagc agctttgaga agaaccctat cgactttctg gaagccaagg gctacaaaga 3660 agtgaaaaag gacctgatca tcaagctgcc taagtactcc ctgttcgagc tggaaaacgg 3720 cagaaagaga atgctggcct ctgccggcga actgcagaag ggaaacgagc tggccctgcc 3780 tagcaaatat gtgaacttcc tgtacctggc ctcccactat gagaagctga agggcagccc 3840 tgaggacaac gaacagaaac agctgtttgt ggaacagcat aagcactacc tggacgagat 3900 catcgagcag atcagcgagt tctccaagag agtgatcctg gccgacgcca atctggacaa 3960 ggtgctgtct gcctacaaca agcacaggga caagcctatc agagagcagg ccgagaatat 4020 catccacctg ttcaccctga caaacctggg cgctcctgcc gccttcaagt actttgacac 4080 caccatcgac cggaagaggt acaccagcac caaagaggtg ctggacgcca ccctgatcca 4140 ccagagcatc accggcctgt acgagacaag aatcgacctg tctcagctgg gaggcgacaa 4200 gagacctgcc gccactaaga aggccggaca ggccaaaaag aagaagtgag cggccgctta 4260 attaagctgc cttctgcggg gcttgccttc tggccatgcc cttcttctct cccttgcacc 4320 tgtacctctt ggtctttgaa taaagcctga gtaggaagaa aaaaaaaaaa aaaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4438 <210> 82 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Synthetic splice acceptor <400> 82 ctgacctctt ctcttcctcc cacag 25 <210> 83 <211> 42 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> Mouse albumin Intron 1 splice acceptor <400> 83 ctttaaatat gttgtgtggt ttttctctcc ctgtttccac ag 42 <210> 84 <211> 33 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> Mouse albumin Intron 2 splice acceptor <400> 84 cctcatactg aggtttttgt gtctgctttt cag 33 <210> 85 <211> 32 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human albumin Intron 1 splice acceptor <400> 85 ttaacaatcc ttttttttct tcccttgccc ag 32 <210> 86 <211> 34 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human albumin Intron 2 splice acceptor <400> 86 attatactac atttttctac atcctttgtt tcag 34 <210> 87 <211> 4402 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8A <400> 87 aattgctgac ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg 60 tcgaattgag ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt 120 ttcctcctcg ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc 180 tcttcgtgga gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg 240 gactcctcgg tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga 300 acatggcctc ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg 360 aaggggccga gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc 420 cgggtggttc gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg 480 atcccctgtg tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca 540 gcgggctgat tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc 600 agacactgca caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata 660 gcgagactaa gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta 720 agatgcatac tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc 780 ggaagtccgt gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt 840 tcttggaggg gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc 900 cgatcacttt cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct 960 gccacatttc gtcccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc 1020 cggaagaacc acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc 1080 ttaccgattc ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc 1140 aaattaggag cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg 1200 aagaggattg ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc 1260 aatacctgaa caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg 1320 cctacaccga cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg 1380 ggccgctgtt gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt 1440 ccagacccta caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga 1500 gactcccgaa gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca 1560 agtacaagtg gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca 1620 ctagatacta ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc 1680 ccctgctcat ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca 1740 aacgcaacgt catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga 1800 acatccagcg gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg 1860 catcaaacat tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt 1920 gcctccatga agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct 1980 ccgtgttctt ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc 2040 tcttcccctt ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt 2100 tggggtgcca caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct 2160 cctgtgacaa gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc 2220 tcctgtccaa gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca 2280 agcgccatca gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt 2340 acgacgacac tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg 2400 aaaatcagtc ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg 2460 agcggctctg ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat 2520 ccgggagcgt ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca 2580 cgcagccgtt gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca 2640 gagcagaggt cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt 2700 cattctactc gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga 2760 agaacttcgt caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg 2820 ccccgaccaa ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg 2880 aaaaggacgt gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca 2940 atcctgctca cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg 3000 acgaaactaa gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta 3060 acatccagat ggaggacccg acattcaagg agaactaccg gttccacgcc attaacggat 3120 acattatgga cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc 3180 ttctgtcgat ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca 3240 cagtgcgcaa gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg 3300 agactgtgga aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg 3360 aacatctgca tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc 3420 cactgggaat ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg 3480 gacaatgggc ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca 3540 ccaaggagcc gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa 3600 ttaagactca gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca 3660 tgtactcact ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga 3720 tggtgttctt cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta 3780 tcatcgcccg atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga 3840 tggaactcat gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg 3900 ctatctcgga cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt 3960 ccccgtccaa agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca 4020 acaacccgaa ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga 4080 ccacccaggg cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat 4140 caagccagga cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc 4200 agggaaatca agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc 4260 gctacttgcg cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc 4320 tgggctgtga agcgcaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt 4380 gtgttggttt tttgtgtgcc gc 4402 <210> 88 <211> 4502 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8B <400> 88 aattgaactt tgagtgtagc agagaggaac cattgccacc ttcagatttt aatgtctgac 60 ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg tcgaattgag 120 ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt ttcctcctcg 180 ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc tcttcgtgga 240 gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg gactcctcgg 300 tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga acatggcctc 360 ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg aaggggccga 420 gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc cgggtggttc 480 gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg atcccctgtg 540 tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca gcgggctgat 600 tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc agacactgca 660 caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata gcgagactaa 720 gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta agatgcatac 780 tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc ggaagtccgt 840 gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt tcttggaggg 900 gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc cgatcacttt 960 cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct gccacatttc 1020 gtcccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc cggaagaacc 1080 acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc ttaccgattc 1140 ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc aaattaggag 1200 cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg aagaggattg 1260 ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc aatacctgaa 1320 caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg cctacaccga 1380 cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg ggccgctgtt 1440 gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt ccagacccta 1500 caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga gactcccgaa 1560 gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca agtacaagtg 1620 gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca ctagatacta 1680 ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc ccctgctcat 1740 ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca aacgcaacgt 1800 catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga acatccagcg 1860 gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg catcaaacat 1920 tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt gcctccatga 1980 agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct ccgtgttctt 2040 ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc tcttcccctt 2100 ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt tggggtgcca 2160 caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct cctgtgacaa 2220 gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc tcctgtccaa 2280 gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca agcgccatca 2340 gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt acgacgacac 2400 tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg aaaatcagtc 2460 ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg agcggctctg 2520 ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat ccgggagcgt 2580 ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca cgcagccgtt 2640 gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca gagcagaggt 2700 cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt cattctactc 2760 gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga agaacttcgt 2820 caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg ccccgaccaa 2880 ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg aaaaggacgt 2940 gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca atcctgctca 3000 cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg acgaaactaa 3060 gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta acatccagat 3120 ggaggacccg acattcaagg agaactaccg gttccacgcc attaacggat acattatgga 3180 cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc ttctgtcgat 3240 ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca cagtgcgcaa 3300 gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg agactgtgga 3360 aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg aacatctgca 3420 tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc cactgggaat 3480 ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg gacaatgggc 3540 ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca ccaaggagcc 3600 gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa ttaagactca 3660 gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca tgtactcact 3720 ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga tggtgttctt 3780 cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta tcatcgcccg 3840 atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga tggaactcat 3900 gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg ctatctcgga 3960 cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt ccccgtccaa 4020 agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca acaacccgaa 4080 ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga ccacccaggg 4140 cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat caagccagga 4200 cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc agggaaatca 4260 agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc gctacttgcg 4320 cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc tgggctgtga 4380 agcgcaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt gtgttggttt 4440 tttgtgtgcg atcgggaact ggcatcttca gggagtagct taggtcagtg aagagaagcc 4500 gc 4502 <210> 89 <211> 4567 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8C <400> 89 gcggcctaag gcaattgtgc cagttcccga tcgttacagg aactttgagt gtagcagaga 60 ggaaccattg ccaccttcag attttaatgt ctgacctctt ctcttcctcc cacagtggcc 120 accagaagat actacctcgg agccgtcgaa ttgagctggg attacatgca atccgacctg 180 ggagaactgc ccgtggatgc caggtttcct cctcgggtcc ccaagtcctt cccgttcaac 240 acctcagtcg tctacaagaa aaccctcttc gtggagttca ccgaccatct gttcaacatc 300 gccaagccaa gacccccgtg gatgggactc ctcggtccga ccatccaagc cgaagtgtac 360 gacactgtgg tcattaccct gaagaacatg gcctcccatc ctgtgtccct gcatgcagtg 420 ggcgtgtcct actggaaggc ttccgaaggg gccgagtacg acgatcaaac cagccagcgg 480 gaaaaggagg atgacaaagt gttcccgggt ggttcgcaca cctacgtgtg gcaagtgctc 540 aaggagaacg gtcctatggc ctctgatccc ctgtgtctga cctactccta cctgtcccat 600 gtcgacctcg tgaaggatct gaacagcggg ctgattggcg ccctgctcgt gtgccgggaa 660 ggctccctgg ccaaggaaaa gacccagaca ctgcacaagt tcatcttgct gttcgccgtg 720 tttgatgagg gaaagtcctg gcatagcgag actaagaact cccttatgca agaccgggat 780 gctgcctccg ctagggcttg gcctaagatg catactgtga acggatacgt gaacagatcc 840 ctgcctggcc ttatcggttg ccaccggaag tccgtgtatt ggcatgtgat cggcatggga 900 accactccag aggtgcactc cattttcttg gaggggcata ccttcttggt gcgcaaccac 960 agacaggcct ccctggaaat ttctccgatc actttcctga ctgcccagac cctccttatg 1020 gacctgggtc agttcctgct gttctgccac atttcgtccc accaacacga tggcatggaa 1080 gcctacgtga aagtggactc gtgcccggaa gaaccacagc tgcggatgaa gaacaacgaa 1140 gaggcagagg actacgatga tgatcttacc gattcggaaa tggatgtggt ccgattcgac 1200 gacgataata gcccatcctt catccaaatt aggagcgtgg ccaagaagca ccccaaaact 1260 tgggtgcatt acattgcggc cgaggaagag gattgggact acgcacccct cgtgcttgca 1320 cccgatgatc ggtcctacaa gtcccaatac ctgaacaacg gcccgcagag gatcggtcgg 1380 aagtataaga aagtgcgctt catggcctac accgacgaga ctttcaagac cagagaggcc 1440 attcagcacg aaagcggcat tctggggccg ctgttgtacg gggaggtcgg agatacactg 1500 ctcatcattt tcaagaacca ggcgtccaga ccctacaaca tctacccgca cggaatcact 1560 gacgtccgcc ccctgtactc ccggagactc ccgaagggag tcaagcactt gaaagacttc 1620 cccatcctgc ctggggaaat cttcaagtac aagtggaccg tgaccgtcga ggatgggccg 1680 accaagtccg atccaagatg cctcactaga tactactcat ccttcgtcaa catggaacgg 1740 gacctggcct caggactgat tggccccctg ctcatctgct acaaggagtc cgtggatcag 1800 cgcggaaacc agatcatgtc ggacaaacgc aacgtcatcc tcttctccgt ctttgacgag 1860 aaccgctcat ggtaccttac ggagaacatc cagcggttcc tccccaaccc tgccggagtg 1920 cagctcgagg acccggaatt ccaggcatca aacattatgc actccatcaa cggttacgtg 1980 ttcgacagcc tccagcttag cgtgtgcctc catgaagtcg catattggta catcctgtcc 2040 attggagcac aaaccgactt tctctccgtg ttcttctccg gatatacctt caagcacaag 2100 atggtgtacg aggataccct gaccctcttc cccttctccg gagagactgt gtttatgtcg 2160 atggaaaacc caggcctgtg gattttgggg tgccacaact cggatttccg aaaccggggc 2220 atgactgcct tgctcaaggt gtcctcctgt gacaagaaca cgggagacta ctacgaggac 2280 tcctacgagg atatttccgc ctacctcctg tccaagaaca acgccatcga acccaggtcc 2340 ttcagccaga accctcctgt cctcaagcgc catcagagag aaatcacccg cacgaccctg 2400 cagtccgacc aggaagagat cgattacgac gacactatct ccgtcgaaat gaagaaggag 2460 gactttgaca tctacgacga agatgaaaat cagtcccctc gctcgttcca aaagaaaacg 2520 agacactact tcatcgctgc tgtggagcgg ctctgggact acggcatgtc ctcatcgccc 2580 cacgtgctta ggaaccgggc tcaatccggg agcgtccctc agttcaagaa agtggtgttt 2640 caagaattca ccgatggaag cttcacgcag ccgttgtaca ggggcgaact gaacgagcac 2700 cttggcctgc tgggacctta catcagagca gaggtcgagg acaacatcat ggtgaccttc 2760 cggaaccaag cctcccggcc atattcattc tactcgagcc ttatctcata cgaggaggat 2820 cagagacagg gggctgaacc tcggaagaac ttcgtcaagc cgaacgagac aaagacctac 2880 ttttggaagg tgcagcacca catggccccg accaaggatg agttcgactg caaggcctgg 2940 gcgtacttct ccgacgtgga tctcgaaaag gacgtgcatt ccgggctgat cggaccgctg 3000 ctcgtctgcc acactaacac cctcaatcct gctcacggca gacaagtgac cgtgcaggag 3060 ttcgccctgt tcttcaccat cttcgacgaa actaagtcat ggtactttac cgagaacatg 3120 gagcggaatt gtcgggcccc atgtaacatc cagatggagg acccgacatt caaggagaac 3180 taccggttcc acgccattaa cggatacatt atggacactc ttccgggact cgtgatggca 3240 caggaccaac gcatcagatg gtatcttctg tcgatgggga gcaacgaaaa catccattcg 3300 atccacttta gcggtcacgt gttcacagtg cgcaagaagg aagagtacaa gatggcgctg 3360 tacaacctgt accctggggt gttcgagact gtggaaatgc tgccgtccaa ggccggaatt 3420 tggcgcgtgg aatgtctgat cggtgaacat ctgcatgccg gaatgtccac cctgttcctg 3480 gtgtactcca acaagtgcca aaccccactg ggaatggcat caggacacat tagagacttc 3540 cagattaccg cgagcggaca gtacggacaa tgggccccca agttggccag gctgcactac 3600 tctggaagca ttaacgcctg gagcaccaag gagccgttca gctggatcaa ggtggacctt 3660 ctggcgccaa tgatcatcca cggaattaag actcagggag cccgccagaa gttctcatcg 3720 ctctacatct cccagtttat catcatgtac tcactggatg ggaagaagtg gcagacttac 3780 cggggaaatt ccaccggtac tctgatggtg ttcttcggaa acgtggacag ctccggcatc 3840 aagcacaata tctttaaccc gcctatcatc gcccgataca tccggctcca cccgactcac 3900 tactccatcc ggtcgactct gcggatggaa ctcatgggtt gcgacctcaa ctcctgctca 3960 atgccactgg gcatggagtc caaggctatc tcggacgctc agattactgc atcgtcgtac 4020 tttaccaaca tgttcgctac ctggtccccg tccaaagccc ggctgcatct ccaaggcaga 4080 tcaaacgcgt ggaggcctca ggtcaacaac ccgaaggaat ggcttcaggt cgacttccaa 4140 aagaccatga aagtcaccgg agtgaccacc cagggcgtga aatcgctgct gacctctatg 4200 tacgtgaagg aattcctgat ctcatcaagc caggacggcc accagtggac actgttcttc 4260 caaaatggaa aggtcaaggt ctttcaggga aatcaagact ccttcacccc cgtggtgaac 4320 tccctggacc cccctctgct tacccgctac ttgcgcattc atccgcaatc ctgggtgcac 4380 cagatcgccc tgcgaatgga agtgctgggc tgtgaagcgc aggacctgta ctaaaataaa 4440 agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgcgatcgg gaactggcat 4500 cttcagggag tagcttaggt cagtgaagag aagtgccagt tcccgatcgt tacaggccgc 4560 gggccgc 4567 <210> 90 <211> 4567 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8D <400> 90 gcggcctaag gcaattgtgc cagttcccga tcgttacagg aactttgagt gtagcagaga 60 ggaaccattg ccaccttcag attttaatgt ctgacctctt ctcttcctcc cacagtggcc 120 accagaaggt actacctagg agccgtggaa ctgagctggg actacatgca gtctgacctg 180 ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac 240 acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc 300 gccaagccta gacctccttg gatgggcctg ctgggcccta caattcaggc cgaggtgtac 360 gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg 420 ggagtgtctt actggaaggc ttctgagggc gccgagtacg acgaccagac aagccagaga 480 gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg 540 aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccat 600 gtggacctgg tcaaggacct gaactctggc ctgatcggcg ctctgctcgt gtgtagagaa 660 ggcagcctgg ccaaagaaaa gacccagaca ctgcacaagt tcatcctgct gttcgccgtg 720 ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagagat 780 gccgcctctg ctagagcttg gcccaagatg cacaccgtga acggctacgt gaacagaagc 840 ctgcctggac tgatcggatg ccacagaaag tccgtgtact ggcatgtgat cggcatgggc 900 accacacctg aggtgcacag catctttctg gaaggacaca ccttcctcgt gcggaaccac 960 agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg 1020 gatctgggcc agtttctgct gttctgccac atcagcagcc accagcacga tggcatggaa 1080 gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgagaatgaa gaacaacgag 1140 gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac 1200 gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc 1260 tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc 1320 cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagag aatcggccgg 1380 aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggct 1440 atccagcacg agagcggcat tctgggacct ctgctgtatg gcgaagtggg cgacacactg 1500 ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc 1560 gatgtgcggc ctctgtactc tagaaggctg cccaagggcg tgaagcacct gaaggacttc 1620 cctatcctgc ctggcgagat cttcaagtac aagtggaccg tgaccgtcga ggacggccct 1680 accaagagcg atcctagatg cctgacacgg tactacagca gcttcgtgaa catggaacgc 1740 gacctggcca gcggcctgat tggtcctctg ctgatctgct acaaagaaag cgtggaccag 1800 aggggcaacc agatcatgag cgacaagaga aacgtgatcc tgttctccgt ctttgacgag 1860 aacaggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgctggcgtg 1920 cagctggaag atcctgagtt ccaggcctcc aacatcatgc actccatcaa cggctatgtg 1980 ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgtct 2040 atcggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag 2100 atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc 2160 atggaaaacc ccggcctgtg gatcctgggc tgtcacaaca gcgacttcag aaacagaggc 2220 atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac 2280 tcttacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc 2340 ttctctcaga accctcctgt gctgaagaga caccagcgcg agatcaccag aaccacactg 2400 cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa 2460 gatttcgaca tctacgacga ggacgagaat cagagcccca gatctttcca gaagaaaacg 2520 cggcactact tcattgccgc cgtggaaaga ctgtgggact acggcatgag cagcagccca 2580 catgtgctga gaaacagggc ccagagcgga agcgtgcccc agttcaagaa agtggtgttc 2640 caagagttca ccgacggcag cttcacccag cctctgtata gaggcgagct gaacgagcac 2700 ctgggactgc tgggacctta catcagagct gaggtcgagg ataacatcat ggtcaccttt 2760 agaaaccagg cctctaggcc ctactccttc tacagctccc tgatcagcta cgaagaggac 2820 cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac 2880 ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaggcctgg 2940 gcctacttct ctgacgtgga cctcgagaag gatgtgcaca gcggactcat cggacccctg 3000 cttgtgtgcc acaccaacac actgaatccc gctcacggca ggcaagtgac cgtgcaagag 3060 ttcgccctgt tcttcaccat cttcgatgag acaaagtcct ggtacttcac cgaaaacatg 3120 gaaagaaact gcagggcccc ttgcaacatc cagatggaag atcccacctt caaagagaac 3180 taccggttcc acgccatcaa tggctacatc atggacactc tgcccggcct ggttatggca 3240 caggatcaga ggatcagatg gtatctgctg tccatgggct ccaacgagaa tatccacagc 3300 atccacttca gcggccatgt gttcaccgtg cggaaaaaag aagagtacaa gatggccctg 3360 tacaatctgt accccggcgt gttcgagact gtggaaatgc tgcctagcaa ggccggaatc 3420 tggcgcgtgg aatgtctgat cggagagcat ctgcatgccg gaatgtctac cctgttcctg 3480 gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc 3540 cagatcaccg cctctggcca gtacggacag tgggctccta aactggctag actgcactac 3600 agcggcagca tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg 3660 ctggctccca tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc 3720 ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3780 agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt 3840 aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac 3900 tacagcatca gatctaccct gaggatggaa ctgatgggct gcgacctgaa cagctgctct 3960 atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac 4020 ttcaccaaca tgttcgccac atggtcccca tctaaggccc ggctgcatct gcagggcaga 4080 tctaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt cgactttcag 4140 aaaaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg 4200 tacgtgaaag agttcctgat ctccagcagc caggacggcc accagtggac cctgtttttc 4260 cagaacggca aagtcaaggt gttccaggga aaccaggaca gcttcacacc cgtggtcaac 4320 tccctggatc ctccactgct gaccagatac ctgagaattc accctcagtc ttgggtgcac 4380 cagatcgctc tgagaatgga agtgctggga tgtgaagctc aggacctcta ctaaaataaa 4440 agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgcgatcgg gaactggcat 4500 cttcagggag tagcttaggt cagtgaagag aagtgccagt tcccgatcgt tacaggccgc 4560 gggccgc 4567 <210> 91 <211> 4402 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8E <400> 91 aattgctgac ctcttctctt cctcccacag tggccaccag aagatactac ctgggagctg 60 tggaattgag ctgggattac atgcaatctg acctgggaga actgcctgtg gatgccaggt 120 ttcctcctag ggtccccaag tccttcccat tcaacacctc agtggtctac aagaaaaccc 180 tctttgtgga gttcacagac catctgttca acattgccaa gccaagaccc ccatggatgg 240 gactcctggg tccaaccatc caagctgaag tgtatgacac tgtggtcatt accctgaaga 300 acatggcctc ccatcctgtg tccctgcatg cagtgggagt gtcctactgg aaggcttctg 360 aaggggctga gtatgatgat caaaccagcc agagagaaaa ggaggatgac aaagtgttcc 420 caggtggtag tcacacctat gtgtggcaag tgctcaagga gaatggtcct atggcctctg 480 atcccctgtg tctgacctac tcctacctgt cccatgtgga cctggtgaag gatctgaact 540 ctgggctgat tggagccctg ctggtgtgca gagaaggctc cctggccaag gaaaagaccc 600 agacactgca caagttcatc ttgctgtttg ctgtgtttga tgagggaaag tcctggcatt 660 ctgagactaa gaactccctt atgcaagaca gagatgctgc ctcagctagg gcttggccta 720 agatgcatac tgtgaatgga tatgtgaaca gatccctgcc tggccttatt ggttgccaca 780 ggaagtctgt gtattggcat gtgattggca tgggaaccac tccagaggtg cactccattt 840 tcttggaggg gcataccttc ttggtgagga accacagaca ggcctccctg gaaatttctc 900 caatcacttt cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct 960 gccacatttc atcccaccaa catgatggca tggaagccta tgtgaaagtg gactcatgcc 1020 cagaagaacc acagctgaga atgaagaaca atgaagaggc agaggactat gatgatgatc 1080 ttacagattc agaaatggat gtggtcagat ttgatgatga taatagccca tccttcatcc 1140 aaattaggag tgtggccaag aagcacccca aaacttgggt gcattacatt gcagctgagg 1200 aagaggattg ggactatgca cccttggtgc ttgcaccaga tgataggtcc tacaagtccc 1260 aatacctgaa caatggccca cagaggattg gtagaaagta taagaaagtg agattcatgg 1320 cctacacaga tgagactttc aagaccagag aggccattca gcatgaatct ggcattctgg 1380 ggccactgtt gtatggggag gttggagata cactgctcat cattttcaag aaccaggcct 1440 ccagacccta caacatctac cctcatggaa tcactgatgt cagacccctg tactccagaa 1500 gactcccaaa gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca 1560 agtacaagtg gacagtgaca gtggaggatg ggccaaccaa gtctgatcca agatgcctca 1620 ctagatacta ctcatccttt gtcaacatgg aaagagacct ggcctcagga ctgattggcc 1680 ccctgctcat ctgctacaag gagtctgtgg atcagagagg aaaccagatc atgtctgaca 1740 aaaggaatgt catcctcttc tctgtctttg atgagaacag atcatggtac cttacagaga 1800 acatccagag gttcctcccc aaccctgctg gagtgcagct ggaggaccca gaattccagg 1860 catcaaacat tatgcactcc atcaatggtt atgtgtttga cagcctccag ctttctgtgt 1920 gcctccatga agtggcatat tggtacatcc tgtccattgg agcacaaaca gactttctct 1980 ctgtgttctt ctctggatat accttcaagc acaagatggt gtatgaggat accctgaccc 2040 tcttcccctt ctctggagag actgtgttta tgtcaatgga aaacccaggc ctgtggattt 2100 tggggtgcca caactcagat ttcagaaaca ggggcatgac tgccttgctc aaggtgtcct 2160 cctgtgacaa gaacacagga gactactatg aggactccta tgaggatatt tctgcctacc 2220 tcctgtccaa gaacaatgcc attgaaccca ggtccttcag ccagaaccct cctgtcctca 2280 agaggcatca gagagaaatc accagaacta ccctgcagtc tgaccaggaa gagattgatt 2340 atgatgacac tatctcagtg gaaatgaaga aggaggactt tgacatctat gatgaagatg 2400 aaaatcagtc ccctaggtcc ttccaaaaga aaacaagaca ctacttcatt gctgctgtgg 2460 agagactctg ggactatggc atgtcctcat caccccatgt gcttaggaac agggctcaat 2520 ctgggtctgt ccctcagttc aagaaagtgg tgtttcaaga attcacagat ggaagcttca 2580 cacagccatt gtacagggga gaactgaatg agcaccttgg cctgctggga ccttacatca 2640 gagcagaggt ggaggacaac atcatggtga ccttcagaaa ccaagcctcc aggccatatt 2700 cattctactc cagccttatc tcatatgagg aggatcagag acagggggct gaacctagga 2760 agaactttgt caagccaaat gagacaaaga cctacttttg gaaggtgcag caccacatgg 2820 cccctaccaa ggatgagttt gactgcaagg cctgggctta cttctctgat gtggatctgg 2880 aaaaggatgt gcattctggg ctgattggac ctctgctggt ctgccacact aacaccctca 2940 atcctgctca tggcagacaa gtgacagtgc aggagtttgc cctgttcttc accatctttg 3000 atgaaactaa gtcatggtac tttacagaga acatggagag aaattgtagg gccccatgta 3060 acatccagat ggaggaccca acattcaagg agaactacag attccatgcc attaatggat 3120 acattatgga cactcttcca ggactggtga tggcacagga ccaaagaatc agatggtatc 3180 ttctgagcat ggggagcaat gaaaacatcc attccatcca cttttcaggt catgtgttca 3240 cagtgaggaa gaaggaagag tacaagatgg ctctgtacaa cctgtaccct ggggtgtttg 3300 agactgtgga aatgctgcca tccaaggctg gaatttggag ggtggaatgt ctgattggtg 3360 aacatctgca tgctggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc 3420 cactgggaat ggcatcagga cacattagag acttccagat tacagcatct ggacagtatg 3480 gacaatgggc ccccaagttg gccaggctgc actactctgg aagcattaat gcctggagca 3540 ccaaggagcc attcagctgg atcaaggtgg accttctggc tccaatgatc atccatggaa 3600 ttaagactca gggagccaga cagaagttct catccctcta catctcccag tttatcatca 3660 tgtactcact ggatgggaag aagtggcaga cttacagggg aaattccaca ggtactctga 3720 tggtgttctt tggaaatgtg gacagctctg gcatcaagca caatatcttt aaccctccta 3780 tcattgccag gtacatcaga ctccacccaa ctcactactc catcaggtcc actctgagga 3840 tggaactcat gggttgtgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg 3900 ctatctcaga tgctcagatt actgcatcct cttactttac caacatgttt gctacctggt 3960 ccccctccaa agccagactg catctccaag gcagatcaaa tgcctggagg cctcaggtca 4020 acaacccaaa ggaatggctt caggtggact tccaaaagac catgaaagtc acaggagtga 4080 ccacccaggg agtgaaatcc ctgctgacct ctatgtatgt gaaggaattc ctgatctcat 4140 caagccagga tggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc 4200 agggaaatca agactccttc acccctgtgg tgaactccct ggacccccct ctgcttacca 4260 ggtacttgag aattcatcca caatcctggg tgcaccagat tgccctgagg atggaagtgc 4320 tgggctgtga agcccaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt 4380 gtgttggttt tttgtgtgcc gc 4402 <210> 92 <211> 4419 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8F (GA co/CpG free) <400> 92 gctagccaat tgctgacctc ttctcttcct cccacagtgg ccaccagaag gtactacctg 60 ggagctgtgg aactgagctg ggactacatg cagtctgacc tgggagagct gcctgtggat 120 gctagatttc ctccaagagt gcccaagagc ttccccttca acacctctgt ggtgtacaag 180 aaaaccctgt ttgtggaatt cacagaccac ctgttcaata ttgccaagcc tagacctcct 240 tggatgggcc tgctgggccc tacaattcag gctgaggtgt atgacacagt ggtcatcacc 300 ctgaagaaca tggccagcca tcctgtgtct ctgcatgctg tgggagtgtc ttactggaag 360 gcttctgagg gggctgagta tgatgaccag acaagccaga gagagaaaga ggatgacaag 420 gttttccctg ggggcagcca cacctatgtc tggcaggtcc tgaaagaaaa tggccctatg 480 gcctctgatc ctctgtgcct gacatacagc tacctgagcc atgtggacct ggtcaaggac 540 ctgaactctg gcctgattgg ggctctgctg gtgtgtagag aaggcagcct ggccaaagaa 600 aagacccaga cactgcacaa gttcatcctg ctgtttgctg tgtttgatga gggcaagagc 660 tggcactctg agacaaagaa cagcctgatg caggacagag atgctgcctc tgctagagct 720 tggcccaaga tgcacacagt gaatggctat gtgaacagaa gcctgcctgg actgattgga 780 tgccacagaa agtctgtgta ctggcatgtg attggcatgg gcaccacacc tgaggtgcac 840 agcatctttc tggaaggaca caccttcctg gtgaggaacc acagacaggc cagcctggaa 900 atcagcccta tcaccttcct gacagctcag accctgctga tggatctggg ccagtttctg 960 ctgttctgcc acatcagcag ccaccagcat gatggcatgg aagcctatgt gaaggtggac 1020 agctgccctg aagaacccca gctgagaatg aagaacaatg aggaagctga ggactatgat 1080 gatgacctga cagactctga gatggatgtg gtcagatttg atgatgataa cagccccagc 1140 ttcatccaga tcagatctgt ggccaagaag caccccaaga cctgggtgca ctatattgct 1200 gctgaggaag aggactggga ttatgctcct ctggtgctgg cccctgatga cagaagctac 1260 aagagccagt acctgaacaa tggccctcag agaattggca ggaagtataa gaaagtgagg 1320 ttcatggcct acacagatga gacattcaag accagagagg ctatccagca tgagtctggc 1380 attctgggac ctctgctgta tggggaagtg ggggacacac tgctgatcat cttcaagaac 1440 caggccagca gaccctacaa catctaccct catggcatca cagatgtgag gcctctgtac 1500 tctagaaggc tgcccaaggg ggtgaagcac ctgaaggact tccctatcct gcctggggag 1560 atcttcaagt acaagtggac agtgacagtg gaggatggcc ctaccaagtc tgatcctaga 1620 tgcctgacaa ggtactacag cagctttgtg aacatggaaa gggacctggc ctctggcctg 1680 attggtcctc tgctgatctg ctacaaagaa tctgtggacc agaggggcaa ccagatcatg 1740 agtgacaaga gaaatgtgat cctgttctct gtctttgatg agaacaggtc ctggtatctg 1800 acagagaaca tccagaggtt tctgcccaat cctgctgggg tgcagctgga agatcctgag 1860 ttccaggcct ccaacatcat gcactccatc aatggctatg tgtttgacag cctgcagctg 1920 tctgtgtgcc tgcatgaagt ggcctactgg tacatcctgt ctattggggc ccagacagac 1980 ttcctgtctg tgttcttttc tggctacacc ttcaagcaca agatggtgta tgaggatacc 2040 ctgacactgt tcccattctc tggggagaca gtgttcatga gcatggaaaa ccctggcctg 2100 tggatcctgg gctgtcacaa cagtgacttc agaaacagag gcatgacagc cctgctgaag 2160 gtgtccagct gtgacaagaa cactggggac tactatgagg actcttatga ggacatctct 2220 gcctacctgc tgagcaagaa caatgccatt gagcctagga gcttctctca gaaccctcct 2280 gtgctgaaga gacaccagag ggagatcacc agaaccacac tgcagtctga ccaagaggaa 2340 attgattatg atgacaccat ctctgtggag atgaagaaag aagattttga catctatgat 2400 gaggatgaga atcagagccc cagatctttc cagaagaaaa caaggcacta cttcattgct 2460 gctgtggaaa gactgtggga ctatggcatg agcagcagcc cccatgtgct gagaaacagg 2520 gcccagtctg gaagtgtgcc ccagttcaag aaagtggtgt tccaagagtt cacagatggc 2580 agcttcaccc agcctctgta tagaggggag ctgaatgagc acctgggact gctgggacct 2640 tacatcagag ctgaggtgga ggataacatc atggtcacct ttagaaacca ggcctctagg 2700 ccctactcct tctacagctc cctgatcagc tatgaagagg accagagaca gggggctgag 2760 cccagaaaga actttgtgaa gcccaatgag actaagacct acttttggaa ggtgcagcac 2820 cacatggccc ctacaaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg 2880 gacctggaga aggatgtgca ctctggactc attggacccc tgcttgtgtg ccacaccaac 2940 acactgaatc ctgctcatgg caggcaagtg acagtgcaag agtttgccct gttcttcacc 3000 atctttgatg agacaaagtc ctggtacttc acagaaaaca tggaaagaaa ctgcagggcc 3060 ccttgcaaca tccagatgga agatcccacc ttcaaagaga actacaggtt ccatgccatc 3120 aatggctaca tcatggacac tctgcctggc ctggttatgg cacaggatca gaggatcaga 3180 tggtatctgc tgtccatggg ctccaatgag aatatccaca gcatccactt ctctggccat 3240 gtgttcacag tgaggaaaaa agaagagtac aagatggccc tgtacaatct gtaccctggg 3300 gtgtttgaga ctgtggaaat gctgcctagc aaggctggaa tctggagggt ggaatgtctg 3360 attggagagc atctgcatgc tggaatgtct accctgttcc tggtgtacag caacaagtgt 3420 cagacccctc tgggcatggc ctctggacac atcagagact tccagatcac agcctctggc 3480 cagtatggac agtgggctcc taaactggct agactgcact actctggcag catcaatgcc 3540 tggtccacca aagagccctt cagctggatc aaggtggacc tgctggctcc catgatcatc 3600 catggaatca agacccaggg ggccagacag aagttcagca gcctgtacat cagccagttc 3660 atcatcatgt acagcctgga tggcaagaag tggcagacct acagaggcaa cagcacaggc 3720 acactcatgg tgttctttgg caatgtggac tcttctggca ttaagcacaa catcttcaac 3780 cctccaatca ttgccaggta catcaggctg caccccacac actacagcat cagatctacc 3840 ctgaggatgg aactgatggg ctgtgacctg aacagctgct ctatgcccct gggaatggaa 3900 agcaaggcca tctctgatgc ccagatcaca gccagcagct acttcaccaa catgtttgcc 3960 acatggtccc catctaaggc caggctgcat ctgcagggca gatctaatgc ttggaggccc 4020 caagtgaaca accccaaaga gtggctgcag gtggactttc agaaaaccat gaaagtgaca 4080 ggagtgacca cacagggggt caagtctctg ctgacctcta tgtatgtgaa agagttcctg 4140 atctccagca gccaggatgg ccaccagtgg accctgtttt tccagaatgg caaagtcaag 4200 gtgttccagg gaaaccagga cagcttcaca cctgtggtca actccctgga tcctccactg 4260 ctgaccagat acctgagaat tcaccctcag tcttgggtgc accagattgc tctgagaatg 4320 gaagtgctgg gatgtgaagc tcaggacctc tactaaaata aaagatcttt attttcatta 4380 gatctgtgtg ttggtttttt gtgtgccgcg ggtttaaac 4419 <210> 93 <211> 4314 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> F8-BDD1, codon optimized <400> 93 gccaccagaa gatactacct cggagccgtc gaattgagct gggattacat gcaatccgac 60 ctgggagaac tgcccgtgga tgccaggttt cctcctcggg tccccaagtc cttcccgttc 120 aacacctcag tcgtctacaa gaaaaccctc ttcgtggagt tcaccgacca tctgttcaac 180 atcgccaagc caagaccccc gtggatggga ctcctcggtc cgaccatcca agccgaagtg 240 tacgacactg tggtcattac cctgaagaac atggcctccc atcctgtgtc cctgcatgca 300 gtgggcgtgt cctactggaa ggcttccgaa ggggccgagt acgacgatca aaccagccag 360 cgggaaaagg aggatgacaa agtgttcccg ggtggttcgc acacctacgt gtggcaagtg 420 ctcaaggaga acggtcctat ggcctctgat cccctgtgtc tgacctactc ctacctgtcc 480 catgtcgacc tcgtgaagga tctgaacagc gggctgattg gcgccctgct cgtgtgccgg 540 gaaggctccc tggccaagga aaagacccag acactgcaca agttcatctt gctgttcgcc 600 gtgtttgatg agggaaagtc ctggcatagc gagactaaga actcccttat gcaagaccgg 660 gatgctgcct ccgctagggc ttggcctaag atgcatactg tgaacggata cgtgaacaga 720 tccctgcctg gccttatcgg ttgccaccgg aagtccgtgt attggcatgt gatcggcatg 780 ggaaccactc cagaggtgca ctccattttc ttggaggggc ataccttctt ggtgcgcaac 840 cacagacagg cctccctgga aatttctccg atcactttcc tgactgccca gaccctcctt 900 atggacctgg gtcagttcct gctgttctgc cacatttcgt cccaccaaca cgatggcatg 960 gaagcctacg tgaaagtgga ctcgtgcccg gaagaaccac agctgcggat gaagaacaac 1020 gaagaggcag aggactacga tgatgatctt accgattcgg aaatggatgt ggtccgattc 1080 gacgacgata atagcccatc cttcatccaa attaggagcg tggccaagaa gcaccccaaa 1140 acttgggtgc attacattgc ggccgaggaa gaggattggg actacgcacc cctcgtgctt 1200 gcacccgatg atcggtccta caagtcccaa tacctgaaca acggcccgca gaggatcggt 1260 cggaagtata agaaagtgcg cttcatggcc tacaccgacg agactttcaa gaccagagag 1320 gccattcagc acgaaagcgg cattctgggg ccgctgttgt acggggaggt cggagataca 1380 ctgctcatca ttttcaagaa ccaggcgtcc agaccctaca acatctaccc gcacggaatc 1440 actgacgtcc gccccctgta ctcccggaga ctcccgaagg gagtcaagca cttgaaagac 1500 ttccccatcc tgcctgggga aatcttcaag tacaagtgga ccgtgaccgt cgaggatggg 1560 ccgaccaagt ccgatccaag atgcctcact agatactact catccttcgt caacatggaa 1620 cgggacctgg cctcaggact gattggcccc ctgctcatct gctacaagga gtccgtggat 1680 cagcgcggaa accagatcat gtcggacaaa cgcaacgtca tcctcttctc cgtctttgac 1740 gagaaccgct catggtacct tacggagaac atccagcggt tcctccccaa ccctgccgga 1800 gtgcagctcg aggacccgga attccaggca tcaaacatta tgcactccat caacggttac 1860 gtgttcgaca gcctccagct tagcgtgtgc ctccatgaag tcgcatattg gtacatcctg 1920 tccattggag cacaaaccga ctttctctcc gtgttcttct ccggatatac cttcaagcac 1980 aagatggtgt acgaggatac cctgaccctc ttccccttct ccggagagac tgtgtttatg 2040 tcgatggaaa acccaggcct gtggattttg gggtgccaca actcggattt ccgaaaccgg 2100 ggcatgactg ccttgctcaa ggtgtcctcc tgtgacaaga acacgggaga ctactacgag 2160 gactcctacg aggatatttc cgcctacctc ctgtccaaga acaacgccat cgaacccagg 2220 tccttcagcc agaaccctcc tgtcctcaag cgccatcaga gagaaatcac ccgcacgacc 2280 ctgcagtccg accaggaaga gatcgattac gacgacacta tctccgtcga aatgaagaag 2340 gaggactttg acatctacga cgaagatgaa aatcagtccc ctcgctcgtt ccaaaagaaa 2400 acgagacact acttcatcgc tgctgtggag cggctctggg actacggcat gtcctcatcg 2460 ccccacgtgc ttaggaaccg ggctcaatcc gggagcgtcc ctcagttcaa gaaagtggtg 2520 tttcaagaat tcaccgatgg aagcttcacg cagccgttgt acaggggcga actgaacgag 2580 caccttggcc tgctgggacc ttacatcaga gcagaggtcg aggacaacat catggtgacc 2640 ttccggaacc aagcctcccg gccatattca ttctactcga gccttatctc atacgaggag 2700 gatcagagac agggggctga acctcggaag aacttcgtca agccgaacga gacaaagacc 2760 tacttttgga aggtgcagca ccacatggcc ccgaccaagg atgagttcga ctgcaaggcc 2820 tgggcgtact tctccgacgt ggatctcgaa aaggacgtgc attccgggct gatcggaccg 2880 ctgctcgtct gccacactaa caccctcaat cctgctcacg gcagacaagt gaccgtgcag 2940 gagttcgccc tgttcttcac catcttcgac gaaactaagt catggtactt taccgagaac 3000 atggagcgga attgtcgggc cccatgtaac atccagatgg aggacccgac attcaaggag 3060 aactaccggt tccacgccat taacggatac attatggaca ctcttccggg actcgtgatg 3120 gcacaggacc aacgcatcag atggtatctt ctgtcgatgg ggagcaacga aaacatccat 3180 tcgatccact ttagcggtca cgtgttcaca gtgcgcaaga aggaagagta caagatggcg 3240 ctgtacaacc tgtaccctgg ggtgttcgag actgtggaaa tgctgccgtc caaggccgga 3300 atttggcgcg tggaatgtct gatcggtgaa catctgcatg ccggaatgtc caccctgttc 3360 ctggtgtact ccaacaagtg ccaaacccca ctgggaatgg catcaggaca cattagagac 3420 ttccagatta ccgcgagcgg acagtacgga caatgggccc ccaagttggc caggctgcac 3480 tactctggaa gcattaacgc ctggagcacc aaggagccgt tcagctggat caaggtggac 3540 cttctggcgc caatgatcat ccacggaatt aagactcagg gagcccgcca gaagttctca 3600 tcgctctaca tctcccagtt tatcatcatg tactcactgg atgggaagaa gtggcagact 3660 taccggggaa attccaccgg tactctgatg gtgttcttcg gaaacgtgga cagctccggc 3720 atcaagcaca atatctttaa cccgcctatc atcgcccgat acatccggct ccacccgact 3780 cactactcca tccggtcgac tctgcggatg gaactcatgg gttgcgacct caactcctgc 3840 tcaatgccac tgggcatgga gtccaaggct atctcggacg ctcagattac tgcatcgtcg 3900 tactttacca acatgttcgc tacctggtcc ccgtccaaag cccggctgca tctccaaggc 3960 agatcaaacg cgtggaggcc tcaggtcaac aacccgaagg aatggcttca ggtcgacttc 4020 caaaagacca tgaaagtcac cggagtgacc acccagggcg tgaaatcgct gctgacctct 4080 atgtacgtga aggaattcct gatctcatca agccaggacg gccaccagtg gacactgttc 4140 ttccaaaatg gaaaggtcaa ggtctttcag ggaaatcaag actccttcac ccccgtggtg 4200 aactccctgg acccccctct gcttacccgc tacttgcgca ttcatccgca atcctgggtg 4260 caccagatcg ccctgcgaat ggaagtgctg ggctgtgaag cgcaggacct gtac 4314 <210> 94 <211> 4443 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> F8-BDD2, codon optimized <400> 94 gccaccagaa ggtactacct aggagccgtg gaactgagct gggactacat gcagtctgac 60 ctgggagagc tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc 120 aacacctccg tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat 180 atcgccaagc ctagacctcc ttggatgggc ctgctgggcc ctacaattca ggccgaggtg 240 tacgacaccg tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc 300 gtgggagtgt cttactggaa ggcttctgag ggcgccgagt acgacgacca gacaagccag 360 agagagaaag aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc 420 ctgaaagaaa acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc 480 catgtggacc tggtcaagga cctgaactct ggcctgatcg gcgctctgct cgtgtgtaga 540 gaaggcagcc tggccaaaga aaagacccag acactgcaca agttcatcct gctgttcgcc 600 gtgttcgacg agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacaga 660 gatgccgcct ctgctagagc ttggcccaag atgcacaccg tgaacggcta cgtgaacaga 720 agcctgcctg gactgatcgg atgccacaga aagtccgtgt actggcatgt gatcggcatg 780 ggcaccacac ctgaggtgca cagcatcttt ctggaaggac acaccttcct cgtgcggaac 840 cacagacagg ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg 900 atggatctgg gccagtttct gctgttctgc cacatcagca gccaccagca cgatggcatg 960 gaagcctacg tgaaggtgga cagctgcccc gaagaacccc agctgagaat gaagaacaac 1020 gaggaagccg aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc 1080 gacgacgata acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag 1140 acctgggtgc actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg 1200 gcccctgacg acagaagcta caagagccag tacctgaaca acggccctca gagaatcggc 1260 cggaagtata agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag 1320 gctatccagc acgagagcgg cattctggga cctctgctgt atggcgaagt gggcgacaca 1380 ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc 1440 accgatgtgc ggcctctgta ctctagaagg ctgcccaagg gcgtgaagca cctgaaggac 1500 ttccctatcc tgcctggcga gatcttcaag tacaagtgga ccgtgaccgt cgaggacggc 1560 cctaccaaga gcgatcctag atgcctgaca cggtactaca gcagcttcgt gaacatggaa 1620 cgcgacctgg ccagcggcct gattggtcct ctgctgatct gctacaaaga aagcgtggac 1680 cagaggggca accagatcat gagcgacaag agaaacgtga tcctgttctc cgtctttgac 1740 gagaacaggt cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgctggc 1800 gtgcagctgg aagatcctga gttccaggcc tccaacatca tgcactccat caacggctat 1860 gtgttcgaca gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg 1920 tctatcggcg cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac 1980 aagatggtgt acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg 2040 agcatggaaa accccggcct gtggatcctg ggctgtcaca acagcgactt cagaaacaga 2100 ggcatgacag ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag 2160 gactcttacg aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg 2220 agcttctctc agaaccctcc tgtgctgaag agacaccagc gcgagatcac cagaaccaca 2280 ctgcagagcg accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa 2340 gaagatttcg acatctacga cgaggacgag aatcagagcc ccagatcttt ccagaagaaa 2400 acgcggcact acttcattgc cgccgtggaa agactgtggg actacggcat gagcagcagc 2460 ccacatgtgc tgagaaacag ggcccagagc ggaagcgtgc cccagttcaa gaaagtggtg 2520 ttccaagagt tcaccgacgg cagcttcacc cagcctctgt atagaggcga gctgaacgag 2580 cacctgggac tgctgggacc ttacatcaga gctgaggtcg aggataacat catggtcacc 2640 tttagaaacc aggcctctag gccctactcc ttctacagct ccctgatcag ctacgaagag 2700 gaccagagac agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc 2760 tacttttgga aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaggcc 2820 tgggcctact tctctgacgt ggacctcgag aaggatgtgc acagcggact catcggaccc 2880 ctgcttgtgt gccacaccaa cacactgaat cccgctcacg gcaggcaagt gaccgtgcaa 2940 gagttcgccc tgttcttcac catcttcgat gagacaaagt cctggtactt caccgaaaac 3000 atggaaagaa actgcagggc cccttgcaac atccagatgg aagatcccac cttcaaagag 3060 aactaccggt tccacgccat caatggctac atcatggaca ctctgcccgg cctggttatg 3120 gcacaggatc agaggatcag atggtatctg ctgtccatgg gctccaacga gaatatccac 3180 agcatccact tcagcggcca tgtgttcacc gtgcggaaaa aagaagagta caagatggcc 3240 ctgtacaatc tgtaccccgg cgtgttcgag actgtggaaa tgctgcctag caaggccgga 3300 atctggcgcg tggaatgtct gatcggagag catctgcatg ccggaatgtc taccctgttc 3360 ctggtgtaca gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac 3420 ttccagatca ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tagactgcac 3480 tacagcggca gcatcaacgc ctggtccacc aaagagccct tcagctggat caaggtggac 3540 ctgctggctc ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc 3600 agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc 3660 tacagaggca acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc 3720 attaagcaca acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca 3780 cactacagca tcagatctac cctgaggatg gaactgatgg gctgcgacct gaacagctgc 3840 tctatgcccc tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc 3900 tacttcacca acatgttcgc cacatggtcc ccatctaagg cccggctgca tctgcagggc 3960 agatctaacg cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggtcgacttt 4020 cagaaaacca tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct 4080 atgtacgtga aagagttcct gatctccagc agccaggacg gccaccagtg gaccctgttt 4140 ttccagaacg gcaaagtcaa ggtgttccag ggaaaccagg acagcttcac acccgtggtc 4200 aactccctgg atcctccact gctgaccaga tacctgagaa ttcaccctca gtcttgggtg 4260 caccagatcg ctctgagaat ggaagtgctg ggatgtgaag ctcaggacct ctactaaaat 4320 aaaagatctt tattttcatt agatctgtgt gttggttttt tgtgtgcgat cgggaactgg 4380 catcttcagg gagtagctta ggtcagtgaa gagaagtgcc agttcccgat cgttacaggc 4440 cgc 4443 <210> 95 <211> 4317 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> F8-BDD3, codon optimized <400> 95 gccaccagaa gatactacct gggagctgtg gaattgagct gggattacat gcaatctgac 60 ctgggagaac tgcctgtgga tgccaggttt cctcctaggg tccccaagtc cttcccattc 120 aacacctcag tggtctacaa gaaaaccctc tttgtggagt tcacagacca tctgttcaac 180 attgccaagc caagaccccc atggatggga ctcctgggtc caaccatcca agctgaagtg 240 tatgacactg tggtcattac cctgaagaac atggcctccc atcctgtgtc cctgcatgca 300 gtgggagtgt cctactggaa ggcttctgaa ggggctgagt atgatgatca aaccagccag 360 agagaaaagg aggatgacaa agtgttccca ggtggtagtc acacctatgt gtggcaagtg 420 ctcaaggaga atggtcctat ggcctctgat cccctgtgtc tgacctactc ctacctgtcc 480 catgtggacc tggtgaagga tctgaactct gggctgattg gagccctgct ggtgtgcaga 540 gaaggctccc tggccaagga aaagacccag acactgcaca agttcatctt gctgtttgct 600 gtgtttgatg agggaaagtc ctggcattct gagactaaga actcccttat gcaagacaga 660 gatgctgcct cagctagggc ttggcctaag atgcatactg tgaatggata tgtgaacaga 720 tccctgcctg gccttattgg ttgccacagg aagtctgtgt attggcatgt gattggcatg 780 ggaaccactc cagaggtgca ctccattttc ttggaggggc ataccttctt ggtgaggaac 840 cacagacagg cctccctgga aatttctcca atcactttcc tgactgccca gaccctcctt 900 atggacctgg gtcagttcct gctgttctgc cacatttcat cccaccaaca tgatggcatg 960 gaagcctatg tgaaagtgga ctcatgccca gaagaaccac agctgagaat gaagaacaat 1020 gaagaggcag aggactatga tgatgatctt acagattcag aaatggatgt ggtcagattt 1080 gatgatgata atagcccatc cttcatccaa attaggagtg tggccaagaa gcaccccaaa 1140 acttgggtgc attacattgc agctgaggaa gaggattggg actatgcacc cttggtgctt 1200 gcaccagatg ataggtccta caagtcccaa tacctgaaca atggcccaca gaggattggt 1260 agaaagtata agaaagtgag attcatggcc tacacagatg agactttcaa gaccagagag 1320 gccattcagc atgaatctgg cattctgggg ccactgttgt atggggaggt tggagataca 1380 ctgctcatca ttttcaagaa ccaggcctcc agaccctaca acatctaccc tcatggaatc 1440 actgatgtca gacccctgta ctccagaaga ctcccaaagg gagtcaagca cttgaaagac 1500 ttccccatcc tgcctgggga aatcttcaag tacaagtgga cagtgacagt ggaggatggg 1560 ccaaccaagt ctgatccaag atgcctcact agatactact catcctttgt caacatggaa 1620 agagacctgg cctcaggact gattggcccc ctgctcatct gctacaagga gtctgtggat 1680 cagagaggaa accagatcat gtctgacaaa aggaatgtca tcctcttctc tgtctttgat 1740 gagaacagat catggtacct tacagagaac atccagaggt tcctccccaa ccctgctgga 1800 gtgcagctgg aggacccaga attccaggca tcaaacatta tgcactccat caatggttat 1860 gtgtttgaca gcctccagct ttctgtgtgc ctccatgaag tggcatattg gtacatcctg 1920 tccattggag cacaaacaga ctttctctct gtgttcttct ctggatatac cttcaagcac 1980 aagatggtgt atgaggatac cctgaccctc ttccccttct ctggagagac tgtgtttatg 2040 tcaatggaaa acccaggcct gtggattttg gggtgccaca actcagattt cagaaacagg 2100 ggcatgactg ccttgctcaa ggtgtcctcc tgtgacaaga acacaggaga ctactatgag 2160 gactcctatg aggatatttc tgcctacctc ctgtccaaga acaatgccat tgaacccagg 2220 tccttcagcc agaaccctcc tgtcctcaag aggcatcaga gagaaatcac cagaactacc 2280 ctgcagtctg accaggaaga gattgattat gatgacacta tctcagtgga aatgaagaag 2340 gaggactttg acatctatga tgaagatgaa aatcagtccc ctaggtcctt ccaaaagaaa 2400 acaagacact acttcattgc tgctgtggag agactctggg actatggcat gtcctcatca 2460 ccccatgtgc ttaggaacag ggctcaatct gggtctgtcc ctcagttcaa gaaagtggtg 2520 tttcaagaat tcacagatgg aagcttcaca cagccattgt acaggggaga actgaatgag 2580 caccttggcc tgctgggacc ttacatcaga gcagaggtgg aggacaacat catggtgacc 2640 ttcagaaacc aagcctccag gccatattca ttctactcca gccttatctc atatgaggag 2700 gatcagagac agggggctga acctaggaag aactttgtca agccaaatga gacaaagacc 2760 tacttttgga aggtgcagca ccacatggcc cctaccaagg atgagtttga ctgcaaggcc 2820 tgggcttact tctctgatgt ggatctggaa aaggatgtgc attctgggct gattggacct 2880 ctgctggtct gccacactaa caccctcaat cctgctcatg gcagacaagt gacagtgcag 2940 gagtttgccc tgttcttcac catctttgat gaaactaagt catggtactt tacagagaac 3000 atggagagaa attgtagggc cccatgtaac atccagatgg aggacccaac attcaaggag 3060 aactacagat tccatgccat taatggatac attatggaca ctcttccagg actggtgatg 3120 gcacaggacc aaagaatcag atggtatctt ctgagcatgg ggagcaatga aaacatccat 3180 tccatccact tttcaggtca tgtgttcaca gtgaggaaga aggaagagta caagatggct 3240 ctgtacaacc tgtaccctgg ggtgtttgag actgtggaaa tgctgccatc caaggctgga 3300 atttggaggg tggaatgtct gattggtgaa catctgcatg ctggaatgtc caccctgttc 3360 ctggtgtact ccaacaagtg ccaaacccca ctgggaatgg catcaggaca cattagagac 3420 ttccagatta cagcatctgg acagtatgga caatgggccc ccaagttggc caggctgcac 3480 tactctggaa gcattaatgc ctggagcacc aaggagccat tcagctggat caaggtggac 3540 cttctggctc caatgatcat ccatggaatt aagactcagg gagccagaca gaagttctca 3600 tccctctaca tctcccagtt tatcatcatg tactcactgg atgggaagaa gtggcagact 3660 tacaggggaa attccacagg tactctgatg gtgttctttg gaaatgtgga cagctctggc 3720 atcaagcaca atatctttaa ccctcctatc attgccaggt acatcagact ccacccaact 3780 cactactcca tcaggtccac tctgaggatg gaactcatgg gttgtgacct caactcctgc 3840 tcaatgccac tgggcatgga gtccaaggct atctcagatg ctcagattac tgcatcctct 3900 tactttacca acatgtttgc tacctggtcc ccctccaaag ccagactgca tctccaaggc 3960 agatcaaatg cctggaggcc tcaggtcaac aacccaaagg aatggcttca ggtggacttc 4020 caaaagacca tgaaagtcac aggagtgacc acccagggag tgaaatccct gctgacctct 4080 atgtatgtga aggaattcct gatctcatca agccaggatg gccaccagtg gacactgttc 4140 ttccaaaatg gaaaggtcaa ggtctttcag ggaaatcaag actccttcac ccctgtggtg 4200 aactccctgg acccccctct gcttaccagg tacttgagaa ttcatccaca atcctgggtg 4260 caccagattg ccctgaggat ggaagtgctg ggctgtgaag cccaggacct gtactaa 4317 <210> 96 <211> 4314 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> F8-BDD4, codon optimized <400> 96 gccaccagaa ggtactacct gggagctgtg gaactgagct gggactacat gcagtctgac 60 ctgggagagc tgcctgtgga tgctagattt cctccaagag tgcccaagag cttccccttc 120 aacacctctg tggtgtacaa gaaaaccctg tttgtggaat tcacagacca cctgttcaat 180 attgccaagc ctagacctcc ttggatgggc ctgctgggcc ctacaattca ggctgaggtg 240 tatgacacag tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcatgct 300 gtgggagtgt cttactggaa ggcttctgag ggggctgagt atgatgacca gacaagccag 360 agagagaaag aggatgacaa ggttttccct gggggcagcc acacctatgt ctggcaggtc 420 ctgaaagaaa atggccctat ggcctctgat cctctgtgcc tgacatacag ctacctgagc 480 catgtggacc tggtcaagga cctgaactct ggcctgattg gggctctgct ggtgtgtaga 540 gaaggcagcc tggccaaaga aaagacccag acactgcaca agttcatcct gctgtttgct 600 gtgtttgatg agggcaagag ctggcactct gagacaaaga acagcctgat gcaggacaga 660 gatgctgcct ctgctagagc ttggcccaag atgcacacag tgaatggcta tgtgaacaga 720 agcctgcctg gactgattgg atgccacaga aagtctgtgt actggcatgt gattggcatg 780 ggcaccacac ctgaggtgca cagcatcttt ctggaaggac acaccttcct ggtgaggaac 840 cacagacagg ccagcctgga aatcagccct atcaccttcc tgacagctca gaccctgctg 900 atggatctgg gccagtttct gctgttctgc cacatcagca gccaccagca tgatggcatg 960 gaagcctatg tgaaggtgga cagctgccct gaagaacccc agctgagaat gaagaacaat 1020 gaggaagctg aggactatga tgatgacctg acagactctg agatggatgt ggtcagattt 1080 gatgatgata acagccccag cttcatccag atcagatctg tggccaagaa gcaccccaag 1140 acctgggtgc actatattgc tgctgaggaa gaggactggg attatgctcc tctggtgctg 1200 gcccctgatg acagaagcta caagagccag tacctgaaca atggccctca gagaattggc 1260 aggaagtata agaaagtgag gttcatggcc tacacagatg agacattcaa gaccagagag 1320 gctatccagc atgagtctgg cattctggga cctctgctgt atggggaagt gggggacaca 1380 ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc tcatggcatc 1440 acagatgtga ggcctctgta ctctagaagg ctgcccaagg gggtgaagca cctgaaggac 1500 ttccctatcc tgcctgggga gatcttcaag tacaagtgga cagtgacagt ggaggatggc 1560 cctaccaagt ctgatcctag atgcctgaca aggtactaca gcagctttgt gaacatggaa 1620 agggacctgg cctctggcct gattggtcct ctgctgatct gctacaaaga atctgtggac 1680 cagaggggca accagatcat gagtgacaag agaaatgtga tcctgttctc tgtctttgat 1740 gagaacaggt cctggtatct gacagagaac atccagaggt ttctgcccaa tcctgctggg 1800 gtgcagctgg aagatcctga gttccaggcc tccaacatca tgcactccat caatggctat 1860 gtgtttgaca gcctgcagct gtctgtgtgc ctgcatgaag tggcctactg gtacatcctg 1920 tctattgggg cccagacaga cttcctgtct gtgttctttt ctggctacac cttcaagcac 1980 aagatggtgt atgaggatac cctgacactg ttcccattct ctggggagac agtgttcatg 2040 agcatggaaa accctggcct gtggatcctg ggctgtcaca acagtgactt cagaaacaga 2100 ggcatgacag ccctgctgaa ggtgtccagc tgtgacaaga acactgggga ctactatgag 2160 gactcttatg aggacatctc tgcctacctg ctgagcaaga acaatgccat tgagcctagg 2220 agcttctctc agaaccctcc tgtgctgaag agacaccaga gggagatcac cagaaccaca 2280 ctgcagtctg accaagagga aattgattat gatgacacca tctctgtgga gatgaagaaa 2340 gaagattttg acatctatga tgaggatgag aatcagagcc ccagatcttt ccagaagaaa 2400 acaaggcact acttcattgc tgctgtggaa agactgtggg actatggcat gagcagcagc 2460 ccccatgtgc tgagaaacag ggcccagtct ggaagtgtgc cccagttcaa gaaagtggtg 2520 ttccaagagt tcacagatgg cagcttcacc cagcctctgt atagagggga gctgaatgag 2580 cacctgggac tgctgggacc ttacatcaga gctgaggtgg aggataacat catggtcacc 2640 tttagaaacc aggcctctag gccctactcc ttctacagct ccctgatcag ctatgaagag 2700 gaccagagac agggggctga gcccagaaag aactttgtga agcccaatga gactaagacc 2760 tacttttgga aggtgcagca ccacatggcc cctacaaagg atgagtttga ctgcaaggcc 2820 tgggcctact tctctgatgt ggacctggag aaggatgtgc actctggact cattggaccc 2880 ctgcttgtgt gccacaccaa cacactgaat cctgctcatg gcaggcaagt gacagtgcaa 2940 gagtttgccc tgttcttcac catctttgat gagacaaagt cctggtactt cacagaaaac 3000 atggaaagaa actgcagggc cccttgcaac atccagatgg aagatcccac cttcaaagag 3060 aactacaggt tccatgccat caatggctac atcatggaca ctctgcctgg cctggttatg 3120 gcacaggatc agaggatcag atggtatctg ctgtccatgg gctccaatga gaatatccac 3180 agcatccact tctctggcca tgtgttcaca gtgaggaaaa aagaagagta caagatggcc 3240 ctgtacaatc tgtaccctgg ggtgtttgag actgtggaaa tgctgcctag caaggctgga 3300 atctggaggg tggaatgtct gattggagag catctgcatg ctggaatgtc taccctgttc 3360 ctggtgtaca gcaacaagtg tcagacccct ctgggcatgg cctctggaca catcagagac 3420 ttccagatca cagcctctgg ccagtatgga cagtgggctc ctaaactggc tagactgcac 3480 tactctggca gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac 3540 ctgctggctc ccatgatcat ccatggaatc aagacccagg gggccagaca gaagttcagc 3600 agcctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa gtggcagacc 3660 tacagaggca acagcacagg cacactcatg gtgttctttg gcaatgtgga ctcttctggc 3720 attaagcaca acatcttcaa ccctccaatc attgccaggt acatcaggct gcaccccaca 3780 cactacagca tcagatctac cctgaggatg gaactgatgg gctgtgacct gaacagctgc 3840 tctatgcccc tgggaatgga aagcaaggcc atctctgatg cccagatcac agccagcagc 3900 tacttcacca acatgtttgc cacatggtcc ccatctaagg ccaggctgca tctgcagggc 3960 agatctaatg cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggtggacttt 4020 cagaaaacca tgaaagtgac aggagtgacc acacaggggg tcaagtctct gctgacctct 4080 atgtatgtga aagagttcct gatctccagc agccaggatg gccaccagtg gaccctgttt 4140 ttccagaatg gcaaagtcaa ggtgttccag ggaaaccagg acagcttcac acctgtggtc 4200 aactccctgg atcctccact gctgaccaga tacctgagaa ttcaccctca gtcttgggtg 4260 caccagattg ctctgagaat ggaagtgctg ggatgtgaag ctcaggacct ctac 4314 <210> 97 <211> 4314 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Native FVIII-BDD mature CDS <400> 97 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggttca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaatccacc agtcttgaaa cgccatcaac gggaaataac tcgtactact 2280 cttcagtcag atcaagagga aattgactat gatgatacca tatcagttga aatgaagaag 2340 gaagattttg acatttatga tgaggatgaa aatcagagcc cccgcagctt tcaaaagaaa 2400 acacgacact attttattgc tgcagtggag aggctctggg attatgggat gagtagctcc 2460 ccacatgttc taagaaacag ggctcagagt ggcagtgtcc ctcagttcaa gaaagttgtt 2520 ttccaggaat ttactgatgg ctcctttact cagcccttat accgtggaga actaaatgaa 2580 catttgggac tcctggggcc atatataaga gcagaagttg aagataatat catggtaact 2640 ttcagaaatc aggcctctcg tccctattcc ttctattcta gccttatttc ttatgaggaa 2700 gatcagaggc aaggagcaga acctagaaaa aactttgtca agcctaatga aaccaaaact 2760 tacttttgga aagtgcaaca tcatatggca cccactaaag atgagtttga ctgcaaagcc 2820 tgggcttatt tctctgatgt tgacctggaa aaagatgtgc actcaggcct gattggaccc 2880 cttctggtct gccacactaa cacactgaac cctgctcatg ggagacaagt gacagtacag 2940 gaatttgctc tgtttttcac catctttgat gagaccaaaa gctggtactt cactgaaaat 3000 atggaaagaa actgcagggc tccctgcaat atccagatgg aagatcccac ttttaaagag 3060 aattatcgct tccatgcaat caatggctac ataatggata cactacctgg cttagtaatg 3120 gctcaggatc aaaggattcg atggtatctg ctcagcatgg gcagcaatga aaacatccat 3180 tctattcatt tcagtggaca tgtgttcact gtacgaaaaa aagaggagta taaaatggca 3240 ctgtacaatc tctatccagg tgtttttgag acagtggaaa tgttaccatc caaagctgga 3300 atttggcggg tggaatgcct tattggcgag catctacatg ctgggatgag cacacttttt 3360 ctggtgtaca gcaataagtg tcagactccc ctgggaatgg cttctggaca cattagagat 3420 tttcagatta cagcttcagg acaatatgga cagtgggccc caaagctggc cagacttcat 3480 tattccggat caatcaatgc ctggagcacc aaggagccct tttcttggat caaggtggat 3540 ctgttggcac caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc 3600 agcctctaca tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact 3660 tatcgaggaa attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg 3720 ataaaacaca atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact 3780 cattatagca ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc 3840 agcatgccat tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc 3900 tactttacca atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg 3960 aggagtaatg cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc 4020 cagaagacaa tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc 4080 atgtatgtga aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt 4140 tttcagaatg gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg 4200 aactctctag acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg 4260 caccagattg ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctac 4314 <210> 98 <211> 9 <212> PRT <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 98 Asp Ala His Ala Thr Arg Arg Tyr Tyr 1 5 <210> 99 <211> 7 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Branch site consensus sequence <220> <221> misc_feature <222> (1)..(1) <223> Y is T or C <220> <221> misc_feature <222> (2)..(2) <223> N is any nucleotide <220> <221> misc_feature <222> (3)..(3) <223> Y is C or T <220> <221> misc_feature <222> (4)..(4) <223> Y is T or C <220> <221> misc_feature <222> (5)..(5) <223> R is A or G <220> <221> misc_feature <222> (7)..(7) <223> Y is C or T <400> 99 ynyyray 7 <210> 100 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> target nucleic acid sequence <220> <221> misc_feature <222> (1)..(20) <223> N is any nucleotide <220> <221> misc_feature <222> (21)..(21) <223> R is G or A <400> 100 nnnnnnnnnn nnnnnnnnnn rg 22 <210> 101 <211> 8 <212> DNA <213> Neisseria meningitidis <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> N is any nucleotide <400> 101 nnnngatt 8 <210> 102 <211> 9 <212> DNA <213> Neisseria meningitidis <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(5) <223> N is any nucleotide <400> 102 nnnnngttt 9 <210> 103 <211> 8 <212> DNA <213> Neisseria meningitidis <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> N is any nucleotide <400> 103 nnnngctt 8 <210> 104 <211> 23 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human Albumin Intron-1_T25 <400> 104 accttttttt ttttttacct agg 23 <210> 105 <211> 20 <212> RNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Exemplary gRNA spacer <400> 105 uaauuuucuu uugcgcacua 20

Claims (93)

  1. 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산;
    SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA); 및
    인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형을 포함하는 시스템.
  2. 제1항에 있어서, 상기 gRNA가 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함하는 시스템.
  3. 제2항에 있어서, 상기 gRNA가 SEQ ID NO: 22로부터의 스페이서 서열을 포함하는 시스템.
  4. 제2항에 있어서, 상기 gRNA가 SEQ ID NO: 21로부터의 스페이서 서열을 포함하는 시스템.
  5. 제2항에 있어서, 상기 gRNA가 SEQ ID NO: 28로부터의 스페이서 서열을 포함하는 시스템.
  6. 제2항에 있어서, 상기 gRNA가 SEQ ID NO: 30으로부터의 스페이서 서열을 포함하는 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제가 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제 또는 그의 기능적 유도체로 이루어진 군으로부터 선택되는 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제가 Cas9인 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 숙주 세포에서의 발현을 위해 코돈 최적화된 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 시스템.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 시스템.
  13. 제12항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 시스템.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 공여자 주형이 아데노 연관 바이러스(AAV) 벡터에 인코딩되는 시스템.
  15. 제14항에 있어서, 상기 공여자 주형이 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 상기 공여자 카세트가 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된 시스템.
  16. 제15항에 있어서, 상기 공여자 카세트가 양 측에서 gRNA 표적 부위에 의해 플랭킹된 시스템.
  17. 제15항 또는 제16항에 있어서, 상기 gRNA 표적 부위가 시스템 내의 gRNA에 대한 표적 부위인 시스템.
  18. 제17항에 있어서, 상기 공여자 주형의 gRNA 표적 부위가 상기 시스템 내의 gRNA에 대한 게놈 gRNA 표적 부위의 역 상보물인 시스템.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자로 제형화되는 시스템.
  20. 제19항에 있어서, 상기 리포좀 또는 지질 나노입자가 gRNA를 또한 포함하는 시스템.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, gRNA와 사전복합체화되어 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 포함하는 시스템.
  22. 세포 내의 게놈의 편집 방법으로서,
    하기의 것을 세포에 제공하는 단계를 포함하는 방법:
    (a) SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA;
    (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
    (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형.
  23. 제22항에 있어서, 상기 gRNA가 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함하는 방법.
  24. 제23항에 있어서, 상기 gRNA가 SEQ ID NO: 21로부터의 스페이서 서열을 포함하는 방법.
  25. 제23항에 있어서, 상기 gRNA가 SEQ ID NO: 22로부터의 스페이서 서열을 포함하는 방법.
  26. 제23항에 있어서, 상기 gRNA가 SEQ ID NO: 28로부터의 스페이서 서열을 포함하는 방법.
  27. 제23항에 있어서, 상기 gRNA가 SEQ ID NO: 30으로부터의 스페이서 서열을 포함하는 방법.
  28. 제22항 내지 제27항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제가 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제; 또는 그의 기능적 유도체로 이루어진 군으로부터 선택되는 방법.
  29. 제22항 내지 제28항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제가 Cas9인 방법.
  30. 제22항 내지 제29항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 세포에서의 발현을 위해 코돈 최적화된 방법.
  31. 제22항 내지 제30항 중 어느 한 항에 있어서, 상기 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 세포에서의 발현을 위해 코돈 최적화된 방법.
  32. 제22항 내지 제31항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 방법.
  33. 제22항 내지 제31항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 방법.
  34. 제33항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 방법.
  35. 제22항 내지 제34항 중 어느 한 항에 있어서, 상기 공여자 주형이 아데노 연관 바이러스(AAV) 벡터에 인코딩되는 방법.
  36. 제22항 내지 제35항 중 어느 한 항에 있어서, 상기 공여자 주형이 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 상기 공여자 카세트가 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된 방법.
  37. 제36항에 있어서, 상기 공여자 주형이 양 측에서 gRNA 표적 부위에 의해 플랭킹된 방법.
  38. 제36항 또는 제37항에 있어서, 상기 gRNA 표적 부위가 (a)의 gRNA에 대한 표적 부위인 방법.
  39. 제38항에 있어서, 상기 공여자 주형의 gRNA 표적 부위가 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 방법.
  40. 제22항 내지 제39항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자로 제형화되는 방법.
  41. 제40항에 있어서, 상기 리포좀 또는 지질 나노입자가 gRNA를 또한 포함하는 방법.
  42. 제22항 내지 제41항 중 어느 한 항에 있어서, gRNA와 사전복합체화되어 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 세포에 제공하는 단계를 포함하는 방법.
  43. 제22항 내지 제42항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한지 4일보다 긴 시간 후에 세포에 제공되는 방법.
  44. 제22항 내지 제43항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)를 세포에 제공한지 적어도 14일 후에 세포에 제공되는 방법.
  45. 제43항 또는 제44항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공되는 방법.
  46. 제45항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공되는 방법.
  47. 제22항 내지 제46항 중 어느 한 항에 있어서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열이 내인성 알부민 프로모터의 제어 하에 발현되는 방법.
  48. 제22항 내지 제47항 중 어느 한 항에 있어서, 상기 세포가 간세포인 방법.
  49. 세포의 게놈이 제22항 내지 제48항 중 어느 한 항의 방법에 의해 편집되는 유전적으로 변형된 세포.
  50. 제49항에 있어서, 상기 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열이 내인성 알부민 프로모터의 제어 하에 발현되는 유전적으로 변형된 세포.
  51. 제49항 또는 제50항에 있어서, 상기 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 상기 세포에서의 발현을 위해 코돈 최적화된 유전적으로 변형된 세포.
  52. 제49항 내지 제51항 중 어느 한 항에 있어서, 상기 세포가 간세포인 유전적으로 변형된 세포.
  53. 대상체에서의 A형 혈우병의 치료 방법으로서,
    하기의 것을 상기 대상체 내의 세포에 제공하는 단계를 포함하는 방법:
    (a) SEQ ID NO: 22, 21, 28, 30, 18 내지 20, 23 내지 27, 29, 31 내지 44 및 104 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA;
    (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
    (c) 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 주형.
  54. 제53항에 있어서, 상기 gRNA가 SEQ ID NO: 22, 21, 28 및 30 중 어느 하나로부터의 스페이서 서열을 포함하는 방법.
  55. 제54항에 있어서, 상기 gRNA가 SEQ ID NO: 22로부터의 스페이서 서열을 포함하는 방법.
  56. 제54항에 있어서, 상기 gRNA가 SEQ ID NO: 21로부터의 스페이서 서열을 포함하는 방법.
  57. 제54항에 있어서, 상기 gRNA가 SEQ ID NO: 28로부터의 스페이서 서열을 포함하는 방법.
  58. 제54항에 있어서, 상기 gRNA가 SEQ ID NO: 30으로부터의 스페이서 서열을 포함하는 방법.
  59. 제53항 내지 제58항 중 어느 한 항에 있어서, 상기 대상체가 A형 혈우병을 갖거나, A형 혈우병을 갖는 것으로 의심되는 환자인 방법.
  60. 제53항 내지 제58항 중 어느 한 항에 있어서, 상기 대상체가 A형 혈우병의 위험이 있는 것으로 진단받는 방법.
  61. 제53항 내지 제60항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제가 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려져 있음), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 또는 Cpf1 엔도뉴클레아제; 또는 그의 기능적 유도체로 이루어진 군으로부터 선택되는 방법.
  62. 제53항 내지 제61항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제가 Cas9인 방법.
  63. 제53항 내지 제62항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 상기 세포에서의 발현을 위해 코돈 최적화된 방법.
  64. 제53항 내지 제63항 중 어느 한 항에 있어서, 인자 VIII(FVIII) 단백질 또는 그의 기능적 유도체를 인코딩하는 핵산 서열이 상기 세포에서의 발현을 위해 코돈 최적화된 방법.
  65. 제53항 내지 제64항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 방법.
  66. 제53항 내지 제64항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 방법.
  67. 제66항에 있어서, 상기 DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 방법.
  68. 제53항 내지 제67항 중 어느 한 항에 있어서, (a)의 gRNA, (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 (c)의 공여자 주형 중 하나 이상이 리포좀 또는 지질 나노입자로 제형화되는 방법.
  69. 제53항 내지 제68항 중 어느 한 항에 있어서, 상기 공여자 주형이 아데노 연관 바이러스(AAV) 벡터에 인코딩되는 방법.
  70. 제53항 내지 제69항 중 어느 한 항에 있어서, 상기 공여자 주형이 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 상기 공여자 카세트가 하나의 또는 양 측에서 gRNA 표적 부위에 의해 플랭킹된 방법.
  71. 제70항에 있어서, 상기 공여자 카세트가 양 측에서 gRNA 표적 부위에 의해 플랭킹된 방법.
  72. 제70항 또는 제71항에 있어서, 상기 gRNA 표적 부위가 (a)의 gRNA에 대한 표적 부위인 방법.
  73. 제72항에 있어서, 상기 공여자 주형의 gRNA 표적 부위가 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 방법.
  74. 제53항 내지 제73항 중 어느 한 항에 있어서, 상기 공여자 주형을 세포에 제공하는 단계가 상기 공여자 주형을 상기 대상체에게 투여하는 것을 포함하는 방법.
  75. 제74항에 있어서, 상기 투여가 정맥내 경로를 통해 이루어지는 방법.
  76. 제53항 내지 제75항 중 어느 한 항에 있어서, 상기 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자로 제형화되는 방법.
  77. 제76항에 있어서, 상기 리포좀 또는 지질 나노입자가 gRNA를 또한 포함하는 방법.
  78. 제77항에 있어서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 상기 리포좀 또는 지질 나노입자를 상기 대상체에게 투여하는 것을 포함하는 방법.
  79. 제78항에 있어서, 상기 투여가 정맥내 경로를 통해 이루어지는 방법.
  80. 제53항 내지 제79항 중 어느 한 항에 있어서, gRNA와 사전-복합체화되어, 리보핵단백질(RNP) 복합체를 형성하는 DNA 엔도뉴클레아제를 세포에 제공하는 단계를 포함하는 방법.
  81. 제53항 내지 제80항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한지 4일보다 긴 시간 후에 세포에 제공되는 방법.
  82. 제53항 내지 제81항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한지 적어도 14일 후에 세포에 제공되는 방법.
  83. 제81항 또는 제82항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공되는 방법.
  84. 제83항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 표적화된 통합 및/또는 표적 수준의 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열의 발현이 달성될 때까지 세포에 제공되는 방법.
  85. 제81항 내지 제84항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 대상체에게 투여하는 것을 포함하는 방법.
  86. 제81항 내지 제85항 중 어느 한 항에 있어서, (c)의 공여자 주형을 세포에 제공하는 단계가 AAV 벡터에 인코딩된 공여자 주형을 대상체에게 투여하는 것을 포함하는 방법.
  87. 제53항 내지 제86항 중 어느 한 항에 있어서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열이 내인성 알부민 프로모터의 제어 하에 발현되는 방법.
  88. 제53항 내지 제87항 중 어느 한 항에 있어서, 상기 세포가 간세포인 방법.
  89. 제53항 내지 제88항 중 어느 한 항에 있어서, 인자 VIII(FVIII) 단백질 또는 기능적 유도체를 인코딩하는 핵산 서열이 대상체의 간에서 발현되는 방법.
  90. 제49항 내지 제52항 중 어느 한 항의 유전적으로 변형된 세포를 대상체에게 투여하는 단계를 포함하는 대상체에서의 A형 혈우병의 치료 방법.
  91. 제90항에 있어서, 상기 유전적으로 변형된 세포가 상기 대상체의 자가 세포인 방법.
  92. 제90항 또는 제91항에 있어서,
    대상체로부터 생물학적 시료를 수득하는 단계로서, 상기 생물학적 시료가 간세포를 포함하며, 상기 유전적으로 변형된 세포가 간세포로부터 제조되는 단계를 추가로 포함하는 방법.
  93. 제1항 내지 제21항 중 어느 한 항의 시스템의 하나 이상의 요소를 포함하며, 사용 설명서를 추가로 포함하는 키트.
KR1020207013950A 2017-10-17 2018-10-17 A형 혈우병을 위한 유전자 편집용 조성물 및 방법 KR20200067190A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762573633P 2017-10-17 2017-10-17
US62/573,633 2017-10-17
PCT/US2018/056390 WO2019079527A1 (en) 2017-10-17 2018-10-17 COMPOSITIONS AND METHODS FOR GENETIC EDITION FOR HEMOPHILIA A

Publications (1)

Publication Number Publication Date
KR20200067190A true KR20200067190A (ko) 2020-06-11

Family

ID=64267913

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207013950A KR20200067190A (ko) 2017-10-17 2018-10-17 A형 혈우병을 위한 유전자 편집용 조성물 및 방법

Country Status (13)

Country Link
US (3) US20190247517A1 (ko)
EP (1) EP3697907A1 (ko)
JP (2) JP7482028B2 (ko)
KR (1) KR20200067190A (ko)
CN (1) CN111684070A (ko)
AU (1) AU2018353012A1 (ko)
BR (1) BR112020007502A2 (ko)
CA (1) CA3079172A1 (ko)
IL (1) IL273999A (ko)
MA (1) MA50833A (ko)
MX (1) MX2020004043A (ko)
SG (1) SG11202003464VA (ko)
WO (1) WO2019079527A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2020081843A1 (en) * 2018-10-17 2020-04-23 Casebia Therapeutics Limited Liability Partnership Compositions and methods for delivering transgenes
KR20210102883A (ko) * 2018-10-18 2021-08-20 인텔리아 테라퓨틱스, 인크. 알부민 좌위로부터 트랜스진을 발현하기 위한 조성물 및 방법
SG11202108357PA (en) 2019-02-15 2021-08-30 Crispr Therapeutics Ag Gene editing for hemophilia a with improved factor viii expression
BR112021015776A2 (pt) * 2019-06-05 2021-11-09 Bayer Healthcare Llc Edição de gene para hemofilia a com expressão de fator viii melhorada
AU2020289581A1 (en) 2019-06-07 2021-11-18 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
CA3150230A1 (en) * 2019-09-04 2021-03-11 Pengfei YUAN METHOD FOR EVALUATING GENE EDITING THERAPY BASED ON OFF-TARGET EVALUATION
WO2021083073A1 (zh) * 2019-10-31 2021-05-06 华东师范大学 一种基于肝细胞Alb基因的疾病治疗的产品
WO2021091927A1 (en) * 2019-11-04 2021-05-14 California Institute Of Technology Deep learning enabled spatial optical barcodes for pooled library screens
US20230190962A1 (en) * 2020-02-28 2023-06-22 Blueallele Corporation Methods for treating gain-of-function disorders combining gene editing and gene therapy
EP4114932A4 (en) 2020-03-06 2024-03-13 Metagenomi, Inc. CLASS II, TYPE V CRISPR SYSTEMS
WO2023172875A1 (en) * 2022-03-07 2023-09-14 Inedita Bio, Inc. Methods and compositions for intron mediated- expression of regulatory elements for trait development
CN114591957B (zh) * 2022-03-22 2024-04-26 吴文书 一种重症a型血友病动物模型的构建方法及其应用
WO2023212539A1 (en) * 2022-04-25 2023-11-02 The Children's Hospital Of Philadelphia Compositions and methods for modulating factor viii function

Family Cites Families (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5023243A (en) 1981-10-23 1991-06-11 Molecular Biosystems, Inc. Oligonucleotide therapeutic agent and method of making same
US4476301A (en) 1982-04-29 1984-10-09 Centre National De La Recherche Scientifique Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon
JPS5927900A (ja) 1982-08-09 1984-02-14 Wakunaga Seiyaku Kk 固定化オリゴヌクレオチド
FR2540122B1 (fr) 1983-01-27 1985-11-29 Centre Nat Rech Scient Nouveaux composes comportant une sequence d'oligonucleotide liee a un agent d'intercalation, leur procede de synthese et leur application
US4605735A (en) 1983-02-14 1986-08-12 Wakunaga Seiyaku Kabushiki Kaisha Oligonucleotide derivatives
US4948882A (en) 1983-02-22 1990-08-14 Syngene, Inc. Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis
US4824941A (en) 1983-03-10 1989-04-25 Julian Gordon Specific antibody to the native form of 2'5'-oligonucleotides, the method of preparation and the use as reagents in immunoassays or for binding 2'5'-oligonucleotides in biological systems
US4587044A (en) 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
US5118802A (en) 1983-12-20 1992-06-02 California Institute Of Technology DNA-reporter conjugates linked via the 2' or 5'-primary amino group of the 5'-terminal nucleoside
US5550111A (en) 1984-07-11 1996-08-27 Temple University-Of The Commonwealth System Of Higher Education Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof
US5258506A (en) 1984-10-16 1993-11-02 Chiron Corporation Photolabile reagents for incorporation into oligonucleotide chains
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
US5430136A (en) 1984-10-16 1995-07-04 Chiron Corporation Oligonucleotides having selectably cleavable and/or abasic sites
US4828979A (en) 1984-11-08 1989-05-09 Life Technologies, Inc. Nucleotide analogs for nucleic acid labeling and detection
FR2575751B1 (fr) 1985-01-08 1987-04-03 Pasteur Institut Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques
US5405938A (en) 1989-12-20 1995-04-11 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5166315A (en) 1989-12-20 1992-11-24 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5185444A (en) 1985-03-15 1993-02-09 Anti-Gene Deveopment Group Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US4762779A (en) 1985-06-13 1988-08-09 Amgen Inc. Compositions and methods for functionalizing nucleic acids
US5317098A (en) 1986-03-17 1994-05-31 Hiroaki Shizuya Non-radioisotope tagging of fragments
JPS638396A (ja) 1986-06-30 1988-01-14 Wakunaga Pharmaceut Co Ltd ポリ標識化オリゴヌクレオチド誘導体
US5264423A (en) 1987-03-25 1993-11-23 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US5276019A (en) 1987-03-25 1994-01-04 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US4904582A (en) 1987-06-11 1990-02-27 Synthetic Genetics Novel amphiphilic nucleic acid conjugates
ATE113059T1 (de) 1987-06-24 1994-11-15 Florey Howard Inst Nukleosid-derivate.
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5188897A (en) 1987-10-22 1993-02-23 Temple University Of The Commonwealth System Of Higher Education Encapsulated 2',5'-phosphorothioate oligoadenylates
US4924624A (en) 1987-10-22 1990-05-15 Temple University-Of The Commonwealth System Of Higher Education 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof
US5525465A (en) 1987-10-28 1996-06-11 Howard Florey Institute Of Experimental Physiology And Medicine Oligonucleotide-polyamide conjugates and methods of production and applications of the same
DE3738460A1 (de) 1987-11-12 1989-05-24 Max Planck Gesellschaft Modifizierte oligonukleotide
US5082830A (en) 1988-02-26 1992-01-21 Enzo Biochem, Inc. End labeled nucleotide probe
EP0406309A4 (en) 1988-03-25 1992-08-19 The University Of Virginia Alumni Patents Foundation Oligonucleotide n-alkylphosphoramidates
US5278302A (en) 1988-05-26 1994-01-11 University Patents, Inc. Polynucleotide phosphorodithioates
US5109124A (en) 1988-06-01 1992-04-28 Biogen, Inc. Nucleic acid probe linked to a label having a terminal cysteine
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
US5175273A (en) 1988-07-01 1992-12-29 Genentech, Inc. Nucleic acid intercalating agents
US5262536A (en) 1988-09-15 1993-11-16 E. I. Du Pont De Nemours And Company Reagents for the preparation of 5'-tagged oligonucleotides
US5512439A (en) 1988-11-21 1996-04-30 Dynal As Oligonucleotide-linked magnetic particles and uses thereof
US5457183A (en) 1989-03-06 1995-10-10 Board Of Regents, The University Of Texas System Hydroxylated texaphyrins
US5599923A (en) 1989-03-06 1997-02-04 Board Of Regents, University Of Tx Texaphyrin metal complexes having improved functionalization
US5391723A (en) 1989-05-31 1995-02-21 Neorx Corporation Oligonucleotide conjugates
US4958013A (en) 1989-06-06 1990-09-18 Northwestern University Cholesteryl modified oligonucleotides
US5451463A (en) 1989-08-28 1995-09-19 Clontech Laboratories, Inc. Non-nucleoside 1,3-diol reagents for labeling synthetic oligonucleotides
US5134066A (en) 1989-08-29 1992-07-28 Monsanto Company Improved probes using nucleosides containing 3-dezauracil analogs
US5254469A (en) 1989-09-12 1993-10-19 Eastman Kodak Company Oligonucleotide-enzyme conjugate that can be used as a probe in hybridization assays and polymerase chain reaction procedures
US5399676A (en) 1989-10-23 1995-03-21 Gilead Sciences Oligonucleotides with inverted polarity
US5264562A (en) 1989-10-24 1993-11-23 Gilead Sciences, Inc. Oligonucleotide analogs with novel linkages
US5264564A (en) 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
US5292873A (en) 1989-11-29 1994-03-08 The Research Foundation Of State University Of New York Nucleic acids labeled with naphthoquinone probe
US5177198A (en) 1989-11-30 1993-01-05 University Of N.C. At Chapel Hill Process for preparing oligoribonucleoside and oligodeoxyribonucleoside boranophosphates
US5130302A (en) 1989-12-20 1992-07-14 Boron Bilogicals, Inc. Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same
US5486603A (en) 1990-01-08 1996-01-23 Gilead Sciences, Inc. Oligonucleotide having enhanced binding affinity
US5587470A (en) 1990-01-11 1996-12-24 Isis Pharmaceuticals, Inc. 3-deazapurines
US5459255A (en) 1990-01-11 1995-10-17 Isis Pharmaceuticals, Inc. N-2 substituted purines
US5681941A (en) 1990-01-11 1997-10-28 Isis Pharmaceuticals, Inc. Substituted purines and oligonucleotide cross-linking
US5587361A (en) 1991-10-15 1996-12-24 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
US5578718A (en) 1990-01-11 1996-11-26 Isis Pharmaceuticals, Inc. Thiol-derivatized nucleosides
WO1991013080A1 (en) 1990-02-20 1991-09-05 Gilead Sciences, Inc. Pseudonucleosides and pseudonucleotides and their polymers
US5214136A (en) 1990-02-20 1993-05-25 Gilead Sciences, Inc. Anthraquinone-derivatives oligonucleotides
US5321131A (en) 1990-03-08 1994-06-14 Hybridon, Inc. Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling
US5470967A (en) 1990-04-10 1995-11-28 The Dupont Merck Pharmaceutical Company Oligonucleotide analogs with sulfamate linkages
DK0455905T3 (da) 1990-05-11 1998-12-07 Microprobe Corp Dipsticks til nukleinsyrehybridiseringsassays og fremgangsmåde til kovalent immobilisering af oligonukleotider
US5688941A (en) 1990-07-27 1997-11-18 Isis Pharmaceuticals, Inc. Methods of making conjugated 4' desmethyl nucleoside analog compounds
US5608046A (en) 1990-07-27 1997-03-04 Isis Pharmaceuticals, Inc. Conjugated 4'-desmethyl nucleoside analog compounds
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5677437A (en) 1990-07-27 1997-10-14 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5618704A (en) 1990-07-27 1997-04-08 Isis Pharmacueticals, Inc. Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling
US5218105A (en) 1990-07-27 1993-06-08 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5623070A (en) 1990-07-27 1997-04-22 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5610289A (en) 1990-07-27 1997-03-11 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogues
US5541307A (en) 1990-07-27 1996-07-30 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs and solid phase synthesis thereof
US5138045A (en) 1990-07-27 1992-08-11 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
JPH0874B2 (ja) 1990-07-27 1996-01-10 アイシス・ファーマシューティカルス・インコーポレーテッド 遺伝子発現を検出および変調するヌクレアーゼ耐性、ピリミジン修飾オリゴヌクレオチド
US5245022A (en) 1990-08-03 1993-09-14 Sterling Drug, Inc. Exonuclease resistant terminally substituted oligonucleotides
WO1992002534A2 (en) 1990-08-03 1992-02-20 Sterling Drug, Inc. Compounds and methods for inhibiting gene expression
US5177196A (en) 1990-08-16 1993-01-05 Microprobe Corporation Oligo (α-arabinofuranosyl nucleotides) and α-arabinofuranosyl precursors thereof
US5512667A (en) 1990-08-28 1996-04-30 Reed; Michael W. Trifunctional intermediates for preparing 3'-tailed oligonucleotides
US5214134A (en) 1990-09-12 1993-05-25 Sterling Winthrop Inc. Process of linking nucleosides with a siloxane bridge
US5561225A (en) 1990-09-19 1996-10-01 Southern Research Institute Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages
WO1992005186A1 (en) 1990-09-20 1992-04-02 Gilead Sciences Modified internucleoside linkages
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
ATE198598T1 (de) 1990-11-08 2001-01-15 Hybridon Inc Verbindung von mehrfachreportergruppen auf synthetischen oligonukleotiden
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5371241A (en) 1991-07-19 1994-12-06 Pharmacia P-L Biochemicals Inc. Fluorescein labelled phosphoramidites
US5571799A (en) 1991-08-12 1996-11-05 Basco, Ltd. (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response
US5484908A (en) 1991-11-26 1996-01-16 Gilead Sciences, Inc. Oligonucleotides containing 5-propynyl pyrimidines
TW393513B (en) 1991-11-26 2000-06-11 Isis Pharmaceuticals Inc Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines
US5595726A (en) 1992-01-21 1997-01-21 Pharmacyclics, Inc. Chromophore probe for detection of nucleic acid
US5565552A (en) 1992-01-21 1996-10-15 Pharmacyclics, Inc. Method of expanded porphyrin-oligonucleotide conjugate synthesis
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
US5434257A (en) 1992-06-01 1995-07-18 Gilead Sciences, Inc. Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages
US5272250A (en) 1992-07-10 1993-12-21 Spielvogel Bernard F Boronated phosphoramidate compounds
US5574142A (en) 1992-12-15 1996-11-12 Microprobe Corporation Peptide linkers for improved oligonucleotide delivery
US5476925A (en) 1993-02-01 1995-12-19 Northwestern University Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups
GB9304618D0 (en) 1993-03-06 1993-04-21 Ciba Geigy Ag Chemical compounds
EP0691977B1 (en) 1993-03-31 1997-11-26 Sanofi Oligonucleotides with amide linkages replacing phosphodiester linkages
US5502177A (en) 1993-09-17 1996-03-26 Gilead Sciences, Inc. Pyrimidine derivatives for labeled binding partners
DE69433592T2 (de) 1993-11-09 2005-02-10 Targeted Genetics Corp., Seattle Die erzielung hoher titer des rekombinanten aav-vektors
CA2176215C (en) 1993-11-09 2007-06-26 James P. Trempe Stable cell lines capable of expressing the adeno-associated virus replication gene
US5457187A (en) 1993-12-08 1995-10-10 Board Of Regents University Of Nebraska Oligonucleotides containing 5-fluorouracil
US5596091A (en) 1994-03-18 1997-01-21 The Regents Of The University Of California Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides
US5625050A (en) 1994-03-31 1997-04-29 Amgen Inc. Modified oligonucleotides and intermediates useful in nucleic acid therapeutics
US5525711A (en) 1994-05-18 1996-06-11 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Pteridine nucleotide analogs as fluorescent DNA probes
US5658785A (en) 1994-06-06 1997-08-19 Children's Hospital, Inc. Adeno-associated virus materials and methods
US5597696A (en) 1994-07-18 1997-01-28 Becton Dickinson And Company Covalent cyanine dye oligonucleotide conjugates
US5580731A (en) 1994-08-25 1996-12-03 Chiron Corporation N-4 modified pyrimidine deoxynucleotides and oligonucleotide probes synthesized therewith
US5856152A (en) 1994-10-28 1999-01-05 The Trustees Of The University Of Pennsylvania Hybrid adenovirus-AAV vector and methods of use therefor
AU707866B2 (en) 1994-12-06 1999-07-22 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant AAV vectors
FR2737730B1 (fr) 1995-08-10 1997-09-05 Pasteur Merieux Serums Vacc Procede de purification de virus par chromatographie
EP0847442A1 (en) 1995-08-30 1998-06-17 Genzyme Corporation Chromatographic purification of adenovirus and aav
AU715543B2 (en) 1995-09-08 2000-02-03 Genzyme Corporation Improved AAV vectors for gene therapy
US5910434A (en) 1995-12-15 1999-06-08 Systemix, Inc. Method for obtaining retroviral packaging cell lines producing high transducing efficiency retroviral supernatant
DK1944362T3 (en) 1997-09-05 2016-01-25 Genzyme Corp Fremgangsmåder til fremstilling af hjælpevirusfri præparater med høj titer af rekombinante AAV-vektorer
US6258595B1 (en) 1999-03-18 2001-07-10 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
US6287860B1 (en) 2000-01-20 2001-09-11 Isis Pharmaceuticals, Inc. Antisense inhibition of MEKK2 expression
US7056502B2 (en) 2000-04-28 2006-06-06 The Trustees Of The University Of Pennsylvania Recombinant aav vectors with AAV5 capsids and AAV5 vectors pseudotyped in heterologous capsids
US20030158403A1 (en) 2001-07-03 2003-08-21 Isis Pharmaceuticals, Inc. Nuclease resistant chimeric oligonucleotides
KR102209330B1 (ko) * 2011-09-21 2021-01-29 상가모 테라퓨틱스, 인코포레이티드 이식 유전자 발현의 조절을 위한 방법 및 조성물
US9209196B2 (en) 2011-11-30 2015-12-08 Sharp Kabushiki Kaisha Memory circuit, method of driving the same, nonvolatile storage device using the same, and liquid crystal display device
DE102012007232B4 (de) 2012-04-07 2014-03-13 Susanne Weller Verfahren zur Herstellung von rotierenden elektrischen Maschinen
UA118014C2 (uk) 2012-05-25 2018-11-12 Те Ріджентс Оф Те Юніверсіті Оф Каліфорнія Спосіб модифікації днк-мішені
US9873894B2 (en) * 2013-05-15 2018-01-23 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
JP2015092462A (ja) 2013-09-30 2015-05-14 Tdk株式会社 正極及びそれを用いたリチウムイオン二次電池
CN105940013B (zh) * 2013-12-09 2020-03-27 桑格摩生物科学股份有限公司 用于治疗血友病的方法和组合物
JP6202701B2 (ja) 2014-03-21 2017-09-27 株式会社日立国際電気 基板処理装置、半導体装置の製造方法及びプログラム
JP6197169B2 (ja) 2014-09-29 2017-09-20 東芝メモリ株式会社 半導体装置の製造方法
AU2016343887B2 (en) * 2015-10-28 2023-04-06 Sangamo Therapeutics, Inc. Liver-specific constructs, factor VIII expression cassettes and methods of use thereof
WO2017077386A1 (en) * 2015-11-06 2017-05-11 Crispr Therapeutics Ag Materials and methods for treatment of glycogen storage disease type 1a
EP3967758A1 (en) * 2015-12-01 2022-03-16 CRISPR Therapeutics AG Materials and methods for treatment of alpha-1 antitrypsin deficiency
CN105567735A (zh) * 2016-01-05 2016-05-11 华东师范大学 一种凝血因子基因突变的定点修复载体系统及方法

Also Published As

Publication number Publication date
IL273999A (en) 2020-05-31
BR112020007502A2 (pt) 2020-10-06
US20210187125A1 (en) 2021-06-24
CA3079172A1 (en) 2019-04-25
US20240173434A1 (en) 2024-05-30
AU2018353012A1 (en) 2020-04-23
JP2024009014A (ja) 2024-01-19
MX2020004043A (es) 2021-05-27
US20220080055A9 (en) 2022-03-17
WO2019079527A1 (en) 2019-04-25
SG11202003464VA (en) 2020-05-28
EP3697907A1 (en) 2020-08-26
CN111684070A (zh) 2020-09-18
JP7482028B2 (ja) 2024-05-13
US20190247517A1 (en) 2019-08-15
JP2021500072A (ja) 2021-01-07
MA50833A (fr) 2020-08-26

Similar Documents

Publication Publication Date Title
KR20200067190A (ko) A형 혈우병을 위한 유전자 편집용 조성물 및 방법
JP6974349B2 (ja) ヘモグロビン異常症の処置のための材料及び方法
US11713459B2 (en) Expression of FOXP3 in edited CD34+ cells
KR20180081600A (ko) 티틴-기반 근증 및 다른 티틴성병증의 치료를 위한 물질 및 방법
US20210180091A1 (en) Materials and methods for treatment of hemoglobinopathies
KR20210096088A (ko) 전이유전자 전달용 조성물 및 방법
WO2019204668A1 (en) Compositions and methods for knockdown of apo(a) by gene editing for treatment of cardiovascular disease
WO2020168362A1 (en) Gene editing for hemophilia a with improved factor viii expression
WO2019140330A1 (en) Compositions and methods for gene editing by targeting transferrin
WO2019161310A1 (en) Compositions and methods for gene editing by targeting fibrinogen-alpha
JP2023520262A (ja) 改善された第viii因子発現による血友病aのための遺伝子編集

Legal Events

Date Code Title Description
E902 Notification of reason for refusal