KR20210102881A - 인자 ix의 발현을 위한 조성물 및 방법 - Google Patents

인자 ix의 발현을 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20210102881A
KR20210102881A KR1020217014834A KR20217014834A KR20210102881A KR 20210102881 A KR20210102881 A KR 20210102881A KR 1020217014834 A KR1020217014834 A KR 1020217014834A KR 20217014834 A KR20217014834 A KR 20217014834A KR 20210102881 A KR20210102881 A KR 20210102881A
Authority
KR
South Korea
Prior art keywords
factor
nucleic acid
sequence
seq
composition
Prior art date
Application number
KR1020217014834A
Other languages
English (en)
Inventor
조나단 더글라스 핀
혼-렌 황
모이트리 로이
케디 라이
레이첼 새틀러
크리스토스 카이랏사우스
청 왕
Original Assignee
인텔리아 테라퓨틱스, 인크.
리제너론 파마슈티칼스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인텔리아 테라퓨틱스, 인크., 리제너론 파마슈티칼스 인코포레이티드 filed Critical 인텔리아 테라퓨틱스, 인크.
Publication of KR20210102881A publication Critical patent/KR20210102881A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/482Serine endopeptidases (3.4.21)
    • A61K38/4846Factor VII (3.4.21.21); Factor IX (3.4.21.22); Factor Xa (3.4.21.6); Factor XI (3.4.21.27); Factor XII (3.4.21.38)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21022Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hematology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Diabetes (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

숙주 세포 또는 숙주 세포들의 집단에서 인자 IX를 발현시키는 조성물 및 방법들이 제공된다. 또한 인자 IX를 발현시키는 조작된 숙주 세포들이 제공된다.

Description

인자 IX의 발현을 위한 조성물 및 방법
본원은 2018년 10월 18일 출원된 미국 가특허출원 제 62/747,509, 2019년 4월 3일 출원된 미국 가특허출원 제 62/829,009, 2019년 4월 4일 출원된 미국 가특허출원 제 62/829,621, 및 2019년 4월 29일 출원된 미국 가특허출원 제 62/840,352의 우선권의 이익을 주장한다. 전술한 출원들 각각의 내용은 전부 본 출원에 참고문헌으로 포함된다.
출혈 장애는 부적절한 혈액 응고로 인해 발생한다. 이 결핍은 선천성 응고 장애, 후천성 응고 장애 또는 외상으로 인한 출혈 병태로 인해 발생할 수 있다. 출혈은 질병의 가장 심각하고 중요한 증상 중 하나이며 국소 부위에서 발생하거나 전신화 될 수 있다. 국소 출혈은 병변과 관련이 있을 수 있으며 결함이 있는 지혈 메커니즘으로 인해 더욱 복잡해질 수 있다. 응고 인자의 선천적 또는 후천적 결핍은 출혈 경향과 관련이 있을 수 있다. 출혈 장애의 전형적인 예로는 혈우병, 가령, 인자 VIII의 결핍으로 인한 혈우병 A 또는 인자 IX의 결핍으로 인한 혈우병 B (크리스마스 질환)가 있다. 혈우병은 모든 인종 및 민족 집단에서 발생하며 미국과 전 세계의 많은 사람들에게 영향을 미친다.
출혈 장애에 대한 전통적인 치료법에는 결핍된 응고 인자, 가령, 인자 VII, 인자 VIII 또는 인자 IX의 비경구 대체가 포함된다. 예를 들어, 혈우병 B에 대한 현재 치료법은 정제된 재조합 인자 IX의 만성 반복 정맥 주사에 의존한다. 그러나 이러한 치료법은 반복적인 정맥 주사의 필요성, 억제제 형성과 관련된다는 점, 그리고 일반적으로 치료적이기 보다는 예방적이라는 점을 비롯한 많은 단점을 가지고 있다. 예를 들어, Petrini 2001, Hemophilia 7:99; Fischer 등, 2002, Blood 99 (7):2337 참조하라.
누락되거나 결함이 있는 유전자의 사본을 환자에게 도입하는 것을 포함하는 유전자 치료법은 환자에게 인자 IX를 장기간 도입 할 수 있는 한 가지 가능한 방법을 제공한다. 그러나, 인자 IX의 개선된 장기 발현을 제공하는 또 다른 조성물 및 방법이 필요하다.
본 발명은 숙주 세포 또는 숙주 세포들의 집단 (시험관내 또는 생체내)에서 인자 IX를 발현하고 혈우병 (예를 들어, 혈우병 B)을 치료하는데 유용한 조성물 및 방법을 제공한다. 본원은 인자 IX를 인코딩하는 서열을 인간 게놈 유전자좌, 예를 들어, 세이프 하버 부위, 가령, 알부민 세이프 하버 부위에 표적화 삽입함에 사용하기 위한 가이드 RNA를 제공한다. 또한 세이프 하버 부위 내부에, 가령, 알부민 세이프 하버 부위의 인트론 1에 표적화 삽입함에 사용하기 위한, 인자 IX를 인코딩하는 서열을 포함하는, 공여자 구조체 (예를 들어, 양방향 구조체)가 제공된다. 일부 구체예에서, 본원에 개시된 가이드 RNA는 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제) 및 인자 IX 트랜스진을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체)와 조합하여 사용될 수 있다. 일부 구체예에서, 공여자 구조체 (예를 들어, 양방향 구조체)는 유전자 편집 시스템 (예를 들어, CRISPR/Cas 시스템; 징크 핑거 뉴클레아제 (ZFN) 시스템; 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) 시스템)와 함께 사용될 수 있다. 일부 구체예에서, 본원에 개시된 가이드 RNA는 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제) 및 인자 IX 트랜스진을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체)와 조합하여 사용될 수 있다. 다음 구체예들이 제공된다.
일부 양상들에서, 다음을 투여하는 단계를 포함하는, 인자 IX 핵산을 세포 또는 세포들의 집단에 도입하는 방법이 본원에 제공된다: i) 인자 IX 단백질 코딩 서열을 포함하는 핵산 구조체. ii) RNA-가이드 DNA 결합제; 및 iii) 서열을 포함하는 가이드 RNA (gRNA). 일부 구체예들에서, 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 서열인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 98-119로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 98-119로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 120-163으로 구성된 그룹에서 선택된 서열인 서열을 포함한다.
일부 양상들에서, 다음을 투여하는 단계를 포함하는, 세포 또는 세포들의 집단에서 인자 IX 핵산을 발현시키는 방법이 본원에 제공된다: i) 인자 IX 단백질 코딩 서열을 포함하는 핵산 구조체. ii) RNA-가이드 DNA 결합제; 및 iii) 서열을 포함하는 가이드 RNA (gRNA). 일부 구체예들에서, 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 98-119로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 98-119로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 120-163으로 구성된 그룹에서 선택된 서열을 포함한다.
일부 양상들에서, 다음을 투여하는 단계를 포함하는, 세포 또는 세포들의 집단에서 인자 IX 핵산을 도입 또는 발현시키는 방법이 본원에 제공된다: i) 인자 IX 단백질 코딩 서열을 포함하는 핵산 구조체. ii) RNA-가이드 DNA 결합제; 및 iii) 서열을 포함하는 가이드 RNA (gRNA), 이 때 상기 투여는 시험관내이다.
일부 구체예들에서, 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 서열을 포함한다.
일부 구체예들에서, 핵산 구조체는 핵산 벡터 및/또는 지질 나노입자에 투여된다. 일부 구체예들에서, RNA-가이드 DNA 결합제 및/또는 gRNA는 핵산 벡터 및/또는 지질 나노입자에 투여된다. 일부 구체예들에서, 핵산 벡터는 바이러스 벡터이다. 일부 구체예들에서, 바이러스 벡터는 아데노 관련 바이러스 (AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 렌티바이러스 벡터로 구성된 그룹에서 선택된다. 일부 구체예들에서, AAV 벡터는 AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV-DJ, 및 AAV2/8로 구성된 그룹에서 선택된다.
일부 구체예들에서, 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는 순차적으로, 임의의 순서로 및/또는 임의의 조합으로 투여된다. 일부 구체예들에서, 이 때 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는, 개별적으로 또는 임의의 조합으로, 동시에 투여된다. 일부 구체예들에서, RNA-가이드 DNA 결합제, 또는 조합된 RNA-가이드 DNA 결합제 및 gRNA는, 핵산 구조체 투여 이전에 투여된다. 일부 구체예들에서, 핵산 구조체는 gRNA 및/또는 RNA-가이드 DNA 결합제 투여 이전에 투여된다.
일부 구체예들에서, RNA-가이드 DNA 결합제는 Cas 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 클래스 2 Cas 뉴클레아제이다. 일부 구체예들에서 Cas 뉴클레아제는 Cas9이다. 일부 구체예들에서, Cas 뉴클레아제는 S. 피오게네스 (S. pyogenes) Cas9 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 닉카제이다.
일부 구체예들에서, 핵산 구조체는 양방향 핵산 구조체이다. 일부 구체예들에서, 핵산 구조체는 단일-가닥 또는 이중-가닥이다. 일부 구체예들에서, 핵산 구조체는 단일-가닥 DNA 또는 이중-가닥 DNA이다. 일부 구체예들에서, 양방향 구조체는 인자 IX 단백질의 발현을 구동시키는 프로모터를 포함하지 않는다. 일부 구체예들에서, 세포 또는 세포들의 집단은 알부민 신호 펩티드와 같은 이종 펩티드를 가진 인자 IX를 발현한다.
일부 구체예들에서, 세포 또는 세포들의 집단은 간 세포를 포함한다. 일부 구체예들에서, 간 세포는 헤파토사이트이다.
일부 구체예들에서, 핵산은 야생형 인자 IX 단백질을 인코딩한다. 일부 구체예들에서, 핵산은 돌연변이체 인자 IX 단백질을 인코딩한다. 일부 구체예들에서, 핵산은 돌연변이 R338L을 가지는 인자 IX 단백질을 인코딩한다.
일부 양상들에서, 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체를 세포 또는 세포들의 집단에 투여하여 세포 또는 세포들의 집단에서 인자 IX를 발현하는 단계를 포함하는, 인자 IX 핵산을 세포 또는 세포들의 집단에 도입하는 방법이 본원에 제공된다. 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체를 세포 또는 세포들의 집단에 투여하여 세포 또는 세포들의 집단에서 인자 IX를 발현하는 단계를 포함하는, 인자 IX를 세포 또는 세포들의 집단에서 발현시키는 방법이 본원에 제공된다.
일부 구체예들에서, 양방향 핵산 구조체는 다음을 포함한다: a) 인자 IX에 대한 코딩 서열을 포함하는 제 1 세그먼트; 및 b) 인자 IX의 코딩 서열의 역 상보체를 포함하는 제 2 세그먼트, 이 때 구조체는 인자 IX의 발현을 구동시키는 프로모터를 포함하지 않는다. 일부 구체예에서, 양방향 핵산 구축물은 다음을 포함한다: a) 인자 IX에 대한 코딩 서열을 포함하는 제 1 세그먼트; 및 b) 제 2 폴리펩티드의 코딩 서열의 역 상보체를 포함하는 제 2 세그먼트, 이 때 구조체는 폴리펩티드의 발현을 구동시키는 프로모터를 포함하지 않는다.
일부 구체예들에서, 인자 IX 핵산을 세포 또는 세포들의 집단에 도입하는 방법은 RNA-가이드 DNA 결합제를 투여하는 단계를 추가로 포함한다. 일부 구체예들에서, 상기 방법은 gRNA를 투여하는 단계를 추가로 포함한다. 일부 구체예들에서, 양방향 핵산 구조체는 핵산 벡터 및/또는 지질 나노입자에 투여된다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 핵산 벡터 및/또는 지질 나노입자에 투여된다. 일부 구체예들에서, gRNA는 핵산 벡터 및/또는 지질 나노입자에 투여된다. 일부 구체예들에서, 핵산 벡터는 바이러스 벡터이다. 일부 구체예들에서, 바이러스 벡터는 아데노 관련 바이러스 (AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 렌티바이러스 벡터로 구성된 그룹에서 선택된다. 일부 구체예들에서, AAV 벡터는 AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV-DJ, 및 AAV2/8로 구성된 그룹에서 선택된다.
일부 구체예들에서, 양방향 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는 순차적으로, 임의의 순서로 및/또는 임의의 조합으로 투여된다. 일부 구체예들에서, 양방향 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는, 임의의 조합으로, 동시에 투여된다. 일부 구체예들에서, RNA-가이드 DNA 결합제, 또는 조합된 RNA-가이드 DNA 결합제 및 gRNA는, 양방향 핵산 구조체 투여 이전에 투여된다. 일부 구체예들에서, 양방향 핵산 구조체는 gRNA 및/또는 RNA-가이드 DNA 결합제 투여 이전에 투여된다.
일부 구체예들에서, RNA-가이드 DNA 결합제는 Cas 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 클래스 2 Cas 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 S. 피오게네스 (S. pyogenes) 뉴클레아제, S. 아우레우스 (S. aureus) 뉴클레아제, C. 제주니 (C. jejuni) 뉴클레아제, S. 써모필루스 (S. thermophilus) 뉴클레아제, N. 메닌기티디스 (N. meningitidis) 뉴클레아제, 및 이의 변이체로 구성된 그룹에서 선택된다. 일부 구체예들에서, Cas 뉴클레아제는 Cas9이다. 일부 구체예들에서, Cas 뉴클레아제는 닉카제이다.
일부 구체예들에서, 양방향 구조체는 인자 IX 단백질의 발현을 구동시키는 프로모터를 포함하지 않는다. 일부 구체예들에서, 양방향 구조체는 단일-가닥 또는 이중-가닥이다. 일부 구체예들에서, 핵산 구조체는 단일-가닥 DNA 또는 이중-가닥 DNA이다. 일부 구체예들에서, gRNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열 또는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다.
일부 양상들에서, 본원은 세포에서 인자 IX을 발현함에 사용하기 위한 조성물을 제공하며, 이 때 조성물은 다음을 포함한다: i) 인자 IX 단백질 코딩 서열을 포함하는 핵산 구조체; ii) RNA-가이드 DNA 결합제; 및 iii) 서열 번호: 2-33으로 구성된 그룹에서 선택된 가이드 서열 또는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함하는 가이드 RNA (gRNA). 본원은 세포 또는 세포들의 집단에서 인자 IX를 발현하는데 사용하기 위한 조성물이 제공되며, 이 때 상기 조성물은 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체를 포함한다. 일부 구체예들에서, 숙주 세포는 임의의 전술한 구체예의 방법에 의해 제조된다.
일부 구체예들에서, 숙주 세포는 간 세포이다. 일부 구체예들에서, 숙주 세포는 비-분열 세포 유형이다. 일부 구체예들에서, 숙주 세포는 양방향 구조체에 의해 인코드된 인자 IX 폴리펩티드를 발현한다. 일부 구체예들에서, 숙주 세포는 헤파토사이트이다.
상기 방법의 방법, 구조체, 또는 숙주 세포의 일부 구체예들에서, gRNA는 서열 번호: 401을 포함한다.
도면의 간단한 설명
도 1은 AAV 게놈에서 표현되는 구조체 형태들을 보여준다. SA= 스플라이스 수용체; pA= 폴리A 신호 서열; HA= 상동성 아암 (homology arm); LHA= 왼쪽 상동성 아암; RHA= 오른쪽 상동성 아암
도 2는 상동성 아암이 없는 벡터가 불멸화된 간 세포주 (Hepa1-6)에서 효과적이지 않음을 보여준다. 200bp 상동성 아암을 포함하는 플라스미드 P00204로부터 유래된 scAAV는 분열 중인 세포에서 hFIX의 발현을 초래했다. P00123 (상동성 아암이 없는 scAAV) 및 P00147 (상동성 아암이 없는 ssAAV 양방향 구조체)에서 유도된 AAV 벡터의 사용은 hFIX의 검출가능한 발현을 가져오지 않았다.
도 3A 및 3B는 P00123, P00147 또는 P00204에서 유래된 벡터를 사용하여 상동성 아암의 유무에 따른 삽입 템플릿의 생체내 테스트 결과를 보여준다. 도 3A는 ~60%의 인델 형성에 의해 측정된 간 편집 수준이 CRISPR/Cas9 성분을 포함하는 LNP로 처리된 각 동물 그룹에서 검출되었음을 보여준다. 도 3B는 상동성 아암이 없는 ssAAV 벡터 (P00147로부터 유래)를 LNP 처리와 조합하여 제공받은 동물들이 혈청에서 최고 수준의 hFIX 발현을 가져옴을 보여준다.
도 4A 및 4B는 상동성 아암의 유무에 따른 ssAAV 삽입 템플릿의 생체내 테스트 결과를 보여준다. 도 4A는 플라스미드 P00350, P00356, P00362 (도시된 비대칭 상동성 아암을 가짐) 및 P00147 (도 4B에 도시된 양방향 구조체)에서 유래된 벡터에 있어서 표적 삽입을 비교한다. 도 4B는 플라스미드 P00353, P00354 (도시된 대칭 상동성 아암을 가짐) 및 P00147에서 유래된 벡터로 표적화된 제 2 부위로의 삽입을 비교한다.
도 5A-5D는 일차 마우스 헤파토사이트들에서 20개의 표적 부위에 걸친 양방향 구조체 표적 삽입 결과를 보여준다. 도 5A는 각 테스트 벡터들의 개략도를 보여준다. 도 5B는 테스트된 각 조합에 걸쳐 각 처리 그룹들에 대한 인델 형성으로 측정된 편집을 보여준다. 도 5C 및 도 5D는 유의한 수준의 편집 (특정 표적 부위에서의 인델 형성과 같은)이 반드시 트랜스진의 더 효율적인 삽입 또는 발현을 가져오는 것은 아니었음을 보여준다. hSA= 인간 F9 스플라이스 수용체; mSA= 마우스 알부민 스플라이스 수용체; HiBit= 루시퍼라제 기반 검출용 태그; pA= 폴리A 신호 서열; Nluc= 나노루시퍼라제 리포터; GFP= 녹색 형광 리포터.
도 6은 P00147로부터 유래된 ssAAV를 사용하여 10개의 표적 부위에 걸쳐 양방향 구조체를 이용한 표적 삽입의 생체내 스크리닝 결과를 보여준다. 보는 바와 같이, 유의한 수준의 인델 형성이 반드시 높은 수준의 트랜스진 발현을 가져오는 것은 아니다.
도 7A-7D는 P00147에서 유래된 ssAAV를 사용하여 20개의 표적 부위에 걸쳐 양방향 구조체를 이용한 생체내 스크리닝 결과를 보여준다. 도 7A는 테스트된 각 LNP/벡터 조합에 걸쳐 각각의 처리 그룹에 대해 인델 형성에 의해 측정된 다양한 수준의 편집이 검출되었음을 보여준다. 도 7B는 해당 표적된 삽입 데이터를 제공한다. 상기 결과들은 양방향 구조체의 삽입 또는 발현과 인델 형성 사이의 낮은 상관관계 (도 7B 및 도 7D)와 시험관내 및 생체내 결과 사이의 양의 상관관계 (도 7C)를 보여준다.
도 8A 및 8B는 hFIX 트랜스진과 마우스 알부민 엑손 1 서열 사이의 접합을 검출할 수 있는 프로브를 사용하는 인 시튜 혼성화 방법을 사용하여 세포 수준에서 양방향 구조체의 삽입을 보여준다 (도 8A). 순환 hFIX 수준은 하이브리드 전사체에 대해 양성인 세포의 수와 상관관계가 있다 (도 8B).
도 9는 양방향 hFIX 구조체를 포함하는 ssAAV와 LNP의 전달 사이의 시간 변화에 따른 표적화된 삽입에 대한 효과를 보여준다.
도 10은 양방향 hFIX 구조체의 전달 후 LNP 투약 횟수 (예를 들어, 1, 2, 또는 3회) 변화에 따른 표적화된 삽입에 대한 효과를 보여준다.
도 11A는 생체내 hFIX 발현의 지속성을 보여준다. 도 11b는 알부민의 인트론 1로부터의 발현이 지속되었음을 입증한다.
도 12A 및 도 12B는 다양한 AAV 또는 LNP 용량이 생체내에서 알부민 유전자의 인트론 1로부터 hFIX의 발현량을 조절할 수 있음을 보여준다.
도 13A-13C는 일차 시노몰구스 헤파토사이트들에서 표적 부위에 걸쳐 양방향 구조체들을 스크리닝한 결과를 보여준다. 도 13A는 각 샘플에 대해 검출된 인델 형성에 의해 측정된 다양한 수준의 편집을 보여준다. 도 13B 및 도 13C는 유의한 수준의 인델 형성이 알부민의 인트론 1 내부로의 양방향 구조체 삽입 또는 발현을 예측하지 못하였음을 보여준다.
도 14A-14C는 일차 인간 헤파토사이트들에서 표적 부위에 걸쳐 양방향 구조체들을 스크리닝한 결과를 보여준다. 도 14A는 각 샘플에 대해 검출된 인델 형성에 의해 측정된 편집을 보여준다. 도 14B, 도 14C, 및 14D는 유의한 수준의 인델 형성이 알부민 유전자의 인트론 1 내부로의 양방향 구조체 삽입 또는 발현을 예측하지 못하였음을 보여준다.
도 15는 비인간 영장류에게 양방향 hFIX 삽입 템플릿 (P00147에서 유래)과 함께 LNP를 투여한 생체내 연구 결과를 보여준다. 전신 hFIX 수준은 LNP 및 AAV 둘 모두로 처리된 동물에서만 구현되었으며, AAV 또는 LNP 하나만을 사용하는 것은 hFIX를 검출 할 수 없었다.
도 16A 및 도 16B는 주사 후 6주차 혈장 샘플에서 인간 인자 IX 발현 수준을 보여준다.
도 17은 각 동물의 여러 엽에 걸쳐 7주차 혈청 수준 및 양성 세포%를 보여준다.
도 18은 주사 후 1, 2 및 4주차에 각 그룹의 혈장 샘플에서 인간 인자 IX 발현 수준을 보여준다.
도 19는 aPTT 분석에서 hF9 트랜스진의 삽입 및 응고 기능을 보여준다.
도 20A 및 도 20B는 TGA-EA 분석에서 hF9 트랜스진의 삽입 및 트롬빈 생성을 보여준다.
도 21은 hF9 트랜스진의 삽입 및 트롬빈 생성을 보여준다.
상세한 설명
이제 본 발명의 특정 구체예에 대해 상세히 언급 할 것이며, 이의 예는 첨부된 도면에서 설명된다. 본 발명은 도시된 구체예들과 관련하여 설명될 것이지만, 본 발명은 이들 구체예로 본 발명을 제한하려는 것이 아니라는 것을 이해할 것이다. 반대로, 본 발명은 모든 대안, 변형 및 균등예들을 포함하고자 하며, 이는 첨부된 구체예들에 의해 정의된 본 발명의 범위에 포함될 수 있다.
본 발명의 내용을 상세하게 설명하기 전에, 본원의개시된 내용이 특정 조성물 또는 공정 단계에 제한되지 않고, 변화할 수 있음을 이해해야 한다. 본 명세서 및 첨부된 구체예에서 사용되는, 단수형 "하나" 및 "그것"은 문맥에서 달리 명확히 언급이 없는 한 복수형을 포함함을 유념하여야 한다. 따라서, 예를 들어, "접합체"에 대한 언급은 복수의 접합체를 포함하고 "세포"에 대한 언급은 복수 또는 세포들의 집단 등을 포함한다. 본원에서 사용되는 용어 "포함하다" 및 이의 문법적 변화형은 비-제한적인 것으로, 목록에 있는 항목들의 언급은 열거된 항목들에 대해 치환 또는 추가될 수 있는 다른 유사 항목들을 제외시키는 것이 아니다.
수치 범위는 범위를 정의하는 수치를 포함한다. 측정 및 측정가능한 값은 유효 숫자 및 측정과 관련된 오류를 고려하여 근사치로 이해된다. 또한, “포함하다 (comprise, comprises)", “포함하는", “함유하다 (contain, contains)”, “함유하는”, “비롯하다 (include, includes)”, 및 "비롯하는”의 사용은 제한을 의도하는 것은 아니다. 전술한 일반적인 설명 및 상세한 설명 모두는 단지 예시 및 설명을 위한 것이며 발명의 내용을 제한하고자 하지 않음을 이해하여야 한다.
명세서에서 구체적으로 언급되지 않는 한, 다양한 구성요소들을 "포함하는" 것을 언급하는 명세서의 구체예들은 또한 언급한 구성요소들로 "구성되는" 또는 "실질적으로 구성되는" 것으로 간주되고; 다양한 구성요소들로 "구성되는" 것을 언급하는 명세서의 구체예들은 또한 언급된 구성요소들을 "포함하는" 또는 이들로 "실질적으로 구성되는" 것으로 간주되고; 그리고 다양한 구성성분들로 "실질적으로 구성되는" 것을 언급하는 명세서의 구체예들은 또한 언급된 구성성분들로 "구성되는" 또는 이들을 "포함하는" 것으로 간주된다 (이러한 호환가능성은 청구범위에서의 이들 용어의 사용에는 적용되지 않는다). 용어 "또는"은 포괄적인 의미로, 즉 문맥상 달리 명시하지 않는 한 "및/또는"과 동등한 의미로 사용된다. 열거된 것 앞에 사용될 경우 용어 "약”은 목록의 각 구성원을 변화시킨다. 용어 "약" 또는 "대략"은 해당 기술 분야의 통상의 지식을 가진 자에 의해 결정된 특정 수치에 대해 허용가능한 오차를 의미하며, 이는 부분적으로 그 수치가 어떻게 측정 또는 결정되는지에 따라 달라진다.
열거된 것 앞에 사용될 경우 용어 "약”은 목록의 각 구성원을 변화시킨다.용어 "약" 또는 "대략"은 해당 기술 분야의 통상의 지식을 가진 자에 의해 결정된 특정 수치에 대해 허용가능한 오차를 의미하며, 이는 부분적으로 그 수치가 어떻게 측정 또는 결정되는지에 따라 달라진다.
본 출원에서 사용되는 구획 제목은 단지 구성을 위한 것이며 원하는 주제를 어떠한 방식으로도 제한하는 것으로 해석되어서는 안된다. 참고로 포함된 자료가 본 명세서에 정의된 용어 또는 본 명세서의 다른 표현 내용과 모순되는 경우, 본 명세서가 우선한다.
I. 정의
달리 명시되지 않는 한, 여기에 사용 된 다음 용어 및 구문은 다음과 같은 의미를 갖는다:
"폴리뉴클레오티드" 및 "핵산"은 골격을 따라 함께 연결된 질소 헤테로사이클릭 염기 또는 염기 유사체를 갖는 뉴클레오사이드 또는 뉴클레오사이드 유사체를 포함하는 다량체 화합물을 지칭하기 위해 본원에서 사용되며, 이는 통상적인 RNA, DNA, 혼합 RNA-DNA 및 이의 유사체인 중합체를 포함한다. 핵산 "골격"은 하나 이상의 당-포스포디에스터 링키지, 펩티드-핵산 결합 ("펩티드 핵산" 또는 PNA; PCT 번호 WO 95/32305), 포스포로티오에이트 링키지, 메틸포스포네이트 링키지, 또는 이들의 조합을 비롯한 다양한 링키지들로 구성 될 수 있다. 핵산의 당 모이어티는 리보스, 데옥시리보스 또는 치환, 예를 들어 2' 메톡시 또는 2' 할라이드 치환을 갖는 유사한 화합물 일 수 있다. 질소 염기는 통상적인 염기 (A, G, C, T, U), 이의 유사체 (예를 들어, 변형된 우리딘, 예를 들어, 5-메톡시우리딘, 슈도우리딘, 또는 N1-메틸슈도우리딘, 또는 기타); 이노신; 퓨린 또는 피리미딘의 유도체 (예를 들어, N4-메틸 데옥시구아노신, 데아자- 또는 아자-퓨린, 데아자- 또는 아자-피리미딘, 5 또는 6 위치에 치환기가 있는 피리미딘 염기 (예를 들어, 5-메틸시토신), 2, 6 또는 8 위치에 치환기가 있는 퓨린 염기, 2-아미노-6-메틸아미노퓨린, O6-메틸구아닌, 4-티오-피리미딘, 4-아미노-피리미딘, 4-디메틸하이드라진-피리미딘 및 O4-알킬-피리미딘; US 특허 5,378,825 및 PCT 제 WO 93/13121) 일 수 있다. 일반적인 논의는 The Biochemistry of the Nucleic Acids 5-36, Adams 등, ed., 11th ed., 1992)를 참고하라. 핵산은 하나 이상의 "비 염기성" 잔기를 포함 할 수 있으며, 여기서 골격은 중합체의 위치(들)에 대하여 질소 염기를 포함하지 않는다. (US 특허 제 5,585,481). 핵산은 통상적인 RNA 또는 DNA 당, 염기 및 링키지만을 포함 할 수 있거나, 통상적인 성분 및 치환 (예를 들어, 2' 메톡시 링키지들을 갖는 통상적인 염기, 또는 통상적인 염기 및 하나 이상의 염기 유사체들을 모두 함유하는 중합체)을 모두 포함 할 수 있다. 핵산은 당 형태를 모방하는 RNA에 잠금된 바이사이클릭 퓨라노스 단위를 가지는 하나 이상의 LNA 뉴클레오티드 단량체를 함유하는 유사체인 “잠금 핵산” (LNA)을 포함하는데, 이는 상보적 RNA 및 DNA 서열들에 대한 혼성화 친화도를 향상시킨다 (Vester and Wengel, 2004, Biochemistry 43(42):13233-41). RNA와 DNA는 상이한 당 모이어티를 가지며 RNA에서 우라실 또는 이의 유사체 그리고 DNA에서 티민 또는 이의 유사체의 존재에 의해 다를 수 있다.
"가이드 RNA", "gRNA" 및 간단히 "가이드"는 가이드 서열을 포함하는 가이드, 예를 들어, crRNA (CRISPR RNA로도 공지) 또는 crRNA와 trRNA의 조합 (tracrRNA로도 공지)을 지칭하기 위해 본원에서 호환적으로 사용된다. crRNA 및 trRNA는 단일 RNA 분자 (단일 가이드 RNA, sgRNA)로 결합되거나, 또는, 예를 들어, 2개의 개별 RNA 분자 (이중 가이드 RNA, dgRNA)로 존재할 수 있다. “가이드 RNA” 또는 “gRNA”는 각 유형을 지칭한다. trRNA는 자연 발생 서열, 또는 자연 발생 서열과 비교하여 변형 또는 변이가 있는 trRNA 서열 일 수 있다. 가이드 RNA, sgRNA 또는 dgRNA는 본원에 기재된 변형된 RNA를 포함 할 수 있다.
본원에 사용된 "가이드 서열"은 표적 서열에 상보적이고 RNA-가이드 DNA 결합제에 의한 결합 또는 변형 (예를 들어, 절단)을 위해 가이드 RNA를 표적 서열로 안내하는 기능을 하는 가이드 RNA 내부의 서열을 지칭한다. "가이드 서열"은 또한 "표적화 서열"또는 "스페이서 서열"로 지칭 될 수 있다. 가이드 서열은, 예를 들어, 스트렙토코쿠스 피오게네스 (Streptococcus pyogenes) (즉, Spy Cas9) 및 관련 Cas9 동족체/오쏠로그의 경우 20개 염기쌍 길이 일 수 있다. 보다 짧은 또는 긴 서열들, 예를 들어, 15-, 16-, 17-, 18-, 19-, 21-, 22-, 23-, 24-, 또는 25-뉴클레오티드 길이 또한 가이드로서 사용될 수 있다. 예를 들어, 일부 구체예들에서, 가이드 서열은 서열 번호:2-33에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 표적 서열은 유전자 또는 염색체에 존재하고 예를 들어 가이드 서열에 상보적이다. 일부 구체예들에서, 가이드 서열과 이의 대응 표적 서열 사이의 상보성 또는 동일성 정도는 약 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 일 수 있다. 예를 들어, 일부 구체예들에서, 가이드 서열은 서열 번호: 2-33에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드에 약 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 가지는 서열을 포함한다. 일부 구체예들에서, 표적 영역의 가이드 서열은 100% 상보적 또는 동일할 수 있다. 다른 구체예에서, 가이드 서열 및 표적 영역은 최소한 하나의 미스매치를 포함 할 수 있다. 예를 들어, 가이드 서열 및 표적 서열은 1, 2, 3, 또는 4개 미스매치를 함유할 수 있으며, 이 때 표적 서열의 총 길이는 최소한 15, 16, 17, 18, 19, 20개 또는 그 이상의 염기쌍이다. 일부 구체예들에서, 가이드 서열 및 표적 영역은 1-4개 미스매치를 함유할 수 있으며 이 때 가이드 서열은 최소한 15, 16, 17, 18, 19, 20개 또는 그 이상의 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 서열 및 표적 영역은 1, 2, 3, 또는 4개 미스매치를 함유할 수 있으며 이 때 가이드 서열은 20개 뉴클레오티드를 포함한다.
RNA-가이드 DNA 결합제에 대한 핵산 기질이 이중-가닥 핵산이므로 RNA-가이드 DNA 결합제들의 표적 서열들은 게놈 DNA의 양성 및 음성 가닥들 모두 (, 주어진 서열 및 이 서열의 역 상보체)를 포함한다. 따라서, 가이드 서열이 "표적 서열에 상보적"이라고 말하는 경우, 가이드 서열은 가이드 RNA가 표적 서열의 역 상보체에 결합하도록 안내할 수 있음을 이해하여야 한다. 따라서, 가이드 서열이 표적 서열의 역 상보체에 결합하는 일부 구체예에서, 가이드 서열은 가이드 서열에서 T에 대한 U의 치환을 제외하고 표적 서열 (예를 들어, PAM을 포함하지 않는 표적 서열)의 특정 뉴클레오티드와 동일하다.
본원에 사용된 "RNA-가이드 DNA 결합제"는 RNA 및 DNA 결합 활성을 갖는 폴리펩티드 또는 폴리펩티드의 복합체, 또는 이러한 복합체의 DNA-결합 서브유닛을 의미하며, 이 때 DNA 결합 활성은 서열 특이적이고 RNA의 서열에 의존적이다. 용어 RNA-가이드 DNA 결합제는 또한 이러한 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적인 RNA-가이드 DNA 결합제는 Cas 클리브아제/닉카제를 포함한다. 예시적인 RNA-가이드 DNA 결합제는, 예를 들어, 이들 제제들이 DNA 절단을 허용하도록 예를 들어, FokI 클리브아제 도메인과의 융합을 통해 변형된 경우, 이의 비활성화 형태들 (“dCas DNA 결합제”)을 포함할 수 있다. 본원에서 사용되는 “Cas 뉴클레아제"는 Cas 클리브아제 및 Cas 닉카제를 포함한다. Cas 클리브아제 및 Cas 닉카제는 유형 III CRISPR 시스템의 Csm 또는 Cmr 복합체, Cas10, 이의 Csm1, 또는 Cmr2 서브유닛, 유형 I CRISPR 시스템의 캐스케이드 복합체, 이의 Cas3 서브유닛, 및 클래스 2 Cas 뉴클레아제를 포함한다. 본원에서 사용되는 “클래스 2 Cas 뉴클레아제”는 RNA-가이드 DNA 결합 활성을 가지는 단일-사슬 폴리펩티드이다. 클래스 2 Cas 뉴클레아제는 RNA-가이드 DNA 클리브아제 또는 닉카제 활성을 추가로 가지는 클래스 2 Cas 클리브아제/닉카제 (예를 들어, H840A, D10A, 또는 N863A 변이체), 그리고, 이들 제제들이 DNA 절단을 허용하도록 변형된 경우, 클리브아제/닉카제 활성이 비활성화되어 있는 클래스 2 dCas DNA 결합제를 포함한다. 클래스 2 Cas 뉴클레아제는, 예를 들어, Cas9, Cpf1, C2c1, C2c2, C2c3, HF Cas9 (예를 들어, N497A, R661A, Q695A, Q926A 변이체), HypaCas9 (예를 들어, N692A, M694A, Q695A, H698A 변이체), eSPCas9(1.0) (예를 들어, K810A, K1003A, R1060A 변이체), 및 eSPCas9(1.1) (예를 들어, K848A, K1003A, R1060A 변이체) 단백질 및 이의 변형을 포함한다. Cpf1 단백질, Zetsche 등, Cell, 163: 1-13 (2015)은, 또한 RuvC-유사 뉴클레아제 도메인을 함유한다. Zetsche의 Cpf1 서열들은 그 전체가 참고로 포함된다. 예를 들어, Zetsche, 표 S1 및 S3를 참고하라. 예를 들어, Makarova 등, Nat Rev Microbiol, 13(11): 722-36 (2015); Shmakov 등, Molecular Cell, 60:385-397 (2015)를 참고하라. 본원에서 사용되는 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제, Cas9 뉴클레아제, 또는 S. 피오게네스 Cas9 뉴클레아제)의 전달은 폴리펩티드 또는 mRNA의 전달을 포함한다.
본원에서 사용되는 “리보핵단백질” (RNP) 또는 “RNP 복합체”는 RNA-가이드 DNA 결합제, 가령, Cas 뉴클레아제, 예를 들어, Cas 클리브아제, Cas 닉카제, 또는 dCas DNA 결합제 (예를 들어, Cas9)와 함께 가이드 RNA를 지칭한다. 일부 구체예들에서, 가이드 RNA는 RNA-가이드 DNA 결합제, 가령, Cas9를 표적 서열로 가이드하고, 가이드 RNA는 표적 서열과 혼성화하여 제제가 표적 서열에 결합한다; 제제가 클리브아제 또는 닉카제인 경우, 결합 후 절단 또는 닉킹이 수반될 수 있다.
본원에서 사용될 때, 제 2 서열에 대한 제 1 서열의 정렬이, 그 전체에서 제 2 서열의 위치들의 X% 또는 그 이상이 제 1 서열과 매치됨을 보여주는 경우, 제 1 서열은 제 2 서열에 대해 "최소한 X% 동일성을 가지는 서열을 포함하는" 것으로 간주된다. 예를 들어, 서열 AAGA는 서열 AAG에 대해 100% 동일성을 가지는 서열을 포함하는데, 제 2 서열의 3개 위치들 모두에 대해 매치된다는 점에서 정렬이 100% 동일성을 제공하기 때문이다. RNA와 DNA 간의 차이 (일반적으로 우리딘을 티미딘으로 또는 그 역으로 교환) 및 뉴클레오시드 유사체, 가령, 변형된 우리딘의 존재는 관련 뉴클레오티드 (가령, 티미딘, 우리딘, 또는 변형된 우리딘)가 동일한 상보체 (예를 들어, 모든 티미딘, 우리딘 또는 변형된 우리딘에 대해 아데노신; 또 다른 예는 시토신 및 5-메틸시토신, 이들 둘 모두 상보체로서 구아노신 또는 변형된 구아노신을 가진다)를 가지는 한 폴리뉴클레오티드에서의 동일성 또는 상보성에서 차이를 유발하지 않는다. 그러므로, 예를 들어, X가 임의의 변형된 우리딘, 가령, 슈도우리딘, N1-메틸 슈도우리딘, 또는 5-메톡시우리딘인 서열 5'-AXG는, AUG에 100% 동일한 것으로 간주되는데, 이들 둘 모두가 동일한 서열 (5'-CAU)에 완벽하게 상보적이기 때문이다. 예시적인 정렬 알고리즘은 당업계에 잘 공지된 Smith-Waterman 및 Needleman-Wunsch 알고리즘이다. 당업자는 주어진 정렬될 서열들 쌍에 대해 어떠한 알고리즘의 선택 및 매개변수 설정이 적절한지를 잘 이해할 것이다; 일반적으로 유사한 길이 그리고 아미노산의 경우 >50% 또는 뉴클레오티드의 경우 >75%의 동일성이 예상되는 서열들에 대하여, www.ebi.ac.uk 웹 서버에서 EBI가 제공하는 Needleman-Wunsch 알고리즘 인터페이스의 기본 설정을 사용하는 Needleman-Wunsch 알고리즘이 일반적으로 적절하다.
본원에서 사용되는 바와 같이, 제 1 서열 염기의 X% 염기들이 제 2 서열과 쌍을 이루는 경우 제 1 서열은 제 2 서열에 "X% 상보적인" 것으로 간주된다. 예를 들어, 제 1 서열 5'AAGA3'은 제 2 서열 3'TTCT5'에 100% 상보적이며, 제 2 서열은 제 1 서열에 100% 상보적이다. 일부 구체예들에서, 제 1 서열 5'AAGA3'은 제 2 서열 3'TTCTGTGA5'에 100% 상보적인 반면, 제 2 서열은 제 1 서열에 50% 상보적이다.
본원에 사용된 "mRNA"는 전체적으로 또는 주로 RNA 또는 변형된 RNA이고 폴리펩티드로 번역 될 수 있는 (즉, 리보솜 및 아미노-아실화 tRNA에 의한 번역을 위한 기질로서 기능할 수 있는) 오픈 리딩 프레임을 포함하는 폴리뉴클레오티드를 지칭하기 위해 본원에서 사용된다. mRNA는 리보스 잔기 또는 이의 유사체, 예를 들어, 2'-메톡시 리보스 잔기를 포함하는 포스페이트-당 골격을 포함 할 수 있다. 일부 구체예들에서, mRNA 포스페이트-당 골격의 당은 본질적으로 리보스 잔기, 2'-메톡시 리보스 잔기 또는 이들의 조합으로 구성된다.
본원 전반에 걸쳐 본원에 기재된 가이드 RNA 조성물 및 방법에 유용한 가이드 서열은 표 1에 제시되어 있다.
본원에 사용된 "인델"은 표적 핵산의 이중-가닥 절단 (DSB) 부위에 삽입되거나 결실된 다수의 뉴클레오티드로 구성된 삽입/결실 돌연변이를 지칭한다.
본원에 사용된 “인자 IX”는 “FIX” 또는 “F9”와 호환적으로 사용되며, 크리스마스 인자로도 공지되어 있다. 인간 야생형 인자 IX 단백질 서열은 NCBI NP_000124에서 이용가능하며; 유전자 서열은 NCBI NM_000133에서 이용가능하다. 인자 IX 단백질 서열의 예들이 본원에 기재되어 있다 (예를 들어, 서열 번호: 700, 서열 번호: 701, 및/또는 서열 번호: 702). 본원에서 사용되는 인자 IX는 또한 인자 IX의 변이체, 예를 들어, 야생형 인자 IX에 비해 증가된 응집 활성을 보유하는 변이체를 포함한다. 인자 IX의 과활성 변이체는 R338의 치환을 포함할 수 있다. 이러한 변이체 인자 IX의 한 예는 서열 번호: 701에 대한 돌연변이 R338L을 포함한다. 용어 과활성 및 과기능은 본원에서 호환적으로 사용된다. 변이체 인자 IX의 또 다른 예는 잔기 338에서 알라닌, 류신, 발린, 이소류신, 페닐알라닌, 트립토판, 메티오닌, 세린 및 트레오닌으로부터 선택된 아미노산을 포함한다. 또 다른 인자 IX 변이체는 잔기 338에서 류신, 시스테인, 아스파르트산, 글루탐산, 히스티딘, 리신, 아스파라긴, 글루타민 또는 티로신으로부터 선택된 아미노산을 포함한다. 본원에서 사용되는 인자 IX는 또한 야생형 인자 IX와 비교하여, 최소한 60%, 70%, 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지는, 서열 번호: 700에 대해 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일한 변이체를 포함한다. 본원에서 사용되는 인자 IX는 또한 서열 번호: 701 또는 서열 번호: 702와 비교하여, 최소한 60%, 70%, 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지는, 서열 번호: 700에 대해 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일한 변이체를 포함한다. 본원에서 사용되는 인자 IX는 또한 야생형 인자 IX와 비교하여 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 보유하는 단편을 포함한다. 일부 구체예들에서, 인자 IX 변이체는 과활성 인자 IX 변이체 일 수 있다. 특정 사례에서, 인자 IX 변이체는 야생형 인자 IX와 비교하여 약 80% 내지 약 100%, 120%, 140%, 160%, 180%, 또는 200%의 활성을 보유한다. 인자 IX 변이체의 비 활성 (specific activities)을 사용하여, 예를 들어, 실시예 13에 기재된 바와 같이 이의 함수적으로 정규화된 활성을 계산할 수 있다. 인자 IX 변이체, 예를 들어, R338L의 비 활성은 문헌에 공지되어 있으며 공지된 방법을 사용하여 계산될 수 있다. 기능항진 인자 IX 변이체는 상응하는 야생형 인자 IX 단백질의 약 1.2, 1.5, 2, 3, 4, 5, 6, 8, 10, 12 또는 15 배 비 활성을 가질 수 있다. 한 구체예에서, 기능항진 인자 IX는 상응하는 야생형 인자 IX 단백질의 약 8-12 배 비 활성을 가질 수 있다. 또 다른 구체예에서, 기능항진 인자 IX는 상응하는 야생형 인자 IX 단백질의 약 1.2-5 배 비 활성을 가질 수 있다. 예시 서열들이 해당 분야에 공지되어 있으며 예를 들어, U.S. 특허 제 4,770,999, 4,994,371, 5,521,070, 6,046,380, 6,531,298, 및 8,383,388의 서열들을 포함한다.
본원에서 사용되는 "표적 서열"은 gRNA의 가이드 서열에 상보성을 갖는 표적 유전자의 핵산 서열을 지칭한다. 표적 서열과 가이드 서열의 상호작용은 RNA-가이드 DNA 결합제가 표적 서열 내부에 결합하고 잠재적으로 (제제의 활성에 따라) 닉 또는 절단하도록 안내한다.
본원에서 사용되는 "혈우병"은 인자 IX 유전자 또는 폴리펩티드의 소실 또는 결함에 의해 유발되는 장애를 지칭한다. 장애는 유전 및/또는 후천적 (예를 들어, 유전자의 자발적인 돌연변이에 의해 유발된) 병태를 포함하고 혈우병 B를 포함한다. 일부 구체예들에서, 결함 인자 IX 유전자 또는 폴리펩티드는 혈장 내 인자 IX 수준 감소 및/또는 인자 IX의 응집 활성 감소를 초래한다. 본원에서 사용되는 혈우병은 경증, 중등도, 및 중증 혈우병을 포함한다. 예를 들어, 약 1% 미만의 활성 인자를 가진 개체들은 중증 혈우병을 가진 것으로 분류되고, 약 1-5% 활성 인자를 가진 개체들은 중등도 혈우병을 갖고, 경증 혈우병이 있는 개체들은 정상 수준 활성 응고 인자의 약 5-40%를 갖는다.
본원에 사용된 "정상" 또는 "건강한" 개체들은 인자 IX 활성의 정상 풀링 (pooling) 혈장 수준 및 항원 수준의 50 내지 160%를 갖는 개체들을 포함한다. 인간 혈장으로부터의 정제에 기반하여, 정상 성인 (인자 IX의 정상 풀링 혈장 수준)에서 인자 IX의 농도는 약 300-400 μg/ml의 혈장이다. 일부 구체예들에서, 인자 IX, 예를 들어, 순환 인자 IX의 수준은 응고 및/또는 면역학적 검정, 예를 들어, 샌드위치 면역검정, ELISA (예를 들어, 실시예 13 참고), MSD (예를 들어, 실시예 14 참고)에 의해 측정될 수 있다. 인자 IX 응고촉진 활성은 환자의 혈장이 인자 IX 결핍 혈장의 응고 시간을 교정하는 능력에 의해 결정된다.
본원에서 사용되는 “치료"는 대상체에서 질환 또는 장애에 대한 치료제의 임의의 투여 또는 적용을 지칭하고, 질환 억제, 발병 억제, 질환의 하나 이상의 증상 완화, 질환 치유 또는 질병의 하나 이상의 증상의 재발 방지를 포함한다. 예를 들어, 혈우병의 치료는 혈우병의 증상 완화를 포함 할 수 있다.
본원에서 사용되는 “양방향 핵산 구조체” (본원에서 호환적으로 “양방향 구조체”로 지칭됨)는 최소한 2개의 핵산 세그먼트를 포함하고, 이 때 하나의 세그먼트 (제 1 세그먼트)는 관심 폴리펩티드를 인코드하는 코딩 서열 (이러한 코딩 서열은 본원에서 “트랜스진” 또는 제 1 트랜스진으로 지칭될 수 있음)을 포함하고, 다른 하나의 세그먼트 (제 2 세그먼트)는, 그 서열의 상보체가 관심 폴리펩티드를 인코드하는 서열 또는 제 2 트랜스진을 포함한다. 즉, 최소한 2개의 세그먼트들은 동일 또는 상이한 폴리펩티드를 인코드할 수 있다. 두 세그먼트가 동일한 폴리펩티드를 인코드 할 때, 제 1 세그먼트의 코딩 서열은 제 2 세그먼트의 서열의 상보체와 동일할 필요는 없다. 일부 구체예들에서, 제 2 세그먼트의 서열은 제 1 세그먼트의 코딩 서열의 역 상보체이다. 양방향 구조체는 단일-가닥 또는 이중-가닥 일 수 있다. 본원에 개시된 양방향 구조체는 임의의 관심 폴리펩티드를 발현 할 수 있는 구조체를 포함한다.
일부 구체예들에서, 양방향 핵산 구조체는 제 1 폴리펩티드를 인코드하는 코딩 서열 (제 1 트랜스진)을 포함하는 제 1 세그먼트, 및 그 서열의 상보체가 제 2 폴리펩티드를 인코드하는 서열 (제 2 트랜스진)을 포함하는 제 2 세그먼트를 포함한다. 일부 구체예들에서, 제 1 및 제 2 폴리펩티드는 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하다. 일부 구체예들에서, 제 1 및 제 2 폴리펩티드는 예를 들어, 50, 100, 200, 500, 1000개 또는 그 이상의 아미노산 잔기들에 걸쳐 최소한 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.
본원에 사용된 "역 상보체"는 참조 서열의 상보 서열인 서열을 지칭하며, 이 때 상보 서열은 역 방향으로 기재된다. 예를 들어, 가정 서열 5'CTGGACCGA3' (서열 번호: 500)에 있어서, "완전" 상보 서열은 3'GACCTGGCT5' (서열 번호: 501)이고, “완전” 역 상보체는 5'TCGGTCCAG3' (서열 번호: 502)로 기재된다. 역 상보체 서열은 "완전"일 필요는 없으며 여전히 참조 서열과 동일한 폴리펩티드 또는 유사한 폴리펩티드를 인코드 할 수 있다. 코돈 사용빈도 중복 (codon usage redundancy)으로 인해 역 상보체는 동일한 폴리펩티드를 인코드하는 참조 서열과 다를 수 있다. 본원에서 사용되는 "역 상보체"는 또한 참조 서열의 역 상보체 서열에 예를 들어, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열들을 포함한다.
본원에서 사용되는, “폴리펩티드”는 야생형 또는 변이체 단백질 (예를 들어, 돌연변이체, 단편, 융합, 또는 이들의 조합)을 지칭한다. 변이체 폴리펩티드는 야생형 폴리펩티드의 최소한 또는 약 5%, 10%, 15%, 20%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%의 기능적 활성을 보유할 수 있다. 일부 구체예들에서, 변이체는 야생형 폴리펩티드 서열에 대해 최소한 70%, 75%, 80%, 85%, 90%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다. 일부 구체예들에서, 변이체 폴리펩티드는 과활성 변이체 일 수 있다. 특정 사례에서, 변이체는 야생형 폴리펩티드의 약 80% 내지 약 120%, 140%, 160%, 180%, 200%, 300%, 400%, 500%, 또는 그 이상의 기능적 활성을 보유한다.
본원에 사용된 "이종 유전자"는 숙주 세포 게놈 내의 부위 (예를 들어, 알부민 인트론 1 부위를 포함하는 세이프 하버 유전자좌와 같은 게놈 유전자좌)에 외인성 공급원으로서 도입된 유전자를 지칭한다. 즉, 도입된 유전자는 삽입 부위에 대해 이종이다. 이러한 이종 유전자로부터 발현된 폴리펩티드를 "이종 폴리펩티드"라 한다. 이종 유전자는 자연적으로 발생하거나 조작 될 수 있으며 야생형 또는 변이체 일 수 있다. 이종 유전자는 이종 폴리펩티드를 인코딩하는 서열 이외의 뉴클레오티드 서열 (예를 들어, 내부 리보솜 진입 부위)을 포함 할 수 있다. 이종 유전자는 야생형 또는 변이체 (예를 들어, 돌연변이체)로서 숙주 게놈에서 자연적으로 발생하는 유전자 일 수 있다. 예를 들어, 숙주 세포가 관심있는 유전자 (야생형 또는 변이체)를 포함한다 하더라도, 동일한 유전자 또는 이의 변이체가 예를 들어 고도로 발현되는 유전자좌에서의 발현을 위해 외인성 공급원으로서 도입 될 수 있다. 이종 유전자는 또한 숙주 게놈에서 자연적으로 발생하지 않거나 숙주 게놈에서 자연적으로 발생하지 않는 이종 폴리펩티드를 발현하는 유전자 일 수 있다. "이종 유전자", "외인성 유전자" 및 "트랜스진"은 호환적으로 사용된다. 일부 구체예들에서, 이종 유전자 또는 트랜스진은 외인성 핵산 서열을 포함한다, 예를 들어, 핵산 서열은 수용 세포에 대해 내인성이 아니다. 일부 구체예들에서, 이종 유전자 또는 트랜스진은 외인성 핵산 서열, 예를 들어, 수용 세포에서 자연적으로 발생하지 않는 핵산 서열을 포함한다. 예를 들어, 이종 유전자는 삽입 부위에 대해 및 수용 세포에 대해 이종일 수 있다.
“세이프 하버” 유전자좌는 유전자가 숙주 세포, 예를 들어, 헤파토사이트에 유의하게 유해한 영향을 주지 않고, 예를 들어, 아폽토시스, 괴사, 및/또는 노화를 유발하지 않고, 또는 대조군 세포에 비해 5%, 10%, 15%, 20%, 25%, 30%, 또는 40% 이상의 아폽토시스, 괴사, 및/또는 노화를 유발하지 않고 삽입될 수 있는 게놈 내 유전자좌이다. 예를 들어, Hsin 등, “Hepatocyte death in liver inflammation, fibrosis, and tumorigenesis,” 2017을 참고하라. 일부 구체예들에서, 세이프 하버 유전자좌는 숙주 세포, 예를 들어, 헤파토사이트에 유의하게 유해한 영향을 주지 않고, 예를 들어, 아폽토시스, 괴사, 및/또는 노화를 유발하지 않고, 또는 대조군 세포에 비해 5%, 10%, 15%, 20%, 25%, 30%, 또는 40% 이상의 아폽토시스, 괴사, 및/또는 노화를 유발하지 않고 외인성 유전자의 과발현을 가능하게 한다. 일부 구체예들에서, 바람직한 세이프 하버 유전자좌는 삽입된 유전자 서열의 발현이 인접 유전자로부터의 리드-쓰루 (read-through) 발현에 의해 교란되지 않는 것일 수 있다. 세이프 하버는 알부민 유전자, 가령, 인간 알부민 유전자 내부에 존재할 수 있다. 세이프 하버는 알부민 인트론 1 영역, 예를 들어, 인간 알부민 인트론 1에 존재할 수 있다. 세이프 하버는, 예를 들어, 간 조직 또는 헤파토사이트 숙주 세포를 위한 인간 세이프 하버 일 수 있다. 일부 구체예들에서, 세이프 하버는 숙주 세포 또는 세포들의 집단, 가령, 헤파토사이트 또는 간 세포에 유의하게 유해한 영향을 주지 않고, 예를 들어, 아폽토시스, 괴사, 및/또는 노화를 유발하지 않고, 또는 대조군 세포 또는 세포들의 집단에 비해 5%, 10%, 15%, 20%, 25%, 30%, 또는 40% 이상의 아폽토시스, 괴사, 및/또는 노화를 유발하지 않고 외인성 유전자의 과발현을 가능하게 한다.
II. 조성물
A. 가이드 RNA (gRNAs)를 포함하는 조성물
본원에서는 게놈 유전자좌, 예를 들어, 숙주 세포 또는 숙주 세포들의 집단의 세이프 하버 부위 내에 인자 IX 유전자를 삽입하고 발현시키는 데 유용한 가이드 RNA 조성물 및 방법을 제공한다. 특히, 본원에 예시된 바와 같이, 알부민 유전자좌 (예를 들어, 인트론 1)에서 외인성 유전자를 표적화하고 삽입하는 것은 알부민의 내인성 프로모터를 사용하여 외인성 유전자의 강력한 발현을 구동시킬 수 있게 한다. 본 발명은 부분적으로 알부민 유전자의 인트론 1 내의 부위들을 특이적으로 표적화하고 인자 IX 유전자의 효율적인 삽입 및 발현을 제공하는 가이드 RNA의 식별에 기초한다. 실시예에 제시된 바와 같이 그리고 본원에 보다 상세히 기재된 바와 같이, 인델 형성 활성을 통해 측정된 높은 수준의 편집을 매개하는 식별된 gRNA의 능력은, 예상외로, 트랜스진을 통해, 예를 들어, 발현으로 측정시 트랜스진들의 효율적인 삽입을 매개하는 동일한 gRNA들의 사용과 반드시 관련되어 있는 것은 아니다. 즉, 높은 수준의 인델 형성을 구현 할 수 있는 특정 gRNA가 반드시 효율적인 삽입을 매개 할 수 있는 것은 아니며, 반대로 낮은 수준의 인델 형성을 구현하는 것으로 나타난 일부 gRNA가 트랜스진의 효율적인 삽입 및 발현을 매개 할 수 있다.
일부 구체예들에서, 본원은 숙주 세포의 알부민 유전자좌 (예를 들어, 인트론 1) 영역 내에 인자 IX 유전자를 삽입하고 발현시킴에 유용한 조성물 및 방법을 제공한다. 일부 구체예들에서, 본원은 숙주 세포의 알부민 유전자좌 내에, 예를 들어, RNA-가이드 DNA 결합제, 및 이종 인자 IX 핵산 ("인자 IX 트랜스진")을 포함하는 구조체 (예를 들어, 공여자 구조체 또는 템플릿)와 함께 본원에 개시된 가이드 RNA를 사용하여 이종 인자 IX 핵산을 도입하거나 삽입하는데 유용한 조성물을 개시한다. 일부 구체예들에서, 본원은 숙주 세포의 알부민 유전자좌로부터, 예를 들어, RNA-가이드 DNA 결합제, 및 이종 인자 IX 핵산을 포함하는 구조체 (예를 들어, 공여자 구조체 또는 템플릿)와 함께 본원에 개시된 가이드 RNA를 사용하여 이종 인자 IX를 발현하는데 유용한 조성물을 개시한다. 일부 구체예들에서, 본원은 숙주 세포의 알부민 유전자좌로부터, 예를 들어, RNA-가이드 DNA 결합제, 및 이종 인자 IX 핵산을 포함하는 구조체와 함께 본원에 개시된 가이드 RNA를 사용하여 이종 인자 IX를 발현하는데 유용한 조성물을 개시한다. 일부 구체예들에서, 본원은, 예를 들어, RNA-가이드 DNA 결합제와 함께 본원에 개시된 가이드 RNA (예를 들어, CRISPR/Cas 시스템)를 사용하여 숙주 세포의 혈청 알부민 유전자 내부에서 절단 (예를 들어, 이중-가닥 절단 (DSB) 또는 단일-가닥 절단 (닉))을 유도함에 유용한 조성물을 개시한다. 이러한 조성물은 예를 들어, 혈우병 치료를 위해 시험관내 또는 생체내에서 사용될 수 있다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 알부민 유전자좌의 인트론 내부에 결합하는 또는 결합할 수 있는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 인간 알부민 유전자의 인트론 1 영역 (서열 번호: 1) 내부에 결합한다. 가이드 서열의 모든 염기가 상기 언급된 영역들 내부에서 결합해야 하는 것은 아니라는 것이 이해 될 것이다. 예를 들어, 일부 구체예들에서, 가이드 RNA 서열의 15, 16, 17, 18, 19, 20개, 또는 그 이상의 염기들이 상기 언급된 영역들과 결합한다. 예를 들어, 일부 구체예들에서, 가이드 RNA 서열의 15, 16, 17, 18, 19, 20개, 또는 그 이상의 연속 염기들이 상기 언급된 영역들과 결합한다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 인간 알부민 인트론 1 (서열 번호: 1) 내부 부위에서 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)에 의한 표적-특이적 절단을 매개한다. 일부 구체예들에서, 가이드 RNA는 상기 영역들에 결합하거나 결합 할 수 있는 가이드 서열을 포함하는 것으로 이해 될 것이다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 가지는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 가지는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 가지는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 이중-가닥 절단 (DSB)을 초래하는 표적-특이적 절단을 매개한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 단일-가닥 절단 (닉)을 초래하는 표적-특이적 절단을 매개한다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 프로토스페이서 인접 모티프 (PAM)의 상류 영역에 결합한다. 당업자가 이해하는 바와 같이, PAM 서열은 표적 서열을 포함하는 가닥의 반대 가닥에서 발생한다. 즉, PAM 서열은 표적 가닥 (가이드 RNA가 결합하는 표적 서열을 포함하는 가닥)의 상보 가닥에 존재한다. 일부 구체예들에서, PAM은 NGG, NNGRRT, NNGRR(N), NNAGAAW, NNNNG(A/C)TT, 및 NNNNRYAC로 구성된 그룹에서 선택된다.
일부 구체예들에서, 본원에 제공된 가이드 RNA 서열들은 PAM 서열에 인접한 서열에 상보적이다.
일부 구체예들에서, 가이드 RNA 서열은 인간 참조 게놈 hg38의 좌표에 따라 본원의 표로부터 선택된 게놈 영역 내부의 서열에 상보적인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA 서열은 본원의 표들에서 선택된 게놈 영역 내부의 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 연속 뉴클레오티드를 포함하는 서열에 상보적인 서열을 포함한다. 일부 구체예들에서, 가이드 RNA 서열은 본원의 표들에서 선택된 게놈 영역에 걸쳐 있는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 연속 뉴클레오티드를 포함하는 서열에 상보적인 서열을 포함한다.
본원에 개시된 가이드 RNA는 이중-가닥 절단 (DSB)을 초래하는 표적-특이적 절단을 매개한다. 본원에 개시된 가이드 RNA는 단일-가닥 절단 (SSB 또는 닉)을 초래하는 표적-특이적 절단을 매개한다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 RNA-가이드 DNA 결합제 (예를 들어, 본원에 개시된 Cas 뉴클레아제)에 의한 표적-특이적 절단을 매개하여 알부민 유전자의 인트론 1 내부에 이종 인자 IX 핵산을 삽입한다. 일부 구체예들에서, 가이드 RNA 및/또는 절단은 30 내지 35%, 35 내지 40%, 40 내지 45%, 45 내지 50%, 50 내지 55%, 55 내지 60%, 60 내지 65%, 65 내지 70%, 70 내지 75%, 75 내지 80%, 80 내지 85%, 85 내지 90%, 90 내지 95%, 또는 95 내지 99%의 이종 인자 IX 유전자의 삽입율을 초래한다. 일부 구체예들에서, 가이드 RNA 및/또는 절단은 최소한 20%, 최소한 30%, 최소한 40%, 최소한 50%, 최소한 60%, 최소한 70%, 최소한 80%, 최소한 90%의 이종 인자 IX의 삽입율을 초래한다. 삽입율은 시험관내 또는 생체내에서 측정될 수 있다. 예를 들어, 일부 구체예들에서, 삽입율은 세포들의 집단 내에서 삽입된 인자 IX 핵산을 검출 및 측정하고 삽입된 인자 IX 핵산을 포함하는 집단의 백분율을 계산함으로써 결정될 수 있다. 삽입율을 측정하는 방법은 공지되어 있으며 당업계에서 이용가능하다. 일부 구체예들에서, 가이드 RNA는 5 내지 10%, 10 내지 15%, 15 내지 20%, 20 내지 25%, 25 내지 30%, 30 내지 35%, 35 내지 40%, 40 내지 45%, 45 내지 50%, 50 내지 55%, 55 내지 60%, 60 내지 65%, 65 내지 70%, 70 내지 75%, 75 내지 80%, 80 내지 85%, 85 내지 90%, 90 내지 95%, 95 내지 99% 또는 그 이상의 이종 인자 IX 유전자 발현 증가를 가능하게 한다. 이종 인자 IX 유전자의 발현 증가는 시험관내 또는 생체내에서 측정될 수 있다. 예를 들어, 일부 구체예들에서, 발현 증가는 인자 IX 폴리펩티드 수준을 검출 및 측정하고, 이 수준을, 예를 들어, 세포를 처리하거나 대상체에 투여하기 전 인자 IX 폴리펩티드 수준과 비교함으로써 결정될 수 있다. 일부 구체예들에서, 가이드 RNA는 이종 인자 IX 유전자 발현으로 인한 5 내지 10%, 10 내지 15%, 15 내지 20%, 20 내지 25%, 25 내지 30%, 30 내지 35%, 35 내지 40%, 40 내지 45%, 45 내지 50%, 50 내지 55%, 55 내지 60%, 60 내지 65%, 65 내지 70%, 70 내지 75%, 75 내지 80%, 80 내지 85%, 85 내지 90%, 90 내지 95%, 95 내지 99% 또는 그 이상의 활성 증가를 가능하게 한다. 예를 들어, 활성 증가는 응고 활성을 검출 및 측정하고, 이 활성을, 예를 들어, 세포를 처리하거나 대상체에 투여하기 전 응고 활성에 대하여 비교함으로써 결정될 수 있다. 일부 구체예들에서, 활성 증가는 aPTT 분석에서 응고 기능 및/또는 TGA-EA 분석에서 트롬빈 생성을 평가하여 결정될 수 있다. 이러한 방법들은 해당 분야에서 이용가능하며 공지되어 있다 (예를 들어, Simioni 등, NEJM 2009).
서열 번호: 2-33에서 표 1에 제시된 가이드 서열들 각각은 crRNA 및/또는 가이드 RNA를 형성하기 위한 추가 뉴클레오티드들을 추가로 포함 할 수 있으며, 예를 들어, 다음과 같은 예시적인 뉴클레오티드 서열이 3' 말단에서 5' 에서 3' 방향으로 가이드 서열에 이어질 수 있다: GUUUUAGAGCUAUGCUGUUUUG (서열 번호: 400). 게놈 좌표는 인간 참조 게놈 hg38에 따른다. sgRNA의 경우, 상기 가이드 서열은 sgRNA를 형성하기 위한 추가 뉴클레오티드를 추가로 포함 할 수 있으며, 예를 들어, 다음과 같은 예시적인 뉴클레오티드 서열이 5' 에서 3' 방향으로 가이드 서열의 3' 말단에 이어질 수 있다: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU (서열 번호: 401) 또는 GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (서열 번호: 402).
서열 번호: 2-5, 10-17, 21-27, 및 29-33에서 표 1의 가이드 서열들 각각은 crRNA를 형성하기 위한 추가 뉴클레오티드들을 추가로 포함 할 수 있으며, 예를 들어, 다음과 같은 예시적인 뉴클레오티드 서열이 3' 말단에서 5' 에서 3' 방향으로 가이드 서열에 이어질 수 있다: GUUUUAGAGCUAUGCUGUUUUG (서열 번호: 400). sgRNA의 경우, 상기 가이드 서열은 sgRNA를 형성하기 위한 추가 뉴클레오티드를 추가로 포함 할 수 있으며, 예를 들어, 다음과 같은 예시적인 뉴클레오티드 서열이 5' 에서 3' 방향으로 가이드 서열의 3' 말단에 이어질 수 있다: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU (서열 번호: 401) 또는 GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (서열 번호: 402).
표 1: 인간 가이드 RNA 서열 및 염색체 좌표
Figure pct00001
가이드 RNA는 trRNA를 추가로 포함할 수 있다. 본원에 기재된 각각의 조성물 및 방법 구체예에서, crRNA 및 trRNA는 단일 RNA (sgRNA)로서 결합 될 수 있거나 별개의 RNA (dgRNA) 상에 존재할 수 있다. sgRNA와 관련하여, crRNA 및 trRNA 구성요소들은 예를 들어, 포스포디에스터 결합 또는 기타 공유 결합을 통해 공유 연결될 수 있다. 일부 구체예들에서, sgRNA는 뉴클레오티드들 사이에 포스포디에스터 링키지 (linkage)가 아닌 하나 이상의 링키지를 포함한다.
본원에 기재된 조성물, 용도 및 방법 구체예 각각에서, 가이드 RNA는 2개의 RNA 분자를 "이중 가이드 RNA"또는 "dgRNA"로서 포함 할 수 있다. dgRNA는, 예를 들어, 표 1에 제시된 가이드 서열을 포함하는 crRNA를 포함하는 제 1 RNA 분자 및 trRNA를 포함하는 제 2 RNA 분자를 포함한다. 제 1 및 제 2 RNA 분자는 공유적으로 연결되지 않을 수 있지만, crRNA와 trRNA의 부분들 사이의 염기 페어링을 통해 RNA 듀플렉스를 형성 할 수 있다.
본원에 기재된 조성물, 용도 및 방법 구체예 각각에서, 가이드 RNA는 단일 RNA 분자를 "단일 가이드 RNA"또는 " sgRNA"로서 포함 할 수 있다. sgRNA는 trRNA에 공유적으로 연결된 표 1에 제시된 가이드 서열을 포함하는 crRNA (또는 이의 일부)를 포함 할 수 있다. sgRNA는 표 1에 제시된 가이드 서열의 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함할 수 있다. 일부 구체예들에서, crRNA 및 trRNA는 링커를 통해 공유적으로 연결된다. 일부 구체예들에서, sgRNA는 crRNA와 trRNA의 부분들 사이의 염기 페어링을 통해 스템-루프 구조를 형성한다. 일부 구체예들에서, crRNA 및 trRNA는 포스포디에스터 결합이 아닌 하나 이상의 결합을 통해 공유적으로 연결된다.
일부 구체예들에서, trRNA는 자연 발생 CRISPR/Cas 시스템으로부터 유래된 trRNA 서열의 전부 또는 일부를 포함 할 수 있다. 일부 구체예들에서, trRNA는 절두되거나 변형된 야생형 trRNA를 포함한다. trRNA의 길이는 사용된 CRISPR/Cas 시스템에 따라 다르다. 일부 구체예들에서, trRNA는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100개, 또는 100개 이상의 뉴클레오티드를 포함하거나 이들로 구성된다. 일부 구체예들에서, trRNA는 특정한 이차 구조, 가령, 예를 들어, 하나 이상의 헤어핀 또는 스템-루프 구조, 또는 하나 이상의 돌출 구조를 포함할 수 있다.
일부 구체예들에서, 인간 알부민 유전자좌 (서열 번호: 1)의 인트론 1 내부의 표적 서열 또는 영역은 가이드 RNA의 가이드 서열에 상보적일 수 있다. 일부 구체예들에서, 가이드 RNA의 가이드 서열과 이의 대응 표적 서열 사이의 상보성 또는 동일성 정도는 최소한 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 일 수 있다. 일부 구체예들에서, gRNA의 가이드 서열 및 표적 서열은 100% 상보적이거나 동일할 수 있다. 다른 구체예에서, gRNA의 가이드 서열 및 표적 서열은 최소한 하나의 미스매치를 포함 할 수 있다. 예를 들어, gRNA의 가이드 서열 및 표적 서열은 1, 2, 3, 4, 또는 5개 미스매치를 포함할 수 있으며, 이 때 가이드 서열의 총 길이는 약 20개, 또는 20개이다. 일부 구체예들에서, gRNA의 가이드 서열 및 표적 서열은 1-4개 미스매치를 포함할 수 있으며, 이 때 가이드 서열은 약 20개, 또는 20개 뉴클레오티드이다.
일부 구체예들에서, 본원에 개시된 조성물 또는 제제는 본원에 기재된 Cas 뉴클레아제와 같은 RNA-가이드 DNA 결합제를 인코딩하는 오픈 리딩 프레임 (ORF)을 포함하는 mRNA를 포함한다. 일부 구체예들에서, Cas 뉴클레아제와 같은 RNA-가이드 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA가 제공, 사용 또는 투여된다.
B. 변형된 gRNA 및 mRNA
일부 구체예들에서, gRNA는 화학적으로 변형된다. 하나 이상의 변형된 뉴클레오시드 또는 뉴클레오티드를 포함하는 gRNA는 “변형된” gRNA 또는 “화학적으로 변형된” gRNA라 불리며, 표준 A, G, C, 및 U 잔기들 대신 또는 이들 이외에 사용되는 하나 이상의 비-자연 및/또는 자연 발생 구성성분들 또는 구조들의 존재를 설명한다. 일부 구체예들에서, 변형된 gRNA는 비-표준 뉴클레오시드 또는 뉴클레오티드를 사용하여 합성되며, 본원에서 "변형된"이라 불린다. 변형된 뉴클레오시드 및 뉴클레오티드는 다음 중 하나 이상을 포함 할 수 있다: (i) 포스포디에스터 골격 링키지에서 하나 이상의 비-연결 포스페이트 산소 및/또는 하나 이상의 연결 포스페이트 산소의 변경, 예를 들어, 대체 (예시적 골격 변형); (ii) 리보스 당의 구성성분, 예를 들어, 리보스 당 상의 2' 하이드록실의 변경, 예를 들어, 대체 (예시적 당 변형); (iii) "데포스포" 링커로 포스페이트 모이어티를 전부 대체 (예시적 골격 변형); (iv) 비-표준 핵염기를 포함하는 자연 발생 핵염기의 변형 또는 대체 (예시적 염기 변형); (v) 리보스-포스페이트 골격의 대체 또는 변형 (예시적 골격 변형); (vi) 올리고뉴클레오티드의 3' 말단 또는 5' 말단의 변형, 예를 들어, 말단 포스페이트기의 제거, 변형 또는 대체, 또는 모이어티, 캡 또는 링커의 접합 (이러한 3' 또는 5' 캡 변형은 당 및/또는 골격 변형을 포함 할 수 있음); 및 (vii) 당의 변형 또는 대체 (예시적 당 변형).
상기 열거된 것과 같은 화학적 변형을 조합하여 2 개, 3 개, 4 개 또는 그 이상의 변형을 가질 수 있는 뉴클레오시드 및 뉴클레오티드들 (집합적으로 "잔기")을 포함하는 변형된 gRNA 및/또는 mRNA를 제공 할 수 있다. 예를 들어, 변형된 잔기는 변형된 당 및 변형된 핵 염기를 가질 수 있다. 일부 구체예들에서, gRNA의 모든 염기는 변형된다, 예를 들어, 모든 염기는 변형된 포스페이트 그룹, 가령, 포스포로티오에이트 그룹을 갖는다. 특정 구체예에서, gRNA 분자의 포스페이트 그룹의 전부 또는 실질적으로 전부는 포스포로티오에이트 그룹으로 대체된다. 일부 구체예들에서, 변형된 gRNA는 RNA의 5' 말단 또는 그 근처에 최소한 하나의 변형된 잔기를 포함한다. 일부 구체예들에서, 변형된 gRNA는 RNA의 3' 말단 또는 그 근처에 최소한 하나의 변형된 잔기를 포함한다. 특정 gRNA들은 RNA의 5' 말단 및 3' 말단 또는 그 근처에 최소한 하나의 변형된 잔기를 포함한다.
일부 구체예들에서, gRNA는, 1, 2, 3개 또는 그 이상의 변형된 잔기들을 포함한다. 일부 구체예들에서, 변형된 gRNA의 위치들 중 최소한 5% ( 예를 들어, 최소한 5%, 최소한 10%, 최소한 15%, 최소한 20%, 최소한 25%, 최소한 30%, 최소한 35%, 최소한 40%, 최소한 45%, 최소한 50%, 최소한 55%, 최소한 60%, 최소한 65%, 최소한 70%, 최소한 75%, 최소한 80%, 최소한 85%, 최소한 90%, 최소한 95%, 또는 100%)는 변형된 뉴클레오시드 또는 뉴클레오티드이다.
변형되지 않은 핵산은 예를 들어, 세포내 뉴클레아제 또는 혈청에서 발견되는 뉴클레아제들에 의해 분해되기 쉽다. 예를 들어, 뉴클레아제는 핵산 포스포디에스터 결합을 가수분해 할 수 있다. 따라서, 한 양상에서 본원에 기재된 gRNA는, 예를 들어, 세포내 또는 혈청-기반 뉴클레아제에 대한 안정성을 도입하기 위해 하나 이상의 변형된 뉴클레오시드 또는 뉴클레오티드를 함유 할 수 있다. 일부 구체예들에서, 본원에 기재된 변형된 gRNA 분자는 생체내 생체외 모두에서 세포들의 집단에 도입 될 때 감소된 선천 면역 반응을 나타낼 수 있다. 용어 "선천 면역 반응"은 단일 가닥 핵산을 비롯한 외인성 핵산에 대한 세포 반응을 포함하며, 이는 사이토카인 발현 및 방출, 특히, 인터페론 및 세포 사멸의 유도를 포함한다.
골격 변형의 일부 구체예들에서, 변형된 잔기의 포스페이트 그룹은 하나 이상의 산소를 상이한 치환기로 대체함으로써 변형 될 수 있다. 추가로, 변형된 잔기, 예를 들어, 변형된 핵산에 존재하는 변형된 잔기는 변형되지 않은 포스페이트 모이어티를 본원에 기재된 변형된 포스페이트 그룹으로 전부 대체하는 것을 포함 할 수 있다. 일부 구체예들에서, 포스페이트 골격의 골격 변형은 하전되지 않은 링커 또는 비대칭 전하 분포를 갖는 하전된 링커를 초래하는 변경을 포함 할 수 있다.
변형된 포스페이트 그룹의 예는 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스터, 하이드로젠 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트라이에스터를 포함한다. 변형되지 않은 포스페이트 그룹에서 인 원자는 아키랄 (achiral)이다. 그러나, 가교되지 않은 산소 중 하나를 상기 원자들 또는 원자들의 그룹들 중 하나로 대체하면 인 원자가 키랄이 될 수 있다. 입체 인 원자는 "R" 구조 (본원에서 Rp) 또는 "S" 구조 (본원에서 Sp)을 가질 수 있다. 골격은 또한 가교 산소 (즉, 포스페이트를 뉴클레오시드에 연결하는 산소), 질소 (가교화 포스포로아미데이트), 황 (가교화 포스포로티오에이트) 및 탄소 (가교화 메틸렌포스포네이트)의 대체에 의해 변형 될 수 있다. 대체는 하나의 연결 산소에서 또는 두 연결 산소들 모두에서 발생 할 수 있다.
포스페이트 그룹은 특정 골격 변형에서 인을 포함하지 않는 연결기(connector)로 대체 될 수 있다. 일부 구체예들에서, 하전된 포스페이트 그룹은 중성 모이어티로 대체 될 수 있다. 포스페이트 그룹을 대체 할 수 있는 모이어티의 예는 제한없이, 예를 들어, 메틸 포스포네이트, 하이드록실아미노, 실록산, 카보네이트, 카르복시메틸, 카바메이트, 아미드, 티오에터, 에틸렌 옥사이드 링커, 설포네이트, 설폰아미드, 티오포름아세탈, 포름아세탈, 옥심, 메틸렌이미노, 메틸렌메틸이미노, 메틸렌하이드라조, 메틸렌디메틸하이드라조 및 메틸렌옥시메틸이미노를 포함한다.
핵산을 모방 할 수 있는 스캐폴드 또한 제작될 수 있는데, 이 때 포스페이트 링커 및 리보스 당은 뉴클레아제 내성 뉴클레오시드 또는 뉴클레오티드 대체물로 대체된다. 이러한 변형은 골격 및 당 변형을 포함 할 수 있다. 일부 구체예들에서, 핵염기는 대체 골격에 의해 테더링 될 수 있다. 예에는 제한없이, 모르폴리노, 시클로부틸, 피롤리딘 및 펩티드 핵산 (PNA) 뉴클레오시드 대체물이 포함 될 수 있다.
변형된 뉴클레오시드 및 변형된 뉴클레오티드는 당 그룹에 대한 하나 이상의 변형, 즉, 당 변형을 포함 할 수 있다. 예를 들어, 2' 하이드록실 그룹 (OH)은 변형, 다수의 상이한 "옥시" 또는 "데옥시"치환기로 대체 될 수 있다. 일부 구체예들에서, 2' 하이드록실 그룹에 대한 변형은 하이드 록실이 더 이상 탈양성자화 되어 2'-알콕사이드 이온을 형성할 수 없기 때문에 핵산의 안정성을 향상시킬 수 있다.
2' 하이드록실 그룹 변형의 예는 알콕시 또는 아릴옥시 (OR, 이 때 "R"은 예를 들어 알킬, 사이클로알킬, 아릴, 아랄킬, 헤테로아릴 또는 당 일 수 있음); 폴리에틸렌 글리콜 (PEG), O(CH 2 CH 2 O) n CH 2 CH 2 OR, 이 때, R은, 예를 들어, H 이거나 또는 선택적으로 치환된 알킬 일 수 있고, n은 0 내지 20 ( 예를 들어, 0 내지 4, 0 내지 8, 0 내지 10, 0 내지 16, 1 내지 4, 1 내지 8, 1 내지 10, 1 내지 16, 1 내지 20, 2 내지 4, 2 내지 8, 2 내지 10, 2 내지 16, 2 내지 20, 4 내지 8, 4 내지 10, 4 내지 16, 및 4 내지 20)의 정수 일 수 있다. 일부 구체예들에서, 2' 하이드록실 그룹 변형은 2'-O-Me 일 수 있다. 일부 구체예들에서, 2' 하이드록실 그룹 변형은 2' 하이드록실 그룹을 불소로 대체하는 2'-플루오로 변형일 수 있다. 일부 구체예들에서, 2' 하이드록실 그룹 변형은 2' 하이드록실 그룹을 수소로 대체하는 2'-H 일 수 있다. 일부 구체예들에서, 2' 하이드록실 그룹 변형은, 2' 하이드록실이, 예를 들어, C 1 - 6 알킬렌 또는 C 1 - 6 헤테로알킬렌 가교에 의해 동일한 리보스 당의 4' 탄소에 연결될 수 있는 "잠금된" 핵산 (LNA) (이 때 예시적인 가교에는 메틸렌, 프로필렌, 에터, 또는 아미노 가교가 포함될 수 있음); O-아미노 (이 때 아미노는 예를 들어, NH 2 일 수 있음); 알킬아미노, 다이알킬아미노, 헤테로사이클릴, 아릴아미노, 다이아릴아미노, 헤테로아릴아미노, 또는 다이헤테로아릴아미노, 에틸렌다이아민, 또는 폴리아미노) 및 아미노알콕시, O(CH 2 ) n -아미노, (이 때 아미노는, 예를 들어, NH 2 ; 알킬아미노, 다이알킬아미노, 헤테로사이클릴, 아릴아미노, 다이아릴아미노, 헤테로아릴아미노, 또는 다이헤테로아릴아미노, 에틸렌다이아민, 또는 폴리아미노 일 수 있음)를 포함할 수 있다. 일부 구체예들에서, 2' 하이드록실 그룹 변형은 리보스 고리에 C2'-C3' 결합이 없는 "잠금해제된" 핵산 (UNA)을 포함 할 수 있다. 일부 구체예들에서, 2' 하이드록실 그룹 변형은 메톡시에틸 그룹 (MOE), (OCH 2 CH 2 OCH 3 , 예를 들어, PEG 유도체)을 포함할 수 있다.
“데옥시” 2' 변형은 수소 ( 즉, 예를 들어, 부분적으로 dsRNA의 오버행 부분에서 데옥시리보스 당); 할로 ( 예를 들어, 브로모, 클로로, 플루오로, 또는 아이오도); 아미노 (이 때 아미노는, 예를 들어, NH 2 ; 알킬아미노, 다이알킬아미노, 헤테로사이클릴, 아릴아미노, 다이아릴아미노, 헤테로아릴아미노, 다이헤테로아릴아미노, 또는 아미노산 일 수 있음); NH(CH 2 CH 2 NH) n CH2CH 2 - 아미노 (이 때 아미노는, 예를 들어, 본원에 기재된 바와 같을 수 있음), -NHC(O)R (이 때 R은, 예를 들어, 알킬, 시클로알킬, 아릴, 아랄킬, 헤테로아릴 또는 당일 수 있음), 시아노; 머캅토; 알킬-티오-알킬; 티오알콕시; 및 알킬, 사이클로알킬, 아릴, 알케닐 및 알키닐 (이는 선택적으로, 예를 들어, 본원에 기재된 아미노로 치환될 수 있음)을 포함할 수 있다.
당 변형은, 리보스에서의 대응 탄소와 반대되는 입체화학적 구조를 갖는 하나 이상의 탄소를 또한 함유 할 수 있는 당 그룹을 포함 할 수 있다. 따라서, 변형된 핵산은 당으로서, 예를 들어, 아라비노스를 함유하는 뉴클레오티드를 포함 할 수 있다. 변형된 핵산은 또한 무염기 당을 포함 할 수 있다. 이들 무염기 당은 또한 하나 이상의 구성성분 당 원자들에서 추가로 변형될 수 있다. 변형된 핵산은 또한 L 형태인 하나 이상의 당, 예를 들어, L-뉴클레오시드을 포함 할 수 있다.
변형된 핵산에 통합 될 수 있는 본원에 기재된 변형된 뉴클레오시드 및 변형된 뉴클레오티드는 핵 염기로도 불리는 변형된 염기를 포함 할 수 있다. 핵 염기의 예는 아데닌 (A), 구아닌 (G), 시토신 (C) 및 우라실 (U)을 포함하지만 이에 제한되지는 않는다. 이러한 핵 염기는 변형된 핵산에 통합 될 수 있는 변형된 잔기를 제공하기 위해 변형되거나 전부 대체 될 수 있다. 뉴클레오티드의 핵 염기는 퓨린, 피리미딘, 퓨린 유사체 또는 피리미딘 유사체로부터 독립적으로 선택 될 수 있다. 일부 구체예들에서, 핵 염기는, 예를 들어, 염기의 자연 발생 및 합성 유도체를 포함 할 수 있다.
이중 가이드 RNA를 사용하는 구체예에서, 각각의 crRNA 및 tracr RNA는 변형을 포함 할 수 있다. 이러한 변형들은 crRNA 및/또는 tracr RNA 중 하나 또는 둘 모두의 말단에 존재할 수 있다. sgRNA를 포함하는 구체예에서, sgRNA의 한 쪽 또는 양 쪽 말단에 있는 하나 이상의 잔기가 화학적으로 변형 될 수 있고 및/또는 내부 뉴클레오사이드가 변형 될 수 있고 및/또는 전체 sgRNA가 화학적으로 변형 될 수 있다. 특정 구체예는 5' 말단 변형을 포함한다. 특정 구체예는 3' 말단 변형을 포함한다.
일부 구체예들에서, 본원에 개시된 가이드 RNA는 2017년 12월 8일에 발명의 명칭 “Chemically Modified Guide RNAs”로 출원된 WO2018/107028 A1에 개시된 변형 패턴들 중 하나를 포함하며, 이의 내용은 그 전체가 본원에 참고로 포함된다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 US20170114334에 개시된 구조/변형 패턴들 중 하나를 포함하며, 이의 내용은 본원에 그 전문이 참고로 포함된다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 WO2017/136794, WO2017004279, US2018187186, US2019048338에 개시된 구조/변형 패턴들 중 하나를 포함하며, 이의 내용은 본원에 그 전문이 참고로 포함된다.
일부 구체예들에서, 본 발명의 sgRNA는 아래 표 2에 제시된 변형 패턴들을 포함한다. 표 2의 “전체 서열”은 표 1에 열거된 가이드들 각각에 대한 sgRNA 서열을 지칭한다. “변형된 전체 서열”은 각 sgRNA에 대한 변형 패턴을 보여준다.
표 2: 인간 알부민 가이드 서열들의 sgRNA 및 sgRNA에 대한 변형 패턴
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
일부 구체예들에서, 변형된 sgRNA는 다음 서열을 포함하고: mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU (서열 번호: 300), 이 때 "N"은 임의의 자연 또는 비-자연 뉴클레오티드 일 수 있으며, 여기서 N 전체는 표 1에 기재된 알부민 인트론 1 가이드 서열을 포함한다. 예를 들어, 서열 번호: 300이 이에 포함되며, 이 때 N'들은 본원 표 1에 개시된 가이드 서열들 중 어느 하나 (서열 번호: 2-33)로 대체된다.
예를 들어, 서열 번호: 300이 이에 포함되며, 이 때 N'들은 본원 표 1에 개시된 가이드 서열들 중 어느 하나 (서열 번호: 2-5, 10-17, 21-27, 및 29-33)로 대체된다.
아래에 기재된 임의의 변형이 본원에 기재된 gRNA 및 mRNA에 존재할 수 있다.
용어 “mA,” “mC,” “mU,” 또는 “mG”는 2'-O-Me로 변형된 뉴클레오티드를 표시하기 위해 사용될 수 있다.
2'-O-메틸의 변형은 다음과 같이 도시될 수 있다:
Figure pct00008
뉴클레오티드 당 고리에 영향을 미치는 것으로 밝혀진 또 다른 화학적 변형은 할로겐 치환이다. 예를 들어, 뉴클레오티드 당 고리에 대한 2'-플루오로 (2'-F) 치환은 올리고뉴클레오티드 결합 친화도와 뉴클레아제 안정성을 증가시킬 수 있다.
본 출원에서 용어 "fA", "fC", "fU" 또는 "fG"는 2'-F로 치환된 뉴클레오티드를 나타내기 위해 사용될 수 있다.
2'-F의 치환은 다음과 같이 도시될 수 있다:
Figure pct00009
포스포로티오에이트 (PS) 링키지 또는 결합은 포스포다이에스터 링키지에서, 예를 들어, 뉴클레오티드 염기들 사이의 결합들에서 하나의 비가교 포스페이트 산소 대신 황이 치환되는 결합을 지칭한다. 포스포로티오에이트가 올리고뉴클레오티드를 생성하는데 사용되는 경우, 변형된 올리고 뉴클레오티드는 또한 S-올리고로 지칭 될 수 있다.
“*”는 PS 변형을 표시하기 위해 사용될 수 있다. 본 출원에서 용어 A*, C*, U* 또는 G*는 다음 (예를 들어, 3') 뉴클레오티드에 PS 결합으로 연결된 뉴클레오티드를 나타내기 위해 사용될 수 있다.
본 출원에서, 용어 “mA*,” “mC*,” “mU*,” 또는 “mG*”는 2'-O-Me로 치환되어 있고 그리고 다음 (예를 들어, 3') 뉴클레오티드에 PS 결합으로 연결되는 뉴클레오티드를 나타내기 위해 사용될 수 있다.
아래 다이어그램은 S-가 비가교 포스페이트 산소로 치환되어 포스포다이에스터 결합 대신 PS 결합을 생성하는 것을 보여준다.
Figure pct00010
무염기(무염기) 뉴클레오티드는 질소성 염기가 없는 뉴클레오티드를 지칭한다. 아래 그림은 염기가 없는 무염기 (무퓨린으로도 공지) 부위가 있는 올리고뉴클레오티드를 도시한다:
Figure pct00011
역위(Inverted) 염기들은 일반적인 5' 에서 3' 으로의 링키지로부터 역위된 링키지들 (, 5' 에서 5'으로의 링키지 또는 3' 에서 3'으로의 링키지)이 있는 염기들을 지칭한다. 예를 들어:
Figure pct00012
무염기 뉴클레오티드는 역위 링키지로 부착 될 수 있다. 예를 들어, 무염기 뉴클레오티드는 5' 에서 5' 링키지를 통해 말단 5'뉴클레오티드에 부착 될 수 있거나, 무염기 뉴클레오티드는 3' 에서 3' 링키지를 통해 말단 3' 뉴클레오티드에 부착 될 수 있다. 말단 5' 또는 3' 뉴클레오티드에 있는 역위 무염기성 뉴클레오티드는 또한 역위 무염기성 말단 캡으로 불릴 수 있다.
일부 구체예들에서, 5' 말단에서 처음 3개, 4개 또는 5개 뉴클레오티드 중 하나 이상 및 3' 말단에서 마지막 3개, 4개 또는 5개 뉴클레오티드 중 하나 이상이 변형된다. 일부 구체예들에서, 변형은 2'-O-Me, 2'-F, 역위 무염기성 뉴클레오티드, PS 결합, 또는 안정성 및/또는 성능을 증가시키기 위해 당업계에 잘 알려진 다른 뉴클레오티드 변형이다.
일부 구체예들에서, 5' 말단의 처음 4개 뉴클레오티드, 및 3' 말단의 마지막 4개 뉴클레오티드는 포스포로티오에이트 (PS) 결합으로 연결된다.
일부 구체예들에서, 5' 말단의 처음 3개의 뉴클레오티드 및 3' 말단의 마지막 3개의 뉴클레오티드는 2'-O-메틸 (2'-O-Me) 변형된 뉴클레오티드를 포함한다. 일부 구체예들에서, 5' 말단의 처음 3개의 뉴클레오티드 및 3' 말단의 마지막 3개의 뉴클레오티드는 2'-플루오로 (2'-F) 변형된 뉴클레오티드를 포함한다. 일부 구체예들에서, 5' 말단의 처음 3개의 뉴클레오티드 및 3' 말단의 마지막 3개의 뉴클레오티드는 역위 무염기 뉴클레오티드를 포함한다.
일부 구체예들에서, 가이드 RNA는 변형된 sgRNA를 포함한다. 일부 구체예들에서, sgRNA는 서열 번호: 300에 제시된 변형 패턴을 포함하고, 여기서 N은 임의의 자연 또는 비 자연 뉴클레오티드이고, N의 전체는 뉴클레아제를 예를 들어 표 1에 제시된 인간 알부민 인트론 1의 표적 서열로 안내하는 가이드 서열을 포함한다.
일부 구체예들에서, 가이드 RNA는 서열 번호: 34-97 중 어느 하나에 제시된 sgRNA를 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33의 가이드 서열 및 서열 번호: 300의 뉴클레오티드 중 어느 하나를 포함하는 sgRNA를 포함하며, 이 때 서열 번호: 300의 뉴클레오티드는 가이드 서열의 3' 말단 상에 존재하고, sgRNA는, 예를 들어, 서열 번호: 300에 제시된 바와 같이 변형될 수 있다.
일부 구체예들에서, 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97 중 어느 하나에 제시된 sgRNA를 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33의 가이드 서열 및 서열 번호: 300의 뉴클레오티드 중 어느 하나를 포함하는 sgRNA를 포함하며, 이 때 서열 번호: 300의 뉴클레오티드는 가이드 서열의 3' 말단 상에 존재하고, sgRNA는, 예를 들어, 서열 번호: 300에 제시된 바와 같이 변형될 수 있다.
상기 언급한 바와 같이, 일부 구체예들에서, 본원에 개시된 조성물 또는 제제는 본원에 기재된 Cas 뉴클레아제와 같은 RNA-가이드 DNA 결합제를 인코딩하는 오픈 리딩 프레임 (ORF)을 포함하는 mRNA를 포함한다. 일부 구체예들에서, Cas 뉴클레아제와 같은 RNA-가이드 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA가 제공, 사용 또는 투여된다. 하기 설명하는 바와 같이, Cas 뉴클레아제를 포함하는 mRNA는 Cas9 뉴클레아제, 가령, 절단, 닉카제 및/또는 부위-특이적 DNA 결합 활성을 갖는 S. 피오게네스 Cas9 뉴클레아제를 포함 할 수 있다. 일부 구체예들에서, RNA-가이드 DNA 뉴클레아제를 인코딩하는 ORF는 "변형된 RNA-가이드 DNA 결합제 ORF" 또는 단순히 "변형된 ORF"이며, 이는 ORF가 변형되어 있음을 나타내는 약어로 사용된다.
변형된 Cas9 ORF를 포함하는 Cas9 ORF가 본원에 제공되며 당업계에 공지되어 있다. 한 예로서, Cas9 ORF는 코딩 서열이 하나 이상의 아미노산에 대한 하나 이상의 대체 코돈을 포함하도록 코돈 최적화 될 수 있다. 본원에서 사용된 "대체 코돈"은 주어진 아미노산에 대한 코돈 사용의 변화를 지칭하고, 주어진 발현 시스템에 대해 바람직한 또는 최적화된 코돈 (코돈 최적화) 일 수도 있고 아닐 수도 있다. 바람직한 코돈 사용, 또는 주어진 발현 시스템에서 내성이 우수한 코돈은 당업계에 공지되어 있다. WO2013/176772, WO2014/065596, WO2016/106121, 및 WO2019/067910의 Cas9 코딩 서열, Cas9 mRNA, 및 Cas9 단백질 서열은 본원에 참고로 포함된다. 특히, WO2019/067910 단락 [0449] 표의 ORF들 및 Cas9 아미노산 서열들, 그리고 WO2019/067910 단락 [0214] - [0234]의 Cas9 mRNA들 및 ORF들이 본원에 참고로 포함된다.
일부 구체예들에서, 변형된 ORF는 우리딘 위치들 중 최소한 하나, 다수, 또는 모두에서 변형된 우리딘을 포함할 수 있다. 일부 구체예들에서, 변형된 우리딘은 5 위치에서, 예를 들어, 할로겐, 메틸 또는 에틸로 변형된 우리딘이다. 일부 구체예들에서, 변형된 우리딘은 1 위치에서, 예를 들어, 할로겐, 메틸 또는 에틸로 변형된 우리딘이다. 변형된 우리딘은 예를 들어, 슈도우리딘, N1-메틸-슈도우리딘, 5-메톡시우리딘, 5-아이오도우리딘, 또는 이들의 조합 일 수 있다. 일부 구체예들에서, 변형된 우리딘은 5-메톡시우리딘이다. 일부 구체예들에서, 변형된 우리딘은 5-아이오도우리딘이다. 일부 구체예들에서, 변형된 우리딘은 슈도우리딘이다. 일부 구체예들에서, 변형된 우리딘은 N1-메틸-슈도우리딘이다. 일부 구체예들에서, 변형된 우리딘은 슈도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예들에서, 변형된 우리딘은 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예들에서, 변형된 우리딘은 N1-메틸 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예들에서, 변형된 우리딘은 5-아이오도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예들에서, 변형된 우리딘은 슈도우리딘 및 5-아이오도우리딘의 조합이다. 일부 구체예들에서, 변형된 우리딘은 5-아이오도우리딘 및 5-메톡시우리딘의 조합이다.
일부 구체예들에서, 본원에 개시된 mRNA는 5' 캡, 가령, Cap0, Cap1, 또는 Cap2를 포함한다. 5' 캡은 일반적으로 5'-트라이포스페이트를 통해 mRNA의 5'에서 3'으로의 첫 번째 뉴클레오티드, 즉, 첫 번째 캡-근위 뉴클레오티드의 5' 위치에 연결된 7-메틸구아닌 리보뉴클레오티드 (이는 예를 들어 ARCA와 관련하여 아래에서 논의된 바와 같이 추가로 변형 될 수 있음)이다. Cap0에서, mRNA의 첫 번째 및 두 번째 캡-근위 뉴클레오티드의 리보스들은 모두 2'-하이드록실을 포함한다. Cap1에서, mRNA의 첫 번째 및 두 번째 전사된 뉴클레오티드의 리보스들은 각각 2'-메톡시 및 2'-하이드록실을 포함한다. Cap2에서, mRNA의 첫 번째 및 두 번째 캡-근위 뉴클레오티드의 리보스들은 모두 2'-메톡시를 포함한다. 예를 들어, Katibah 등, (2014) Proc Natl Acad Sci USA 111(33):12025-30; Abbas 등, (2017) Proc Natl Acad Sci USA 114(11):E2106-E2115를 참고하라. 인간 mRNA와 같은 포유류 mRNA를 비롯하여 대부분의 내인성 고등 진핵 mRNA는 Cap1 또는 Cap2를 포함한다. Cap0 그리고 Cap1 및 Cap2와 상이한 기타 캡 구조는 IFIT-1 및 IFIT-5와 같은 선천성 면역 시스템의 구성요소들에 의해 "비 자기"로 인식되어 인간과 같은 포유류에서 면역원성일 수 있으며, 이는 I형 인터페론을 비롯한 사이토카인의 수준 상승을 가져올 수 있다. 선천성 면역 시스템의 구성요소들, 가령, IFIT-1 및 IFIT-5는 또한 mRNA의 결합에 있어서 Cap1 또는 Cap2 이외의, mRNA의 번역을 잠재적으로 억제하는 캡을 가지는 eIF4E와 경쟁할 수 있다.
캡은 공동전사적으로 포함될 수 있다. 예를 들어, ARCA (항-역 캡 유사체; Thermo Fisher Scientific 카탈로그 번호 AM8045)는 구아닌 리보뉴클레오티드의 5' 위치에 연결된 7-메틸구아닌 3'-메톡시-5'-트라이포스페이트를 포함하는 캡 유사체로서, 초기에 시험관내에서 전사체로 통합될 수 있다. ARCA는 첫 번째 캡-근위 뉴클레오티드의 2' 위치가 하이드록실인 Cap0 캡을 생성한다. 예를 들어, Stepinski 등, (2001) “Synthesis and properties of mRNAs containing the novel 'anti-reverse' cap analogs 7-methyl(3'-O-methyl)GpppG and 7-methyl(3'deoxy)GpppG,” RNA 7: 1486-1495 참고. ARCA 구조는 아래 제시된다.
Figure pct00013
CleanCapTM AG (m7G(5')ppp(5')(2'OMeA)pG; TriLink Biotechnologies 카탈로그 번호 N-7113) 또는 CleanCapTM GG (m7G(5')ppp(5')(2'OMeG)pG; TriLink Biotechnologies 카탈로그 번호 N-7133)을 사용하여 Cap1 구조를 공동-전사적으로 제공할 수 있다. CleanCapTM AG 및 CleanCapTM GG의 3'-O-메틸화 형태들은 또한 각각 TriLink Biotechnologie사로부터 카탈로그 번호 N-7413 및 N-7433으로 이용가능하다. CleanCapTM AG 구조를 아래 제시한다.
Figure pct00014
대안적으로 캡을 전사 후 RNA에 첨가 할 수 있다. 예를 들어, 백시니아 캡핑 효소는 시판되고 있으며 (New England Biolabs 카탈로그 번호 M2080S) 이의 D1 서브유닛에 의해 제공되는 RNA 트라이포스파타제 및 구아닐릴트랜스퍼라제 활성과 D12 서브유닛에서 제공하는 구아닌메틸트랜스퍼라제를 가지고 있다. 이와 같이, RNA에 7-메틸구아닌을 첨가하여 S-아데노실 메티오닌과 GTP의 존재하에 Cap0을 제공 할 수 있다. 예를 들어, Guo, P. and Moss, B. (1990) Proc. Natl. Acad. Sci. USA 87, 4023-4027; Mao, X. and Shuman, S. (1994) J. Biol. Chem. 269, 24472-24479를 참고하라.
일부 구체예들에서, mRNA는 폴리-아데닐화 (폴리-A) 꼬리를 추가로 포함한다. 일부 구체예들에서, 폴리-A 꼬리는 최소한 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아데닌, 선택적으로 최대 300개 아데닌을 포함한다. 일부 구체예들에서, 폴리-A 꼬리는 95, 96, 97, 98, 99, 또는 100개의 아데닌 뉴클레오티드를 포함한다.
C. 공여자 구조체
본원에 기재된 조성물 및 방법은 본 발명의 가이드 RNA 및 RNA-가이드 DNA 결합제에 의해 생성된 절단 부위에 삽입될 이종 인자 IX 유전자를 인코딩하는 서열을 포함하는 핵산 구조체의 사용을 포함한다. 본원에서 사용시, 이러한 구조체는 때때로 "공여자 구조체/템플릿"으로 지칭된다. 일부 구체예들에서, 이러한 구조체는 DNA 구조체이다. 공여자 구조체에 대한 다양한 기능적/구조적 변형을 설계하고 만드는 방법은 당업계에 공지되어 있다. 일부 구체예들에서, 구조체는 폴리아데닐화 꼬리 서열, 폴리아데닐화 신호 서열, 스플라이스 수용 부위 또는 선별 마커 중 임의의 하나 이상을 포함 할 수 있다. 일부 구체예들에서, 폴리아데닐화 꼬리 서열은 코딩 서열의 3' 말단에서, 예를 들어, "폴리-A" 스트레치로서 인코드된다. 적합한 폴리아데닐화 꼬리 서열 및/또는 폴리아데닐화 신호 서열을 설계하는 방법은 당업계에 공지이다. 예를 들어, 폴리아데닐화 신호 서열 AAUAAA (서열 번호 : 800)는 포유류 시스템에서 일반적으로 사용되지만 UAUAAA (서열 번호 : 801) 또는 AU/GUAAA (서열 번호 : 802)와 같은 변이체가 확인된 바 있다. 예를 들어, NJ Proudfoot, Genes & Dev. 25(17):1770-82, 2011을 참고하라.
일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하고, 이 때 IX 서열은 야생형 인자 IX, 예를 들어 서열 번호 700이다. 일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하고, 이 때 IX 서열은 야생형 인자 IX, 예를 들어 서열 번호 701이다. 일부 구체예들에서, 서열은 인자 IX의 변이체를 인코드한다. 예를 들어, 변이체는 야생형 인자 IX보다 증가된 응고 활성을 보유할 수 있다. 예를 들어, 변이 인자 IX는 서열 번호: 701에 대해 위치 R338에서 아미노산 치환과 같은 하나 이상의 돌연변이를 포함 할 수 있다 (예를 들어, R338L). 일부 구체예들에서, 서열은 서열 번호: 700, 서열 번호: 701, 또는 서열 번호: 702에 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지는 인자 IX 변이체를 인코딩한다. 일부 구체예들에서, 서열은 인자 IX의 단편을 인코딩하며, 이 때 이러한 단편은 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 보유한다.
일부 구체예들에서, 공여자 구조체는 인자 IX 변이체를 인코딩하는 서열을 포함하며, 이 때 인자 IX 변이체는 이의 보조인자인 인자 VIII의 부재시 응고를 활성화한다. 이러한 인자 IX 변이체는 추가로 야생형 인자 IX의 활성을 유지할 수 있다. 이러한 인자 IX 변이체는 혈우병 B와 같은 혈우병 치료에 사용될 수 있다. 예를 들어, 이러한 인자 IX 변이체는 야생형 인자 IX에 대해 (예를 들어, 서열 번호 701에 대해) 위치 L6, V181, K265, I383, E185, 또는 이들의 조합에서 아미노산 치환을 포함 할 수 있다. 예를 들어, 이러한 인자 IX 변이체는 야생형 인자 IX에 대해 (예를 들어, 서열 번호: 701에 대해) L6F 돌연변이, V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, E185D 돌연변이, 또는 이들의 조합을 포함 할 수 있다.
한 예에서, 인자 IX 단백질은 위치 L6 및 V181에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6 및 K265에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181 및 K265에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 K265 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181 및 K265에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, K265 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, I383, 및 E186에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, K265 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, I383, 및 E186에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다.
한 특정 예에서, 인자 IX 단백질은 위치 V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 특정 예에서, 인자 IX 단백질은 위치 V181, K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 특정 예에서, 인자 IX 단백질은 위치 L6, V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다.
한 예에서, 인자 IX 단백질은 L6F 돌연변이 및 V181I 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이 및 K265A 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이 및 K265A 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 K265A 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 K265A 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 I383V 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, 및 K265A 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, K265A 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, K265A 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, I383V 돌연변이, 및 E186D 돌연변이를 포함할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, I383V 돌연변이, 및 E186D 돌연변이를 포함할 수 있다. 또 다른 예에서, 인자 IX 단백질은 K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, K265A 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다.
특정 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 특정 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 일부 구체예들에서, 인자 IX 변이체는 서열 번호: 700에 최소한 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가진다. 특정 구체예들에서, 인자 IX 변이체는 서열 번호: 700에 최소한 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지며, V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, 및/또는 E185D 돌연변이를 포함한다. 또 다른 특정 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, K265A 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 일부 구체예들에서, 인자 IX 변이체는 서열 번호: 700에 최소한 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지며, L6F 돌연변이, V181I 돌연변이, K265A 돌연변이, 및/또는 I383V 돌연변이를 포함한다.
구조체의 길이는 삽입될 유전자의 크기에 따라 다양 할 수 있으며, 예를 들어 200 염기쌍 (bp) 내지 약 5000 bp, 예를 들어 약 200 bp 내지 약 2000 bp, 예를 들어 약 500 bp 내지 약 1500 bp 일 수 있다. 일부 구체예들에서, DNA 공여자 템플릿의 길이는 약 200bp, 또는 약 500bp, 또는 약 800bp, 또는 약 1000 염기쌍, 또는 약 1500 염기쌍이다. 다른 구체예들에서, 공여자 템플릿의 길이는 최소한 200 bp, 또는 최소한 500 bp, 또는 최소한 800 bp, 또는 최소한 1000 bp, 또는 최소한 1500 bp이다. 다른 구체예들에서, 공여자 템플릿의 길이는 최소한 200 bp, 또는 최소한 500 bp, 또는 최소한 800 bp, 또는 최소한 1000 bp, 또는 최소한 1500 bp, 또는 최소한 2000 bp, 또는 최소한 2500 bp, 또는 최소한 3000 bp, 또는 최소한 3500 bp, 또는 최소한 4000 bp, 또는 최소한 4500 bp, 또는 최소한 5000 bp이다.
구조체는 DNA 또는 RNA, 단일 가닥, 이중-가닥 또는 부분 단일 가닥 및 부분 이중-가닥 일 수 있으며 선형 또는 원형 (예를 들어, 미니서클) 형태로 숙주 세포에 도입 될 수 있다. 예를 들어, 미국 특허 공개공보 제 2010/0047805, 2011/0281361, 2011/0207221을 참고하라. 선형 형태로 도입되는 경우, 공여자 서열의 말단은 당업자에게 공지된 방법에 의해 (예를 들어, 외부핵분해성 분해 (exonucleolytic degradation)로부터) 보호 될 수 있다. 예를 들어, 하나 이상의 다이데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 첨가되고 및/또는 자기-상보성 올리고뉴클레오티드가 한쪽 또는 양쪽 말단에 결찰된다. 예를 들어, Chang 등, (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls 등, (1996) Science 272:886-889를 참고하라. 외인성 폴리뉴클레오티드를 분해로부터 보호하기 위한 또 다른 방법은 말단 아미노기 (들)의 첨가 및, 예를 들어, 포스포로티오에이트, 포스포라미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기와 같은 변형된 뉴클레오티드 간 링키지의 사용을 포함하지만 이에 제한되지는 않는다. 구조체는 예를 들어, 복제 기점, 프로모터 및 항생제 내성을 인 코딩하는 유전자와 같은 추가 서열을 갖는 벡터 분자의 일부로서 세포에 도입 될 수 있다. 구조체는 바이러스 요소들을 생략할 수 있다. 더욱이, 공여자 구조체는 리포솜 또는 폴록사머와 같은 물질과 복합된 핵산과 같은 네이키드 핵산으로 도입 될 수 있거나 바이러스 (예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스)에 의해 전달 될 수 있다.
일부 구체예들에서, 구조체는 그 발현이 삽입 부위에서 내인성 프로모터 (예를 들어, 공여자가 숙주 세포의 알부민 유전자좌에 통합되는 경우 내인성 알부민 프로모터)에 의해 구동되도록 삽입 될 수 있다. 그러한 경우에, 트랜스진은 이의 발현을 구동시키는 제어 요소 (예를 들어, 프로모터 및/또는 인핸서)가 결핍될 수 있다 (예를 들어, 무 프로모터 구조체). 그럼에도 불구하고, 다른 경우에서 구조체는 프로모터 및/또는 인핸서, 예를 들어 통합시 기능성 단백질의 발현을 구동시키는 항시성 프로모터 또는 유도성 또는 조직 특이적 (예를 들어, 간 또는 혈소판 특이적) 프로모터를 포함 할 수 있음이 명백 할 것이다. 이러한 구조체는 신호 펩티드를 인코딩하는 신호 서열에 작동가능하게 연결되고 이의 하류에서 이종 인자 IX 단백질을 인코딩하는 서열을 포함 할 수 있다. 일부 구체예들에서, 핵산 구조체는 인자 IX 단백질을 인코딩하는 핵산의 상동성-독립적 삽입에서 작동한다. 일부 구체예들에서, 이러한 핵산 구조체는 비-분열 세포, 예를 들어, 이중-가닥 DNA 절단을 복구하는 주요 메커니즘이 HR이 아닌 NHEJ인 세포에서 작동한다. 핵산은 상동성-독립적 공여자 구조체 일 수 있다.
이종 인자 IX 핵산 (인자 IX 트랜스 진)을 포함하는 일부 공여자 구축물은 유전자 편집 시스템을 위한 표적 DNA 서열의 절단 부위에 비상동 말단 결합에 의해 삽입가능하다 (예를 들어, 알부민 유전자좌와 같은 세이프 하버 유전자에 삽입가능함). 일부 경우에 이러한 구조체는 상동성 아암을 포함하지 않는다. 예를 들어, 이러한 구조체는 본원에 개시된 바와 같은 유전자 편집 시스템 (예를 들어, CRISPR/Cas 시스템)을 이용한 절단 후 블런트 말단 이중-가닥 절단 내부에 삽입 될 수 있다. 특정 예에서, 구조체는 AAV를 통해 전달 될 수 있고 비-상동 말단 결합에 의해 삽입 될 수 있다 (예를 들어, 구조체는 상동성 아암을 포함하지 않는 것일 수 있다).
특정 예에서, 구조체는 상동성-독립적 표적화 통합을 통해 삽입 될 수 있다. 예를 들어, 구조체에서 이종 인자 IX 핵산은 각 측면에 유전자 편집 시스템을 위한 표적 부위 (예를 들어, 표적화된 삽입을 위한 표적 DNA 서열에서와 동일한 표적 부위 (예를 들어, 세이프 하버 유전자에서), 그리고 표적화 삽입을 위해 표적 DNA 서열을 절단하기 위해 사용되는 동일한 유전자 편집 시스템)가 연접할 수 있다. 유전자 편집 시스템은 이종 인자 IX 핵산에 연접한 표적 부위를 절단 할 수 있다. 특정 예에서, 구조체는 AAV-매개 전달을 전달하고, 이종 인자 IX 핵산에 연접한 표적 부위의 절단은 AAV의 역 말단 반복 (ITR)을 제거 할 수 있다. 일부 방법에서, 표적 삽입을 위한 표적 DNA 서열 (예를 들어, 세이프 하버 유전자좌 내의 표적 DNA 서열, 예를 들어, 연접 프로토스페이서 인접 모티프를 포함하는 gRNA 표적 서열)은 이종 인자 IX 핵산이 절단 부위 또는 표적 DNA 서열에 올바른 방향으로 삽입되는 경우에는 더 이상 존재하지 않지만 이종 인자 IX 핵산이 절단 부위 또는 표적 DNA 서열에 반대 방향으로 삽입되는 경우에는 재형성된다. 이는 이종 인자 IX 핵산이 발현에 올바른 방향으로 삽입되게 하는데 도움을 줄 수 있다.
또한 본 발명은 인자 IX 유전자의 삽입 및 발현 향상을 가능하게 하는 양방향 핵산 구조체들을 기재한다. 요약하면, 본원에 개시된 다양한 양방향 구조체는 최소한 2 개의 핵산 세그먼트를 포함하고, 여기서 하나의 세그먼트 (제 1 세그먼트)는 인자 IX를 인코딩하는 코딩 서열 (본원에서 "트랜스진"으로 호환적으로 지칭됨)을 포함하는 반면, 다른 세그먼트 (제 2 세그먼트)는 서열의 상보체가 인자 IX를 인코딩하는 서열을 포함한다.
한 구체예에서, 양방향 구조체는 최소한 2개의 핵산 세그먼트들을 시스로 포함하고, 이 때 하나의 세그먼트 (제 1 세그먼트)는 코딩 서열 (때때로 본원에서 호환적으로 “트랜스진”으로 지칭됨)을 포함하는 반면, 다른 세그먼트 (제 2 세그먼트)는 해당 서열의 상보체가 트랜스진을 인코드하는 서열을 포함한다. 제 1 트랜스진 및 제 2 트랜스진은 동일하거나 상이할 수 있다. 양방향 구조체들은 최소한 2개의 핵산 세그먼트들을 시스로 포함할 수 있으며, 이 때 하나의 세그먼트 (제 1 세그먼트)는 이종 유전자를 한 방향으로 인코딩하는 코딩 서열을 포함하는 반면, 다른 세그먼트 (제 2 세그먼트)는 그 상보체가 이종 유전자를 다른 방향으로 인코딩하는 서열을 포함한다. 즉, 제 1 세그먼트는 제 2 세그먼트의 상보체이고 (반드시 완벽한 상보체는 아님); 제 2 세그먼트의 상보체는 제 1 세그먼트의 역 상보체이다 (둘 다 동일한 이종 단백질을 인코딩하더라도 반드시 완벽한 역 상보체는 아님). 양방향 구조체는 스플라이스 수용체에 연결된 이종 유전자를 인코딩하는 제 1 코딩 서열 그리고, 상보체가 다른 방향으로 이종 유전자를 인코딩하고 스플라이스 수용체에 또한 연결된 제 2 코딩 서열을 포함 할 수 있다.
본원에 기재된 유전자 편집 시스템 (예를 들어, CRISPR/Cas 시스템; 징크 핑거 뉴클레아제 (ZFN) 시스템; 전사 활성화-유사 이펙터 뉴클레아제 (TALEN) 시스템)과 조합하여 사용되는 경우, 핵산 구조체들의 양방향성은 구조체가 표적 삽입 부위 내부에 어느 하나의 방향으로 삽입되게 (한 방향의 삽입에만 제한되는 것은 아님) 하여, 본원에 예시된 바와 같이 a) 하나의 세그먼트의 코딩 서열 (예를 들어, 도 1에서 "인간 F9"를 인코딩하는 왼쪽 세그먼트, 상부 왼쪽 ssAAV 구조체), 또는 b) 다른 세그먼트의 상보체 (예를 들어, “인간 F9”를 인코딩하는 오른쪽 세그먼트의 상보체, 도 1의 상부 왼쪽 ssAAV 구조체에서 거꾸로 표시됨)로부터 인자 IX를 발현시킴으로써, 삽입 및 발현 효율성을 향상시킬 수 있다. 다양한 공지의 유전자 편집 시스템들, 예를 들어, CRISPR/Cas 시스템; 징크 핑거 뉴클레아제 (ZFN) 시스템; 전사 활성화-유사 이펙터 뉴클레아제 (TALEN) 시스템이 본 발명의 실시에서 사용될 수 있다.
본원에 개시된 양방향 구조체는 임의의 특정 용도에 필요하고 및/또는 하나 이상의 원하는 기능을 부여하는 임의의 적합한 구조적 특징을 포함하도록 변형 될 수 있다. 일부 구체예들에서, 본원에 개시된 양방향 핵산 구조체는 상동성 아암을 포함하지 않는다. 일부 구체예들에서, 본원에 개시된 양방향 핵산 구조체는 상동성-독립적 공여자 구조체이다. 일부 구체예들에서, 부분적으로 핵산 구조체의 양방향 기능으로 인해, 양방향 구조체는 본원에 기재된 바와 같이 어느 방향으로든 게놈 유전자좌 내부에 삽입되어, 관심 폴리펩티드 (예를 들어, 인자 IX)를 효율적으로 삽입 및/또는 발현시킬 수 있다.
일부 구체예들에서, 양방향 핵산은 인자 IX의 발현을 구동시키는 프로모터를 포함하지 않는다. 예를 들어, 인자 IX의 발현은 숙주 세포의 프로모터 (예를 들어, 트랜스진이 숙주 세포의 알부민 유전자좌에 통합 될 때 내인성 알부민 프로모터)에 의해 구동된다.
일부 구체예들에서, 양방향 핵산 구조체는 인자 IX에 대한 코딩 서열을 포함하는 제 1 세그먼트 및 인자 IX의 코딩 서열의 역 상보체를 포함하는 제 2 세그먼트를 포함한다. 그러므로, 제 1 세그먼트의 코딩 서열은 인자 IX를 발현할 수 있는 반면, 제 2 세그먼트의 역 상보체의 상보체 또한 인자 IX를 발현할 수 있다. 본원에서 사용되는 “코딩 서열”은, 역 상보 서열을 포함하는 제 2 세그먼트를 지칭할 때, 제 2 세그먼트의 상보적 (코딩) 가닥 (, 제 2 세그먼트의 역 상보 서열의 상보적 코딩 서열)을 지칭한다.
일부 구체예들에서, 제 1 세그먼트에서 인자 IX를 인코드하는 코딩 서열은 인자 IX를 또한 인코드하는 코딩 서열의 역 상보체에 100% 미만 상보적이다. 즉, 일부 구체예들에서, 제 1 세그먼트는 인자 IX에 대한 코딩 서열 (1)을 포함하고, 제 2 세그먼트는 인자 IX에 대한 코딩 서열 (2)의 역 상보체이고, 이 때 코딩 서열 (1)은 코딩 서열 (2)와 동일하지 않다. 예를 들어, 인자 IX를 인코딩하는 코딩 서열 (1) 및/또는 코딩 서열 (2)은 코딩 서열 (1) 및 코딩 서열 (2)의 역 상보체가 100% 미만의 상보성을 갖도록 코돈 최적화 될 수 있다. 일부 구체예들에서, 제 2 세그먼트의 코딩 서열은 제 1 세그먼트의 코딩 서열에 의해 코딩되는 동일한 (즉, 동일한 아미노산 서열) 인자 IX의 하나 이상의 아미노산에 대해 하나 이상의 대체 코돈을 사용하여 인자 IX를 코딩한다. 본원에서 사용된 "대체 코돈"은 주어진 아미노산에 대한 코돈 사용의 변화를 지칭하고, 주어진 발현 시스템에 대해 바람직한 또는 최적화된 코돈 (코돈 최적화) 일 수도 있고 아닐 수도 있다. 바람직한 코돈 사용, 또는 주어진 발현 시스템에서 내성이 우수한 코돈은 당업계에 공지되어 있다.
일부 구체예들에서, 제 2 세그먼트는 헤어핀 형성을 줄이기 위해 제 1 세그먼트의 코딩 서열과 상이한 코돈 사용을 채택하는 역 상보체 서열을 포함한다. 이러한 역 상보체는 재 1 세그먼트 내 코딩 서열의 모든 뉴클레오티드보다 적은 염기쌍을 형성하지만, 선택적으로 동일한 폴리펩티드를 인코딩한다. 이러한 사례에서, 제 1 세그먼트의, 예를 들어, 폴리펩티드 A에 대한 코딩 서열 대부분은 양방향 구조체의 제 2의 절반의, 예를 들어, 폴리펩티드 A에 대한, 코딩 서열에 상동성이지만 이와 동일하지는 않다. 일부 구체예들에서, 제 2 세그먼트는 제 1 세그먼트의 코딩 서열에 대해 실질적으로 상보적이지 않은 (예를 들어, 70% 이하의 상보적인) 역 상보체 서열을 포함한다. 일부 구체예들에서, 제 2 세그먼트는 제 1 세그먼트의 코딩 서열에 대해 매우 상보적인 (예를 들어, 최소한 90% 상보적인) 역 상보체 서열을 포함한다. 일부 구체예들에서, 제 2 세그먼트는 제 1 세그먼트의 코딩 서열에 최소한 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 약 97%, 또는 약 99% 상보성을 가지는 역 상보 서열을 포함한다.
일부 구체예들에서, 제 2 세그먼트는 제 1 세그먼트의 코딩 서열에 100% 상보성을 가지는 역 상보 서열을 포함한다. 즉, 제 2 세그먼트의 서열은 제 1 세그먼트의 코딩 서열의 완벽한 역 상보체이다. 예로서, 제 1 세그먼트는 가정 서열 5' CTGGACCGA 3' (서열 번호: 500)을 포함하고 제 2 세그먼트는 서열 번호: 1의 역 상보체 - , 5' TCGGTCCAG 3' (서열 번호: 502)를 포함한다.
일부 구체예들에서, 양방향 핵산 구조체는 인자 IX (제 1 폴리펩티드)에 대한 코딩 서열을 포함하는 제 1 세그먼트 및 (제 2) 폴리펩티드의 코딩 서열의 역 상보체를 포함하는 제 2 세그먼트를 포함한다. 일부 구체예들에서, 제 1 및 제 2 세그먼트들 각각은 상기 기재한 바와 같이 동일한 폴리펩티드 (예를 들어, 인자 IX)를 인코드하는 코딩 서열을 포함한다. 일부 구체예들에서, 제 1 및 제 2 세그먼트 각각은 상이한 폴리펩티드들을 인코드하는 코딩 서열을 포함한다. 예를 들어, 제 1 폴리펩티드는 인자 IX이고 제 2 폴리펩티드는 폴리펩티드 B이다. 한 추가 예에서, 제 1 폴리펩티드는 인자 IX이고 제 2 폴리펩티드는 (예를 들어, 본원에 기재된 R338L 돌연변이를 가지는) 인자 IX의 변이체 (예를 들어, 단편, 돌연변이체, 융합)이다. 폴리펩티드를 인코딩하는 코딩 서열은 폴리펩티드에 연결된 하나 이상의 추가 서열들, 가령, 아미노- 또는 카르복시- 말단 아미노산 서열들을 인코딩하는 서열들, 가령, 신호 서열, 라벨 서열 (예를 들어, HiBit), 또는 이종 기능 서열 (예를 들어, 핵 국재화 서열 (NLS) 또는 자가-절단 펩티드)을 선택적으로 포함할 수 있다. 폴리펩티드를 인코딩하는 코딩 서열은 하나 이상의 아미노- 말단 신호 펩티드 서열들을 인코딩하는 서열들을 선택적으로 포함할 수 있다. 이들 추가 서열들 각각은 구조체의 제 1 세그먼트 및 제 2 세그먼트에서 동일 또는 상이할 수 있다.
일부 구체예들에서, 양방향 핵산 구조체는 선형이다. 예를 들어, 제 1 및 제 2 세그먼트들은 링커 서열을 통해 선형 방식으로 결합된다. 일부 구체예들에서, 역 상보 서열을 포함하는 제 2 세그먼트의 5' 말단은 제 1 세그먼트의 3' 말단에 연결된다. 일부 구체예들에서, 제 1 세그먼트의 5' 말단은 역 상보 서열을 포함하는 제 2 세그먼트의 3' 말단에 연결된다. 일부 구체예들에서, 링커 서열은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 500, 1000, 1500, 2000 또는 그 이상의 뉴클레오티드 길이이다. 당업자에 의해 이해되는 바와 같이, 링커 서열에 추가로 또는 대신에 다른 구조적 요소가 제 1 및 제 2 세그먼트 사이에 삽입 될 수 있다.
본원에 개시된 양방향 구조체는 임의의 특정 용도에 필요하고 및/또는 하나 이상의 원하는 기능을 부여하는 임의의 적합한 구조적 특징을 포함하도록 변형 될 수 있다. 일부 구체예들에서, 본원에 개시된 양방향 핵산 구조체는 상동성 아암을 포함하지 않는다. 일부 구체예들에서, 부분적으로 핵산 구조체의 양방향 기능으로 인해, 양방향 구조체는 본원에 기재된 바와 같이 어느 방향 (배향)으로든 게놈 유전자좌 내부에 삽입되어, 관심 폴리펩티드 (예를 들어, 이종 인자 IX)를 효율적으로 삽입 및/또는 발현시킬 수 있다.
일부 구체예들에서, 제 1 및 제 2 세그먼트 중 하나 또는 둘 모두는 폴리아데닐화 꼬리 서열을 포함한다. 적합한 폴리아데닐화 꼬리 서열을 설계하는 방법은 당업계에 잘 알려져 있다.
일부 구체예들에서, 제 1 및 제 2 세그먼트 중 하나 또는 둘 모두는 오픈 리딩 프레임의 하류에 폴리아데닐화 꼬리 서열 및/또는 폴리아데닐화 신호 서열을 포함한다. 일부 구체예들에서, 폴리아데닐화 꼬리 서열은 제 1 및/또는 제 2 세그먼트의 3' 말단에서, 예를 들어, "폴리-A" 스트레치로서 인코드된다. 일부 구체예들에서, 폴리아데닐화 꼬리 서열은 제 1 및/또는 제 2 세그먼트의 3' 말단 또는 그 근처에서 인코딩되는 폴리아데닐화 신호 서열의 결과로서 공동-전사적으로 제공된다. 일부 구체예들에서, 폴리-A 꼬리는 최소한 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아데닌, 선택적으로 최대 300개 아데닌을 포함한다. 일부 구체예들에서, 폴리-A 꼬리는 95, 96, 97, 98, 99, 또는 100개의 아데닌 뉴클레오티드를 포함한다. 적합한 폴리아데닐화 꼬리 서열 및/또는 폴리아데닐화 신호 서열을 설계하는 방법은 당업계에 공지이다. 마우스 알부민 및 인간 FIX 스플라이스 수용체 부위들을 포함하는 적합한 스플라이스 수용체 서열들이 본원에 개시되고 예시된다. 일부 구체예들에서, 폴리아데닐화 신호 서열 AAUAAA (서열 번호 : 800)는 포유류 시스템에서 일반적으로 사용되지만 UAUAAA (서열 번호 : 801) 또는 AU/GUAAA (서열 번호 : 802)와 같은 변이체가 확인된 바 있다. 예를 들어, NJ Proudfoot, Genes & Dev. 25(17):1770-82, 2011을 참고하라. 일부 구체예들에서, 폴리A 꼬리 서열이 포함된다.
일부 구체예들에서, 본원에 개시된 구조체들은 DNA 또는 RNA, 단일-가닥, 이중-가닥, 또는 부분적 단일- 및 부분적 이중-가닥 일 수 있다. 예를 들어, 구조체들은 단일- 또는 이중-가닥 DNA 일 수 있다. 일부 구체예들에서, 핵산은 본원에 기재된 바와 같이 (예를 들어, 뉴클레오시드 유사체들을 사용하여) 변형될 수 있다.
일부 구체예들에서, 본원에 개시된 구조체들은 구조체의 한쪽 또는 양쪽 말단에, 예를 들어, 제 1 및/또는 제 2 세그먼트들의 오픈 리딩 프레임의 5'에, 또는 하나 또는 둘 모두의 트랜스진 서열들의 5'에 스플라이스 수용체 부위를 포함한다. 일부 구체예들에서, 스플라이스 수용체 부위는 NAG를 포함한다. 추가 구체예들에서, 스플라이스 수용체 부위는 NAG로 구성된다. 일부 구체예들에서, 스플라이스 수용체는 알부민 스플라이스 수용체, 예를 들어, 알부민의 엑손 1 및 2의 스플라이싱에 함께 사용되는 알부민 스플라이스 수용체이다. 일부 구체예들에서, 스플라이스 수용체는 인간 알부민 유전자에서 유래된다. 일부 구체예들에서, 스플라이스 수용체는 마우스 알부민 유전자에서 유래된다. 일부 구체예들에서, 스플라이스 수용체는 F9 (또는 “FIX”) 스플라이스 수용체, 예를 들어, F9의 엑손 1 및 2의 스플라이싱에 함께 사용되는 F9 스플라이스 수용체이다. 일부 구체예들에서, 스플라이스 수용체는 인간 F9 유전자에서 유래된다. 일부 구체예들에서, 스플라이스 수용체는 마우스 F9 유전자에서 유래된다. 인공 스플라이스 수용체들을 비롯하여, 진핵세포에서 유용한 또 다른 적합한 스플라이스 수용체 부위들은 공지이며 해당 분야에서 유래될 수 있다. 예를 들어, Shapiro, 등, 1987, Nucleic Acids Res., 15, 7155-7174, Burset, 등, 2001, Nucleic Acids Res., 29, 255-259를 참고하라.
일부 구체예들에서, 본원에 개시된 양방향 구조체는 필요에 따라 하나 이상의 적합한 구조적 특징을 포함하고 및/또는 하나 이상의 기능적 이점을 부여하도록 한쪽 또는 양쪽 말단에서 변형 될 수 있다. 예를 들어, 구조적 변형은 본원에 개시된 구조체들을 숙주 세포에 전달하는 데 사용되는 방법- 예를 들어, 바이러스 벡터 전달의 사용 또는 전달용 지질 나노입자로의 패키징-에 따라 달라질 수 있다. 이러한 변형들에는, 제한 없이, 예를 들어, 말단 구조들, 가령, 역위 말단 반복서열들 (ITR), 헤어핀, 루프, 및 다른 구조들, 가령, 토로이드(toroid)가 포함된다. 일부 구체예들에서, 본원에 개시된 구조체들은 1, 2, 또는 3개의 ITR들을 포함한다. 일부 구체예들에서, 본원에 개시된 구조체들은 2개 이하의 ITR들을 포함한다. 다양한 구조적 변형 방법들은 해당 분야에 공지이다.
일부 구체예들에서, 구조체의 한쪽 또는 양쪽 말단들은 해당 분야에 공지된 방법에 의해 (예를 들어, 외부핵분해성 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 다이데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 첨가되고 및/또는 자기-상보성 올리고뉴클레오티드가 한쪽 또는 양쪽 말단에 결찰된다. 예를 들어, Chang 등, (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls 등, (1996) Science 272:886-889를 참고하라. 구조체들을 분해로부터 보호하기 위한 또 다른 방법은 말단 아미노기 (들)의 첨가 및, 예를 들어, 포스포로티오에이트, 포스포라미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기와 같은 변형된 뉴클레오티드 간 링키지의 사용을 포함하지만 이에 제한되지는 않는다.
일부 구체예들에서, 본원에 개시된 구조체들은 예를 들어, 복제 기점, 프로모터 및 항생제 내성을 인 코딩하는 유전자와 같은 추가 서열을 갖는 벡터의 일부로서 세포에 도입 될 수 있다. 일부 구체예들에서, 구조체들은 리포솜, 폴리머, 또는 폴록사머와 같은 물질과 복합된 핵산과 같은 네이키드 핵산으로 도입 될 수 있거나 바이러스 벡터들 (예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스)에 의해 전달 될 수 있다.
일부 구체예들에서, 발현에 필요하지는 않지만, 본원에 개시된 구조체들은 또한 전사 또는 번역 조절 서열, 예를 들어, 프로모터, 인핸서, 절연체, 내부 리보솜 진입 부위, 펩티드를 인코딩하는 서열 및/또는 폴리아데닐화 신호를 포함 할 수 있다.
일부 구체예들에서, 인자 IX에 대한 코딩 서열을 포함하는 구조체는 다음 변형 중 하나 이상을 포함 할 수 있다: 코돈 최적화 (예를 들어, 인간 코돈에 대한) 및/또는 하나 이상의 당화 부위의 추가. 예를 들어, McIntosh 등, (2013) Blood (17):3335-44를 참고하라.
D. 유전자 편집 시스템
다양한 공지의 유전자 편집 시스템들, 예를 들어, CRISPR/Cas 시스템; 징크 핑거 뉴클레아제 (ZFN) 시스템; 전사 활성화-유사 이펙터 뉴클레아제 (TALEN) 시스템이 본 발명의 실시에서 인자 IX 유전자의 표적화 삽입을 위해 사용될 수 있다. 일반적으로 유전자 편집 시스템은 표적 DNA 서열에서 이중-가닥 절단 (DSB) 또는 닉 (예를 들어, 단일 가닥 절단 또는 SSB)을 유도하기 위하여 조작된 절단 시스템의 사용을 포함한다. 절단 또는 닉킹은 표적 DNA 서열의 특이적 절단 또는 닉킹을 가이드하도록 조작된 가이드 RNA를 가지는 CRISPR/Cas 시스템을 사용하여 또는 특정 뉴클레아제, 가령, 조작된 ZFN, TALEN을 사용하여 발생할 수 있다. 또한, 표적 뉴클레아제가 Argonaute 시스템을 기반으로 개발 중에 있으며 (예를 들어, 'TtAgo'로 알려진 T. 써모필루스, Swarts et al (2014) Nature 507(7491): 258-261 참조), 이 또한 게놈 편집 및 유전자 치료에 사용될 가능성이 있을 수 있다.
본원에 개시된 가이드 RNA를 사용하는 방법의 경우, 아 방법은 CRISPR/Cas 시스템 (및 인자 IX를 인코딩하는 서열을 포함하는 본원에 개시된 임의의 공여자 구조체)의 사용을 포함함이 이해될 것이다. 또한, 본 발명은 본원에 개시된 양방향 구조체를 사용하는 인자 IX의 표적화 삽입 및 발현 방법을 고려하고 있음이 이해될 것이며, 이 방법은 본원에 개시된 가이드 RNA의 유무에 관계없이 수행 될 수 있다 (예를 들어, ZFN 시스템을 사용하여 표적 DNA 서열에 절단을 유발하여 양방향 구조체의 삽입 부위를 생성함).
일부 구체예들에서, CRISPR/Cas 시스템 (예를 들어, 가이드 RNA 및 RNA-가이드 DNA 결합제)을 사용하여 숙주 게놈 내의 원하는 유전자좌에 삽입 부위를 생성 할 수 있으며, 이 부위에 본원에 개시된 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체)가 삽입되어, 인자 IX를 발현할 수 있다. 인자 IX는 삽입 부위 또는 유전자좌, 예를 들어, 본원에 기술된 바와 같이, 인자 IX가 정상적으로 발현되지 않는 세이프 하버 유전자좌와 관련하여 이종 일 수 있다. 대안적으로, 일부 구체예들에서, 인자 IX는 그의 삽입 부위와 관련하여 비-이종성 일 수 있으며, 예를 들어, 결함이 있는 인자 IX 유전자를 교정하기 위해 야생형 인자 IX를 내인성 유전자좌로 삽입 할 수 있다. 세이프 하버는 알부민 유전자, 가령, 인간 알부민 유전자 내부에 존재할 수 있다. 세이프 하버는 알부민 인트론 1 영역, 예를 들어, 인간 알부민 인트론 1에 존재할 수 있다. 세이프 하버는, 예를 들어, 간 조직 또는 헤파토사이트 숙주 세포를 위한 인간 세이프 하버 일 수 있다. 일부 구체예들에서, 본원에 기재된 가이드 RNA는 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)와 함께 본 발명의 방법에 따라 사용되어, 삽입 부위를 생성 할 수 있으며, 이 부위에서 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체)가 삽입되어, 인자 IX를 발현할 수 있다. 인간 알부민 유전자좌의 인트론 1 내부로의 인자 IX의 표적화 삽입에 유용한 가이드 RNA가 본원에 예시 및 기재된다 (예를 들어, 표 1 참고).
다양한 RNA-가이드 DNA 결합제, 예를 들어, 뉴클레아제, 가령, Cas 뉴클레아제, 예를 들어, Cas9의 사용 방법은 또한 해당 분야에 널리 공지되어 있다. CRISPR/Cas 시스템과 함께 양방향 핵산의 사용이 본원에 예시되어 있으나 이러한 시스템에 대한 적합한 변형 또한 사용될 수 있음이 이해될 것이다. 문맥에 따라, RNA-가이드 DNA 결합제는 핵산 (예를 들어, DNA 또는 mRNA) 또는 단백질로 제공 될 수 있음이 이해될 것이다. 일부 구체예들에서, 본 발명의 방법은 RNA-가이드 DNA 결합제를 이미 포함 및/또는 발현하는 숙주 세포에서 실행될 수 있다.
일부 구체예들에서, RNA-가이드 DNA 결합제, 가령, Cas9 뉴클레아제는 클리브아제 활성을 가지며, 이는 또한 이중-가닥 엔도뉴클레아제 활성으로도 지칭될 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제, 가령, Cas9 뉴클레아제는 닉카제 활성을 가지며, 이는 또한 단일-가닥 엔도뉴클레아제 활성으로도 지칭될 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 Cas 뉴클레아제를 포함한다. Cas 뉴클레아제의 예들에는 S. 피오게네스, S. 아우레우스, 및 기타 원핵 생물의 유형 II CRISPR 시스템 (예를 들어, 다음 단락의 목록 참조) 및 이의 변이체 또는 돌연변이체 (예를 들어, 조작된, 비-자연 발생 , 자연 발생 또는 기타 변이체) 형태를 포함한다. 예를 들어, US2016/0312198 A1; US 2016/0312199 A1을 참고하라.
Cas 뉴클레아제가 유도될 수 있는 비-제한적 예시 종들에는 스트렙토코쿠스 피오게네스, 스트렙토코쿠스 써모필루스, 스트렙토코쿠스 종, 스타필로코쿠스 아우레우스, 리스테리아 이노쿠아, 락토바실루스 가세리, 프란시셀라 노비시다, 볼리넬라 숙시노게네스, 수테렐라 와즈워텐시스, 감마프로테오박테리움, 네이세리아 메닌기티디스, 캄필로박터 제주니, 파스퇴렐라 물토시다, 피브로박터 숙시노겐, 로도스피릴룸 루브룸, 노카르디옵시스 다쏜빌레이, 스트렙토마이세스 프리스티나에스피랄리스, 스트렙토마이세스 비리도크로모게네스, 스트렙토마이세스 비리도크로모게네스, 스트렙토스포란지움 로세움, 스트렙토스포란지움 로세움, 알리사이클로바실루스 아시도칼다리우스, 바실루스 슈도마이코이데스, 바실루스 셀레니티레두센스, 엑시구오박테리움 시비리쿰, 락토바실루스 델브루엑키이, 락토바실루스 살리바리우스, 락토바실루스 부크네리, 트레포네마 덴티콜라, 마이크로실라 마리나, 부르크홀데리알레스 박테리움, 폴라로모나스 나프탈레니보란스, 폴라로모나스 종, 크로코스파에라 왓소니이, 시아노테세 종, 마이크로시스티스 아에루기노사, 시네코코쿠스 종, 아세토할로비움 아라바티쿰, 암모니펙스 데겐시이, 칼디세룰로시룹토르 벡스치이, 칸디다투스 데술포루디스, 클로스트리디움 보툴리눔, 클로스트리디움 디피실레, 피네골디아 마그나, 나트라나에로비우스 써모필루스, 펠로토마쿨룸 테르모프로피오니쿰, 아시디티오바실루스 칼두스, 아시디티오바실루스 페로옥시단스, 알로크로마티움 비노숨, 마리노박터 종, 니트로소코쿠스 할로필루스, 니트로소코쿠스 왓소니, 슈도알테로모나스 할로플란크티스, 크테도노박터 라세미페르, 메타노할로비움 에베스티가툼, 아나바에나 바리아빌리스, 노둘라리아 스푸미게나, 노스톡 종, 아르쓰로스피라 맥시마, 아르쓰로스피라 플라텐시스, 아르쓰로스피라 종, 링비아 종, 마이크로콜레우스 크토노플라스테스, 오실라토리아 종, 페트로토가 모빌리스, 써모시포 아프리카누스, 스트렙토코쿠스 파스퇴리아누스, 네이세리아 시네레아, 캄필로박터 라리, 파르비바쿨룸 라바멘티보란스, 코리네박테리움 디프테리아, 아시다미노코쿠스 종, 라크노스피라세아에 박테리움 ND2006, 및 아카리오클로리스 마리나가 포함된다.
일부 구체예들에서, Cas 뉴클레아제는 스트렙토코쿠스 피오게네스의 Cas9 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 스트렙토코쿠스 써모필루스의 Cas9 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 네이세리아 메닌기티디스의 Cas9 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 스타필로코쿠스 아우레우스의 Cas9 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 프란시셀라 노비시다의 Cpf1 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 아시다미노코쿠스 종 Cpf1 뉴클레아제이다. 일부 구체예들에서, Cas 뉴클레아제는 라크노스피라세아에 박테리움 ND2006의 Cpf1 뉴클레아제이다. 추가 구체예들에서, Cas 뉴클레아제는 프란시셀라 툴라렌시스, 라크노스피라세아에 박테리움, 부티리비브리오 프로테오클라스티쿠스, 페레그리니박테리아 박테리움, 파르쿠박테리아 박테리움, 스미텔라, 아시다미노코쿠스, 칸디다투스 메타노플라스마 테르미툼, 에우박테리움 엘리겐스, 모락셀라 보보쿨리, 렙토스피라 이나다이, 포르피로모나스 크레비오리카리스, 프레보텔라 디시엔스, 또는 포르피로모나스 마카카에의 Cpf1 뉴클레아제이다. 특정 구체예들에서, Cas 뉴클레아제는 아시다미노코쿠스 또는 라크노스피라세아에의 Cpf1 뉴클레아제이다.
일부 구체예들에서, gRNA는 RNA-가이드 DNA 결합제와 함께 리보핵단백질 복합체 (RNP)라 불린다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 Cas 뉴클레아제이다. 일부 구체예들에서, gRNA는 Cas 뉴클레아제와 함께 Cas RNP라 불린다. 일부 구체예들에서, RNP는 유형-I, 유형-II, or 유형-III 요소들을 포함한다. 일부 구체예들에서, Cas 뉴클레아제는 유형-II CRISPR/Cas 시스템의 Cas9 단백질이다. 일부 구체예들에서, gRNA는 Cas9와 함께 Cas9 RNP라 불린다.
야생형 Cas9는 2개의 뉴클레아제 도메인: RuvC 및 HNH를 가진다. RuvC 도메인은 비-표적 DNA 가닥을 절단하고, HNH 도메인은 DNA의 표적 가닥을 절단한다. 일부 구체예들에서, Cas9 단백질은 하나 이상의 RuvC 도메인 및/또는 하나 이상의 HNH 도메인을 포함한다. 일부 구체예들에서, Cas9 단백질은 야생형 Cas9이다. 조성물, 용도 및 방법 구체예들 각각에서, Cas는 표적 DNA에서 이중-가닥 절단을 유도한다.
일부 구체예들에서, 키메라 Cas 뉴클레아제들이 사용되며, 여기서 단백질의 하나의 도메인 또는 영역은 상이한 단백질의 일부분으로 대체된다. 일부 구체예들에서, Cas 뉴클레아제 도메인은 Fok1과 같은 상이한 뉴클레아제의 도메인으로 대체 될 수 있다. 일부 구체예들에서, Cas 뉴클레아제는 변형된 뉴클레아제 일 수 있다.
다른 구체예들에서, Cas 뉴클레아제는 유형-I CRISPR/Cas 시스템으로부터 유래할 수 있다. 일부 구체예들에서, Cas 뉴클레아제는 유형-I CRISPR/Cas 시스템의 캐스케이드 복합체의 구성성분일 수 있다. 일부 구체예들에서, Cas 뉴클레아제는 Cas3 단백질 일 수 있다. 일부 구체예들에서, Cas 뉴클레아제는 유형-III CRISPR/Cas 시스템으로부터 유래할 수 있다. 일부 구체예들에서, Cas 뉴클레아제는 RNA 절단 활성을 가질 수 있다.
일부 구체예들에서, RNA-가이드 DNA 결합제는 단일-가닥 닉카제 활성을 가지고 있다, 즉, 하나의 DNA 가닥을 절단하여 "닉 (nick)"으로도 공지된 단일-가닥 절단을 생성 할 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 Cas 닉카제를 포함한다. 닉카제는 dsDNA에서 닉을 생성하는 효소이다, 즉, DNA 이중 나선의 한 가닥은 자르지만 다른 가닥은 자르지 않는 것이다. 일부 구체예들에서, Cas 닉카제는 예를 들어 촉매 도메인에서 하나 이상의 변형 (예를 들어, 점 돌연변이)에 의해 내부핵분해성 활성 부위가 비활성화되는 Cas 뉴클레아제 형태 (예를 들어, 상기 논의된 Cas 뉴클레아제)이다. 예를 들어, Cas 닉카제 및 예시적 촉매 도메인 변형들에 관한 논의에 대한 미국 특허 제 8,889,356호를 참고하라. 일부 구체예들에서, Cas 닉카제, 가령, Cas9 닉카제는 비활성화된 RuvC 또는 HNH 도메인을 가진다.
일부 구체예들에서, RNA-가이드 DNA 결합제는 단 하나의 기능적 뉴클레아제 도메인을 포함하도록 변형된다. 예를 들어, 작용제 단백질은 핵산 절단 활성을 감소시키기 위해 뉴클레아제 도메인 중 하나가 돌연변이되거나 완전히 또는 부분적으로 결실되도록 변형 될 수 있다. 일부 구체예들에서, 활성이 감소된 RuvC 도메인을 갖는 닉카제가 사용된다. 일부 구체예들에서, 비활성 RuvC 도메인을 갖는 닉카제가 사용된다. 일부 구체예들에서, 활성이 감소된 HNH 도메인을 갖는 닉카제가 사용된다. 일부 구체예들에서, 비활성 HNH 도메인을 갖는 닉카제가 사용된다.
일부 구체예들에서, 뉴클레아제 활성을 감소 또는 변경하기 위해 Cas 단백질 뉴클레아제 도메인 내의 보존된 아미노산이 치환된다. 일부 구체예들에서, Cas 뉴클레아제는 RuvC 또는 RuvC-유사 뉴클레아제 도메인에 아미노산 치환을 포함 할 수 있다. RuvC 또는 RuvC-유사 뉴클레아제 도메인에서 예시적인 아미노산 치환들은 D10A (S. 피오게네스 Cas9 단백질 기준)를 포함한다. 예를 들어, Zetsche 등, (2015) Cell Oct 22:163(3): 759-771을 참고하라. 일부 구체예들에서, Cas 뉴클레아제는 HNH 또는 HNH-유사 뉴클레아제 도메인에 아미노산 치환을 포함 할 수 있다. HNH 또는 HNH-유사 뉴클레아제 도메인에서 예시적인 아미노산 치환은 E762A, H840A, N863A, H983A, 및 D986A (S. 피오게네스 Cas9 단백질 기준)를 포함한다. 예를 들어, Zetsche 등, (2015)을 참고하라. 추가의 예시적인 아미노산 치환에는 D917A, E1006A, 및 D1255A가 포함된다 (프란시셀라 노비시다 U112 Cpf1 (FnCpf1) 서열 (UniProtKB - A0Q7Q2 (CPF1_FRATN) 기준).
일부 구체예들에서, 닉카제는 표적 서열의 센스 및 안티센스 가닥 각각에 상보적인 한 쌍의 가이드 RNA와 조합하여 제공된다. 이 구체예에서, 가이드 RNA는 닉카제를 표적 서열로 안내하고 표적 서열의 반대 가닥에 닉을 생성함으로써 DSB를 도입한다 (즉, 이중 닉킹). 일부 구체예에서, 닉카제는 DNA의 반대 가닥들을 표적화하는 2 개의 개별 가이드 RNA와 함께 사용되어, 표적 DNA에서 이중 닉을 생성한다. 일부 구체예들에서, 닉카제는 매우 근접하도록 선택된 두 개의 개별 가이드 RNA와 함께 사용되어, 표적 DNA에서 이중 닉을 생성한다.
일부 구체예들에서,RNA-가이드 DNA 결합제는 하나 이상의 이종 기능성 도메인들을 포함한다 (예를 들어, 융합 폴리펩티드이거나 이를 포함함).
일부 구체예들에서, 이종 기능성 도메인은 RNA-가이드 DNA 결합제의 세포 핵으로의 수송을 촉진 할 수 있다. 예를 들어, 이종 기능성 도메인은 핵 국재화 신호 (NLS) 일 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 1-10 NLS(들)과 융합될 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 1-5 NLS(들)과 융합될 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 하나의 NLS와 융합될 수 있다. 하나의 NLS가 사용될 경우, NLS는 RNA-가이드 DNA 결합제 서열의 N-말단 또는 C-말단에서 연결될 수 있다. 이는 또한 RNA-가이드 DNA 결합제 서열 내부에 삽입될 수 있다. 다른 구체예들에서, RNA-가이드 DNA 결합제는 하나 이상의 NLS와 융합될 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 2, 3, 4, 또는 5개 NLS와 융합될 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 2개의 NLS와 융합될 수 있다. 특정 상황에서, 2개의 NLS는 동일하거나 (예를 들어, 2개의 SV40 NLS) 다를 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 카르복시 말단에 연결된 2개의 SV40 NLS 서열에 융합된다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 2개의 NLS들과 융합될 수 있는데, 하나는 N-말단에서 그리고 하나는 C-말단에서 연결된다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 3개의 NLS와 융합될 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제는 NLS와 융합되지 않을 수 있다. 일부 구체예들에서, NLS는 단립형 (monopartite) 서열, 가령, 예를 들어, SV40 NLS, PKKKRKV (서열 번호: 600) 또는 PKKKRRV (서열 번호: 601) 일 수 있다. 일부 구체예들에서, NLS는 양립형 서열 (bipartite), 가령, 핵플라스민의 NLS, KRPAATKKAGQAKKKK (서열 번호: 602) 일 수 있다. 한 특정 구체예에서, 단일 PKKKRKV (서열 번호: 600) NLS는 RNA-가이드 DNA 결합제의 C-말단에 연결될 수 있다. 하나 이상의 링커들은 선택적으로 융합 부위에 포함된다.
III. 전달 방법
본원에 개시된 가이드 RNA, RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제) 및 핵산 구조체 (예를 들어, 양방향 구조체)는 당업계에서 이용가능한 다양한 공지의 적합한 방법을 사용하여 생체내 또는 생체외에서 숙주 세포 또는 숙주 세포들의 집단 또는 대상체에 전달 될 수 있다. 가이드 RNA, RNA-가이드 DNA 결합제 및 핵산 구조체는 동일하거나 다른 전달 방법을 사용하여 적절히 개별적으로 또는 임의의 조합으로 함께 전달 될 수 있다.
통상적인 바이러스 및 비-바이러스 기반 유전자 전달 방법을 사용하여 세포 (예를 들어, 포유동물 세포) 및 표적 조직에 본원에 개시된 가이드 RNA, 뿐만 아니라 RNA-가이드 DNA 결합제 및 공여자 구조체를 도입할 수 있다. 본원은 또한, 핵산, 가령, 비-바이러스 벡터, 플라스미드 벡터, 및 예를 들어, 네이키드 핵산, 및 리포좀, 지질 나노입자 (LNP), 또는 폴록사머와 같은 전달 비히클과 복합된 핵산을 포함하는 비-바이러스 벡터 전달 시스템이 제공된다. 바이러스 벡터 전달 시스템들은 DNA 및 RNA 바이러스를 포함한다.
핵산의 비-바이러스 전달을 위한 방법 및 조성물은 전기천공, 리포펙션, 미세주입, 유전자총, 비로좀, 리포좀, 면역리포좀, LNP, 다중 양이온 또는 지질:핵산 접합체, 네이키드 핵산 (예를 들어, 네이키드 DNA/RNA), 인공 비리온, 및 DNA의 작용제-개선된 흡수를 포함한다. 핵산의 전달을 위해, 예를 들어, Sonitron 2000 시스템 (Rich-Mar)을 사용한 초음파천공 (Sonoporation) 또한 사용될 수 있다.
추가적인 예시적 핵산 전달 시스템들에는, AmaxaBiosystems (Cologne, 독일), Maxcyte, Inc. (Rockville, Md.), BTX Molecular Delivery Systems (Holliston, MA) 및 Copernicus Therapeutics Inc.에 의해 공급되는 시스템들이 포함된다 (예를 들면 미국 특허 제 6,008,336 참고). 리포펙틴은 예를 들어, 미국 특허 제 5,049,386; 4,946,787; 및 4,897,355에 기재되어 있으며 리포펙틴 시약들은 시판되고 있다 (예를 들어, Transfectam™및 Lipofectin™면역지질 복합체와 같은 표적화된 리포좀을 포함하는 지질:핵산 복합체의 제조는 당업계에 잘 알려져 있고 본원에 기재된 바와 같다.
가이드 RNA, RNA-가이드 DNA 결합제 및 공여자 구조체를 단독으로 또는 조합하여 포함하는 다양한 전달 시스템 (예를 들어, 벡터, 리포좀, LNP)은 생체내 세포로의 전달을 위해 유기체에 투여되거나 생체외 세포 또는 세포 배양물에 투여될 수 있다. 투여는 분자를 도입하여 혈액, 체액 또는 분자들과 궁극적으로 접촉시키기 위해 통상적으로 사용되는, 주사, 주입, 국소적용 및 전기천공을 비롯한 (그러나 이에 제한되지 않음) 임의의 경로들에 의해 의한다. 이러한 핵산을 투여하는 적절한 방법을 이용할 수 있으며 당업자에게 잘 알려져 있다.
특정 구체예들에서, 본 발명은 본원에 개시된 임의의 조성물 - 예를 들어, 본원에 개시된 임의의 하나 이상의 가이드 서열을 포함하는 가이드 RNA를 인코딩하는 DNA 또는 RNA 벡터; 또는 인자 IX를 인코딩하는 서열을 포함하는 구조체 ( 예를 들어, 양방향 구조체)를 제공한다. 일부 구체예들에서, 이러한 벡터는 또한 RNA-가이드 DNA 결합제를 인코딩하는 서열을 포함한다. 특정 구체예들에서, 본 발명은 본원에 기재된 임의의 하나 이상의 조성물들을 인코딩하는 DNA 또는 RNA 벡터들 또는 이의 조합을 포함한다. 일부 구체예들에서, 벡터는, 예를 들어, 프로모터, 인핸서, 및 조절 서열들을 추가로 포함한다. 일부 구체예들에서, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체를 포함하는 벡터는 인자 IX 발현을 구동시키는 프로모터를 포함하지 않는다. 예를 들어, 인자 IX 폴리펩티드의 발현은 숙주 세포의 프로모터 (예를 들어, 트랜스진이 숙주 세포의 알부민 유전자좌에 통합 될 때 내인성 알부민 프로모터)에 의해 구동된다. 일부 구체예들에서, 양방향 핵산 구조체는 제 1 세그먼트 및 제 2 세그먼트를 포함하며, 각각은 트랜스진의 상류에 스플라이스 수용체를 가진다. 특정 구체예들에서, 스플라이스 수용체는 숙주 세포들의 세이프 하버 부위의 스플라이스 공여자 서열, 예를 들어, 인간 알부민 유전자의 인트론 1의 스플라이스 공여자와 양립가능하다. 일부 구체예들에서, 본원에 기재된 가이드 서열 중 임의의 하나 이상을 포함하는 가이드 RNA를 포함하는 벡터는 또한 본원에 기재된 바와 같은 crRNA, trRNA, 또는 crRNA 및 trRNA를 인코딩하는 하나 이상의 뉴클레오티드 서열 (들)을 포함한다.
일부 구체예들에서, 벡터는 본원에 기재된 가이드 RNA를 인코딩하는 뉴클레오티드 서열을 포함한다. 일부 구체예들에서, 벡터는 가이드 RNA의 하나의 사본을 포함한다. 다른 구체예들에서, 벡터는 하나 이상의 가이드 RNA 사본을 포함한다. 하나 이상의 가이드 RNA가 있는 구체예들에서, 가이드 RNA가 동일하지 않아서 상이한 표적 서열들을 표적할 수 있거나, 또는 동일하여 동일한 표적 서열을 표적할 수 있다. 벡터가 하나 이상의 가이드 RNA를 포함하는 일부 구체예들에서, 각 가이드 RNA는 RNA-가이드 DNA 뉴클레아제와의 복합체, 가령, Cas RNP 복합체 내부에서 다른 상이한 성질들, 가령, 활성 또는 안정성을 가질 수 있다. 일부 구체예들에서, 가이드 RNA를 인코딩하는 뉴클레오티드 서열은 최소한 하나의 전사 또는 번역 조절 서열, 가령, 프로모터, 3' UTR 또는 5' UTR에 작동가능하게 연결될 수 있다. 한 구체 예에서, 프로모터는 tRNA 프로모터, 예를 들어, tRNALys3, 또는 tRNA 키메라 일 수 있다. Mefferd 등, RNA . 2015 21:1683-9; Scherer 등, Nucleic Acids Res . 2007 35: 2620-2628을 참고하라. 일부 구체예들에서, 프로모터는 RNA 폴리머라제 III (Pol III)에 의해 인식 될 수 있다. Pol III 프로모터의 비-제한적 예는 U6 및 H1 프로모터를 포함한다. 일부 구체예들에서, 가이드 RNA를 인코딩하는 뉴클레오티드 서열은 마우스 또는 인간 U6 프로모터에 작동가능하게 연결될 수 있다. 다른 구체예들에서, 가이드 RNA를 인코딩하는 뉴클레오티드 서열은 마우스 또는 인간 H1 프로모터에 작동가능하게 연결될 수 있다. 하나 이상의 가이드 RNA가 있는 구체예에서, 발현을 구동시키는데 사용되는 프로모터는 동일하거나 상이 할 수 있다. 일부 구체예들에서, 가이드 RNA의 crRNA를 인코딩하는 뉴클레오티드와 가이드 RNA의 trRNA를 인코딩하는 뉴클레오티드가 동일한 벡터에 제공 될 수 있다. 일부 구체예들에서, crRNA를 인코딩하는 뉴클레오티드 및 trRNA를 인코딩하는 뉴클레오티드는 동일한 프로모터에 의해 구동 될 수 있다. 일부 구체예들에서, crRNA 및 trRNA는 단일 전사체로 전사 될 수 있다. 예를 들어, crRNA 및 trRNA는 단일 전사체로부터 가공되어 이중-분자 가이드 RNA를 형성 할 수 있다. 대안적으로, crRNA 및 trRNA는 단일-분자 가이드 RNA (sgRNA)로 전사 될 수 있다. 다른 구체예들에서, crRNA 및 trRNA는 동일한 벡터상의 상응하는 프로모터에 의해 구동 될 수 있다. 또 다른 구체예에서, crRNA 및 trRNA는 상이한 벡터에 의해 인코딩 될 수 있다.
일부 구체예들에서, 가이드 RNA를 인코딩하는 뉴클레오티드 서열은 Cas 단백질과 같은 RNA-가이드 DNA 결합제를 인코딩하는 뉴클레오티드 서열을 포함하는 동일한 벡터 상에 위치 할 수 있다. 일부 구체예들에서, 가이드 RNA 및 Cas 단백질과 같은 RNA-가이드 DNA 결합제의 발현은 그들 자신의 상응하는 프로모터에 의해 구동 될 수 있다. 일부 구체예들에서, 가이드 RNA의 발현은 Cas 단백질과 같은 RNA-가이드 DNA 결합제의 발현을 구동시키는 동일한 프로모터에 의해 구동 될 수 있다. 일부 구체예들에서, 가이드 RNA 및 RNA-가이드 DNA 결합제, 가령, Cas 단백질 전사체는 단일 전사체 내부에 포함될 수 있다. 예를 들어, 가이드 RNA는 RNA 가이드 DNA 결합제, 가령, Cas 단백질 전사체의 비 번역 영역 (UTR) 내에 있을 수 있다. 일부 구체예들에서, 가이드 RNA는 전사체의 5' UTR 내부에 있을 수 있다. 다른 구체예들에서, 가이드 RNA는 전사체의 3' UTR 내부에 있을 수 있다. 일부 구체예들에서, 전사체의 세포내 반감기는 3' UTR 내부에 가이드 RNA를 포함시켜 3' UTR의 길이를 단축시킴으로써 감소 될 수 있다. 추가 구체예에서, 가이드 RNA는 전사체의 인트론 내부에 있을 수 있다. 일부 구체예들에서, 가이드 RNA가 전사체로부터 적절하게 스플라이싱 되도록 가이드 RNA가 위치하는 인트론에 적합한 스플라이스 부위가 추가 될 수 있다. 일부 구체예들에서, 동일한 벡터로부터 Cas 단백질과 같은 RNA-가이드 DNA 결합제 및 가이드 RNA를 시간상으로 가깝게 발현시키면 보다 효율적인 CRISPR RNP 복합체 형성을 촉진 할 수 있다.
일부 구체예들에서, RNA-가이드 DNA 결합제 및/또는 가이드 RNA를 인코딩하는 뉴클레오티드 서열은 인자 IX 유전자를 포함하는 구조체를 포함하는 동일한 벡터 상에 위치 할 수 있다. 일부 구체예들에서, 동일한 벡터상에서 인자 IX 유전자 및 가이드 RNA (및/또는 RNA-가이드 DNA 결합제)를 포함하는 구조체의 근접성은 가이드 RNA/RNA-가이드 DNA 결합제에 의해 생성되는 삽입 부위 내부로의 이러한 구조체의 보다 효율적인 삽입을 촉진할 수 있다.
일부 구체예들에서, 벡터는 Cas 단백질, 가령, Cas9 또는 Cpf1 일 수 있는 RNA-가이드 DNA 결합제를 인코딩하는 mRNA 및 sgRNA를 인코딩하는 하나 이상의 뉴클레오티드 서열(들)을 포함한다. 일부 구체예들에서, 벡터는 Cas 단백질, 가령, Cas9 또는 Cpf1 일 수 있는 RNA-가이드 DNA 결합제를 인코딩하는 mRNA, trRNA 및 crRNA를 인코딩하는 하나 이상의 뉴클레오티드 서열(들)을 포함한다. 한 구체예에서, Cas9는 스트렙토코쿠스 피오게네스 에서 유래된다 ( , Spy Cas9). 일부 구체예들에서, crRNA, trRNA 또는 crRNA 및 trRNA (sgRNA 일 수 있음)를 인코딩하는 뉴클레오티드 서열은 자연 발생 CRISPR/Cas 시스템으로부터의 반복 서열들의 전부 또는 일부가 연접된 가이드 서열을 포함하거나 이들로 구성된다. crRNA, trRNA 또는 crRNA 및 trRNA를 포함하거나 이들로 구성된 핵산은, crRNA, trRNA 또는 crRNA 및 trRNA와 함께 자연적으로 발견되지 않는 핵산들을 포함하거나 이들로 구성된 벡터 서열을 추가로 포함 할 수 있다.
일부 구체예들에서, crRNA 및 trRNA는 하나의 벡터 내에서 비-연속 핵산에 의해 인코딩된다. 다른 구체예들에서, crRNA 및 trRNA는 연속 핵산에 의해 인코딩될 수 있다. 일부 구체예들에서, crRNA 및 trRNA는 단일 핵산의 반대 가닥들에 의해 인코딩된다. 다른 구체예들에서, crRNA 및 trRNA는 단일 핵산의 동일한 가닥에 의해 인코딩된다.
일부 구체예들에서, 벡터는 본원에 개시된 바와 같은 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조체 (예를 들어, 양방향 핵산 구조체)를 포함한다. 일부 구체예들에서, 본원에 개시된 공여자 구조체 (예를 들어, 양방향 핵산 구조체)에 추가하여, 벡터는 본원에 기재된 가이드 RNA를 인코딩하는 핵산 및/또는 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제, 가령, Cas9)를 인코딩하는 핵산을 추가로 포함 할 수 있다. 일부 구체예들에서, RNA-가이드 DNA 결합제를 인코딩하는 핵산은 본원에 개시된 공여자 구조체 (예를 들어, 양방향 구조체)를 포함하는 벡터와는 별개의 벡터 상에 각각 또는 둘 모두 존재한다. 임의의 구체예들에서, 벡터는 본원에 기재된 바와 같은 프로모터, 인핸서, 조절 서열을 포함하는 (그러나 이에 제한되지 않음) 다른 서열을 포함 할 수 있다. 일부 구체예들에서, 프로모터는 공여자 구조체 (예를 들어, 양방향 구조체)의 인자 IX의 발현을 구동시키지 않는다. 일부 구체예들에서, 벡터는 crRNA, trRNA, 또는 crRNA 및 trRNA를 인코딩하는 하나 이상의 뉴클레오티드 서열(들)을 포함한다. 일부 구체예들에서, 벡터는 Cas 뉴클레아제 (예를 들어, Cas9) 일 수 있는 RNA-가이드 DNA 뉴클레아제를 인코딩하는 mRNA 및 sgRNA를 인코딩하는 하나 이상의 뉴클레오티드 서열(들)을 포함한다. 일부 구체예들에서, 벡터는 Cas 뉴클레아제, 가령, Cas9 일 수 있는 RNA-가이드 DNA 뉴클레아제를 인코딩하는 mRNA, trRNA 및 crRNA를 인코딩하는 하나 이상의 뉴클레오티드 서열(들)을 포함한다. 일부 구체예들에서, Cas9는 스트렙토코쿠스 피오게네스에서 유래된다 (, Spy Cas9). 일부 구체예들에서, crRNA, trRNA 또는 crRNA 및 trRNA (sgRNA 일 수 있음)를 인코딩하는 뉴클레오티드 서열은 자연 발생 CRISPR/Cas 시스템으로부터의 반복 서열들의 전부 또는 일부가 연접된 가이드 서열을 포함하거나 이들로 구성된다. crRNA, trRNA 또는 crRNA 및 trRNA를 포함하거나 이들로 구성된 핵산은, crRNA, trRNA 또는 crRNA 및 trRNA와 함께 자연적으로 발견되지 않는 핵산들을 포함하거나 이들로 구성된 벡터 서열을 추가로 포함 할 수 있다.
일부 구체예들에서, 벡터는 원형일 수 있다. 다른 구체예들에서, 벡터는 선형일 수 있다. 일부 구체예들에서, 벡터는 지질 나노입자, 리포솜, 비-지질 나노입자 또는 바이러스 캡시드로 둘러싸일 수 있다. 비 제한적인 예시적인 벡터는 플라스미드, 파지미드, 코스미드, 인공 염색체, 미니염색체, 트랜스포존, 바이러스 벡터 및 발현 벡터를 포함한다.
일부 구체예들에서, 벡터는 바이러스 벡터일 수 있다. 일부 구체예들에서, 바이러스 벡터는 이의 야생형 대응물로부터 유전자 변형 될 수 있다. 예를 들어, 바이러스 벡터는 클로닝을 용이하게 하기 위해 또는 벡터의 하나 이상의 특성들을 변화시키는 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환을 포함할 수 있다. 이러한 특성에는 패키징 용량, 형질도입 효율, 면역원성, 게놈 통합, 복제, 전사 및 번역이 포함될 수 있다. 일부 구체예들에서, 바이러스가 더 큰 크기를 갖는 외인성 서열을 패키징 할 수 있도록 바이러스 게놈의 일부가 결실 될 수 있다. 일부 구체예들에서, 바이러스 벡터는 향상된 형질도입 효율을 가질 수 있다. 일부 구체예들에서, 숙주에서 바이러스에 의해 유도된 면역 반응이 감소 될 수 있다. 일부 구체예들에서, 바이러스가 통합되지 않도록, 바이러스 서열의 숙주 게놈으로의 통합을 촉진하는 바이러스 유전자 (예를 들어, 인테그라제)가 돌연변이 될 수 있다. 일부 구체예들에서, 바이러스 벡터는 복제 결함 일 수 있다. 일부 구체예들에서, 바이러스 벡터는 벡터에서 코딩 서열들의 발현을 구동시키기 위해 외인성 전사 또는 번역 제어 서열을 포함 할 수 있다. 일부 구체예들에서, 바이러스는 헬퍼-의존성 일 수 있다. 예를 들어, 바이러스는 벡터를 증폭하고 바이러스 입자로 패키징하는데 필요한 바이러스 성분들 (예를 들어, 바이러스 단백질)을 공급하기 위해 하나 이상의 헬퍼 바이러스가 필요할 수 있다. 이러한 경우, 바이러스 성분들을 인코딩하는 하나 이상의 벡터들을 포함하는 하나 이상의 헬퍼 성분들은 본원에 기재된 벡터 시스템과 함께 숙주 세포 또는 숙주 세포들의 집단에 도입 될 수 있다. 다른 구체예들에서, 바이러스는 헬퍼가 없을 수 있다. 예를 들어, 바이러스는 헬퍼 바이러스 없이 벡터를 증폭 및 패키징 할 수 있다. 일부 구체예들에서, 본원에 기재된 벡터 시스템은 또한 바이러스 증폭 및 패키징에 필요한 바이러스 성분들을 인코딩 할 수 있다.
비-제한적인 예시적인 바이러스 벡터는 아데노-연관 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 헬퍼 의존성 아데노바이러스 벡터 (HDAd), 단순 헤르페스 바이러스 (HSV-1) 벡터, 박테리오파지 T4, 배큘로바이러스 벡터 및 레트로바이러스 벡터를 포함한다. 일부 구체예들에서, 바이러스 벡터는 AAV 벡터 일 수 있다. 다른 구체예들에서, 바이러스 벡터는 렌티바이러스 벡터 일 수 있다.
일부 구체예들에서, "AAV"는 모든 혈청형, 아형 및 자연 발생 AAV, 뿐만 아니라 재조합 AAV를 지칭한다. "AAV"는 바이러스 자체 또는 이의 유도체를 지칭하기 위해 사용될 수 있다. 용어 “AAV”는 AAV1, AAV2, AAV3, AAV3B, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAVrh.64R1, AAVhu.37, AAVrh.8, AAVrh.32.33, AAV8, AAV9, AAV-DJ, AAV2/8, AAVrh10, AAVLK03 , AV10, AAV11, AAV12, rh10, 및 이의 하이브리드, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 영장류 AAV, 비영장류 AAV, 및 양 AAV를 포함한다. AAV의 다양한 혈청형의 게놈 서열, 뿐만 아니라 천연 말단 반복서열 (TR), Rep 단백질 및 캡시드 서브유닛의 서열들은 당업계에 공지되어 있다. 이러한 서열은 문헌 또는 GenBank와 같은 공개 데이터베이스에서 찾을 수 있다. 본원에 사용된 "AAV 벡터"는 AAV 기원이 아닌 이종성 서열 (즉, AAV에 이종성인 핵산 서열)을 포함하는 AAV 벡터를 지칭하며, 일반적으로 관심 이종성 폴리펩티드를 인코딩하는 서열을 포함한다. 구조체는 AAV1, AAV2, AAV3, AAV3B, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAVrh.64R1, AAVhu.37, AAVrh.8, AAVrh.32.33, AAV8, AAV9, AAV-DJ, AAV2/8, AAVrh10, AAVLK03 , AV10, AAV11, AAV12, rh10, 및 이의 하이브리드, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 영장류 AAV, 비영장류 AAV, 및 양 AAV 캡시드 서열을 포함할 수 있다. 일반적으로, 이종 핵산 서열 (트랜스진)은 최소한 하나에 의해, 그리고 일반적으로 두 개의 AAV 반전된 말단 반복 서열 (ITRs)에 의해 연접된다. AAV 벡터는 단일 가닥 (ssAAV) 또는 자기 상보성 (scAAV) 일 수 있다.
일부 구체예들에서, 렌티바이러스는 통합되지 않을 수 있다. 일부 구체예들에서, 바이러스 벡터는 아데노바이러스 벡터 일 수 있다. 일부 구체예들에서, 아데노바이러스는 고-클로닝 용량 또는 "유전자미함유(gutless)" 아데노바이러스 일 수 있으며, 여기서 5' 및 3' 역위 말단 반복서열 (ITR) 및 패키징 신호 ('I')를 제외한 모든 코딩 바이러스 영역들은 패키징 용량을 증가시키기 위해 바이러스로부터 제거되어 있다. 또 다른 구체예에서, 바이러스 벡터는 HSV-1 벡터 일 수 있다. 일부 구체예들에서, HSV-1-기반 벡터는 헬퍼 의존적이며, 다른 구체예에서는 헬퍼 독립적이다. 예를 들어, 패키징 서열만 유지하는 앰플리콘 벡터는 패키징을 위한 구조적 구성요소들을 가지는 헬퍼 바이러스가 필요한 반면, 비-필수 바이러스 기능들을 제거하는 30kb-결실된 HSV-1 벡터는 헬퍼 바이러스를 필요로 하지 않는다. 또 다른 구체예들에서, 바이러스 벡터는 박테리오파지 T4 일 수 있다. 일부 구체예들에서, 박테리오파지 T4는 바이러스 헤드가 비워 질 때 선형 또는 원형 DNA 또는 RNA 분자를 패키징 할 수 있다. 추가 구체예들에서, 바이러스 벡터는 배큘로바이러스 벡터 일 수 있다. 추가 구체예들에서, 바이러스 벡터는 레트로바이러스 벡터 일 수 있다. 더 작은 클로닝 용량을 갖는 AAV 또는 렌티바이러스 벡터를 사용하는 구체예에서, 본원에 개시된 벡터 시스템의 모든 구성요소들을 전달하기 위해 하나 이상의 벡터를 사용하는 것이 필요할 수 있다. 예를 들어, 하나의 AAV 벡터는 Cas 단백질 (예를 들어, Cas9)과 같은 RNA-가이드 DNA 결합제를 인코딩하는 서열을 포함 할 수 있는 반면, 제 2 AAV 벡터는 하나 이상의 가이드 서열을 포함 할 수 있다.
일부 구체예들에서, 벡터 시스템은 세포에서 하나 이상의 뉴클레아제 구성요소들의 발현을 구동 할 수 있다. 일부 구체예들에서, 양방향 구조체는, 선택적으로 벡터 시스템의 일부로서, 세포에서 코딩 서열의 발현을 구동시킬 수 있는 프로모터를 포함 할 수 있다. 일부 구체예들에서, 벡터는 일단 세포에 통합되면 하나 이상의 코딩 서열들의 발현을 구동시키는 프로모터를 포함하지 않는다 (예를 들어, 본원에 예시된 바와 같은 알부민 유전자좌가 인트론 1에 삽입되는 경우와 같이 숙주 세포의 내인성 프로모터를 사용함). 일부 구체예들에서, 세포는 진핵 세포, 가령, 예를 들어, 효모, 식물, 곤충 또는 포유류 세포일 수 있다. 일부 구체예들에서, 진핵 세포는 포유류 세포 일 수 있다. 일부 구체예들에서, 진핵 세포는 설치류 세포 일 수 있다. 일부 구체예들에서, 진핵 세포는 인간 세포 일 수 있다. 상이한 유형의 세포에서 발현을 구동시키는 적합한 프로모터는 당업계에 공지되어있다. 일부 구체예들에서, 프로모터는 야생형 일 수 있다. 다른 구체예들에서, 프로모터는 보다 효율적이거나 효과적인 발현을 위해 변형 될 수 있다. 또 다른 구체예에서, 프로모터는 절두 될 수 있지만 그 기능을 유지한다. 예를 들어, 프로모터는 벡터를 바이러스로 적절하게 패키징하기에 적합한 정상 크기 또는 감소된 크기를 가질 수 있다.
일부 구체예들에서, 벡터는 본원에 기재된 Cas 단백질 (예를 들어, Cas9)과 같은 RNA-가이드 DNA 결합제를 인코딩하는 뉴클레오티드 서열을 포함 할 수 있다. 일부 구체예들에서, 벡터에 의해 인코딩된 뉴클레아제는 Cas 단백질 일 수 있다. 일부 구체예들에서, 벡터 시스템은 뉴클레아제를 인코딩하는 하나의 뉴클레오티드 서열 사본을 포함 할 수 있다. 다른 구체예들에서, 벡터 시스템은 뉴클레아제를 인코딩하는 하나 이상의 뉴클레오티드 서열 사본을 포함 할 수 있다. 일부 구체예들에서, 뉴클레아제를 인코딩하는 뉴클레오티드 서열은 최소한 하나의 전사 또는 번역 제어 서열에 작동가능하게 연결될 수 있다. 일부 구체예들에서, 뉴클레아제를 인코딩하는 뉴클레오티드 서열은 최소한 하나의 프로모터에 작동가능하게 연결될 수 있다.
일부 구체예들에서, 벡터는 본원에 기재된 이종 인자 IX 유전자를 포함하는 임의의 하나 이상의 구조체를 포함 할 수 있다. 일부 구체예들에서, 인자 IX 유전자는 최소한 하나의 전사 또는 번역 제어 서열에 작동가능하게 연결될 수 있다. 일부 구체예들에서, 인자 IX 유전자는 최소한 하나의 프로모터에 작동가능하게 연결될 수 있다. 일부 구체예들에서, 인자 IX 유전자는 이종 유전자의 발현을 구동시키는 프로모터에 연결되지 않는다.
일부 구체예들에서, 프로모터는 항시성, 유도성 또는 조직 특이성 일 수 있다. 일부 구체예들에서, 프로모터는 항시성 프로모터 일 수 있다. 비-제한적인 예시적인 항시성 프로모터에는 거대세포 바이러스 즉시 초기 프로모터 (CMV), 유인원 바이러스 (SV40) 프로모터, 아데노바이러스 주요 후기 (MLP) 프로모터, Rous 육종 바이러스 (RSV) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 연장 인자-알파 (EF1a) 프로모터, 유비퀴틴 프로모터, 액틴 프로모터, 튜불린 프로모터, 면역글로불린 프로모터, 이의 기능적 단편, 또는 전술한 것들의 임의의 조합이 포함된다. 일부 구체예들에서, 프로모터는 CMV 프로모터 일 수 있다. 일부 구체예들에서, 프로모터는 절두된 CMV 프로모터 일 수 있다. 다른 구체예들에서, 프로모터는 EF1a 프로모터 일 수 있다. 일부 구체예들에서, 프로모터는 유도성 프로모터 일 수 있다. 비 제한적인 예시적인 유도성 프로모터는 열 충격, 빛, 화학 물질, 펩티드, 금속, 스테로이드, 항생제 또는 알코올에 의해 유도 될 수 있는 것들을 포함한다. 일부 구체예들에서, 유도성 프로모터는 예를 들어 Tet-On® 프로모터 (Clontech)와 같이 낮은 기저 (비-유도) 발현 수준을 갖는 것일 수 있다.
일부 구체예들에서, 프로모터는 조직-특이적 프로모터, 예를 들어 간에서의 발현에 특이적인 프로모터 일 수 있다.
일부 구체예들에서, 조성물은 벡터 시스템을 포함한다. 일부 구체예들에서, 벡터 시스템은 하나의 단일 벡터를 포함 할 수 있다. 다른 구체예들에서, 벡터 시스템은 2 개의 벡터를 포함 할 수 있다. 또 다른 구체예에서, 벡터 시스템은 3 개의 벡터를 포함 할 수 있다. 다중화에 서로 다른 가이드 RNA가 사용되거나 다수의 가이드 RNA 사본이 사용되는 경우 벡터 시스템은 3개 이상의 벡터를 포함 할 수 있다.
일부 구체예들에서, 벡터 시스템은 표적 세포로 전달된 후에만 발현을 시작하는 유도성 프로모터를 포함 할 수 있다. 비 제한적인 예시적인 유도성 프로모터는 열 충격, 빛, 화학 물질, 펩티드, 금속, 스테로이드, 항생제 또는 알코올에 의해 유도 될 수 있는 것들을 포함한다. 일부 구체예들에서, 유도성 프로모터는 예를 들어 Tet-On® 프로모터 (Clontech)와 같이 낮은 기저 (비-유도) 발현 수준을 갖는 것일 수 있다.
또 다른 구체예에서, 벡터 시스템은 특정 조직으로 전달된 후에만 발현을 시작하는 조직-특이적 프로모터를 포함 할 수 있다.
개별적으로 또는 임의의 조합으로 인자 IX를 인코딩하는 서열을 포함하는 가이드 RNA, RNA-결합 DNA 결합제 또는 공여자 구조체를 포함하는 벡터는 리포좀, 나노입자, 엑소좀 또는 미세소포에 의해 전달 될 수 있다. 벡터는 지질 나노입자 (LNP)에 의해 전달 될 수도 있다. 개별적으로 또는 임의의 조합으로 이종 단백질을 인코딩하는 서열을 포함하는 하나 이상의 가이드 RNA, RNA-결합 DNA 결합제 (예를 들어, mRNA) 또는 공여자 구조체는 리포좀, 나노입자, 엑소좀 또는 미세소포에 의해 전달 될 수 있다. 개별적으로 또는 임의의 조합으로 이종 단백질을 인코딩하는 서열을 포함하는 하나 이상의 가이드 RNA, RNA-결합 DNA 결합제 (예를 들어, mRNA) 또는 공여자 구조체는 LNP에 의해 전달 될 수 있다.
지질 나노입자 (LNPs)는 뉴클레오티드 및 단백질 카고의 전달에 있어서 잘 알려진 수단이며, 본원에 개시된 임의의 가이드 RNA, RNA-가이드 DNA 결합제 및/또는 공여자 구조체 (예를 들어, 양방향 구조체)의 전달에 사용될 수 있다. 일부 구체예들에서, LNP는 적절하게 핵산 (예를 들어, DNA 또는 mRNA), 또는 단백질 (예를 들어, Cas 뉴클레아제), 또는 단백질과 함께하는 핵산의 형태로 조성물을 전달한다.
일부 구체예들에서, 본 발명은 본원에 기재된 임의의 가이드 RNA 및/또는 본원에 개시된 공여자 구조체 (예를 들어, 양방향 구조체)를, 단독으로 또는 조합하여, 숙주 세포 또는 숙주 세포들의 집단 또는 대상체에 전달하는 방법을 제공하며, 이 때 상기 구성요소들 중 임의의 하나 이상은 LNP와 결합된다. 일부 구체예들에서, 상기 방법은 RNA-가이드 DNA 결합제 (예를 들어, Cas9 또는 Cas9를 인코딩하는 서열)를 추가로 포함한다.
일부 구체예들에서, 본 발명은 본원에 기재된 임의의 가이드 RNA 및/또는 본원에 개시된 공여자 구조체 (예를 들어, 양방향 구조체)를, 단독으로 또는 조합하여, LNP와 함께 포함하는 조성물을 제공한다. 일부 구체예들에서, 상기 조성물은 RNA-가이드 DNA 결합제 (예를 들어, Cas9 또는 Cas9를 인코딩하는 서열)를 추가로 포함한다.
일부 구체예들에서, LNP는 양이온성 지질을 포함한다. 일부 구체예들에서, LNP는 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(다이에틸아미노)프로폭시)카보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-다이에노에이트)로도 불리는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(다이에틸아미노)프로폭시)카보닐)옥시)메틸)프로필 옥타데카-9,12-다이에노에이트, 또는 또 다른 이온화가능한 지질을 포함한다. 예를 들어, PCT/US2018/053559 (2018년 9월 28일 출원), WO/2017/173054, WO2015/095340, 및 WO2014/136086의 지질, 뿐만 아니라 이 문헌들에 제공된 참고문헌을 참고하라. 일부 구체예들에서, LNP는 약 4.5, 5.0, 5.5, 6.0, 또는 6.5의 양이온성 지질 아민 대 RNA 포스페이트 몰비 (N:P)를 포함한다. 일부 구체예들에서, LNP 지질과 관련하여 용어 양이온성 및 이온화가능한은 상호교환 가능하며, 예를 들어, 이온화가능한 지질은 pH에 따라 양이온성이다.
일부 구체예들에서, 본원에 개시된 양방향 구조체와 관련된 LNP는 질병 또는 장애를 치료하기 위한 약제를 제조하는데 사용하기 위한 것이다. 이러한 질병 또는 장애는 인자 IX 결핍증, 가령, 혈우병 B 일 수 있다.
일부 구체예들에서, 본원에 기재된 임의의 가이드 RNA, RNA-가이드 DNA 결합제, 및/또는 본원에 개시된 공여자 구조체 (예를 들어, 양방향 구조체)는, 단독으로 또는 조합으로, 네이키드 또는 벡터의 일부분으로서 지질 나노입자에서 제제화되거나 지질 나노입자를 통해 투여된다; 예를 들어, 본원에 그 내용 전문이 참고문헌으로 포함된 WO/2017/173054를 참고하라.
일부 구체예들에서, RNA 성분 및 지질 성분을 포함하는 LNP 조성물이 포함되며, 지질 성분은 생분해성, 이온화가능한 지질과 같은 아민 지질을 포함한다. 일부 예에서, 지질 성분은 생분해성, 이온화가능한 지질, 콜레스테롤, DSPC 및 PEG-DMG를 포함한다.
본원에 개시된 가이드 RNA, RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제 또는 Cas 뉴클레아제를 인코딩하는 핵산), 및 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조물 (예를 들어, 양방향 구조물)이 동일하거나 상이한 시스템을 사용하여 전달될 수 있음이 명백할 것이다. 예를 들어, 가이드 RNA, Cas 뉴클레아제, 및 구조체는 동일한 벡터 ( 예를 들어, AAV)에 의해 운반될 수 있다. 대안적으로, Cas 뉴클레아제 (단백질 또는 mRNA로서) 및/또는 gRNA는 플라스미드 또는 LNP에 의해 운반 될 수 있는 반면, 공여자 구조체는 AAV와 같은 벡터에 의해 운반 될 수 있다. 또한, 상이한 전달 시스템은 동일하거나 상이한 경로에 의해 (예를 들어, 주입에 의해; 근육내 주사, 꼬리 정맥 주사 또는 다른 정맥내 주사와 같은 주사에 의해; 복강내 투여 및/또는 근육내 주사에 의해) 투여 될 수 있다.
상이한 전달 시스템은 시험관내 또는 생체내에서 동시에 또는 임의의 순차적 순서로 전달 될 수 있다. 일부 구체예들에서, 공여자 구조체, 가이드 RNA 및 Cas 뉴클레아제는 시험관내 또는 생체내에서 동시에, 예를 들어, 하나의 벡터, 두 개의 벡터, 개별 벡터, 하나의 LNP, 두 개의 LNP, 개별 LNP, 또는 이들의 조합으로 전달 될 수 있다. 일부 구체예들에서, 공여자 구조체는 가이드 RNA 및/또는 Cas 뉴클레아제를, 벡터로서 및/또는 LNP 단독과 결합하여 또는 리보핵단백질 (RNP)로서 함께 전달하기 ( 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14일, 또는 그 이상) 이전에, 벡터로서 및/또는 LNP와 결합되어 생체내 또는 시험관내 전달될 수 있다. 추가 예로서, 구조체를, 벡터로서 및/또는 LNP와 결합하여 전달하기 ( 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14일, 또는 그 이상) 이전에 가이드 RNA 및 Cas 뉴클레아제는, 벡터로서 및/또는 LNP 단독과 결합하여 또는 리보핵단백질 (RNP)로서 함께, 생체내 또는 시험관내 전달될 수 있다.
일부 구체예들에서, 본 발명은 또한 본원에 개시된 임의의 가이드 RNA를 투여하기 위한 약학 제제를 제공한다. 일부 구체예들에서, 약학 제제는 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제) 및 본원에 개시된 바와 같은 치료적 이종 유전자의 코딩 서열을 포함하는 공여자 구조체를 포함한다. 대상체 (예를 들어, 인간 대상체)로의 전달에 적합한 약학 제제는 당업계에 잘 알려져 있다.
IV. 사용 방법
본원에 기재된 gRNAs, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제는 생체내 또는 시험관내에서 숙주 세포 또는 숙주 세포들의 집단에 인자 IX 핵산을 도입함에 유용하다. 일부 구체예들에서, 본원에 기재된 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제는 숙주 세포 또는 숙주 세포들의 집단에서, 또는 필요로 하는 대상체에서 인자 IX를 발현시킴에 유용하다. 일부 구체예들에서, 본원에 기재된 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제는 필요로 하는 대상체에서 혈우병 (예를 들어, 혈우병 B) 치료에 유용하다. 본원에 기재된 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제의 하나 이상의 투여는 인자 IX 단백질 수준 및/또는 인자 IX 활성 수준, 예를 들어, 순환, 혈청 또는 혈장 수준을 증가시킬 것이다. 일부 구체예들에서, 치료의 효율성은 혈청 또는 혈장 IX 활성을 측정하여 평가할 수 있으며, 여기서 대상체의 혈장 수준 및/또는 인자 IX의 활성의 증가는 치료의 효율성을 나타낸다. 일부 구체예들에서, 치료의 효율성은 혈청 또는 혈장 IX 단백질 및/또는 활성 수준을 측정하여 평가할 수 있으며, 여기서 대상체의 혈장 수준 및/또는 인자 IX의 활성의 증가는 치료의 효율성을 나타낸다. 일부 구체예들에서, 치료 효율성은 aPTT 분석에서 응고 기능 및/또는 TGA-EA 분석에서 트롬빈 생성을 평가하여 결정될 수 있다. 일부 구체예들에서, 치료 효율성은 인자 IX, 예를 들어, 순환 인자 IX의 수준을 평가하여 결정될 수 있으며, 이는 응고 및/또는 면역학적 검정, 예를 들어, 샌드위치 면역검정, ELISA (예를 들어, 실시예 13 참고), MSD (예를 들어, 실시예 14 참고)에 의해 측정될 수 있다.
정상 또는 건강한 개인에서 인자 IX 활성 및 항원 수준은 성인 인간 혈장으로부터의 정제에 기초하여 약 3-5 μg/ml인 정상 풀링 혈장의 약 50 내지 160%에서 변화한다 (Amiral 등, Clin. Chem. 30(9), 1512-16, 1984의 표 2; 또한 Osterud 등, 1978 참고). 정상 혈장 수준의 50% 미만인 인자 IX 활성 및/또는 항원 수준을 가지는 개체들은 혈우병을 가지는 것으로 분류된다. 특히, 약 1% 미만의 활성 인자를 가진 개체는 중증 혈우병으로 분류되고, 약 1-5% 활성 인자를 가지는 개체는 중등도 혈우병으로 분류된다. 경증 혈우병 개체들은 정상 수준의 약 6-49%의 활성 응고 인자를 가진다. 일부 구체예들에서, 순환 인자 IX의 수준은 응고 및/또는 면역학적 분석에 의해 측정 될 수 있으며,이 방법은 당업계에 잘 알려져 있다(예를 들어, Simioni 등, NEJM 2009, Adcock 등, Coagulation Handbook, Esoterix Laboratory Services, 2006). hFIX 단백질을 검출하기 위한 면역학적 방법 및 기능항진 hFIX 변이체의 인자 IX 활성을 함수적으로 정규화하는 방법은 실시예 13에서 찾을 수 있다. 일부 구체예들에서, 인자 IX, 예를 들어, 순환 인자 IX는, 응고 및/또는 면역학적 검정, 예를 들어, 샌드위치 면역검정, ELISA (예를 들어, 실시예 13 참고), MSD (예를 들어, 실시예 14 참고)에 의해 측정될 수 있다.
따라서, 일부 구체예들에서, 본원에 개시된 조성물 및 방법들은 혈우병을 가진 대상체에서 인자 IX의 혈장 수준 또는 인자 IX 활성 수준을 정상 수준의 약 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 또는 그 이상까지 증가시킴에 유용하다.
일부 구체예들에서, 본원에 개시된 조성물 및 방법들은 인자 IX 활성 및/또는 수준을 증가, 예를 들어, 순환 FIX 단백질 수준을 약 0.05, 0.1, 0.2, 0.5, 1, 2, 3, 또는 4 μg/ml까지 증가시킴에 유용하다. FIX 단백질 수준은 약 150 μg/ml, 또는 그 이상에 도달할 수 있다. 일부 구체예들에서, 본원에 개시된 조성물 및 방법들은 인자 IX 단백질 수준을 약 4 μg/ml까지 증가시킴에 유용하다. 일부 구체예들에서, 본원에 개시된 조성물 및 방법들은 인자 IX 단백질 수준을 약 4 μg/ml 내지 약 5 μg/ml, 약 4μg/ml 내지 6 μg/ml, 약 4μg/ml 내지 8 μg/ml, 약 4 μg/ml 내지 약 10 μg/ml 까지, 또는 그 이상 증가시킴에 유용하다. 일부 구체예들에서, 본원에 개시된 조성물 및 방법들은 인자 IX 단백질 수준을 약 0.1 μg/ml 내지 약 10 μg/ml, 약 1 μg/ml 내지 약 10 μg/ml, 약 0.1 μg/ml 내지 약 6 μg/ml, 약 1 μg/ml 내지 약 6 μg/ml, 약 2μg/ml 내지 약 5 μg/ml, 또는 약 3 μg/ml 내지 약 5 μg/ml까지 증가시킴에 유용하다. 예를 들어, 본원에 개시된 조성물 및 방법들은 혈우병을 가진 대상체에서 인자 IX의 혈장 수준을 약 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150 μg/ml까지, 또는 그 이상 증가시킴에 유용하다.
일부 구체예들에서, 본원에 개시된 조성물 및 방법들은 혈우병을 가진 대상체의 인자 IX의 혈장 수준 및/또는 활성 수준을, 투여 전 대상체의 인자 IX 혈장 수준 및/또는 활성에 비해 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 또는 그 이상만큼 증가시킴에 유용하다.
일부 구체예들에서, 본원에 개시된 조성물 및 방법들은 숙주 세포 또는 숙주 세포들의 집단에서 인자 IX 단백질 및/또는 인자 IX 활성을, 숙주 세포 또는 숙주 세포들의 집단에 투여하기 전 인자 IX 수준 및/또는 활성, 예를 들어, 정상 수준에 비해 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 또는 그 이상 만큼 증가시킴에 유용하다. 일부 구체예들에서, 세포는 간 세포 또는 간 세포들의 집단이다. 일부 구체예들에서, 간 세포는 헤파토사이트이고 또는 간 세포들의 집단은 헤파토사이트이다.
일부 구체예들에서, 상기 방법은 LNP 중의 가이드 RNA 및 RNA-가이드 DNA 결합제 (가령, Cas9 뉴클레아제를 인코딩하는 mRNA)를 투여하는 단계를 포함한다. 추가 구체예들에서, 상기 방법은 인자 IX 단백질을 인코딩하는 AAV 핵산 구조체, 가령, 양방향 FIX 구조체를 투여하는 단계를 포함한다. 가이드 RNA 및 Cas9를 인코딩하는 mRNA를 포함하는 CRISPR/Cas9 LNP는 정맥내 투여될 수 있다. AAV FIX 공여자 구조체는 정맥내 투여될 수 있다. CRISPR/Cas9 LNP 용량의 예시에는 약 0.1, 0.25, 0.3, 0.5, 1, 2, 3, 4, 5, 6, 8, 또는 10 mpk (RNA)가 포함된다. 단위 mg/kg 및 mpk는 본원에서 호환적으로 사용된다. FIX 단백질을 인코딩하는 핵산을 포함하는 AAV의 예시 용량은 약 1011, 1012, 1013, 및 1014 vg/kg의 MOI를 포함하며, 선택적으로 MOI는 약 1x 1013 내지 1x 1014 vg/kg 일 수 있다.
일부 구체예들에서, 상기 방법은 치료적 유효량의 인자 IX 단백질을 발현시키는 것을 포함한다. 일부 구체예들에서, 상기 방법은 개체에서 순환 인자 IX 응고 활성의 치료적 유효 수준을 구현하는 것을 포함한다. 특정 구체예들에서, 상기 방법은 정상의 최소한 약 5% 내지 약 50%의 인자 IX 활성을 구현하는 것을 포함한다. 상기 방법은 정상의 최소한 약 50% 내지 약 150%의 인자 IX 활성을 구현하는 것을 포함할 수 있다. 특정 구체예들에서, 상기 방법은 환자의 기준 인자 IX 활성에 비해 정상 인자 IX 활성의 최소한 약 1% 내지 약 50%, 또는 정상 인자 IX 활성의 최소한 약 5% 내지 약 50%, 또는 정상 인자 IX 활성의 최소한 약 50% 내지 약 150%의 인자 IX 활성 증가를 구현하는 것을 포함한다.
일부 구체예들에서, 상기 방법은 지속 효과, 예를 들어, 최소한 1 개월, 2 개월, 6 개월, 1 년, 또는 2 년 효과를 구현하는 것을 추가로 포함한다. 일부 구체예들에서, 상기 방법은 치료 효과를 지속적이고 계속적인 방식으로, 예를 들어, 최소한 1 개월, 2 개월, 6 개월, 1 년, 또는 2 년 효과를 구현하는 것을 추가로 포함한다. 일부 구체예들에서, 순환 인자 IX 활성 및/또는 수준은 최소한 1 개월, 2 개월, 6 개월, 1 년, 또는 그 이상 동안 안정하다. 일부 구체예들에서 정상-상태 활성 및/또는 FIX 단백질 수준은 최소한 7 일, 최소한 14 일, 또는 최소한 28 일까지 구현된다. 또 다른 구체예에서, 상기 방법은 단회 투약 후 인자 IX 활성 및/또는 수준을 최소한 1, 2, 4, 또는 6 개월, 또는 최소한 1, 2, 3, 4, 또는 5 년 동안 유지하는 것을 포함한다.
알부민 유전자좌로의 삽입을 포함하는 추가 구체예에서, 개체의 순환 알부민 수준은 정상이다. 이 방법은 개체의 순환 알부민 수준을 정상 순환 알부민 수준의 ±5%, ±10%, ±15%, ±20%, 또는 ±50% 내로 유지하는 것을 포함할 수 있다. 특정 구체예들에서, 개체의 알부민 수준은 치료되지 않은 개체의 알부민 수준과 비교하여 최소한 4 주, 8 주, 12 주 또는 20 주까지 변하지 않는다. 특정 구체예들에서, 개체의 알부민 수치는 일시적으로 떨어진 다음 정상 수준으로 되돌아간다. 특히, 상기 방법은 혈장 알부민 수준의 유의한 변화를 검출하지 않는 것을 포함 할 수 있다.
일부 구체예들에서, 본 발명은, 숙주 세포 또는 숙주 세포들의 집단에 본원에 기재된 하나 이상의 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를 투여 또는 전달하는 단계를 포함하는, 알부민 유전자, 예컨대 인간 알부민 유전자를 변형 (예를 들어, 이중-가닥 절단 생성)시키는 방법 또는 변형의 사용을 포함한다. 일부 구체예들에서, 본 발명은, 숙주 세포 또는 숙주 세포들의 집단에 본원에 기재된 하나 이상의 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를 투여 또는 전달하는 단계를 포함하는, 알부민 인트론 1 영역, 예컨대 인간 알부민 인트론 1을 변형 (예를 들어, 이중-가닥 절단 생성)시키는 방법 또는 변형의 사용을 포함한다. 일부 구체예들에서, 본 발명은, 숙주 세포 또는 숙주 세포들의 집단에 본원에 기재된 하나 이상의 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를 투여 또는 전달하는 단계를 포함하는, 인간 세이프 하버, 예를 들어, 간 조질 또는 헤파토사이트 숙주 세포를 변형 (예를 들어, 이중-가닥 절단 생성)시키는 방법 또는 변형의 사용을 포함한다. 세이프 하버 유전자좌, 가령, 알부민 유전자좌 내부에의 삽입은, 숙주 세포 또는 세포들의 집단, 가령, 헤파토사이트 또는 간 세포들에 심각한 유해한 영향을 주지 않고 인자 IX 유전자가 과발현될 수 있게 한다. 일부 구체예들에서, 본 발명은, 숙주 세포 또는 숙주 세포들의 집단에 본원에 기재된 하나 이상의 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를 투여 또는 전달하는 단계를 포함하는, 인간 알부민 유전자좌의 인트론 1을 변형 (예를 들어, 이중-가닥 절단 생성)시키는 방법 또는 변형의 사용을 포함한다. 일부 구체예들에서, 가이드 RNA는 인간 알부민 유전자좌 (서열 번호: 1)의 인트론 1 내에 결합하는 최소한 15, 16, 17, 18, 19 또는 20개의 연속 뉴클레오티드를 포함하는 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 가지는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 상기 방법은 시험관내 실시된다. 일부 구체예들에서, 상기 방법은 생체내 실시된다. 일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체이다. 일부 구체예들에서, 숙주 세포는 가령, 간 세포이다. 또 다른 구체예들에서, 간 세포는 헤파토사이트이다.
일부 구체예들에서, 본 발명은, 본원에 기재된 임의의 하나 이상의 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를 투여 또는 전달하는 단계를 포함하는, 숙주 세포 또는 숙주 세포들의 집단에 인자 IX 핵산을 도입하는 방법 또는 도입의 사용을 포함한다. 일부 구체예들에서, 가이드 RNA는 인간 알부민 유전자좌 (서열 번호: 1)의 인트론 1 내부의 영역에 결합할 수 있는 최소한 15, 16, 17, 18, 19 또는 20개의 연속 뉴클레오티드를 포함하는 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 가지는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 상기 방법은 시험관내 실시된다. 일부 구체예들에서, 상기 방법은 생체내 실시된다. 일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체이다. 일부 구체예들에서, 숙주 세포는 간 세포이고, 또는 숙주 세포들의 집단은 간 세포들, 가령, 헤파토사이트이다.
일부 구체예들에서, 본 발명은, 본원에 기재된 임의의 하나 이상의 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를 투여 또는 전달하는 단계를 포함하는, 숙주 세포 또는 숙주 세포들의 집단에서 인자 IX를 발현시키는 방법 또는 발현의 사용을 포함한다. 일부 구체예들에서, 가이드 RNA는 인간 알부민 유전자좌 (서열 번호: 1)의 인트론 1 내부의 영역에 결합할 수 있는 최소한 15, 16, 17, 18, 19 또는 20개의 연속 뉴클레오티드를 포함하는 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 가지는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 상기 방법은 시험관내 실시된다. 일부 구체예들에서, 상기 방법은 생체내 실시된다. 일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체이다. 일부 구체예들에서, 숙주 세포는 간 세포이고, 또는 숙주 세포들의 집단은 간 세포들, 가령, 헤파토사이트이다.
일부 구체예들에서, 본 발명은, 본원에 기재된 임의의 하나 이상의 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를 필요로 하는 대상체에게 투여 또는 전달하는 단계를 포함하는, 혈우병 (예를 들어, 혈우병 B)의 치료 방법 또는 치료의 사용을 포함한다. 일부 구체예들에서, 가이드 RNA는 인간 알부민 유전자좌 (서열 번호: 1)의 인트론 1 내부의 영역에 결합할 수 있는 최소한 15, 16, 17, 18, 19 또는 20개의 연속 뉴클레오티드를 포함하는 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 가지는 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 15, 16, 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함한다. 일부 구체예들에서, 가이드 RNA는서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드인 가이드 서열을 포함한다. 일부 구체예들에서, 본원에 개시된 가이드 RNA는 서열 번호: 34-37, 42-49, 53-59, 61-69, 74-81, 85-91, 및 93-97로 구성된 그룹에서 선택된 가이드 서열을 포함한다. 일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체이다. 일부 구체예들에서, 숙주 세포는 간 세포이고, 또는 숙주 세포들의 집단은 간 세포들, 가령, 헤파토사이트이다.
본원에 기재된, 인자 IX를 인코딩하는 서열, 가이드 RNA, 및 RNA-가이드 DNA 결합제를 포함하는 공여자 구조체 ( 예를 들어, 양방향 구조체)는 해당 분야에 공지된 임의의 적합한 전달 시스템 및 방법을 사용하여 전달될 수 있다. 조성물은 시험관내 또는 생체내에서 동시에 또는 임의의 순차적 순서로 전달될 수 있다. 일부 구체예들에서, 공여자 구조체, 가이드 RNA 및 Cas 뉴클레아제는 시험관내 또는 생체내에서 동시에, 예를 들어, 하나의 벡터, 두 개의 벡터, 개별 벡터, 하나의 LNP, 두 개의 LNP, 개별 LNP, 또는 이들의 조합으로 전달 될 수 있다. 일부 구체예들에서, 공여자 구조체는 가이드 RNA 및/또는 Cas 뉴클레아제를, 벡터로서 및/또는 LNP 단독과 결합하여 또는 리보핵단백질 (RNP)로서 함께 전달하기 ( 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14일, 또는 그 이상) 이전에, 벡터로서 및/또는 LNP와 결합되어 생체내 또는 시험관내 전달될 수 있다. 일부 구체예들에서, 공여자 구조체는 예를 들어 매일, 2일 마다, 3일 마다, 4일 마다, 매주, 2주 마다, 3주 마다 또는 4주 마다 다회 투여로 전달 될 수 있다. 일부 구체예들에서, 공여자 구조체는 1 주 간격으로, 예를 들어, 1 주차, 2 주차 및 3 주차 등으로 전달 될 수 있다. 추가 예로서, 구조체를, 벡터로서 및/또는 LNP와 결합하여 전달하기 ( 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14일, 또는 그 이상) 이전에 가이드 RNA 및 Cas 뉴클레아제는, 벡터로서 및/또는 LNP 단독과 결합하여 또는 리보핵단백질 (RNP)로서 함께, 생체내 또는 시험관내 전달될 수 있다. 일부 구체예들에서, 알부민 가이드 RNA는 예를 들어 매일, 2일 마다, 3일 마다, 4일 마다, 매주, 2주 마다, 3주 마다 또는 4주 마다 다회 투여로 전달 될 수 있다. 일부 구체예들에서, 알부민 가이드 RNA는 1 주 간격으로, 예를 들어, 1 주차, 2 주차 및 3 주차 등으로 전달 될 수 있다. 일부 구체예들에서, Cas 뉴클레아제는 다회 투여로 전달 될 수 있다, 예를 들어, 매일, 2일 마다, 3일 마다, 4일 마다, 매주, 2주 마다, 3주 마다 또는 4주 마다 전달 될 수 있다. 일부 구체예들에서, Cas 뉴클레아제는 1 주 간격으로, 예를 들어, 1 주차, 2 주차 및 3 주차 등으로 전달 될 수 있다. 일부 구체예들에서, 가이드 RNA 및 Cas 뉴클레아제는 인자 IX 공여자 구조체를 전달하기 전에 LNP와 결합되어 숙주 세포 또는 숙주 세포들의 집단에 전달된다.
일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하고, 이 때 IX 서열은 야생형 인자 IX, 예를 들어 서열 번호 700이다. 일부 구체예들에서, 공여자 구조체는 인자 IX를 인코딩하는 서열을 포함하고, 이 때 IX 서열은 야생형 인자 IX, 예를 들어 서열 번호 701이다. 일부 구체예들에서, 서열은 인자 IX의 변이체를 인코드한다. 예를 들어, 변이체는 야생형 인자 IX보다 증가된 응고 활성을 보유한다. 예를 들어, 변이 인자 IX는 서열 번호: 701에 대해 위치 R338에서 아미노산 치환과 같은 하나 이상의 돌연변이를 포함한다 (예를 들어, R338L). 일부 구체예들에서, 서열은 서열 번호: 700, 서열 번호: 701, 또는 서열 번호: 702에 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지는 인자 IX 변이체를 인코딩한다. 일부 구체예들에서, 서열은 인자 IX의 단편을 인코딩하며, 이 때 이러한 단편은 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 보유한다.
한 예에서, 인자 IX 단백질은 위치 L6 및 V181에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6 및 K265에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181 및 K265에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 K265 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181 및 K265에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, K265 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, I383, 및 E186에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, K265 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, I383, 및 E186에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, V181, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 L6, K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 위치 V181, K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다.
일부 구체예들에서, 공여자 구조체는 인자 IX 변이체를 인코딩하는 서열을 포함하며, 이 때 인자 IX 변이체는 이의 보조인자인 인자 VIII (발현은 치료적으로 관련된 FVIII 모사체 활성을 초래한다)의 부재시 응고를 활성화한다. 이러한 인자 IX 변이체는 추가로 야생형 인자 IX의 활성을 유지할 수 있다. 예를 들어, 이러한 인자 IX 변이체는 야생형 인자 IX에 대해 (예를 들어, 서열 번호 701에 대해) 위치 L6, V181, K265, I383, E185, 또는 이들의 조합에서 아미노산 치환을 포함 할 수 있다. 예를 들어, 이러한 인자 IX 변이체는 야생형 인자 IX에 대해 (예를 들어, 서열 번호: 701에 대해) L6F 돌연변이, V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, E185D 돌연변이, 또는 이들의 조합을 포함 할 수 있다.
한 특정 예에서, 인자 IX 단백질은 위치 V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다. 또 다른 특정 예에서, 인자 IX 단백질은 위치 V181, K265, I383 및 E185에서 아미노산 치환을 포함 할 수 있다. 또 다른 특정 예에서, 인자 IX 단백질은 위치 L6, V181, K265 및 I383에서 아미노산 치환을 포함 할 수 있다.
한 예에서, 인자 IX 단백질은 L6F 돌연변이 및 V181I 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이 및 K265A 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이 및 K265A 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 K265A 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 K265A 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 I383V 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, 및 K265A 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, K265A 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, K265A 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, I383V 돌연변이, 및 E186D 돌연변이를 포함할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, I383V 돌연변이, 및 E186D 돌연변이를 포함할 수 있다. 또 다른 예에서, 인자 IX 단백질은 K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, K265A 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 L6F 돌연변이, K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 또 다른 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다.
특정 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이 및 I383V 돌연변이를 포함 할 수 있다. 또 다른 특정 예에서, 인자 IX 단백질은 V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, 및 E185D 돌연변이를 포함 할 수 있다. 일부 구체예들에서, 인자 IX 단백질은 서열 번호: 700에 최소한 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가진다. 특정 구체예들에서, 인자 IX 변이체는 서열 번호: 700에 최소한 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지며, V181I 돌연변이, K265A 돌연변이, I383V 돌연변이, 및/또는 E185D 돌연변이를 포함한다. 또 다른 특정 예에서, 인자 IX 단백질은 L6F 돌연변이, V181I 돌연변이, K265A 돌연변이, 및 I383V 돌연변이를 포함 할 수 있다. 특정 구체예들에서, 인자 IX 변이체는 서열 번호: 700에 최소한 80%, 85%, 90%, 93%, 95%, 97%, 99% 동일하고, 야생형 인자 IX에 비해 최소한 80%, 85%, 90%, 92%, 94%, 96%, 98%, 99%, 100%, 또는 그 이상의 활성을 가지며, V181I 돌연변이, K265A 돌연변이, 및 I383V 돌연변이를 포함한다.
일부 구체예들에서, 숙주 세포는 간 세포이고, 또는 숙주 세포들의 집단은 간 세포들이다. 일부 구체예들에서, 숙주 세포는, 또는 숙주 세포들의 집단은, 임의의 적합한 비-분열 세포이다. 본원에서 사용되는 "비-분열 세포"는 말단 분화되고 분열하지 않는 세포, 뿐만 아니라 분열하지는 않지만 세포 분열 및 증식에 재진입하는 능력을 보유하는 정지 세포를 의미한다. 예를 들어, 간 세포는 분열 능력을 유지하지만 (예를 들어, 부상을 입거나 절제시) 일반적으로 분열하지 않는다. 유사분열기 세포 분열 동안 상동성 재조합은 게놈을 보호하고 이중-가닥 절단을 복구하는 메커니즘이다. 일부 구체예들에서, "비-분열" 세포는, 예를 들어 대조군 분열 세포와 비교하여, 세포에서 이중-가닥 DNA 절단을 복구하는 1차 메커니즘이 상동성 재조합 (HR)이 아닌 세포를 의미한다. 일부 구체예들에서, "비-분열" 세포는, 예를 들어 대조군 분열 세포와 비교하여, 세포에서 이중-가닥 DNA 절단을 복구하는 1차 메커니즘이 비-상동성 말단 연결 (non-homologous end joining, NHEJ)인 세포를 의미한다. 비-분열 세포 유형들은 문헌에, 예를 들어, 능동적 NHEJ 이중-가닥 DNA 절단 복구 메커니즘으로 기재되어 있다. 예를 들어, Iyama, DNA Repair (Amst.) 2013, 12(8): 620-636을 참고하라. 일부 구체예들에서, 숙주 세포는 간 세포, 근육 세포 또는 신경 세포를 포함하지만 이에 제한되지 않는다. 일부 구체예들에서, 숙주 세포, 또는 숙주 세포들의 집단은 헤파토사이트, 가령, 마우스, 사이노 또는 인간 헤파토사이트이다. 일부 구체예들에서, 숙주 세포는 근세포, 가령, 마우스, 사이노, 또는 인간 근세포이다. 일부 구체예들에서, 본원은 본원에 기재된 임의의 하나 이상의 가이드 RNA를 단독으로 또는 RNA-가이드 DNA 결합 단백질과 조합하여 포함하는 숙주 세포 조성물을 제공한다. 일부 구체예들에서, 본원은 본원에 기재된 임의의 하나 이상의 벡터를 포함하는 숙주 세포 조성물을 제공한다.
일부 구체예들에서, 공여자 구조체 (예를 들어, 양방향 구조체)는 핵산 벡터로, 가령, AAV 벡터, 예를 들어, AAV8로 투여된다. 일부 구체예들에서, 공여자 구조체는 상동성 아암을 포함하지 않는다.
일부 구체예들에서, 대상체는 포유동물이다. 일부 구체예들에서, 대상체는 인간이다. 일부 구체예들에서, 대상체는 소, 돼지, 원숭이, 양, 개, 고양이, 물고기 또는 가금류이다.
일부 구체예들에서, 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체), 가이드 RNA, 및 RNA-가이드 DNA 결합제는 정맥내 투여된다. 일부 구체예들에서, 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체), 가이드 RNA, 및 RNA-가이드 DNA 결합제는 간 순환에 투여된다.
일부 구체예들에서, 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체), 가이드 RNA, 및 RNA-가이드 DNA 결합제의 단회 투여는 인자 IX의 발현을 원하는 수준으로 증가시키기에 충분하다. 다른 구체예들에서, 인자 IX를 인코딩하는 서열을 포함하는 공여자 구조체 (예를 들어, 양방향 구조체), 가이드 RNA, 및 RNA-가이드 DNA 결합제를 포함하는 조성물의 1회 이상의 투여는 치료 효과를 최대화함에 유익할 수 있다.
일부 구체예들에서, 본 발명은 임의의 하나 이상의 본원에 기재된 gRNA, 공여자 구조체 (예를 들어, 인자 IX를 인코딩하는 서열을 포함하는 양방향 구조체), 및 RNA-가이드 DNA 결합제 (예를 들어, Cas 뉴클레아제)를, 상기 기재된 바와 같은 혈우병 치료에 적합한 추가 치료제와 함께 포함하는 조합 요법을 포함한다. 예를 들어, 본 발명의 방법들은 다른 지혈제, 혈액 인자 및 약물의 사용과 조합 될 수 있다. 예를 들어, 대상체는 인자 XI, 인자 XII, 프리칼리크레인, 고 분자량 키니노겐 (HMWK), 인자 V, 인자 VII, 인자 VIII, 인자 X, 인자 XIII, 인자 II, 인자 VIIa 및 폰 빌레브란츠 인자로 구성된 그룹에서 선택된 하나 이상의 인자의 치료적 유효량을 투여받을 수 있다.
일부 구체예들에서, 치료는 응고 촉진제, 가령, 인자 Xa, 인자 IXa, 인자 XIa, 인자 XIIa 및 VIIIa, 프리칼레크레인 및 고 분자량 키니노겐을 포함하는 내인성 응고 경로의 활성화제; 또는 조직 인자, 인자 VIIa, 인자 Va 및 인자 Xa를 포함하는 외인성 응고 경로의 활성화제를 투여하는 것을 추가로 포함 할 수 있다. 이러한 기재 및 예시적인 구체예들은 제한적인 것으로 간주되어서는 안된다. 본 명세서 및 첨부된 실시예에 있어서, 달리 표시되지 않는 한, 명세서 및 실시예에서 사용되는 수량, 백분율 또는 비율, 및 기타 수치를 나타내는 모든 숫자는 모든 경우에 용어 "약"에 의해 이들이 그렇게 이미 변형되지 않은 정도로 변형된 것으로 이해되어야 한다. 따라서, 반대의 언급이 없는 한, 본 명세서 및 첨부된 청구범위에 제시된 수치 파라미터들은 근사치로서 얻고자 하는 성질에 따라 달라질 수 있다. 최소한으로, 그리고 본 발명의 구체예들의 범위에 대한 균등론 적용을 제한하고자 하는 시도로서가 아니라, 각 수치 변수는 최소한 기록된 유효 자리수의 수를 고려하여 그리고 통상의 올림법을 적용하여 해석되어어야 한다.
인간 인자 IX 단백질 서열 (서열 번호: 700) NCBI 참조번호: NP_000124:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNL
ERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCP
FGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGR
VSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPW
QVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRII
PHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVF
HKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVE
GTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
인간 인자 IX 뉴클레오티드 서열 (서열 번호: 706) NCBI 참조번호: NM_000133):
1 accactttca caatctgcta gcaaaggtta tgcagcgcgt gaacatgatc atggcagaat
61 caccaggcct catcaccatc tgccttttag gatatctact cagtgctgaa tgtacagttt
121 ttcttgatca tgaaaacgcc aacaaaattc tgaatcggcc aaagaggtat aattcaggta
181 aattggaaga gtttgttcaa gggaaccttg agagagaatg tatggaagaa aagtgtagtt
241 ttgaagaagc acgagaagtt tttgaaaaca ctgaaagaac aactgaattt tggaagcagt
301 atgttgatgg agatcagtgt gagtccaatc catgtttaaa tggcggcagt tgcaaggatg
361 acattaattc ctatgaatgt tggtgtccct ttggatttga aggaaagaac tgtgaattag
421 atgtaacatg taacattaag aatggcagat gcgagcagtt ttgtaaaaat agtgctgata
481 acaaggtggt ttgctcctgt actgagggat atcgacttgc agaaaaccag aagtcctgtg
541 aaccagcagt gccatttcca tgtggaagag tttctgtttc acaaacttct aagctcaccc
601 gtgctgagac tgtttttcct gatgtggact atgtaaattc tactgaagct gaaaccattt
661 tggataacat cactcaaagc acccaatcat ttaatgactt cactcgggtt gttggtggag
721 aagatgccaa accaggtcaa ttcccttggc aggttgtttt gaatggtaaa gttgatgcat
781 tctgtggagg ctctatcgtt aatgaaaaat ggattgtaac tgctgcccac tgtgttgaaa
841 ctggtgttaa aattacagtt gtcgcaggtg aacataatat tgaggagaca gaacatacag
901 agcaaaagcg aaatgtgatt cgaattattc ctcaccacaa ctacaatgca gctattaata
961 agtacaacca tgacattgcc cttctggaac tggacgaacc cttagtgcta aacagctacg
1021 ttacacctat ttgcattgct gacaaggaat acacgaacat cttcctcaaa tttggatctg
1081 gctatgtaag tggctgggga agagtcttcc acaaagggag atcagcttta gttcttcagt
1141 accttagagt tccacttgtt gaccgagcca catgtcttcg atctacaaag ttcaccatct
1201 ataacaacat gttctgtgct ggcttccatg aaggaggtag agattcatgt caaggagata
1261 gtgggggacc ccatgttact gaagtggaag ggaccagttt cttaactgga attattagct
1321 ggggtgaaga gtgtgcaatg aaaggcaaat atggaatata taccaaggta tcccggtatg
1381 tcaactggat taaggaaaaa acaaagctca cttaatgaaa gatggatttc caaggttaat
1441 tcattggaat tgaaaattaa cagggcctct cactaactaa tcactttccc atcttttgtt
1501 agatttgaat atatacattc tatgatcatt gctttttctc tttacagggg agaatttcat
1561 attttacctg agcaaattga ttagaaaatg gaaccactag aggaatataa tgtgttagga
1621 aattacagtc atttctaagg gcccagccct tgacaaaatt gtgaagttaa attctccact
1681 ctgtccatca gatactatgg ttctccacta tggcaactaa ctcactcaat tttccctcct
1741 tagcagcatt ccatcttccc gatcttcttt gcttctccaa ccaaaacatc aatgtttatt
1801 agttctgtat acagtacagg atctttggtc tactctatca caaggccagt accacactca
1861 tgaagaaaga acacaggagt agctgagagg ctaaaactca tcaaaaacac tactcctttt
1921 cctctaccct attcctcaat cttttacctt ttccaaatcc caatccccaa atcagttttt
1981 ctctttctta ctccctctct cccttttacc ctccatggtc gttaaaggag agatggggag
2041 catcattctg ttatacttct gtacacagtt atacatgtct atcaaaccca gacttgcttc
2101 cgtagtggag acttgctttt cagaacatag ggatgaagta aggtgcctga aaagtttggg
2161 ggaaaagttt ctttcagaga gttaagttat tttatatata taatatatat ataaaatata
2221 taatatacaa tataaatata tagtgtgtgt gtatgcgtgt gtgtagacac acacgcatac
2281 acacatataa tggaagcaat aagccattct aagagcttgt atggttatgg aggtctgact
2341 aggcatgatt tcacgaaggc aagattggca tatcattgta actaaaaaag ctgacattga
2401 cccagacata ttgtactctt tctaaaaata ataataataa tgctaacaga aagaagagaa
2461 ccgttcgttt gcaatctaca gctagtagag actttgagga agaattcaac agtgtgtctt
2521 cagcagtgtt cagagccaag caagaagttg aagttgccta gaccagagga cataagtatc
2581 atgtctcctt taactagcat accccgaagt ggagaagggt gcagcaggct caaaggcata
2641 agtcattcca atcagccaac taagttgtcc ttttctggtt tcgtgttcac catggaacat
2701 tttgattata gttaatcctt ctatcttgaa tcttctagag agttgctgac caactgacgt
2761 atgtttccct ttgtgaatta ataaactggt gttctggttc at
인간 인자 IX 폴리펩티드 (서열 번호: 701)
YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
실시예
하기 실시예는 개시된 특정 구체예들을 예시하기 위해 제공되며 어떠한 방식으로든 본 발명의 범위를 제한하는 것으로 해석되어서는 안된다.
실시예 1- 재료 및 방법
클로닝 및 플라스미드 준비
상업상의 공급업체가 ITR들이 연접된 양방향 삽입 구조체를 합성하고 pUC57-Kan로 클로닝하였다. 생성된 구조체 (P00147)를 다른 벡터들에 대한 모체 클로닝 벡터로 사용하였다. 다른 삽입 구조체들 (ITR 없음) 또한 상업적으로 합성하고 pUC57로 클로닝하였다. 정제된 플라스미드를 BglII 제한 효소 (New England BioLabs, 카탈로그# R0144S)로 분해하고 삽입 구조체들을 모체 벡터에 클로닝했다. 플라스미드를 Stbl3TM 화학적 반응능 대장균 (Thermo Fisher, 카탈로그# C737303)에서 번식시켰다.
AAV 제조
HEK293 세포에서 삼중 형질감염을 사용하여 AAV8 및 AAV-DJ 제조를 위한 관심 구조체를 가진 게놈들을 패키징하고 생성된 벡터를 아이오딕산올 구배 초원심분리 방법을 통해 용해된 세포 및 배양 배지 모두로부터 정제하였다 (예를 들어, Lock 등, Hum Gene Ther. 2010 Oct;21(10):1259-71 참고). 관심 구조체들을 갖는 게놈을 포함하는 삼중 형질감염에 사용된 플라스미드는 실시예에서 "PXXXX" 번호로 참조되며, 또한 예를 들어, 표 9를 참고하라. 단리된 AAV를 저장 완충액 (0.001% Pluronic F68을 보유한 PBS)에서 투석하였다. AAV 역가는 ITR 영역 내에 위치한 프라이머/프로브를 사용하여 qPCR에 의해 결정되었다.
뉴클레아제 mRNA의 시험관내 전사 (“IVT”)
N1-메틸 슈도-U를 포함하는, 캡핑 및 폴리아데닐화 스트렙토코쿠스 피오게네스 ("Spy") Cas9 mRNA를 선형화 플라스미드 DNA 템플릿 및 T7 RNA 폴리머라제를 사용하여 시험관내 전사에 의해 생성하였다. 일반적으로 T7 프로모터와 100 nt 폴리 (A/T) 영역을 포함하는 플라스미드 DNA는 37°C에서 XbaI와 함께 배양하여 분해를 완료한 다음 65°C에서 XbaI의 열 비활성화에 의해 선형화되었다. 선형화된 플라스미드는 효소 및 완충 염으로부터 정제되었다. Cas9 변형된 mRNA를 생성하기 위한 IVT 반응물은 다음 조건에서 37°C에서 4시간 동안 배양되었다: 50 ng/μL 선형화된 플라스미드; GTP, ATP, CTP, 및 N1-메틸 슈도-UTP (Trilink) 각 2 mM; 10 mM ARCA (Trilink); 5 U/μL T7 RNA 폴리머라제 (NEB); 1 U/μL 뮤린 Rnase 억제제 (NEB); 0.004 U/μL 무기 대장균 파이로포스파타제 (NEB); 및 1x 반응 완충액. TURBO Dnase (ThermoFisher)를 최종 농도 0.01 U/μL까지 첨가하고 반응물을 추가로 30분 동안 배양하여 DNA 템플릿을 제거했다. Cas9 mRNA는 제조업체 (ThermoFisher)의 프로토콜에 따라 MegaClear 전사 클린-업 키트를 사용하여 정제되었다. 대안적으로, Cas9 mRNA를 LiCl 침전, 암모늄 아세테이트 침전 및 소듐 아세테이트 침전을 사용하거나 LiCl 침전 방법을 사용하여 정제한 다음 후속하여 접선 유동 여과에 의해 추가 정제하였다. 전사체 농도는 260nm에서 흡광도를 측정하여 (Nanodrop사) 결정했으며, 전사체는 바이오분석장치 (Bioanlayzer) (Agilent사)에 의한 모세관 전기 영동으로 분석했다.
하기 Cas9 mRNA는 Cas9 ORF 서열 번호: 703 또는 서열 번호: 704 또는 PCT/US2019/053423 (본원에 참고로 포함됨)의 표 24의 서열을 포함한다.
Cas9 mRNA 및 gRNA 전달을 위한 지질 제제
3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(다이에틸아미노)프로폭시)카보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-다이에노에이트)라고도 불리는 이온화가능한 지질 ((9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(다이에틸아미노)프로폭시)카보닐)옥시)메틸)프로필 옥타데카-9,12-다이에노에이트, 콜레스테롤, DSPC, 및 PEG2k-DMG를 포함하는 지질 제제를 이용하여 Cas9 mRNA 및 gRNA를 세포 및 동물들에게 전달하였다.
사전-혼합된 지질 제제 (본원에서 "지질 패킷"이라고 함)을 사용하는 실험의 경우, 성분들은 100% 에탄올에서 50:38:9:3의 이온화가능한 지질:콜레스테롤:DSPC:PEG2k-DMG의 몰비로 재구성된 다음, 본원에 추가로 기재된 바와 같이 약 6.0의 지질 아민 대 RNA 포스페이트 (N:P) 몰비로 RNA 카고 (예를 들어, Cas9 mRNA 및 gRNA)와 혼합되었다.
지질 나노입자 (LNP)로 제제화된 성분들을 이용한 실험들의 경우, 이 성분들은 100% 에탄올에 다양한 몰비로 용해되었다. RNA 카고 (예를 들어, Cas9 mRNA 및 gRNA)들을 25 mM 시트레이트, 100 mM NaCl, pH 5.0에 용해시켜, 대략 0.45 mg/mL의 RNA 카고 농도를 생성하였다.
실시예 2에 기재된 실험의 경우, 제조업체의 프로토콜에 따라 Precision Nanosystems NanoAssemblrTM 벤치 탑 기기를 사용하여 지질과 RNA 용액을 미세유체 혼합하여 LNP를 형성하였다. 상이한 유속을 사용하여 혼합하는 동안 수성 대 유기 용매의 2:1 비율은 유지되었다. 혼합 후 LNP를 수집하고 물에 희석하고 (약 1:1 v/v) 실온에서 1시간 동안 유지시키고 최종 완충액 교환 전에 물로 추가 희석했다 (약 1:1 v/v). PD-10 탈염 컬럼 (GE)을 사용하여 50 mM Tris, 45 mM NaCl, 5% (w/v) 수크로스, pH 7.5 (TSS)로의 최종 완충액 교환을 완료하였다. 필요한 경우, Amicon 100kDa 원심분리 필터 (Millipore)로 원심분리하여 제제를 농축시켰다. 이어서 생성된 혼합물을 0.2μm 멸균 필터를 사용하여 여과하였다. 최종 LNP는 차후 사용할 때까지 -80°C에 보관되었다. LNP는 45:44:9:2 몰비의 이온화가능한 지질:콜레스테롤:DSPC:PEG2k-DMG에서, 약 4.5의 지질 아민 대 RNA 포스페이트 (N:P) 몰비, 및 1:1의 gRNA 대 mRNA 중량비로 제조되었다.
다른 실시예들에 기재된 실험들의 경우, LNP들은 2 부피의 RNA 용액 및 1 부피의 물과 에탄올 중의 지질의 충돌 제트 혼합을 이용하는 교차-흐름 기술을 사용하여 제조되었다. 에탄올 중의 지질은 혼합 교차를 통해 2 부피의 RNA 용액과 혼합되었다. 네 번째 물 스트림은 인라인 T를 통해 교차부의 출구 스트림과 혼합되었다 (WO2016010840 도 2 참고.). LNP를 실온에서 1시간 동안 유지시키고 물로 추가 희석하였다 (약 1:1 v/v). 희석시킨 LNP들을 접선 유동 여과를 사용하여 플랫 쉬트 카트리지 (Sartorius, 100kD MWCO) 상에서 농축시킨 다음 정용여과에 의해 50 mM Tris, 45 mM NaCl, 5% (w/v) 수크로스, pH 7.5 (TSS)로 완충액 교환하였다. 대안적으로, TSS로의 최종 완충액 교환은 PD-10 탈염 컬럼 (GE)을 사용하여 완료되었다. 필요한 경우, Amicon 100kDa 원심분리 필터 (Millipore)로 원심분리하여 제제를 농축시켰다. 이어서 생성된 혼합물을 0.2μm 멸균 필터를 사용하여 여과하였다. 최종 LNP는 차후 사용할 때까지 4°C 또는 -80°C에서 보관되었다. LNP는 50:38:9:3 몰비의 이온화가능한 지질:콜레스테롤:DSPC:PEG2k-DMG에서, 약 6.0의 지질 아민 대 RNA 포스페이트 (N:P) 몰비, 및 1:1의 gRNA 대 mRNA 중량비로 제조되었다.
Cas9 mRNA, gRNA 및 삽입 구조체들의 세포 배양 및 시험관내 전달
Hepa1-6 세포
Hepa 1-6 세포들을 96-웰 플레이트에서 10,000 세포/웰의 밀도로 플레이팅하였다. 24 시간 후, 세포를 LNP 및 AAV로 처리하였다. 처리 전 웰들로부터 배지를 흡인하였다. LNP를 DMEM+10% FBS 배지에서 4ng/ul로 희석하고 10% FBS (DMEM에서)에서 2ng/ul로 추가 희석하고 37°C에서 10분 동안 배양했다 (최종 농도 5% FBS). AAV의 목표 MOI는 DMEM+10% FBS 배지에 희석된 1e6이었다. 2ng/ul의 상기 희석된 LNP 50 μl를 (총 100ng의 RNA 카고 전달), 이어서 AAV 50μl를 세포에 첨가하였다. LNP와 AAV의 처리는 수 분 간격으로 이루어졌다. 세포에서 총 배지 부피는 100 μl이었다. 처리 후 72 시간 및 처리 후 30 일 후, 이들 처리된 세포로부터의 상청액을 아래에 기재된 바와 같이 인간 FIX ELISA 분석을 위해 수집하였다.
일차 헤파토사이트
일차 마우스 헤파토사이트 (PMH), 일차 사이노 헤파토사이트 (PCH) 및 일차 인간 헤파토사이트 (PHH)를 해동하고 보충제 (ThermoFisher)와 함께 헤파토사이트 해동 배지에 재현탁한 다음 원심분리했다. 상청액을 버리고, 펠릿화 된 세포를 헤파토사이트 플레이팅 배지 및 보충제 팩 (ThermoFisher)에 재현탁시켰다. 세포를 계수하고 PHH의 경우 33,000 세포/웰, PCH의 경우 50,000 세포/웰 및 PMH의 경우 15,000 세포/웰의 밀도로 Bio-coat 콜라겐 I 코팅된 96-웰 플레이트에 플레이팅했다. 플레이팅된 세포를 37°C 및 5% CO2 분위기의 조직 배양 인큐베이터에서 5시간 동안 침강시키고 부착시켰다. 배양 후 세포들을 단층 형성에 대해 확인하고, 먼저 헤파토사이트 유지 배지로 3회 세척한 다음 37°C에서 배양하였다.
지질 패킷 전달을 이용한 실험의 경우, Cas9 mRNA 및 gRNA를 각각 유지 배지에서 2mg/ml로 개별적으로 희석하고, 각 2.9 μl를, 12.5 μl의 50mM 소듐 시트레이트, pH 5의 200mM 소듐 클로라이드 및 6.9 μl의 물을 함유하는 웰들 (96-웰 Eppendorf 플레이트)에 첨가하였다. 이어서 12.5 μl의 지질 패킷 제제, 다음으로 12.5 μl의 물과 150 μl의 TSS를 첨가하였다. 각 웰을 헤파토사이트 유지 배지를 사용하여 20 ng/μl (총 RNA 함량에 대해)까지 희석시킨 다음, 6% 새로운 마우스 혈청으로 10 ng/μl (총 RNA 함량에 대해)까지 희석시켰다. 형질감염 전에 세포로부터 배지를 흡인하고 지질 패킷/RNA 혼합물 40 μl를 세포에 첨가한 다음, 1e5의 MOI로 AAV (유지 배지에서 희석)를 첨가하였다. 처리 72 시간 후에 분석을 위해 배지를 수집하고 본원에 기재된 바와 같은 추가 분석을 위해 세포를 수확하였다.
루시퍼라제 분석
세포 배지에서 NanoLuc 검출을 포함하는 실험을 위해, Nano-Glo®루시퍼라제 분석 기질 1 부피를 Nano-Glo®루시퍼라제 분석 완충액 50 부피와 조합하였다. 분석은 1:10 희석 샘플들 (50 μl 시약 + 40 μl 물 + 10 μl 세포 배지)을 사용하여 0.5초의 통합 시간으로 Promega Glomax 러너에서 수행되었다.
세포 배지에서 HiBit 태그의 검출을 포함하는 실험을 위해, LgBiT 단백질 및 Nano-GloR HiBiT 세포외 기질을 실온 Nano-GloR HiBiT 세포외 완충액에서 각각 1:100 및 1:50으로 희석했다. 분석은 1:10 희석 샘플들 (50 μl 시약 + 40 μl 물 + 10 μl 세포 배지)을 사용하여 1.0초의 통합 시간으로 Promega Glomax 러너에서 수행되었다.
LNP 및/또는 AAV의 생체내 전달
측면 꼬리 정맥을 통해 마우스들에게 AAV, LNP, AAV 및 LNP 모두, 또는 비히클 (AAV 비히클의 경우 PBS + 0.001% Pluronic, LNP 비히클의 경우 TSS)을 투약하였다. AAV는 본원에 기재된 양 (벡터 게놈/마우스, "vg/ms")으로 동물 당 0.1 mL의 부피로 투여되었다. LNP를 TSS로 희석하고, 본원에 표시된 양으로 약 5μl/체중 g으로 투여하였다. 일반적으로 마우스에 AAV를 먼저 주사한 다음, 적용가능한 경우 LNP를 주사했다. 치료 후 다양한 시점에서, 아래에 추가로 설명하는 바와 같은 특정 분석을 위해 혈청 및/또는 간 조직을 수집하였다.
인간 인자 IX ( hFIX ) ELISA 분석
시험관내 연구를 위해, 세포 배지에서 분비된 총 인간 인자 IX 수준을 제조업체의 프로토콜에 따라 인간 인자 IX ELISA 키트 (Abcam, 카탈로그# ab188393)를 사용하여 결정하였다. 분비된 hFIX 수준을 4 매개변수 로지스틱 적합을 사용하여 표준 곡선에서 정량화하고 ng/배지 ml로 표현하였다.
생체내 연구를 위해 혈액을 수집하고 표시된 바와 같이 혈청 또는 혈장을 단리하였다. 총 인간 인자 IX 수준을 제조업체의 프로토콜에 따라 인간 인자 IX ELISA 키트 (Abcam, 카탈로그# ab188393)를 사용하여 결정하였다. 혈청 또는 혈장 hFIX 수준을 4 매개변수 로지스틱 적합을 사용하여 표준 곡선에서 정량하고 μg/혈청 mL로 표현하였다.
차세대 시퀀싱 ( "NGS") 및 온-타겟 절단 효율 분석
예를 들어, 알부민의 인트론 1 내부에 유전자 편집에 의해 도입된 삽입 및 결실의 존재를 확인하기 위해 딥 시퀀싱을 사용하였다. PCR 프라이머가 표적 부위 주변에 설계되었고 관심 게놈 영역을 증폭시켰다. 프라이머 서열 설계는 해당 분야의 표준과 같이 수행되었다.
제조업체의 프로토콜 (Illumina)에 따라 추가 PCR을 수행하여 시퀀싱을 위한 화학 물질을 첨가했다. 앰플리콘들은 Illumina MiSeq 기기에서 시퀀싱되었다. 리드들은 품질 점수가 낮은 것을 제거한 후 참조 게놈에 대해 정렬되었다. 리드들을 포함하는 생성된 파일들을 참조 게놈에 매핑하였으며 (BAM 파일), 여기서 관심 표적 영역과 중첩되는 리드들이 선택되고 야생형 리드의 수 대 삽입 또는 결실 ("인델")을 내포하는 리드들의 수가 계산되었다.
편집 백분율 (예를 들어, “편집 효율성” 또는 “퍼센트 편집")은 야생형을 포함하는 서열 리드들의 총 수에 대한 삽입 또는 결실 ("인델")이 있는 서열 리드들의 총 수로 정의된다.
인 시튜 혼성화 분석
BaseScope (ACDbio, Newark, CA)는 예를 들어, 삽입 부위 (예를 들어, 알부민의 엑손 1)로부터의 코딩 서열 및 삽입 트랜스진 (hFIX)을 내포하는 하이브리드 mRNA 전사체에서 엑손 접합부의 특이적 검출을 제공할 수 있는 특수화된 RNA 인 시튜 혼성화 기술이다. BaseScope를 사용하여 하이브리드 mRNA를 발현하는 간세포의 백분율을 측정했다.
하이브리드 mRNA를 검출하기 위해 양방향 구조체의 삽입 후 발생할 수 있는 하이브리드 mRNA들에 대한 2개의 프로브가 ACDbio (Newark, CA)에 의해 설계되었다. 프로브들 중 하나는 한 방향의 구조체 삽입으로 인한 하이브리드 mRNA를 검출하도록 설계된 반면, 다른 하나의 프로브는 다른 방향의 구조체 삽입으로 인한 하이브리드 mRNA를 검출하기 위해 설계되었다. 상이한 마우스 그룹들에서 간을 수집하고 신선-냉동 절편화하였다. 제조업체의 프로토콜에 따라 단일 프로브 또는 풀링된 프로브를 사용한 BaseScope 분석을 수행하였다. 슬라이드들을 HALO 소프트웨어로 스캔 및 분석하였다. 이 분석의 배경 (식염수 처리 그룹)은 0.58%였다.
실시예 2- 상동성 아암 유무에 따른 삽입 템플릿들의 시험관내 테스트
본 실시예에서, 예를 들어, 실시예 1에 기재된 바와 같이 Hepa1-6 세포를 배양하고 Cas9 mRNA 및 G000551을 전달하는 LNP의 존재 또는 부재하에서 다양한 형태의 삽입 템플릿 (예를 들어, 단일-가닥 게놈 ("ssAAV") 또는 자기-상보성 게놈 ("scAAV")을 가짐)을 포함하는 AAV로 처리하였다 (n=3). AAV 및 LNP는 실시예 1에 기재된 바와 같이 제조되었다. 처리 후, 실시예 1에 기재된 바와 같이 인간 인자 IX 수준에 대해 배지를 수집하였다.
Hepa1-6 세포는 배양에서 계속 분열하는 불멸화된 마우스 간 세포주이다. 도 2에 나타낸 바와 같이 (처리 후 72 시간 시점), 200bp 상동성 아암을 포함하는 벡터 (플라스미드 P00204로부터 유래된 scAAV)만이 hFIX의 검출가능한 발현을 초래하였다. 본 실험에서 P00123 (상동성 아암이 없는 scAAV) 및 P00147 (상동성 아암이 없는 ssAAV 양방향 구조체)에서 유도된 AAV 벡터의 사용은 hFIX의 검출가능한 발현을 가져오지 않았다. 세포를 배양물에 보관하고, 이러한 결과들을 처리 후 30일에 재-분석했을 때 확인하였다 (데이터 표시되지 않음).
실시예 3- 상동성 아암 유무에 따른 삽입 템플릿들의 생체내 테스트
본 실시예에서, 마우스들을 실시예 2에서 시험관내 테스트한 것과 동일한 플라스미드 (P00123, P00204 및 P00147)로부터 유래된 AAV로 처리하였다. 투여 물질은 실시예 1에 기재된 바와 같이 제조 및 투여되었다. C57Bl/6 마우스들에게 각각 3e11 벡터 게놈 (vg/ms)을 투여하고 (각 그룹에 대해 n=5), G000551을 포함하는 LNP ("G551")를 (총 RNA 카고 함량에 대해) 4mg/kg의 용량으로 투여했다. 투여 4주 후, 동물을 안락사시키고 간 조직 및 혈청을 각각 편집 및 hFIX 발현을 위해 수집하였다.
도 3A 및 표 12에 나타낸 바와 같이, 뮤린 알부민의 인트론 1을 표적하는 gRNA를 포함하는 LNP로 처리된 각 동물 그룹에서 ~60%의 간 편집 수준이 검출되었다. 그러나, 각 처리 그룹에서 편집 수준이 강력하고 일관되었음에도 불구하고, 상동성 아암들이 없는 양방향 벡터 (P00147 유래 ssAAV 벡터)를 LNP 처리와 조합하여 제공받은 동물들은 혈청에서 최고 수준의 hFIX 발현을 초래하였다 (도 3B 및 표 13).
표 12.% 인델
Figure pct00015
표 13. 인자 IX 수준
Figure pct00016
실시예 4- 상동성 아암 유무에 따른 ssAAV 삽입 템플릿들의 생체내 테스트
본 실시예에 기재된 실험은 ssAAV 벡터에 상동성 아암을 통합시키는 것의 생체내 효과를 조사했다.
본 실험에 사용된 투여 물질은 실시예 1에 기재된 바와 같이 제조 및 투여되었다. C57Bl/6 마우스들에게 각각 3e11 vg/ms을 투여하고 (각 그룹에 대해 n=5), G000666 (“G666”) 또는 G000551 (“G551”)을 포함하는 LNP를 (총 RNA 카고 함량에 대해) 0.5 mg/kg의 용량으로 투여했다. 투여 4 주 후, hFIX 발현을 위해 동물 혈청을 수집하였다.
도 4A 및 표 14에서 보는 바와 같이, G551에 의해 표적되는 부위로의 삽입을 위해, 비대칭 상동성 아암들 (플라스미드 P00350, P00356, 및 P00362로부터 유래된 벡터들 각각에 대해 300/600bp 아암, 300/2000bp 아암, 및 300/1500bp 아암)을 가지는 ssAAV 벡터를 사용시 본 분석에 대한 검출 하한 미만이었던 순환 hFIX 수준을 초래하였다. 그러나, 상동성 아암이 없고 양방향 배향의 2개의 hFIX 오픈 리딩 프레임 (ORF)을 가지는 ssAAV 벡터 (P00147로부터 유래)를 사용시 각 동물에서 검출가능한 순환 hFIX 수준을 초래하였다.
유사하게, G666에 의해 표적되는 부위로의 삽입을 위해, 비대칭 상동성 아암들 (플라스미드 P00353 및 P00354에서 유래된 벡터들 각각에 대해 500bp 아암 및 800bp 아암)을 가지는 ssAAV 벡터들을 사용시, 상동성 아암들이 없는 양방향 벡터 (P00147에서 유래)를 사용한 것에 비해 낮지만 검출가능한 수준을 초래하였다 (도 4B 및 표 15 참고).
표 14.- 혈청 hFIX 수준
Figure pct00017
표 15.- 혈청 hFIX 수준
Figure pct00018
실시예 5- 일차 마우스 헤파토사이트에서 표적 부위들 전반에 걸친 양방향 구조체들의 시험관내 스크리닝
상동성 아암들이 없는 양방향 구조체들이 다른 구조들을 가지는 벡터들 보다 우수함을 입증한 후, 본 실시예에 기재된 실험은 hFIX와 알부민의 엑손 1 사이에 하이브리드 전사체를 형성하기 위해 사용된 스플라이스 수용체들을 변경하는 것 그리고 CRISPR/Cas9-매개된 삽입을 표적하기 위한 gRNA들을 변경하는 것의 효과를 조사하였다. 이러한 다양한 양방향 구조체들을 일차 마우스 헤파토사이트 (PMH)에서 뮤린 알부민의 인트론 1을 표적하는 20개의 서로 다른 gRNA들을 사용하여 표적 부위들의 패널에 걸쳐 테스트하였다.
본 실시예에서 테스트된 ssAAV 및 지질 패킷 전달 물질은 1e5 MOI의 AAV를 사용하여 실시예 1에 기재된 바와 같이 제조되고 PMH에 전달되었다. 처리 후, 단리된 게놈 DNA 및 세포 배지를 각각 편집 및 트랜스진 발현 분석을 위해 수집하였다. 벡터들 각각은, 실시예 1에 기재되고 도 5C에 상대 루시퍼라제 단위 (“RLU”)로 도시된 바와 같이, 루시퍼라제-기반 형광 검출을 통해 측정될 수 있는 리포터를 포함하였다. 벡터는 hFIX ORF의 3' 말단에 융합된, 상대적 발현의 민감한 검출을 가능하게 하는 HiBit 펩티드를 포함하고 있다. 테스트된 각 벡터의 개략도는 도 5A에 제공되어 있다. 테스트 gRNA들은 표 5에 열거된 것들에 대한 축약된 숫자를 사용하여 (예를 들어, 선행하는 0들이 생략되는 경우, 예를 들어, “G551”은 표 5의 “G000551”에 해당함) 도 5B 및 5C에 도시되어 있다.
도 5B 및 표 16에서 보는 바와 같이, 테스트된 각 조합에서 각 처리 그룹들에 대해 일관되지만 다양한 수준의 편집이 검출되었다. 템플릿과 가이드 RNA의 다양한 조합을 사용한 트랜스진 발현은 도 5C 및 표 17에 도시되어 있다. 도 5D에서 보는 바와 같이, 유의한 수준의 인델 형성이 반드시 보다 효율적인 트랜스진 발현을 가져오는 것은 아니었다. P00411- 및 P00418-유래 템플릿을 사용시, 10% 미만의 편집을 가진 가이드들이 포함되지 않는 경우, R2 값은 각각 0.54 및 0.37였다. 마우스 알부민 스플라이스 수용체 및 인간 FIX 스플라이스 수용체 각각은 효과적인 트랜스진 발현을 초래하였다.
표 16.-%인델
Figure pct00019
표 17.- 루시퍼라제 수준
Figure pct00020
실시예 6- 표적 부위들 전반에 걸친 양방향 구조체들의 생체내 스크리닝
생체내에서 표적 부위에 걸친 양방향 구조체들의 성능을 평가하기 위해, 본 실시예에서 테스트되는 ssAAV 및 LNP를 실시예 1에 기재된 바와 같이 제조하고 및 C57Bl/ 6 마우스에 전달하였다. 투여 4주 후, 동물을 안락사시키고 간 조직 및 혈청을 각각 편집 및 hFIX 발현을 위해 수집하였다.
초기 실험에서 알부민의 인트론 1을 표적으로 하는 10개의 서로 다른 gRNA를 포함하는 10개의 서로 다른 LNP 제제들을 P00147에서 유래된 ssAAV와 함께 마우스에 전달하였다. AAV 및 LNP를 각각 3e11 vg/ms 및 4 mg/kg (총 RNA 카고 함량에 대해)으로 전달하였다 (각 그룹에 대해 n=5). 본 실험에서 테스트된 gRNA들을 도 6에 도시하고 표 18에 표로 작성하였다. 도 6에서 보는 바와 같이 그리고 시험관내에서 관찰된 바와 같이, 유의한 수준의 인델 형성은 트랜스진의 삽입이나 발현을 예측하지 못했다.
별도의 실험에서, 실시예 5에서 시험관내 테스트된 20개의 서로 다른 표적 부위들을 표적으로 하는 20개 gRNA들의 패널을 생체내 테스트하였다. 이를 위해 알부민 인트론 1을 표적으로 하는 20개의 gRNA를 포함하는 LNP 제제들을 P00147에서 유래된 ssAAV와 함께 마우스들에 전달하였다. AAV 및 LNP를 각각 3e11 vg/ms 및 1 mg/kg (총 RNA 카고 함량에 대해)으로 전달하였다. 본 실험에서 테스트된 gRNA들을 도 7A 및 7B에 도시하였다.
도 7A에서 보는 바와 같이 그리고 표 19에 표로 나타낸 바와 같이, 테스트된 각 LNP/벡터 조합에서 각 처리 그룹들에 대해 다양한 수준의 편집이 검출되었다. 그러나 도 7B 및 표 20에서 보는 바와 같이 그리고 실시예 5에 기재된 시험관내 데이터와 일관되게, 보다 높은 편집 수준이 반드시 생체내에서 트랜스진의 보다 높은 수준의 발현을 가져오는 것은 아니었으며, 이는 양방향 hFIX 구조체들의 삽입/발현과 편집 사이에 상관관계가 없음을 나타내는 것이다. 실제로, 도 7D에 제공된 플롯에서 보는 바와 같이 구현된 편집양과 hFIX 발현양 사이에는 거의 상관관계가 없다. 특히, 10% 미만의 편집을 구현한 gRNA가 분석에서 제거 될 때, 본 실험에 대한 편집 및 발현 데이터 세트들 사이에 고작 0.34의 R2 값이 계산된다. 흥미롭게도,도 7C에서 보는 바와 같이, 실시예 5의 시험관내 실험으로부터 RLU로 측정된 발현 수준과 본 실험에서 검출된 생체내 트랜스진 유전자 발현 수준을 비교하는 상관관계 플롯이 제공되는데, 이 때 R2 값은 0.70이고, 이는 일차 세포 스크리닝과 생체내 처리들 사이의 양의 상관관계를 나타낸다.
세포 수준에서 양방향 구조체들의 삽입을 평가하기 위해, 처리된 동물의 간 조직을 예를 들어, 실시예 1에 기재된 바와 같이 인 시튜 혼성화 방법 (BaseScope)을 사용하여 분석하였다. 이 분석은 hFIX 트랜스진과 마우스 알부민 엑손 1 서열 사이의 접합부를 검출 할 수 있는 프로브를 하이브리드 전사체로 사용했다. 도 8A에서 보는 바와 같이, AAV 및 LNP를 모두 제공받은 동물에서 하이브리드 전사체에 양성인 세포가 검출되었다. 구체적으로, AAV 단독 투여시 1.0% 미만의 세포들이 하이브리드 전사체에 대해 양성이었다. G011723, G000551 또는 G000666을 포함하는 LNP의 투여시, 세포의 4.9%, 19.8% 또는 52.3%가 하이브리드 전사체에 대해 양성이었다. 추가로, 도 8B에서 보는 바와 같이, 순환 hFIX 수준은 하이브리드 전사체에 대해 양성인 세포의 수와 상관관계가 있었다. 마지막으로, 분석은 양방향 hFIX 구조체의 삽입을 어느 방향으로든 검출 할 수 있는 풀링된 프로브를 사용했다. 그러나 단일 방향만 검출하는 단일 프로브를 사용했을 때 하이브리드 전사체에 대해 양성인 세포의 양은 풀링된 프로브를 사용하여 검출된 것의 약 절반 (한 예에서 4.46% 대 9.68%)이었으며, 이는 양방향 구조체들은 실제로 어느 방향으로든 삽입 가능하여 단백질 수준에서 트랜스진 발현양과 상관 관계가 있는 하이브리드 전사체 발현을 생성함을 제시하는 것이다. 이들 데이터는 구현된 순환 hFIX 수준이 삽입에 사용된 가이드에 따라 달라진다는 것을 보여준다.
표 18- hFIX 혈청 수준 및% 인델
Figure pct00021
표 19-% 간 편집
Figure pct00022
표 20- 혈청 hFIX 수준
Figure pct00023
실시예 7- 생체내 AAV 및 LNP 전달 타이밍
본 실시예에서, LNP와 양방향 hFIX 구조체를 포함하는 ssAAV 전달 사이의 타이밍을 C57Bl/6 마우스에서 조사하였다.
본 실시예에서 테스트된 ssAAV 및 LNP를 실시예 1에 기재된 바와 같이 제조하고 마우스에 전달하였다. LNP 제제는 G000551을 포함하였으며 양방향 템플릿은 P00147에서 유래된 ssAAV로 전달되었다. AAV 및 LNP를 각각 3e11 vg/ms 및 4 mg/kg (총 RNA 카고 함량에 대해)으로 전달하였다 (각 그룹에 대해 n=5). "템플릿 단독" 코호트는 AAV만 제공받았으며 "PBS" 코호트는 AAV 또는 LNP를 제공받지 않았다. 한 코호트는 0일차에 AAV 및 LNP를 순차적으로 (수 분 간격으로) 제공받았으며 (“템플릿 + LNP 0일차”); 또 다른 코호트는 0일차에 AAV를 그리고 1일차에 LNP를 제공받았고 (“템플릿 + LNP 1일차”); 그리고 최종 코호트는 0일차에 AAV를 그리고 7일차에 LNP를 제공받았다(“템플릿 + LNP 7일차”). 1 주차, 2 주차, 및 6 주차에, hFIX 발현 분석을 위해 혈장을 수집하였다.
도 9에서 보는 바와 같이, hFIX는, AAV 전달 후 7일차에 LNP를 제공받은 코호트에 있어서 1주차 시점을 제외하고, 분석된 각 시간에 각 코호트에서 검출되었다.
실시예 8- AAV의 전달 후 LNP 다회 투약
본 실시예에서, ssAAV 투여 후 LNP 반복 투약의 효과를 조사하였다.
본 실시예에서 테스트된 ssAAV 및 LNP를 실시예 1에 기재된 바와 같이 제조하고 C57Bl/6 마우스에 전달하였다. LNP 제제는 G000551을 함유하였으며 ssAAV는 P00147로부터 유래되었다. AAV 및 LNP를 각각 3e11 vg/ms 및 0.5 mg/kg (총 RNA 카고 함량에 대해)으로 전달하였다 (각 그룹에 대해 n=5). "템플릿 단독" 코호트는 AAV만 제공받았으며 "PBS" 코호트는 AAV 또는 LNP를 제공받지 않았다. 한 코호트는 0일차에 추가 처리 없이 AAV 및 LNP를 순차적으로 (수 분 간격으로) 제공받았으며 (도 10에서 “템플릿 + LNP(1x)”); 또 다른 코호트는 0일차에 AAV 및 LNP를 순차적으로 (수 분 간격으로) 그리고 7일차에 두 번째 LNP 용량을 제공받았으며 (도 10에서 “템플릿 + LNP(2x)”); 그리고 최종 코호트는 0일차에 AAV 및 LNP를 순차적으로 (수 분 간격으로), 7일차에 두 번째 LNP 용량을 그리고 14일차에 세 번째 LNP 용량을 제공받았다 (도 10에서 “템플릿 + LNP(3x)”). AAV 투여 후 1, 2, 4 및 6주차에, hFIX 발현 분석을 위해 혈장을 수집하였다.
도 10에서 보는 바와 같이, hFIX는 분석된 각 시간에 각 코호트에서 검출되었으며, 다회의 후속 LNP 투약은 hFIX 발현 양을 유의하게 증가시키지 않았다.
실시예 9- 생체내 hFIX 발현의 지속성
처리된 동물에서 시간에 따른 hFIX 발현의 지속성을 본 실시예에서 평가하였다. 이를 위해 1 년 지속성 연구의 일환으로 투여 후 처리된 동물의 혈청에서 hFIX를 측정했다.
본 실시예에서 테스트된 ssAAV 및 LNP를 실시예 1에 기재된 바와 같이 제조하고 C57Bl/6 마우스에 전달하였다. LNP 제제는 G000551을 함유하였으며 ssAAV는 P00147로부터 유래되었다. AAV를 3e11 vg/ms로 전달하고 LNP를 0.25 또는 1.0 mg/kg (총 RNA 카고 함량에 대해)으로 전달하였다 (각 그룹에 대해 n=5).
도 11A 및 표 21에서 보는 바와 같이, hFIX 발현은 두 그룹에 대해 평가된 각 시점에서 41 주차까지 지속되었다. 8 주차에 관찰된 수준 감소는 ELISA 분석의 가변성 때문인 것으로 생각된다. 혈청 알부민 수준들을 2주차 및 41주차에 ELISA로 측정하였으며, 연구 전반에 걸쳐 순환 알부민 수준이 유지된다는 것을 보여준다.
도 11B 및 표 22에서 보는 바와 같이, hFIX 발현은 두 그룹에 대해 평가된 각 시점에서 52 주차까지 지속되었다.
표 21 FIX 수준
Figure pct00024
표 22 -FIX 수준
Figure pct00025
실시예 10-생체내에서 hFIX 발현을 조절하기 위한 AAV 및 LNP 용량 변화의 효과
본 실시예에서, hFIX의 발현을 조절하기 위한 AAV 및 LNP 용량 변화의 효과가 C57Bl/6 마우스에서 평가되었다.
본 실시예에서 테스트된 ssAAV 및 LNP를 실시예 1에 기재된 바와 같이 제조하고 마우스에 전달하였다. LNP 제제는 G000553을 함유하였으며 ssAAV는 P00147로부터 유래되었다. AAV를 1e11, 3e11, 1e12 또는 3e12 vg/ms로 전달하고 LNP를 0.1, 0.3 또는 1.0 mg/kg (총 RNA 카고 함량에 대해)으로 전달하였다 (각 그룹에 대해 n=5). 투약 2주 후, 동물들을 안락사시켰다. hFIX 발현 분석을 위해 2개 시점들에서 혈청을 수집하였다.
도 12A (1 주차), 도 12B (2 주차) 및 표 23에서 보는 바와 같이, AAV 또는 LNP의 용량을 변화시켜 생체내 hFIX의 발현 양을 조절할 수 있다.
표 23. - 혈청 hFIX
Figure pct00026
실시예 11- 일차 사이노몰구스 및 일차 인간 헤파토사이트에서 표적 부위들 전반에 걸친 양방향 구조체들의 시험관내 스크리닝
본 실시예에서, 양방향 구조체를 포함하는 ssAAV 벡터들을 각각 사이노몰구스의 인트론 1 (“사이노”) 및 일차 사이노 (PCH) 및 일차 인간 헤파토사이트 (PHH)에서 인간 알부민을 표적하는 gRNA들을 이용하여 표적 부위들의 패널에 걸쳐 테스트하였다.
본 실시예에서 테스트된 ssAAV 및 지질 패킷 전달 물질은 실시예 1에 기재된 바와 같이 제조되고 PCH 및 PHH에 전달되었다. 처리 후, 단리된 게놈 DNA 및 세포 배지를 각각 편집 및 트랜스진 발현 분석을 위해 수집하였다. 벡터들 각각은, 실시예 1에 기재되고 (플라스미드 P00415로부터 유래) 도 13B 및 14B에 상대 루시퍼라제 단위 (“RLU”)로 도시된 바와 같이, 루시퍼라제-기반 형광 검출을 통해 측정될 수 있는 리포터를 포함하였다. 예를 들어, AAV 벡터들은 (GFP 이외에) NanoLuc ORF를 내포하였다. 테스트된 벡터들의 개략도는 도 13B 및 14B에 제공되어 있다. 테스트된 gRNA들을 표 1 및 표 7에 열거된 것들에 대한 축약된 숫자를 사용하여 도면 각각에 도시한다.
PCH의 경우 도 13A에 그리고 PHH의 경우 도 14A에 도시된 바와 같이, 테스트된 조합들 각각에 대해 다양한 수준의 편집이 검출되었다 (PCH 실험에서 테스트된 일부 조합들에 대한 편집 데이터는 앰플리콘 기반 시퀀싱에 사용된 특정 프라이머 쌍들의 실패로 인해 도 13A 및 표 3에 보고되어 있지 않음). 도 13A 및 14A에 그래프로 도시된 편집 데이터를 하기 표 3 및 표 4에 수치로 재현하였다. 그러나, 도 13B, 13C 및 도 14B 및 14C에서 보는 바와 같이, 유의한 수준의 인델 형성은 트랜스진들의 삽입 또는 발현을 예측하지 못했는데, 이는 PCH 및 PHH 각각에서 양방향 구조체들의 편집과 삽입/발현 간에 상관관계가 거의 없음을 나타낸다. 한 측정값으로서, 도 13C에서 계산된 R2 값은 0.13이고, 도 14D의 R2 값은 0.22이다.
추가적으로, 양방향 구조체를 포함하는 ssAAV 벡터들을 일차 인간 헤파토사이트 (PHH)에서 인간 알부민의 인트론 1을 표적하는 단일 가이드 RNA들을 이용하여 표적 부위들의 패널에 걸쳐 테스트하였다.
ssAAV 및 LNP 재료들을 실시예 1에 기재된 바와 같이 제조하고 PHH에 전달하였다. 처리 후, 단리된 게놈 DNA 및 세포 배지를 각각 편집 및 트랜스진 발현 분석을 위해 수집하였다. 벡터들 각각은, 실시예 1에 기재되고 (플라스미드 P00415로부터 유래) 도 14D에 상대 루시퍼라제 단위 (“RLU”)로 도시되고 하기 표 24에 표로 제시한 바와 같이, 루시퍼라제-기반 형광 검출을 통해 측정될 수 있는 리포터를 포함하였다. 예를 들어, AAV 벡터들은 (GFP 이외에) NanoLuc ORF를 내포하였다. 테스트된 벡터들의 개략도는 도 13B 및 14B에 제공되어 있다. 테스트된 gRNA들을 표 1 및 표 7에 열거된 것들에 대한 축약된 숫자를 사용하여 도 14D에 도시한다.
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
실시예 12- 대안적인 세이프 하버 유전자좌로부터 인자 IX 발현의 생체내 테스트
본 실시예에서, 대안적인 세이프 하버 유전자좌에서 양방향 hFIX 구조체를 포함하는 ssAAV의 삽입을 평가하였다. 대안적인 세이프 하버 유전자좌로의 삽입을 테스트하기 위해 AAV를 상기 설명한 바와 같이 준비하였다. 마우스들에게 3e11 vg/마우스의 용량으로 AAV를 투여한 직후 Cas9 mRNA 및 가이드 RNA와 함께 제제화된 LNP를 0.3 mg/kg 용량으로 투여했다. 동물을 투여 후 4주차에 희생시키고 간 및 혈액 샘플을 수집하였다. 간 샘플들에서의 편집을 NGS로 결정하였다. 혈청 내 인간 hFIX 수준을 ELISA로 결정하였다. NGS 및 ELISA 데이터는 대안적인 세이프 하버 유전자좌 내부에서 hFIX의 효과적인 삽입 및 발현을 보여주었다.
실시예 13- 비-인간 영장류에서 인간 인자 IX 유전자 삽입의 생체내 테스트
본 실시예에서, 아데노-연관 바이러스 (AAV) 및/또는 지질 나노입자 (LNP)를 다양한 가이드들과 함께 투여하여 사이노몰구스 원숭이들에서 인간 인자 IX 유전자 삽입 및 hFIX 단백질 발현을 평가하기 위한 8주 연구가 수행되었다. 본 연구는 상기 기재된 바와 같이 준비된 LNP 제제들 및 AAV 제제들을 사용하여 수행되었다. 각 LNP 제제는 Cas9 mRNA 및 가이드 RNA (gRNA)를 2:1의 mRNA:gRNA 중량비로 포함하였다. ssAAV는 P00147로부터 유래되었다.
수컷 사이노몰구스 원숭이들은 n=3의 코호트에서 처리되었다. 표 10에 기재된 용량으로 느린 볼루스 주사 또는 주입에 의해 동물들에게 AAV를 투여 하였다. AAV 처리 후, 동물들은 표 10에 기재된 바와 같이 완충액 또는 LNP를 느린 볼루스 또는 주입에 의해 제공받았다.
투여 2주 후, 단일 초음파-가이드된 경피 생검을 통해 간 표본들을 수집하였다. 각 생검 표본을 액체 질소에서 급속 냉동시키고 -86 내지 -60°C에서 보관하였다. 간 표본들의 편집 분석을 전술한 바와 같은 NGS 시퀀싱으로 수행하였다.
인자 IX ELISA 분석을 위해, 투여 후 7, 14, 28, 및 56 일차에 혈액 샘플들을 수집하였다. 채혈 후 혈액 샘플을 수집하여 혈장으로 처리하고 분석 할 때까지 -86 내지 -60 °C에서 보관하였다.
총 인간 인자 IX 수준을 혈장 샘플로부터 ELISA로 결정하였다. 요약하면, Reacti-Bind 96-웰 마이크로플레이트 (VWR 카탈로그# PI15041)들을 1 μg/ml 농도의 포획 항체 (인간 인자 IX 항체에 대한 마우스 mAB (HTI, 카탈로그#AHIX-5041))로 코팅한 다음, 5% 소 혈청 알부민이 있는 1x PBS를 사용하여 차단하였다. 사이노몰구스 원숭이 혈장에 희석시킨 정제된 인간 인자 IX 단백질 (ERL, 카탈로그# HFIX 1009, 로트#HFIX4840)의 테스트 샘플들 또는 표준들을 개별 웰들에서 다음으로 배양하였다. 검출 항체 (양 항-인간 인자 9 폴리클로날 항체, Abcam, 카탈로그# ab128048)는 100 ng/ml의 농도에서 흡착되었다. 100 ng/mL의 2차 항체 (HRP가 있는 당나귀 항-양 IgG pAbs, Abcam, 카탈로그# ab97125)를 사용하였다. TMB 기질 시약 세트 (BD OptEIA 카탈로그#555214)를 사용하여 플레이트를 전개하였다. 광학 밀도는 마이크로플레이트 리더 (Molecular Devices i3 시스템)에서 450nm에서 분광 광도계로 평가되었으며 SoftMax pro 6.4를 사용하여 분석되었다.
인델 형성을 검출하였으며, 이는 편집이 일어났음을 확인시켜 주는 것이다. NGS 대이터는 효과적인 인덱 형성을 보여주었다. NHP 내 알부민 유전자좌로부터 hFIX의 발현은 ELISA로 측정가능하며 표 11 및 도 15에 도시되어있다 hFIX의 혈장 수준은 치료적으로 유효한 것으로 앞서 기재한 수준에 도달하였다 (George, 등, NEJM 377(23), 2215-27, 2017 참고).
측정시, 순환 hFIX 단백질 수준은 8주 연구 전체에 걸쳐 지속되었으며 (도 15 참고, 7, 14, 28, 및 56일차에 각각 ~135, ~140, ~150, 및 ~110 ng/mL의 평균 수준을 보임), ~75 ng/mL 내지 ~250 ng/mL 범위의 단백질 수준을 구현하였다. R338L 기능항진 hFIX 변이체에 대한 ~8 배 더 높은 특이적 활성을 사용하여 혈장 hFIX 수준들을 계산하였다 (Simioni 등, NEJM 361(17), 1671-75, 2009) (이 문헌은 밀리그램 당 390±28 U의 hFIX-R338L의 단백질-특이적 활성, 및 밀리그램 당 45±2.4 U의 야생형 인자 IX에 대한 단백질-특이적 활성을 보고한다). 본 실시예에서 테스트된 기능항진 인자 IX 변이체에 대하여 함수상으로 정규화된 인자 IX 활성을 계산하였을 때, 본 실험은 8주 연구에 걸쳐 NHP에서 야생형 인자 IX 활성의 약 20-40%에 해당하는 안정한 인간 인자 IX 단백질 수준에 도달하였다 (범위는 야생형 인자 IX 활성의 12-67%에 걸쳐 있다).
표 10 간에서의 편집
Figure pct00032
표 11. hFIX 발현
Figure pct00033
실시예 14 비-인간 영장류에서 인자 IX 삽입의 생체내 테스트
본 실시예에서, P00147로부터 유래된 ssAAV 및/또는 G009860를 비롯한 다양한 가이드 및 다양한 LNP 구성성분들을 가지는 CRISPR/Cas9 지질 나노입자 (LNP) 투여 후 사이노몰구스 원숭이들에서 인자 IX 유전자 삽입 및 hFIX 단백질 발현을 평가하기 위한 연구가 수행되었다.
인델 형성을 NGS로 측정하였으며, 이는 편집이 일어났음을 확인시켜 주는 것이다. 실시예 13에 기재된 바와 같이, 인간 인자 IX 항체 (HTI, 카탈로그#AHIX-5041), 양 항-인간 인자 9 폴리클로날 항체 (Abcam, 카탈로그# ab128048), 및 HRP를 가지는 당나귀 항-양 IgG pAb들 (Abcam, 카탈로그# ab97125)에 대한 마우스 mAB를 사용하여 ELISA에 의해 혈장 샘플들로부터 총 인간 인자 IX 수준들을 결정하였다. 실시예 13의 실험에서 구현된 것 보다>3 배 더 높은 인간 FIX 단백질 수준을 대안적인 CRISPR/Cas9 LNP를 사용한 양방향 템플릿으로부터 얻었다. 본 연구에서, ELISA 분석 결과는 정상 범위 (3-5 ug/mL; Amiral 등, Clin. Chem., 30(9), 1512-16, 1984)의 또는 그 이상의 인간 FIX 수준의 순환 hFIX 단백질 수준들이 NHP들에서 G009860을 사용하여 최소한 14일 및 28일 시점들까지 구현되었음을 나타낸다. 초기 데이터는 단회 투약 후 14일차에 ~3-4 μg/mL의 순환 인간 FIX 단백질 수준을 나타내었으며, 이 수준들은 본 연구의 처음 28일에 걸쳐 유지되었다 (~3-5 μg/mL) . 연구 종료시 인간 FIX 수준을 동일한 방법으로 측정하였으며 데이터는 표 25에 제시되어 있다. 또 다른 가이드들 G009847, G009862, 및 G009864 또한 테스트하였으며 NHP 연구에서 FIX-발현 템플릿의 삽입을 용이하게 하는 것으로 나타났다.
표 25. 혈청 인간 인자 IX 단백질 수준 -실시예 13의 ELISA 방법
Figure pct00034
순환 알부민 수준을 ELISA로 측정하였으며, 이는 28일차에서 기준 알부민 수준들이 유지됨을 나타낸다. 비처리 동물들에서 테스트된 알부민 수준들은 본 연구에서 ± ~15% 변화하였다. 처리된 동물에서, 순환 알부민 수준들은 최소한으로 변화하였으며 정상 범위를 벗어나지 않았고 그 수준들은 한 달 이내에 기준치로 회복되었다.
순환 인간 FIX 단백질 수준은 또한 더 큰 동적 범위로 샌드위치 면역분석에 의해 결정되었다. 요약하면, MSD GOLD 96-웰 스트렙타비딘 SECTOR 플레이트 (Meso Scale Diagnostics, Cat. L15SA-1)를 1% ECL 차단제 (Sigma, GERPN2125)로 차단했다. 차단 용액을 뽑아낸 후 비오티닐화된 포획 항체 (Sino Biological, 11503-R044)를 플레이트에 고정하였다. 재조합 인간 FIX 단백질 (Enzyme Research Laboratories, HFIX 1009)을 사용하여 0.5% ECL 차단제에서 보정 표준을 준비했다. 세척 후, 보정 표준 및 혈장 샘플들을 플레이트에 첨가하고 배양했다. 세척 후, 설포-태그 라벨과 접합된 검출 항체 (Haematologic Technologies, AHIX-5041)를 웰에 첨가하고 배양하였다. 결합되지 않은 검출 항체를 세척한 후 리드 완충액 T (Read Buffer T)를 웰에 적용했다. 추가 배양없이 플레이트를 MSD Quick Plex SQ120 기기로 이미지화하고 Discovery Workbench 4.0 소프트웨어 패키지 (Meso Scale Discovery)로 데이터를 분석했다. 농도는 ug/m 단위로 계산된 평균 농도로 표현된다. 샘플의 경우, 별표로 표시되지 않는 한 N=3이고, 별표의 경우 N=2이다. MSD ELISA에 의해 측정된, 처리된 연구 그룹에서 알부민 유전자좌로부터의 hFIX의 발현을 표 26에 도시한다.
표 26. 혈청 인간 인자 IX 단백질 수준 - MSD ELISA
Figure pct00035
실시예 15 - 알부민 인간 가이드들의 오프-타겟 분석
생화학적 방법 (예를 들어, Cameron 등, Nature Methods. 6, 600-606; 2017 참조)을 사용하여 Cas9 표적화 알부민에 의해 절단된 잠재적인 오프-타겟 게놈 부위들을 결정하였다. 본 실험에서는 인간 알부민을 표적으로하는 13개의 sgRNA와 공지된 오프-타겟 프로파일들을 가진 2개의 대조군 가이드를 단리된 HEK293 게놈 DNA를 사용하여 스크리닝했다. 생화학적 분석에서 16 nM의 가이드 농도를 사용하여 검출된 잠재적인 오프-타겟 부위의 수를 표 27에 나타내었다. 본 분석은 테스트 sgRNA들에 대한 잠재적인 오프-타겟 부위들을 식별하였다.
표 27. 오프-타겟 분석
Figure pct00036
상기 사용된 생화학적 방법과 같은 공지된 오프-타겟 검출 분석에서, 많은 수의 잠재적 오프-타겟 부위들은 통상적으로, 다른 내용에서, 예를 들어, 관심 일차 세포에서 검증될 수 있는 잠재적 부위들에 대하여 "넓은 그물을 던지도록" 하는 설계에 의해 복구된다. 예를 들어, 생화학적 방법은 통상적으로 잠재적 오프-타겟 부위들의 수를 과도하게 제시하는데, 이러한 분석이 정제된 고 분자량 게놈 DNA가 없는 세포 환경을 이용하고 사용된 Cas9 RNP의 용량에 의존하기 때문이다. 따라서, 이들 방법들에 의해 식별된 잠재적 오프-타겟 부위들은 식별된 잠재적 오프-타겟 부위들의 표적화된 시퀀싱을 사용하여 검증될 수 있다.
실시예 16. 가이드 RNA들을 생체내 인간 F9 삽입에 대해 스크린하기 위한 인간화 알부민 마우스의 사용
우리는 인간 알부민 유전자좌에 hF9를 삽입하기에 효과적인 가이드 RNA를 식별하는 것을 목표로 하였다. 이를 위하여, 우리는 마우스 알부민 유전자좌가 제 1 인트론을 비롯한 상응하는 인간 알부민 게놈 서열로 대체되어 있는 마우스들 (ALBhu/hu 마우스들)을 이용하였다. 이를 통해 우리는 성인 간과 관련하여 인간 알부민의 첫 번째 인트론을 생체내에서 표적으로 하는 가이드 RNA의 삽입 효율을 테스트 할 수 있었다. 각각 인간 알부민 유전자좌의 첫 번째 인트론을 표적하는 총 11개의 가이드 RNA를 스크리닝하기 위하여 ALBhu/hu 마우스들을 사용하여 2가지 별개 마우스 실험들을 셋업하였다. 실험 0일차에 모든 마우스들을 계량하고 꼬리 정맥을 통해 주사하였다. 꼬리 채혈을 통하여 1, 3, 4, 및 6주차에 혈액을 수집하고, 혈장을 분리하였다. 마우스들을 7주차에 사망시켰다. 대정맥을 통해 혈액을 수집하고 혈장을 분리했다. 간 및 비장들을 또한 절제하였다.
첫 번째 실험에서, Cas9 mRNA 및 다음 가이드들을 포함하는 6개의 LNP들을 실시예 1에서와 같이 준비하고 테스트하였다: G009852, G009859, G009860, G009864, G009874, 및 G012764. LNP들을 0.3 mg/kg까지 희석시키고 (30 그램의 평균 중량을 사용) 양방향 hF9 삽입 템플릿과 함께 패키징된 마우스 당 3E11 바이러스 게놈 용량의 AAV8과 함께 공동-주입하였다. 그룹 당 5마리의 12 내지 14주령 ALBhu/hu 수컷 마우스들을 주사하였다. 동일한 코호트의 5마리 마우스들에게 hF9에 작동가능하게 연결된 CAGG 프로모터와 함께 패키징된 AAV8을 주사하였으며, 이는 hF9 의 에피솜 발현을 초래하였다 (마우스 당 3E11 바이러스 게놈). 3가지 음성 대조 그룹들이 있었으며, 그룹 당 3마리의 마우스들에게 완충액 단독, 양방향 hF9 삽입 템플릿과 패키징된 AAV8 단독 또는 LNP-G009874 단독을 주사하였다.
본 실험에서 Cas9 mRNA 및 다음 가이드들을 포함하는 다음과 같은 LNP들을 실시예 1에서와 같이 준비하고 테스트하였다: G009860, G012764, G009844, G009857, G012752, G012753, 및 G012761. 모두 0.3 mg/kg까지 희석시키고 (40 그램의 평균 중량을 사용) 양방향 hF9 삽입 템플릿과 함께 패키징된 마우스 당 3E11 바이러스 게놈 용량의 AAV8과 함께 공동-주입하였다. 그룹 당 5마리의 30주령 ALBhu/hu 수컷 마우스들을 주사하였다. 동일한 코호트의 5마리 마우스들에게 hF9에 작동가능하게 연결된 CAGG 프로모터와 함께 패키징된 AAV8을 주사하였으며, 이는 hF9 의 에피솜 발현을 초래하였다 (마우스 당 3E11 바이러스 게놈). 3가지 음성 대조 그룹들이 있었으며, 그룹 당 3마리의 마우스들에게 완충액 단독, 양방향 hF9 삽입 템플릿과 패키징된 AAV8 단독 또는 LNP-G009874 단독을 주사하였다.
분석을 위해, 각 시점에서 마우스들에서의 hFIX 순환 수준을 측정하기 위해 ELISA를 수행하였다. 이를 위해 인간 인자 IX ELISA 키트들 (ab188393)을 사용하였으며, 모든 플레이트들을 George King Bio-Medical사의 인간 풀링된 정상 혈장을 양성 분석 대조로 사용하여 실험하였다. 주사 후 6 주차에서 각 그룹의 혈장 샘플들에서의 인간 인자 IX 발현 수준을 도 16A 및 도 16B에 나타낸다. 시험관내 삽입 데이터와 일치되게, 가이드 RNA G009852를 사용하였을 때 낮은 내지 0의 인자 IX 혈청 수준이 검출되었다. 인간 알부민 내 인접한 PAM 서열이 없는 것과 일치되게, 가이드 RNA G009864를 사용하였을 때 인자 IX 혈청 수준은 검출할 수 없었다. 가이드 RNA들 G009859, G009860, G009874, 및 G0012764를 사용하는 그룹들에 대한 혈청 내 인자 IX 발현을 관찰하였다.
비장 및 모든 간의 왼쪽 측엽의 일부를 차세대 시퀀싱 (NGS) 분석을 위해 제출하였다. AAV-hF9 공여자 및 LNP-CRISPR/Cas9 주사 후 7주차에 NGS를 사용하여 인간화 알부민 유전자좌에 삽입/결실 (인델)이 있는 간 세포들의 백분율을 평가하였다. 인간 알부민에서 인접한 PAM 서열이 없는 것과 일치되게, 가이드 RNA G009864를 사용하였을 때 간에서 검출가능한 편집은 없었다. 가이드 RNA G009859, G009860, G009874, 및 G012764를 사용한 그룹들에 대하여 간에서의 편집을 관찰하였다 (데이터 도시되지 않음).
남은 간을 10% 중성 완충 포르말린에서 24시간 동안 고정시킨 다음 70% 에탄올로 옮겼다. 별 개의 엽들에서 4 내지 5개의 샘플들을 잘라내어 HistoWisz로 배송하고 파라핀 블록에서 처리 및 포매시켰다. 이어서 성공적인 통합 및 전사에 도달할 때 각 파라핀 블록으로부터 5-마이크론 절편들을 절제하고, 범용 BASESCOPE™절차 및 Advanced Cell Diagnostics 사의 시약들 및 ALBhu/hu 알부민 유전자좌의 첫 번째 인트론으로부터의 인간 알부민 신호 서열과 F9 트랜스진 사이에서 형성된 고유한 mRNA 접합부를 표적하는 맞춤 설계된 프로브를 사용하여 Ventana Ultra Discovery (Roche) 기기에서 BASESCOPE™를 수행하였다. 이어서 HALO 이미징 소프트웨어 (Indica Labs)를 사용하여 각 샘플에서 양성 세포들의 백분율을 정량하였다. 그 후 각 동물들에 있어서 다수의 엽들 전반에 걸친 양성 세포들의 백분율 평균을 7주차 혈청 내 hFIX 수준과 상관시켰다. 결과를 도 17표 28에 나타낸다. hALB-hFIX mRNA에 대한 7주차 혈청 수준과 양성 세포%는 강력한 상관관계를 가졌다 (r = 0.89; R2 = 0.79).
표 28. 7주차 hFIX 및 BASESCOPE™데이터.
Figure pct00037
실시예 17 - F9 녹아웃 마우스와 교차된 인간화 알부민 마우스를 사용하여 삽입된 인간 F9 생체내 기능성 평가
다음 연구를 위해, 삽입된 hF9 의 기능성을 수컷 ALBms/hu x F9 -/- 마우스들에서 테스트하였다. Cas9 mRNA 및 다음 가이드들을 포함하는 LNP들을 실시예 1에서와 같이 준비하고 테스트하였다: G009860 (인간 알부민 유전자좌의 제 1인트론을 표적화) 및 G000666 (마우스 알부민 유전자좌의 제 1 인트론을 표적화). G009860을 0.3 mg/kg까지 희석시키고, 및 G000666을 1.0 mg/kg 까지 희석시키고 (31.2 그램의 평균 중량 사용), 둘 모두를 양방향 hF9 삽입 템플릿과 함께 패키징된 마우스 당 3E11 바이러스 게놈 용량의 AAV8과 함께 공동-주입하였다. 그룹 당 5마리의 ALBms/hu x F9 -/- 수컷 마우스들 (16주령)을 주사하였다. 동일한 코호트의 5마리 마우스들에게 hF9에 작동가능하게 연결된 CAGG 프로모터와 함께 패키징된 AAV8을 주사하였으며, 이는 hF9 의 에피솜 발현을 초래하였다 (마우스 당 3E11 바이러스 게놈). 6가지 음성 대조 동물들이 있었으며, 그룹 당 한 마리의 마우스에게는 완충액 단독 또는 양방향 hF9 삽입 템플릿과 함께 패키징된 AAV8 단독을 주사하고, 그룹 당 두 마리의 마우스들에게는 LNP-G009860 또는 LNP-G000666 단독을 각각 0.3 mg/kg 및 1.0 mg/kg 주사하였다.
분석을 위해, 각 시점에서 마우스들에서의 hFIX 순환 수준을 측정하기 위해 ELISA를 수행하였다. 이를 위해 인간 인자 IX ELISA 키트들 (ab188393)을 사용하였으며, 모든 플레이트들을 George King Bio-Medical사의 인간 풀링된 정상 혈장을 양성 분석 대조로 사용하여 실험하였다. 비장 및 모든 간의 왼쪽 측엽의 일부를 NGS 분석을 위해 제출하였다.
주사 후 1, 2, 및 4주차에 각 그룹의 혈장 샘플들에서 인간 인자 IX 발현 수준을 도 18표 29에 나타낸다. 또한, 간과 비장 내 알부민 유전자좌에서 삽입 및 결실 (인델) 수준들을 보여주는 NGS 결과들을 표 29에 나타낸다. 도 18 표 29에서 보는 바와 같이, 처리된 Alb +/hu /F9 -/- 마우스들의 혈장에서 1, 3, 및 4주차에 hFIX가 검출되었으며, ELISA는 1, 3 및 4주차에서 0.5-10 μg/mL의 발현 값을 보여준다.
표 29. 인간 FIX 혈장 수준 및 NGS 결과.
Figure pct00038
남은 간을 10% 중성 완충 포르말린에서 24시간 동안 고정시킨 다음 70% 에탄올로 옮겼다. 별 개의 엽들에서 4 내지 5개의 샘플들을 잘라내어 HistoWiz로 배송하고 파라핀 블록에서 처리 및 포매시켰다. 이어서 범용 BASESCOPE™절차 및 Advanced Cell Diagnostics 사의 시약들 및 성공적인 통합 및 전사가 구현된 경우 ALBms/hu 마우스에서 각각의 알부민 유전자좌 각각의 제 1 인트론으로부터의 인간 또는 마우스 알부민 신호 서열과 F9 트랜스진 사이에서 형성된 고유한 mRNA 접합부를 표적하는 맞춤 설계된 프로브를 사용하여 Ventana Ultra Discovery (Roche) 기기에서 BASESCOPE™를 통해 분석하기 위해, 성공적인 통합 및 전사에 도달할 때, 각 파라핀 블록으로부터 5-마이크론 절편들을 절제하였다. HALO 이미징 소프트웨어 (Indica Labs)를 사용하여 각 샘플에서 양성 세포들의 백분율을 정량한다.
다음으로, 말단 혈액을 사용하여 활성화 부분 트롬보플라스틴 시간 (aPTT) 및 트롬빈 생성 분석 (TGA)에 의해 기능적 응고 활성을 평가하였다. 활성화 부분 트롬보플라스틴 시간 (aPTT)은 혈장 내 고유 경로 응고 활성에 관한 임상적 측정값이다. 혈장은 엘라그산 또는 카올린을 첨가하여 응고를 유도하는데, 이 두 가지 모두 고유한 응고 경로 (접촉 경로로도 공지됨)에서 응고 인자 XII를 활성화하고, 이는 순차적으로 트롬빈이 활성화되면 피브리노겐으로부터 섬유소를 생성한다. aPTT 분석은 개체의 혈전 생성 능력에 대한 추정치를 제공하며, 이 정보를 사용하여 출혈 또는 혈전증의 위험을 결정할 수 있다. aPTT를 테스트하기 위해 전기-기계적 응고 검출 방법 (점도-기반 검출 시스템)을 이용하는 반자동 벤치 탑 시스템 (Diagnostica Stago STart 4)을 사용하여 혈장에서의 응고를 평가했다. 강철 볼이 있는 각 큐벳에 50μL의 시트레이트화 혈장을 첨가하고 37°에서 5 분 동안 배양한 다음, 37°에서 50μL의 엘라그산 (최종 농도 30μM)을 300초 동안 첨가하여 응고를 촉발시켰다. 각 큐벳에 50μL의 0.025M 칼슘 클로라이드 (최종 농도 8mM)을 첨가하여 응고를 최종 활성화한 후, 강철 볼이 2개의 드라이브 코일들 사이에서 앞뒤로 진동하기 시작했다. 볼의 움직임이 수신기 코일에 의해 탐지되었다. 피브린의 생성은 볼이 움직이지 않을 때까지 (이는 응고 시간으로 기록됨) 혈장 점도를 증가시켰다. 측정된 유일한 매개변수는 응고 시간이었다. 실험들을 중복으로 수행하였다.
트롬빈 생성 분석 (TGA)은 활성화된 혈장에서의 트롬빈 생성 동역학에 대한 비-임상적 평가이다. 트롬빈은 다른 응고 인자의 활성화 및 피브리노겐의 피브린으로의 전환을 위한 추가 트롬빈의 전파 (FXI 활성화를 통해)를 담당하기 때문에 트롬빈 생성은 응고의 필수 과정이다. 트롬빈 생성은 개체의 트롬빈 생성 능력에 대한 추정치를 제공하며, 이 정보를 사용하여 출혈 또는 혈전증의 위험을 결정할 수 있다. TGA를 수행하기 위해, 보정된 자동 혈전계를 사용하여 분광광도계 (Thrombinograph™, Thermo Scientific)에서 트롬빈 생성 수준을 평가했다. 고 처리량 실험을 위해, 96-웰 플레이트 (Immulon II HB)가 사용되었다. 각 웰에, 55 μL의 시트레이트화 혈장 (마우스 혈장에 대하여 식염수로 4x 희석)을 첨가하고 37°C에서 30분 동안 배양하였다. 트롬빈 생성은 15 μL의 2 μM 엘라그산 (최종 농도 0.33 μM)을 37°C에서 45분 동안 첨가하여 촉발된다. 트롬빈 생성은 16mM CaCl2 (FluCa; Thrombinoscope BV)와 함께 15μL의 형광 기질을 각 웰에 자동 주입한 후 결정되었다. 형광 기질은 생성된 트롬빈과 반응했으며, 이는 460nm에서 90분 동안 33초마다 혈장에서 연속적으로 측정되었다. 형광 강도는 트롬빈의 단백질분해 활성에 비례했다. 추적에서 측정된 주요 매개변수는 지연 시간, 피크 트롬빈 생성, 피크 트롬빈 생성 시간 및 내인성 트롬빈 전위 (ETP)였다. 지연 시간은 혈장에서 트롬빈의 초기 검출에 필요한 시간을 추정한다. 피크는 활성화 후 주어진 시간에 생성되는 트롬빈의 최대량이다. 피크 트롬빈 생성까지의 시간은 응고 캐스케이드의 시작부터 트롬빈의 피크 생성까지의 시간이다. ETP는 측정된 60 분 동안 생성된 트롬빈의 총량이다. 실험들을 중복으로 수행하였다.
도 19 및 표 30에서 보는 바와 같이, 예를 들어 G000666을 사용한hF9 트랜스진의 삽입은 aPTT 분석에서 회복된 응고 기능을 보여주었다. AAV 단독 및 LNP 단독 음성 대조 샘플들은 염수에서 45-60초의 지연된 aPTT 시간을 보여주었다. 양성 대조 CAGG 및 테스트 샘플들 AAV8+LNP는 28-34초의 정상 인간 aPTT에 더 근접하였다.
표 30. aPTT 및 TGA-EA.
Figure pct00039
도 20A, 도 20B, 및 도 21 그리고 표 30에서 보는 바와 같이, 예를 들어 G000666을 사용한 hF9 트랜스진 삽입은 TGA-EA 분석에서 증가된 트롬빈 생성을 보여주었다. 트롬빈 농도는 음성 대조 샘플에 비해 양성 대조 CAGG 및 AAV8+LNP에서 더 높았다.
결론적으로, 1 주, 3 주, 4 주차에 Alb +/hu /F9 -/- 마우스의 혈장에서 hFIX가 검출되었으며, 발현된 hFIX-R338L은 TGA 분석에서 트롬빈이 생성되었고 aPTT 응고 시간이 개선되었기 때문에 기능적임이 확인되었다.
인간 알부민 인트론 1: (서열 번호: 1)
gtaagaaatccatttttctattgttcaacttttattctattttcccagtaaaataaagttttagtaaactctgcatctttaaagaattattttggcatttatttctaaaatggcatagtattttgtatttgtgaagtcttacaaggttatcttattaataaaattcaaacatcctaggtaaaaaaaaaaaaaggtcagaattgtttagtgactgtaattttcttttgcgcactaaggaaagtgcaaagtaacttagagtgactgaaacttcacagaatagggttgaagattgaattcataactatcccaaagacctatccattgcactatgctttatttaaaaaccacaaaacctgtgctgttgatctcataaatagaacttgtatttatatttattttcattttagtctgtcttcttggttgctgttgatagacactaaaagagtattagatattatctaagtttgaatataaggctataaatatttaataatttttaaaatagtattcttggtaattgaattattcttctgtttaaaggcagaagaaataattgaacatcatcctgagtttttctgtaggaatcagagcccaatattttgaaacaaatgcataatctaagtcaaatggaaagaaatataaaaagtaacattattacttcttgttttcttcagtatttaacaatccttttttttcttcccttgcccag
표 5. 마우스 알부민 가이드 RNA
Figure pct00040
표 6. 마우스 알부민 sgRNAs 및 변형 패턴
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
표 7. 사이노 알부민 가이드 RNA
Figure pct00045
표 8. 사이노 sgRNA 및 변형 패턴
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
표 9. 벡터 구성성분들 및 서열들
Figure pct00051
5' ITR 서열 (서열 번호: 263):
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT
마우스 알부민 스플라이스 수용체 (제 1 방향) (서열 번호: 264):
TAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAG
인간 인자 IX (R338L), 제 1 방향 (서열 번호: 265):
TTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAA
폴리-A (제 1 방향) (서열 번호: 266):
CCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCC
폴리-A (제 2 방향) (서열 번호: 267):
AAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTG
인간 인자 IX (R338L), 제 2 방향 (서열 번호: 268):
TTAGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAA
마우스 알부민 스플라이스 수용체 (제 2 방향) (서열 번호: 269):
CTGTGGAAACAGGGAGAGAAAAACCACACAACATATTTAAAGATTGATGAAGACAACTAACTGTAATATGCTGCTTTTTGTTCTTCTCTTCACTGACCTA
3' ITR 서열 (서열 번호: 270):
AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
인간 인자 IX 스플라이스 수용체 (제 1 방향) (서열 번호: 271):
GATTATTTGGATTAAAAACAAAGACTTTCTTAAGAGATGTAAAATTTTCATGATGTTTTCTTTTTTGCTAAAACTAAAGAATTATTCTTTTACATTTCAG
인간 인자 IX (R338L)-HiBit (제 1 방향) (서열 번호: 272):
TTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTCTCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTGTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAA
인간 인자 IX (R338L)-HiBit (제 2 방향) (서열 번호: 273):
TTAGGAAATCTTCTTAAACAGCCGCCAGCCGCTCACGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAA
인간 인자 IX 스플라이스 수용체 (제 2 방향) (서열 번호: 274):
CTGAAATGTAAAAGAATAATTCTTTAGTTTTAGCAAAAAAGAAAACATCATGAAAATTTTACATCTCTTAAGAAAGTCTTTGTTTTTAATCCAAATAATC
Nluc-P2A-GFP (제 1 방향) (서열 번호: 275):
TTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCAGTATTCACTTTGGAGGACTTTGTCGGTGACTGGAGGCAAACCGCTGGTTATAATCTCGACCAAGTACTGGAACAGGGCGGGGTAAGTTCCCTCTTTCAGAATTTGGGTGTAAGCGTCACACCAATCCAGCGGATTGTGTTGTCTGGAGAGAACGGACTCAAAATTGACATCCATGTTATCATTCCATATGAAGGTCTCAGTGGAGACCAAATGGGGCAGATCGAGAAGATTTTCAAGGTAGTTTACCCAGTCGACGATCACCACTTCAAAGTCATTCTCCACTATGGCACACTTGTTATCGACGGAGTAACTCCTAATATGATTGATTACTTTGGTCGCCCGTATGAGGGCATCGCAGTGTTTGATGGCAAAAAGATCACCGTAACAGGAACGTTGTGGAATGGGAACAAGATAATCGACGAGAGATTGATAAATCCAGACGGGTCACTCCTGTTCAGGGTTACAATTAACGGCGTCACAGGATGGAGACTCTGTGAACGAATACTGGCCACAAATTTTTCACTCCTGAAGCAGGCCGGAGACGTGGAGGAAAACCCAGGGCCCGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAA
Nluc-P2A-GFP (제 2 방향) (서열 번호: 276):
TTACACCTTCCTCTTCTTCTTGGGGCTGCCGCCGCCCTTGTACAGCTCGTCCATGCCCAGGGTGATGCCGGCGGCGGTCACGAACTCCAGCAGCACCATGTGGTCCCTCTTCTCGTTGGGGTCCTTGCTCAGGGCGCTCTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCACGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCCAGCTGCACGCTGCCGTCCTCGATGTTGTGCCTGATCTTGAAGTTCACCTTGATGCCGTTCTTCTGCTTGTCGGCCATGATGTACACGTTGTGGCTGTTGTAGTTGTACTCCAGCTTGTGGCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCCTTCAGCTCGATCCTGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGCCCTGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTCCTCTCCTGCACGTAGCCCTCGGGCATGGCGCTCTTGAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTACCTGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACCAGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCGTCGCCCTCGCCCTCGCCGCTCACGCTGAACTTGTGGCCGTTCACGTCGCCGTCCAGCTCCACCAGGATGGGCACCACGCCGGTGAACAGCTCCTCGCCCTTGCTCACGGGGCCGGGGTTCTCCTCCACGTCGCCGGCCTGCTTCAGCAGGCTGAAGTTGGTGGCCAGGATCCTCTCGCACAGCCTCCAGCCGGTCACGCCGTTGATGGTCACCCTGAACAGCAGGCTGCCGTCGGGGTTGATCAGCCTCTCGTCGATGATCTTGTTGCCGTTCCACAGGGTGCCGGTCACGGTGATCTTCTTGCCGTCGAACACGGCGATGCCCTCGTAGGGCCTGCCGAAGTAGTCGATCATGTTGGGGGTCACGCCGTCGATCACCAGGGTGCCGTAGTGCAGGATCACCTTGAAGTGGTGGTCGTCCACGGGGTACACCACCTTGAAAATCTTCTCGATCTGGCCCATCTGGTCGCCGCTCAGGCCCTCGTAGGGGATGATCACGTGGATGTCGATCTTCAGGCCGTTCTCGCCGCTCAGCACGATCCTCTGGATGGGGGTCACGCTCACGCCCAGGTTCTGGAACAGGCTGCTCACGCCGCCCTGCTCCAGCACCTGGTCCAGGTTGTAGCCGGCGGTCTGCCTCCAGTCGCCCACGAAGTCCTCCAGGGTGAACACGGCCTCCTCGAAGCTGCACTTCTCCTCCATGCACTCCCTCTCCAGGTTGCCCTGCACGAACTCCTCCAGCTTGCCGCTGTTGTACCTCTTGGGCCTGTTCAGGATCTTGTTGGCGTTCTCGTGGTCCAGGAA
P00147 전체 서열 (ITR로부터 ITR까지): (서열 번호: 277)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTAGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAAAACTGTGGAAACAGGGAGAGAAAAACCACACAACATATTTAAAGATTGATGAAGACAACTAACTGTAATATGCTGCTTTTTGTTCTTCTCTTCACTGACCTAAGAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00411 전체 서열 (ITR로부터 ITR까지): (서열 번호: 278)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTGATTATTTGGATTAAAAACAAAGACTTTCTTAAGAGATGTAAAATTTTCATGATGTTTTCTTTTTTGCTAAAACTAAAGAATTATTCTTTTACATTTCAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTCTCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTGTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTAGGAAATCTTCTTAAACAGCCGCCAGCCGCTCACGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAAAACTGAAATGTAAAAGAATAATTCTTTAGTTTTAGCAAAAAAGAAAACATCATGAAAATTTTACATCTCTTAAGAAAGTCTTTGTTTTTAATCCAAATAATCAGAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00415 전체 서열 (ITR로부터 ITR까지): (서열 번호: 279)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCAGTATTCACTTTGGAGGACTTTGTCGGTGACTGGAGGCAAACCGCTGGTTATAATCTCGACCAAGTACTGGAACAGGGCGGGGTAAGTTCCCTCTTTCAGAATTTGGGTGTAAGCGTCACACCAATCCAGCGGATTGTGTTGTCTGGAGAGAACGGACTCAAAATTGACATCCATGTTATCATTCCATATGAAGGTCTCAGTGGAGACCAAATGGGGCAGATCGAGAAGATTTTCAAGGTAGTTTACCCAGTCGACGATCACCACTTCAAAGTCATTCTCCACTATGGCACACTTGTTATCGACGGAGTAACTCCTAATATGATTGATTACTTTGGTCGCCCGTATGAGGGCATCGCAGTGTTTGATGGCAAAAAGATCACCGTAACAGGAACGTTGTGGAATGGGAACAAGATAATCGACGAGAGATTGATAAATCCAGACGGGTCACTCCTGTTCAGGGTTACAATTAACGGCGTCACAGGATGGAGACTCTGTGAACGAATACTGGCCACAAATTTTTCACTCCTGAAGCAGGCCGGAGACGTGGAGGAAAACCCAGGGCCCGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTACACCTTCCTCTTCTTCTTGGGGCTGCCGCCGCCCTTGTACAGCTCGTCCATGCCCAGGGTGATGCCGGCGGCGGTCACGAACTCCAGCAGCACCATGTGGTCCCTCTTCTCGTTGGGGTCCTTGCTCAGGGCGCTCTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCACGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCCAGCTGCACGCTGCCGTCCTCGATGTTGTGCCTGATCTTGAAGTTCACCTTGATGCCGTTCTTCTGCTTGTCGGCCATGATGTACACGTTGTGGCTGTTGTAGTTGTACTCCAGCTTGTGGCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCCTTCAGCTCGATCCTGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGCCCTGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTCCTCTCCTGCACGTAGCCCTCGGGCATGGCGCTCTTGAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTACCTGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACCAGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCGTCGCCCTCGCCCTCGCCGCTCACGCTGAACTTGTGGCCGTTCACGTCGCCGTCCAGCTCCACCAGGATGGGCACCACGCCGGTGAACAGCTCCTCGCCCTTGCTCACGGGGCCGGGGTTCTCCTCCACGTCGCCGGCCTGCTTCAGCAGGCTGAAGTTGGTGGCCAGGATCCTCTCGCACAGCCTCCAGCCGGTCACGCCGTTGATGGTCACCCTGAACAGCAGGCTGCCGTCGGGGTTGATCAGCCTCTCGTCGATGATCTTGTTGCCGTTCCACAGGGTGCCGGTCACGGTGATCTTCTTGCCGTCGAACACGGCGATGCCCTCGTAGGGCCTGCCGAAGTAGTCGATCATGTTGGGGGTCACGCCGTCGATCACCAGGGTGCCGTAGTGCAGGATCACCTTGAAGTGGTGGTCGTCCACGGGGTACACCACCTTGAAAATCTTCTCGATCTGGCCCATCTGGTCGCCGCTCAGGCCCTCGTAGGGGATGATCACGTGGATGTCGATCTTCAGGCCGTTCTCGCCGCTCAGCACGATCCTCTGGATGGGGGTCACGCTCACGCCCAGGTTCTGGAACAGGCTGCTCACGCCGCCCTGCTCCAGCACCTGGTCCAGGTTGTAGCCGGCGGTCTGCCTCCAGTCGCCCACGAAGTCCTCCAGGGTGAACACGGCCTCCTCGAAGCTGCACTTCTCCTCCATGCACTCCCTCTCCAGGTTGCCCTGCACGAACTCCTCCAGCTTGCCGCTGTTGTACCTCTTGGGCCTGTTCAGGATCTTGTTGGCGTTCTCGTGGTCCAGGAA
P00418 전체 서열 (ITR로부터 ITR까지): (서열 번호: 280)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTCTCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTGTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTAGGAAATCTTCTTAAACAGCCGCCAGCCGCTCACGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAAAACTGTGGAAACAGGGAGAGAAAAACCACACAACATATTTAAAGATTGATGAAGACAACTAACTGTAATATGCTGCTTTTTGTTCTTCTCTTCACTGACCTAAGAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00123 전체 서열 (ITR로부터 ITR까지): (서열 번호: 281)
GGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGGAGGGGTGGAGTCGTGATAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCACTAGTCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGA
P00204 전체 서열 (ITR로부터 ITR까지): (서열 번호: 282)
GGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGGAGGGGTGGAGTCGTGACCTAGGTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTACTAGTCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGA
P00353 전체 서열 (ITR로부터 ITR까지): (서열 번호: 283)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGAATCTCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00354 전체 서열 (ITR로부터 ITR까지): (서열 번호: 284)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGAATCTCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGTACTGAAACCTTATACATGTGAAGTAAGGGGTCTATACTTAAGTCACATCTCCAACCTTAGTAATGTTTTAATGTAGTAAAAAAATGAGTAATTAATTTATTTTTAGAAGGTCAATAGTATCATGTATTCCAAATAACAGAGGTATATGGTTAGAAAAGAAACAATTCAAAGGACTTATATAATATCTAGCCTTGACAATGAATAAATTTAGAGAGTAGTTTGCCTGTTTGCCTCATGTTCATAAATCTATTGACACATATGTGCATCTGCACTTCAGCATGGTAGAAGTCCATATTCAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00350: 300/600bp HA F9 구조체 (G551에 대해) (서열 번호: 285)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTAAGTATATTAGAGCGAGTCTTTCTGCACACAGATCACCTTTCCTATCAACCCCACTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00356: 300/2000bp HA F9 구조체 (G551에 대해) (서열 번호: 286)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTAAGTATATTAGAGCGAGTCTTTCTGCACACAGATCACCTTTCCTATCAACCCCACTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGACAAGAGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGATCCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGTACTGAAACCTTATACATGTGAAGTAAGGGGTCTATACTTAAGTCACATCTCCAACCTTAGTAATGTTTTAATGTAGTAAAAAAATGAGTAATTAATTTATTTTTAGAAGGTCAATAGTATCATGTATTCCAAATAACAGAGGTATATGGTTAGAAAAGAAACAATTCAAAGGACTTATATAATATCTAGCCTTGACAATGAATAAATTTAGAGAGTAGTTTGCCTGTTTGCCTCATGTTCATAAATCTATTGACACATATGTGCATCTGCACTTCAGCATGGTAGAAGTCCATATTCCTTTGCTTGGAAAGGCAGGTGTTCCCATTACGCCTCAGAGAATAGCTGACGGGAAGAGGCTTTCTAGATAGTTGTATGAAAGATATACAAAATCTCGCAGGTATACACAGGCATGATTTGCTGGTTGGGAGAGCCACTTGCCTCATACTGAGGTTTTTGTGTCTGCTTTTCAGAGTCCTGATTGCCTTTTCCCAGTATCTCCAGAAATGCTCATACGATGAGCATGCCAAATTAGTGCAGGAAGTAACAGACTTTGCAAAGACGTGTGTTGCCGATGAGTCTGCCGCCAACTGTGACAAATCCCTTGTGAGTACCTTCTGATTTTGTGGATCTACTTTCCTGCTTTCTGGAACTCTGTTTCAAAGCCAATCATGACTCCATCACTTAAGGCCCCGGGAACACTGTGGCAGAGGGCAGCAGAGAGATTGATAAAGCCAGGGTGATGGGAATTTTCTGTGGGACTCCATTTCATAGTAATTGCAGAAGCTACAATACACTCAAAAAGTCTCACCACATGACTGCCCAAATGGGAGCTTGACAGTGACAGTGACAGTAGATATGCCAAAGTGGATGAGGGAAAGACCACAAGAGCTAAACCCTGTAAAAAGAACTGTAGGCAACTAAGGAATGCAGAGAGAAAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00362: 300/1500bp HA F9 구조체 (G551에 대해) (서열 번호: 287)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTAAGTATATTAGAGCGAGTCTTTCTGCACACAGATCACCTTTCCTATCAACCCCACTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGACAAGAGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGATCCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGTACTGAAACCTTATACATGTGAAGTAAGGGGTCTATACTTAAGTCACATCTCCAACCTTAGTAATGTTTTAATGTAGTAAAAAAATGAGTAATTAATTTATTTTTAGAAGGTCAATAGTATCATGTATTCCAAATAACAGAGGTATATGGTTAGAAAAGAAACAATTCAAAGGACTTATATAATATCTAGCCTTGACAATGAATAAATTTAGAGAGTAGTTTGCCTGTTTGCCTCATGTTCATAAATCTATTGACACATATGTGCATCTGCACTTCAGCATGGTAGAAGTCCATATTCCTTTGCTTGGAAAGGCAGGTGTTCCCATTACGCCTCAGAGAATAGCTGACGGGAAGAGGCTTTCTAGATAGTTGTATGAAAGATATACAAAATCTCGCAGGTATACACAGGCATGATTTGCTGGTTGGGAGAGCCACTTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
P00147에서 인코드된 인자 IX R338L 폴리펩티드 (서열 번호: 702)
YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
Cas9 ORF (서열 번호: 703)
ATGGATAAGAAGTACTCAATCGGGCTGGATATCGGAACTAATTCCGTGGGTTGGGCAGTGATCACGGATGAATACAAAGTGCCGTCCAAGAAGTTCAAGGTCCTGGGGAACACCGATAGACACAGCATCAAGAAAAATCTCATCGGAGCCCTGCTGTTTGACTCCGGCGAAACCGCAGAAGCGACCCGGCTCAAACGTACCGCGAGGCGACGCTACACCCGGCGGAAGAATCGCATCTGCTATCTGCAAGAGATCTTTTCGAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACCGCCTGGAAGAATCTTTCCTGGTGGAGGAGGACAAGAAGCATGAACGGCATCCTATCTTTGGAAACATCGTCGACGAAGTGGCGTACCACGAAAAGTACCCGACCATCTACCATCTGCGGAAGAAGTTGGTTGACTCAACTGACAAGGCCGACCTCAGATTGATCTACTTGGCCCTCGCCCATATGATCAAATTCCGCGGACACTTCCTGATCGAAGGCGATCTGAACCCTGATAACTCCGACGTGGATAAGCTTTTCATTCAACTGGTGCAGACCTACAACCAACTGTTCGAAGAAAACCCAATCAATGCTAGCGGCGTCGATGCCAAGGCCATCCTGTCCGCCCGGCTGTCGAAGTCGCGGCGCCTCGAAAACCTGATCGCACAGCTGCCGGGAGAGAAAAAGAACGGACTTTTCGGCAACTTGATCGCTCTCTCACTGGGACTCACTCCCAATTTCAAGTCCAATTTTGACCTGGCCGAGGACGCGAAGCTGCAACTCTCAAAGGACACCTACGACGACGACTTGGACAATTTGCTGGCACAAATTGGCGATCAGTACGCGGATCTGTTCCTTGCCGCTAAGAACCTTTCGGACGCAATCTTGCTGTCCGATATCCTGCGCGTGAACACCGAAATAACCAAAGCGCCGCTTAGCGCCTCGATGATTAAGCGGTACGACGAGCATCACCAGGATCTCACGCTGCTCAAAGCGCTCGTGAGACAGCAACTGCCTGAAAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAATGGGTACGCAGGGTACATCGATGGAGGCGCTAGCCAGGAAGAGTTCTATAAGTTCATCAAGCCAATCCTGGAAAAGATGGACGGAACCGAAGAACTGCTGGTCAAGCTGAACAGGGAGGATCTGCTCCGGAAACAGAGAACCTTTGACAACGGATCCATTCCCCACCAGATCCATCTGGGTGAGCTGCACGCCATCTTGCGGCGCCAGGAGGACTTTTACCCATTCCTCAAGGACAACCGGGAAAAGATCGAGAAAATTCTGACGTTCCGCATCCCGTATTACGTGGGCCCACTGGCGCGCGGCAATTCGCGCTTCGCGTGGATGACTAGAAAATCAGAGGAAACCATCACTCCTTGGAATTTCGAGGAAGTTGTGGATAAGGGAGCTTCGGCACAAAGCTTCATCGAACGAATGACCAACTTCGACAAGAATCTCCCAAACGAGAAGGTGCTTCCTAAGCACAGCCTCCTTTACGAATACTTCACTGTCTACAACGAACTGACTAAAGTGAAATACGTTACTGAAGGAATGAGGAAGCCGGCCTTTCTGTCCGGAGAACAGAAGAAAGCAATTGTCGATCTGCTGTTCAAGACCAACCGCAAGGTGACCGTCAAGCAGCTTAAAGAGGACTACTTCAAGAAGATCGAGTGTTTCGACTCAGTGGAAATCAGCGGGGTGGAGGACAGATTCAACGCTTCGCTGGGAACCTATCATGATCTCCTGAAGATCATCAAGGACAAGGACTTCCTTGACAACGAGGAGAACGAGGACATCCTGGAAGATATCGTCCTGACCTTGACCCTTTTCGAGGATCGCGAGATGATCGAGGAGAGGCTTAAGACCTACGCTCATCTCTTCGACGATAAGGTCATGAAACAACTCAAGCGCCGCCGGTACACTGGTTGGGGCCGCCTCTCCCGCAAGCTGATCAACGGTATTCGCGATAAACAGAGCGGTAAAACTATCCTGGATTTCCTCAAATCGGATGGCTTCGCTAATCGTAACTTCATGCAATTGATCCACGACGACAGCCTGACCTTTAAGGAGGACATCCAAAAAGCACAAGTGTCCGGACAGGGAGACTCACTCCATGAACACATCGCGAATCTGGCCGGTTCGCCGGCGATTAAGAAGGGAATTCTGCAAACTGTGAAGGTGGTCGACGAGCTGGTGAAGGTCATGGGACGGCACAAACCGGAGAATATCGTGATTGAAATGGCCCGAGAAAACCAGACTACCCAGAAGGGCCAGAAAAACTCCCGCGAAAGGATGAAGCGGATCGAAGAAGGAATCAAGGAGCTGGGCAGCCAGATCCTGAAAGAGCACCCGGTGGAAAACACGCAGCTGCAGAACGAGAAGCTCTACCTGTACTATTTGCAAAATGGACGGGACATGTACGTGGACCAAGAGCTGGACATCAATCGGTTGTCTGATTACGACGTGGACCACATCGTTCCACAGTCCTTTCTGAAGGATGACTCGATCGATAACAAGGTGTTGACTCGCAGCGACAAGAACAGAGGGAAGTCAGATAATGTGCCATCGGAGGAGGTCGTGAAGAAGATGAAGAATTACTGGCGGCAGCTCCTGAATGCGAAGCTGATTACCCAGAGAAAGTTTGACAATCTCACTAAAGCCGAGCGCGGCGGACTCTCAGAGCTGGATAAGGCTGGATTCATCAAACGGCAGCTGGTCGAGACTCGGCAGATTACCAAGCACGTGGCGCAGATCTTGGACTCCCGCATGAACACTAAATACGACGAGAACGATAAGCTCATCCGGGAAGTGAAGGTGATTACCCTGAAAAGCAAACTTGTGTCGGACTTTCGGAAGGACTTTCAGTTTTACAAAGTGAGAGAAATCAACAACTACCATCACGCGCATGACGCATACCTCAACGCTGTGGTCGGTACCGCCCTGATCAAAAAGTACCCTAAACTTGAATCGGAGTTTGTGTACGGAGACTACAAGGTCTACGACGTGAGGAAGATGATAGCCAAGTCCGAACAGGAAATCGGGAAAGCAACTGCGAAATACTTCTTTTACTCAAACATCATGAACTTTTTCAAGACTGAAATTACGCTGGCCAATGGAGAAATCAGGAAGAGGCCACTGATCGAAACTAACGGAGAAACGGGCGAAATCGTGTGGGACAAGGGCAGGGACTTCGCAACTGTTCGCAAAGTGCTCTCTATGCCGCAAGTCAATATTGTGAAGAAAACCGAAGTGCAAACCGGCGGATTTTCAAAGGAATCGATCCTCCCAAAGAGAAATAGCGACAAGCTCATTGCACGCAAGAAAGACTGGGACCCGAAGAAGTACGGAGGATTCGATTCGCCGACTGTCGCATACTCCGTCCTCGTGGTGGCCAAGGTGGAGAAGGGAAAGAGCAAAAAGCTCAAATCCGTCAAAGAGCTGCTGGGGATTACCATCATGGAACGATCCTCGTTCGAGAAGAACCCGATTGATTTCCTCGAGGCGAAGGGTTACAAGGAGGTGAAGAAGGATCTGATCATCAAACTCCCCAAGTACTCACTGTTCGAACTGGAAAATGGTCGGAAGCGCATGCTGGCTTCGGCCGGAGAACTCCAAAAAGGAAATGAGCTGGCCTTGCCTAGCAAGTACGTCAACTTCCTCTATCTTGCTTCGCACTACGAAAAACTCAAAGGGTCACCGGAAGATAACGAACAGAAGCAGCTTTTCGTGGAGCAGCACAAGCATTATCTGGATGAAATCATCGAACAAATCTCCGAGTTTTCAAAGCGCGTGATCCTCGCCGACGCCAACCTCGACAAAGTCCTGTCGGCCTACAATAAGCATAGAGATAAGCCGATCAGAGAACAGGCCGAGAACATTATCCACTTGTTCACCCTGACTAACCTGGGAGCCCCAGCCGCCTTCAAGTACTTCGATACTACTATCGATCGCAAAAGATACACGTCCACCAAGGAAGTTCTGGACGCGACCCTGATCCACCAAAGCATCACTGGACTCTACGAAACTAGGATCGATCTGTCGCAGCTGGGTGGCGAT
U-dep Cas9 ORF (서열 번호: 704)
ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAG
U dep Cas9를 포함하는 mRNA (서열 번호: 705)
GGGUCCCGCAGUCGGCGUCCAGCGGCUCUGCUUGUUCGUGUGUGUGUCGUUGCAGGCCUUAUUCGGAUCCGCCACCAUGGACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCGGAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGUCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUGAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACUGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACAAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACACAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACACUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAAGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACGCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGAAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCAAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAGCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAAUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUCUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGCCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAGCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAAAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGUCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAGAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAAGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAAGGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUCGAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGCAGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUACCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAACAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAUCGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACCUGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGAGAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGCACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACACAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACAGGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGUCUAGCUAGCCAUCACAUUUAAAAGCAUCUCAGCCUACCAUGAGAAUAAGAGAAAGAAAAUGAAGAUCAAUAGCUUAUUCAUCUCUUUUUCUUUUUCGUUGGUGUAAAGCCAACACCCUGUCUAAAAAACAUAAAUUUCUUUAAUCAUUUUGCCUCUUUUCUCUGUGCUUCAAUUAAUAAAAAAUGGAAAGAACCUCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
SEQUENCE LISTING <110> INTELLIA THERAPEUTICS, INC. REGENERON PHARMACEUTICALS, INC. <120> COMPOSITIONS AND METHODS FOR EXPRESSING FACTOR IX <130> 1861884-0002-004-WO1 <140> PCT/US2019/057090 <141> 2019-10-18 <150> 62/840,352 <151> 2019-04-29 <150> 62/829,621 <151> 2019-04-04 <150> 62/829,009 <151> 2019-04-03 <150> 62/747,509 <151> 2018-10-18 <160> 1130 <170> PatentIn version 3.5 <210> 1 <211> 709 <212> DNA <213> Homo sapiens <400> 1 gtaagaaatc catttttcta ttgttcaact tttattctat tttcccagta aaataaagtt 60 ttagtaaact ctgcatcttt aaagaattat tttggcattt atttctaaaa tggcatagta 120 ttttgtattt gtgaagtctt acaaggttat cttattaata aaattcaaac atcctaggta 180 aaaaaaaaaa aaggtcagaa ttgtttagtg actgtaattt tcttttgcgc actaaggaaa 240 gtgcaaagta acttagagtg actgaaactt cacagaatag ggttgaagat tgaattcata 300 actatcccaa agacctatcc attgcactat gctttattta aaaaccacaa aacctgtgct 360 gttgatctca taaatagaac ttgtatttat atttattttc attttagtct gtcttcttgg 420 ttgctgttga tagacactaa aagagtatta gatattatct aagtttgaat ataaggctat 480 aaatatttaa taatttttaa aatagtattc ttggtaattg aattattctt ctgtttaaag 540 gcagaagaaa taattgaaca tcatcctgag tttttctgta ggaatcagag cccaatattt 600 tgaaacaaat gcataatcta agtcaaatgg aaagaaatat aaaaagtaac attattactt 660 cttgttttct tcagtattta acaatccttt tttttcttcc cttgcccag 709 <210> 2 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 2 gagcaaccuc acucuugucu 20 <210> 3 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 3 augcauuugu uucaaaauau 20 <210> 4 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 4 ugcauuuguu ucaaaauauu 20 <210> 5 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 5 auuuaugaga ucaacagcac 20 <210> 6 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 6 gaucaacagc acagguuuug 20 <210> 7 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 7 uuaaauaaag cauagugcaa 20 <210> 8 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 8 uaaagcauag ugcaauggau 20 <210> 9 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 9 uagugcaaug gauaggucuu 20 <210> 10 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 10 uacuaaaacu uuauuuuacu 20 <210> 11 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 11 aaaguugaac aauagaaaaa 20 <210> 12 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 12 aaugcauaau cuaagucaaa 20 <210> 13 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 13 uaauaaaauu caaacauccu 20 <210> 14 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 14 gcaucuuuaa agaauuauuu 20 <210> 15 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 15 uuuggcauuu auuucuaaaa 20 <210> 16 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 16 uguauuugug aagucuuaca 20 <210> 17 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 17 uccuagguaa aaaaaaaaaa 20 <210> 18 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 18 uaauuuucuu uugcgcacua 20 <210> 19 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 19 ugacugaaac uucacagaau 20 <210> 20 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 20 gacugaaacu ucacagaaua 20 <210> 21 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 21 uucauuuuag ucugucuucu 20 <210> 22 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 22 auuaucuaag uuugaauaua 20 <210> 23 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 23 aauuuuuaaa auaguauucu 20 <210> 24 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 24 ugaauuauuc uucuguuuaa 20 <210> 25 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 25 aucauccuga guuuuucugu 20 <210> 26 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 26 uuacuaaaac uuuauuuuac 20 <210> 27 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 27 accuuuuuuu uuuuuuaccu 20 <210> 28 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 28 agugcaaugg auaggucuuu 20 <210> 29 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 29 ugauuccuac agaaaaacuc 20 <210> 30 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 30 ugggcaaggg aagaaaaaaa 20 <210> 31 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 31 ccucacucuu gucugggcaa 20 <210> 32 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 32 accucacucu ugucugggca 20 <210> 33 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 33 ugagcaaccu cacucuuguc 20 <210> 34 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 34 gagcaaccuc acucuugucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 35 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 35 augcauuugu uucaaaauau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 36 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 36 ugcauuuguu ucaaaauauu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 37 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 37 auuuaugaga ucaacagcac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 38 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 38 gaucaacagc acagguuuug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 39 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 39 uuaaauaaag cauagugcaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 40 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 40 uaaagcauag ugcaauggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 41 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 41 uagugcaaug gauaggucuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 42 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 42 uacuaaaacu uuauuuuacu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 43 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 43 aaaguugaac aauagaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 44 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 44 aaugcauaau cuaagucaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 45 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 45 uaauaaaauu caaacauccu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 46 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 46 gcaucuuuaa agaauuauuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 47 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 47 uuuggcauuu auuucuaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 48 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 48 uguauuugug aagucuuaca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 49 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 49 uccuagguaa aaaaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 50 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 50 uaauuuucuu uugcgcacua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 51 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 51 ugacugaaac uucacagaau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 52 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 52 gacugaaacu ucacagaaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 53 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 53 uucauuuuag ucugucuucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 54 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 54 auuaucuaag uuugaauaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 55 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 55 aauuuuuaaa auaguauucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 56 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 56 ugaauuauuc uucuguuuaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 57 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 57 aucauccuga guuuuucugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 58 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 58 uuacuaaaac uuuauuuuac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 59 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 59 accuuuuuuu uuuuuuaccu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 60 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 60 agugcaaugg auaggucuuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 61 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 61 ugauuccuac agaaaaacuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 62 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 62 ugggcaaggg aagaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 63 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 63 ccucacucuu gucugggcaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 64 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 64 accucacucu ugucugggca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 65 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 65 ugagcaaccu cacucuuguc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 66 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 66 gagcaaccuc acucuugucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 67 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 67 augcauuugu uucaaaauau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 68 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 68 ugcauuuguu ucaaaauauu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 69 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 69 auuuaugaga ucaacagcac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 70 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 70 gaucaacagc acagguuuug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 71 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 71 uuaaauaaag cauagugcaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 72 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 72 uaaagcauag ugcaauggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 73 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 73 uagugcaaug gauaggucuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 74 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 74 uacuaaaacu uuauuuuacu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 75 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 75 aaaguugaac aauagaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 76 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 76 aaugcauaau cuaagucaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 77 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 77 uaauaaaauu caaacauccu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 78 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 78 gcaucuuuaa agaauuauuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 79 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 79 uuuggcauuu auuucuaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 80 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 80 uguauuugug aagucuuaca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 81 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 81 uccuagguaa aaaaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 82 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 82 uaauuuucuu uugcgcacua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 83 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 83 ugacugaaac uucacagaau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 84 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 84 gacugaaacu ucacagaaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 85 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 85 uucauuuuag ucugucuucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 86 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 86 auuaucuaag uuugaauaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 87 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 87 aauuuuuaaa auaguauucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 88 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 88 ugaauuauuc uucuguuuaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 89 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 89 aucauccuga guuuuucugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 90 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 90 uuacuaaaac uuuauuuuac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 91 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 91 accuuuuuuu uuuuuuaccu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 92 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 92 agugcaaugg auaggucuuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 93 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 93 ugauuccuac agaaaaacuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 94 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 94 ugggcaaggg aagaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 95 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 95 ccucacucuu gucugggcaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 96 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 96 accucacucu ugucugggca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 97 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 97 ugagcaaccu cacucuuguc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 98 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 98 auuugcaucu gagaacccuu 20 <210> 99 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 99 aucgggaacu ggcaucuuca 20 <210> 100 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 100 guuacaggaa aaucugaagg 20 <210> 101 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 101 gaucgggaac uggcaucuuc 20 <210> 102 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 102 ugcaucugag aacccuuagg 20 <210> 103 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 103 cacucuuguc uguggaaaca 20 <210> 104 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 104 aucguuacag gaaaaucuga 20 <210> 105 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 105 gcaucuucag ggaguagcuu 20 <210> 106 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 106 caaucuuuaa auauguugug 20 <210> 107 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 107 ucacucuugu cuguggaaac 20 <210> 108 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 108 ugcuuguauu uuucuaguaa 20 <210> 109 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 109 guaaauaucu acuaagacaa 20 <210> 110 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 110 uuuuucuagu aauggaagcc 20 <210> 111 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 111 uuauauuauu gauauauuuu 20 <210> 112 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 112 gcacagauau aaacacuuaa 20 <210> 113 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 113 cacagauaua aacacuuaac 20 <210> 114 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 114 gguuuuaaaa auaauaaugu 20 <210> 115 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 115 ucagauuuuc cuguaacgau 20 <210> 116 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 116 cagauuuucc uguaacgauc 20 <210> 117 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 117 caaugguaaa uaagaaauaa 20 <210> 118 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 118 ggaaaaucug aagguggcaa 20 <210> 119 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 119 ggcgaucuca cucuugucug 20 <210> 120 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 120 auuugcaucu gagaacccuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 121 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 121 aucgggaacu ggcaucuuca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 122 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 122 guuacaggaa aaucugaagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 123 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 123 gaucgggaac uggcaucuuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 124 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 124 ugcaucugag aacccuuagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 125 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 125 cacucuuguc uguggaaaca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 126 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 126 aucguuacag gaaaaucuga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 127 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 127 gcaucuucag ggaguagcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 128 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 128 caaucuuuaa auauguugug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 129 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 129 ucacucuugu cuguggaaac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 130 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 130 ugcuuguauu uuucuaguaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 131 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 131 guaaauaucu acuaagacaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 132 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 132 uuuuucuagu aauggaagcc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 133 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 133 uuauauuauu gauauauuuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 134 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 134 gcacagauau aaacacuuaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 135 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 135 cacagauaua aacacuuaac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 136 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 136 gguuuuaaaa auaauaaugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 137 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 137 ucagauuuuc cuguaacgau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 138 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 138 cagauuuucc uguaacgauc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 139 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 139 caaugguaaa uaagaaauaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 140 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 140 ggaaaaucug aagguggcaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 141 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 141 ggcgaucuca cucuugucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 142 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 142 auuugcaucu gagaacccuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 143 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 143 aucgggaacu ggcaucuuca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 144 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 144 guuacaggaa aaucugaagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 145 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 145 gaucgggaac uggcaucuuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 146 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 146 ugcaucugag aacccuuagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 147 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 147 cacucuuguc uguggaaaca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 148 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 148 aucguuacag gaaaaucuga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 149 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 149 gcaucuucag ggaguagcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 150 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 150 caaucuuuaa auauguugug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 151 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 151 ucacucuugu cuguggaaac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 152 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 152 ugcuuguauu uuucuaguaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 153 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 153 guaaauaucu acuaagacaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 154 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 154 uuuuucuagu aauggaagcc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 155 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 155 uuauauuauu gauauauuuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 156 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 156 gcacagauau aaacacuuaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 157 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 157 cacagauaua aacacuuaac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 158 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 158 gguuuuaaaa auaauaaugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 159 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 159 ucagauuuuc cuguaacgau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 160 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 160 cagauuuucc uguaacgauc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 161 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 161 caaugguaaa uaagaaauaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 162 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 162 ggaaaaucug aagguggcaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 163 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 163 ggcgaucuca cucuugucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 164 <400> 164 000 <210> 165 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 165 agcaaccuca cucuugucug 20 <210> 166 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 166 accucacucu ugucugggga 20 <210> 167 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 167 ccucacucuu gucuggggaa 20 <210> 168 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 168 cucacucuug ucuggggaag 20 <210> 169 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 169 ggggaagggg agaaaaaaaa 20 <210> 170 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 170 gggaagggga gaaaaaaaaa 20 <210> 171 <400> 171 000 <210> 172 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 172 ugcauuuguu ucaaaauauu 20 <210> 173 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 173 ugauuccuac agaaaaaguc 20 <210> 174 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 174 uacagaaaaa gucaggauaa 20 <210> 175 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 175 uuucuucugc cuuuaaacag 20 <210> 176 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 176 uuauaguuuu auauucaaac 20 <210> 177 <400> 177 000 <210> 178 <400> 178 000 <210> 179 <400> 179 000 <210> 180 <400> 180 000 <210> 181 <400> 181 000 <210> 182 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 182 agugcaaugg auaggucuua 20 <210> 183 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 183 uuacuuugca cuuuccuuag 20 <210> 184 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 184 uacuuugcac uuuccuuagu 20 <210> 185 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 185 ucugaccuuu uauuuuaccu 20 <210> 186 <400> 186 000 <210> 187 <400> 187 000 <210> 188 <400> 188 000 <210> 189 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 189 auuauccuga cuuuuucugu 20 <210> 190 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 190 ugaauuauuc cucuguuuaa 20 <210> 191 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 191 uaauuuucuu uugcccacua 20 <210> 192 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 192 aaaaggucag aauuguuuag 20 <210> 193 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 193 aacauccuag guaaaauaaa 20 <210> 194 <400> 194 000 <210> 195 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 195 uugucaugua uuucuaaaau 20 <210> 196 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 196 uuugucaugu auuucuaaaa 20 <210> 197 <400> 197 000 <210> 198 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 198 agcaaccuca cucuugucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 199 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 199 accucacucu ugucugggga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 200 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 200 ccucacucuu gucuggggaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 201 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 201 cucacucuug ucuggggaag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 202 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 202 ggggaagggg agaaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 203 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 203 gggaagggga gaaaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 204 <400> 204 000 <210> 205 <400> 205 000 <210> 206 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 206 ugauuccuac agaaaaaguc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 207 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 207 uacagaaaaa gucaggauaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 208 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 208 uuucuucugc cuuuaaacag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 209 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 209 uuauaguuuu auauucaaac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 210 <400> 210 000 <210> 211 <400> 211 000 <210> 212 <400> 212 000 <210> 213 <400> 213 000 <210> 214 <400> 214 000 <210> 215 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 215 agugcaaugg auaggucuua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 216 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 216 uuacuuugca cuuuccuuag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 217 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 217 uacuuugcac uuuccuuagu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 218 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 218 ucugaccuuu uauuuuaccu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 219 <400> 219 000 <210> 220 <400> 220 000 <210> 221 <400> 221 000 <210> 222 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 222 auuauccuga cuuuuucugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 223 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 223 ugaauuauuc cucuguuuaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 224 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 224 uaauuuucuu uugcccacua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 225 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 225 aaaaggucag aauuguuuag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 226 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 226 aacauccuag guaaaauaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 227 <400> 227 000 <210> 228 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 228 uugucaugua uuucuaaaau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 229 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 229 uuugucaugu auuucuaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 230 <400> 230 000 <210> 231 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 231 agcaaccuca cucuugucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 232 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 232 accucacucu ugucugggga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 233 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 233 ccucacucuu gucuggggaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 234 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 234 cucacucuug ucuggggaag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 235 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 235 ggggaagggg agaaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 236 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 236 gggaagggga gaaaaaaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 239 ugauuccuac agaaaaaguc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 240 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 240 uacagaaaaa gucaggauaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 241 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 241 uuucuucugc cuuuaaacag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 242 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 242 uuauaguuuu auauucaaac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 248 agugcaaugg auaggucuua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 249 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 249 uuacuuugca cuuuccuuag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 250 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 250 uacuuugcac uuuccuuagu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 251 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 251 ucugaccuuu uauuuuaccu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 252 <400> 252 000 <210> 253 <400> 253 000 <210> 254 <400> 254 000 <210> 255 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 255 auuauccuga cuuuuucugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 256 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 256 ugaauuauuc cucuguuuaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 257 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 257 uaauuuucuu uugcccacua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 258 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 258 aaaaggucag aauuguuuag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 259 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 259 aacauccuag guaaaauaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 260 <400> 260 000 <210> 261 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 261 uugucaugua uuucuaaaau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 262 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 262 uuugucaugu auuucuaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 263 <211> 145 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 263 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 264 <211> 100 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 264 taggtcagtg aagagaagaa caaaaagcag catattacag ttagttgtct tcatcaatct 60 ttaaatatgt tgtgtggttt ttctctccct gtttccacag 100 <210> 265 <211> 1296 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 265 tttcttgatc atgaaaacgc caacaaaatt ctgaatcggc caaagaggta taattcaggt 60 aaattggaag agtttgttca agggaacctt gagagagaat gtatggaaga aaagtgtagt 120 tttgaagaag cacgagaagt ttttgaaaac actgaaagaa caactgaatt ttggaagcag 180 tatgttgatg gagatcagtg tgagtccaat ccatgtttaa atggcggcag ttgcaaggat 240 gacattaatt cctatgaatg ttggtgtccc tttggatttg aaggaaagaa ctgtgaatta 300 gatgtaacat gtaacattaa gaatggcaga tgcgagcagt tttgtaaaaa tagtgctgat 360 aacaaggtgg tttgctcctg tactgaggga tatcgacttg cagaaaacca gaagtcctgt 420 gaaccagcag tgccatttcc atgtggaaga gtttctgttt cacaaacttc taagctcacc 480 cgtgctgaga ctgtttttcc tgatgtggac tatgtaaatt ctactgaagc tgaaaccatt 540 ttggataaca tcactcaaag cacccaatca tttaatgact tcactcgggt tgttggtgga 600 gaagatgcca aaccaggtca attcccttgg caggttgttt tgaatggtaa agttgatgca 660 ttctgtggag gctctatcgt taatgaaaaa tggattgtaa ctgctgccca ctgtgttgaa 720 actggtgtta aaattacagt tgtcgcaggt gaacataata ttgaggagac agaacataca 780 gagcaaaagc gaaatgtgat tcgaattatt cctcaccaca actacaatgc agctattaat 840 aagtacaacc atgacattgc ccttctggaa ctggacgaac ccttagtgct aaacagctac 900 gttacaccta tttgcattgc tgacaaggaa tacacgaaca tcttcctcaa atttggatct 960 ggctatgtaa gtggctgggg aagagtcttc cacaaaggga gatcagcttt agttcttcag 1020 taccttagag ttccacttgt tgaccgagcc acatgtcttc tatctacaaa gttcaccatc 1080 tataacaaca tgttctgtgc tggcttccat gaaggaggta gagattcatg tcaaggagat 1140 agtgggggac cccatgttac tgaagtggaa gggaccagtt tcttaactgg aattattagc 1200 tggggtgaag agtgtgcaat gaaaggcaaa tatggaatat ataccaaggt atcccggtat 1260 gtcaactgga ttaaggaaaa aacaaagctc acttaa 1296 <210> 266 <211> 276 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 266 cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 60 tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 120 attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 180 aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg gcttctgagg 240 cggaaagaac cagctggggc tctagggggt atcccc 276 <210> 267 <211> 192 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 267 aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 60 taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 120 aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 180 ttatcatgtc tg 192 <210> 268 <211> 1296 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 268 ttaggtgagc ttagtctttt cttttatcca attcacgtag cgagagacct tcgtatagat 60 gccatatttc cccttcatcg cacattcctc cccccaactt attatcccgg tcaagaaact 120 tgttccttcg acttcagtga cgtgtggtcc acctgaatca ccttggcatg agtcgcgacc 180 gccctcgtga aacccagcac aaaacatgtt attgtaaatc gtaaatttcg tggacagaag 240 acaggtcgct ctatcgacca acgggacgcg caaatattgc agaacgaggg ctgatcgacc 300 tttgtggaag acccgccccc acccactcac atatccgctc ccaaatttca agaagatatt 360 tgtatattct ttatcggcta tacaaatcgg ggtaacatag gagttaagta cgagtggctc 420 gtccagctcc aggagggcta tatcatggtt gtacttgttt atagcggcat tataattgtg 480 atggggtatg atcctgataa cattcctttt ctgttcagta tgctcagttt cttcaatgtt 540 gtgttcgcca gccacgaccg taatcttaac ccccgtctcg acacagtgtg cggccgttac 600 aatccacttt tcattgacta tggagccccc acaaaacgcg tcgacttttc cgttgagcac 660 cacctgccat ggaaattggc caggtttagc gtcctcgccc ccgacaaccc tagtaaagtc 720 attaaatgac tgtgtggatt gtgttatatt atcaagaatc gtttcggctt cagtagagtt 780 aacgtagtcc acatcgggaa aaactgtctc ggcccttgtc aactttgatg tctgggacac 840 acttacccga ccgcacggga agggcaccgc cggttcacag ctcttttgat tctcagcgag 900 ccggtagccc tcagtgcaac tacacacaac tttgttgtcg gcggaatttt tacagaattg 960 ctcgcatcgt ccatttttaa tgttgcaggt gacgtccaac tcgcagtttt ttccttcaaa 1020 accaaaaggg caccaacact cgtaggaatt tatatcgtct ttacaactcc ccccattcag 1080 acatggatta gattcgcatt ggtccccatc gacatattgc ttccagaact cagtggtccg 1140 ttctgtattc tcaaacacct cgcgcgcttc ttcaaaactg catttttcct ccatacactc 1200 tcgctccaag ttcccttgca cgaattcttc aagctttcct gagttatacc ttttaggccg 1260 gttaagtatc ttattcgcgt tttcgtggtc cagaaa 1296 <210> 269 <211> 100 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 269 ctgtggaaac agggagagaa aaaccacaca acatatttaa agattgatga agacaactaa 60 ctgtaatatg ctgctttttg ttcttctctt cactgaccta 100 <210> 270 <211> 145 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 270 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 271 <211> 100 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 271 gattatttgg attaaaaaca aagactttct taagagatgt aaaattttca tgatgttttc 60 ttttttgcta aaactaaaga attattcttt tacatttcag 100 <210> 272 <211> 1329 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 272 tttcttgatc atgaaaacgc caacaaaatt ctgaatcggc caaagaggta taattcaggt 60 aaattggaag agtttgttca agggaacctt gagagagaat gtatggaaga aaagtgtagt 120 tttgaagaag cacgagaagt ttttgaaaac actgaaagaa caactgaatt ttggaagcag 180 tatgttgatg gagatcagtg tgagtccaat ccatgtttaa atggcggcag ttgcaaggat 240 gacattaatt cctatgaatg ttggtgtccc tttggatttg aaggaaagaa ctgtgaatta 300 gatgtaacat gtaacattaa gaatggcaga tgcgagcagt tttgtaaaaa tagtgctgat 360 aacaaggtgg tttgctcctg tactgaggga tatcgacttg cagaaaacca gaagtcctgt 420 gaaccagcag tgccatttcc atgtggaaga gtttctgttt cacaaacttc taagctcacc 480 cgtgctgaga ctgtttttcc tgatgtggac tatgtaaatt ctactgaagc tgaaaccatt 540 ttggataaca tcactcaaag cacccaatca tttaatgact tcactcgggt tgttggtgga 600 gaagatgcca aaccaggtca attcccttgg caggttgttt tgaatggtaa agttgatgca 660 ttctgtggag gctctatcgt taatgaaaaa tggattgtaa ctgctgccca ctgtgttgaa 720 actggtgtta aaattacagt tgtcgcaggt gaacataata ttgaggagac agaacataca 780 gagcaaaagc gaaatgtgat tcgaattatt cctcaccaca actacaatgc agctattaat 840 aagtacaacc atgacattgc ccttctggaa ctggacgaac ccttagtgct aaacagctac 900 gttacaccta tttgcattgc tgacaaggaa tacacgaaca tcttcctcaa atttggatct 960 ggctatgtaa gtggctgggg aagagtcttc cacaaaggga gatcagcttt agttcttcag 1020 taccttagag ttccacttgt tgaccgagcc acatgtcttc tatctacaaa gttcaccatc 1080 tataacaaca tgttctgtgc tggcttccat gaaggaggta gagattcatg tcaaggagat 1140 agtgggggac cccatgttac tgaagtggaa gggaccagtt tcttaactgg aattattagc 1200 tggggtgaag agtgtgcaat gaaaggcaaa tatggaatat ataccaaggt ctcccggtat 1260 gtcaactgga ttaaggaaaa aacaaagctc actgtcagcg gatggagact gttcaagaag 1320 atcagctaa 1329 <210> 273 <211> 1329 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 273 ttaggaaatc ttcttaaaca gccgccagcc gctcacggtg agcttagtct tttcttttat 60 ccaattcacg tagcgagaga ccttcgtata gatgccatat ttccccttca tcgcacattc 120 ctccccccaa cttattatcc cggtcaagaa acttgttcct tcgacttcag tgacgtgtgg 180 tccacctgaa tcaccttggc atgagtcgcg accgccctcg tgaaacccag cacaaaacat 240 gttattgtaa atcgtaaatt tcgtggacag aagacaggtc gctctatcga ccaacgggac 300 gcgcaaatat tgcagaacga gggctgatcg acctttgtgg aagacccgcc cccacccact 360 cacatatccg ctcccaaatt tcaagaagat atttgtatat tctttatcgg ctatacaaat 420 cggggtaaca taggagttaa gtacgagtgg ctcgtccagc tccaggaggg ctatatcatg 480 gttgtacttg tttatagcgg cattataatt gtgatggggt atgatcctga taacattcct 540 tttctgttca gtatgctcag tttcttcaat gttgtgttcg ccagccacga ccgtaatctt 600 aacccccgtc tcgacacagt gtgcggccgt tacaatccac ttttcattga ctatggagcc 660 cccacaaaac gcgtcgactt ttccgttgag caccacctgc catggaaatt ggccaggttt 720 agcgtcctcg cccccgacaa ccctagtaaa gtcattaaat gactgtgtgg attgtgttat 780 attatcaaga atcgtttcgg cttcagtaga gttaacgtag tccacatcgg gaaaaactgt 840 ctcggccctt gtcaactttg atgtctggga cacacttacc cgaccgcacg ggaagggcac 900 cgccggttca cagctctttt gattctcagc gagccggtag ccctcagtgc aactacacac 960 aactttgttg tcggcggaat ttttacagaa ttgctcgcat cgtccatttt taatgttgca 1020 ggtgacgtcc aactcgcagt tttttccttc aaaaccaaaa gggcaccaac actcgtagga 1080 atttatatcg tctttacaac tccccccatt cagacatgga ttagattcgc attggtcccc 1140 atcgacatat tgcttccaga actcagtggt ccgttctgta ttctcaaaca cctcgcgcgc 1200 ttcttcaaaa ctgcattttt cctccataca ctctcgctcc aagttccctt gcacgaattc 1260 ttcaagcttt cctgagttat accttttagg ccggttaagt atcttattcg cgttttcgtg 1320 gtccagaaa 1329 <210> 274 <211> 100 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 274 ctgaaatgta aaagaataat tctttagttt tagcaaaaaa gaaaacatca tgaaaatttt 60 acatctctta agaaagtctt tgtttttaat ccaaataatc 100 <210> 275 <211> 1446 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 275 tttcttgatc atgaaaacgc caacaaaatt ctgaatcggc caaagaggta taattcaggt 60 aaattggaag agtttgttca agggaacctt gagagagaat gtatggaaga aaagtgtagt 120 tttgaagaag cagtattcac tttggaggac tttgtcggtg actggaggca aaccgctggt 180 tataatctcg accaagtact ggaacagggc ggggtaagtt ccctctttca gaatttgggt 240 gtaagcgtca caccaatcca gcggattgtg ttgtctggag agaacggact caaaattgac 300 atccatgtta tcattccata tgaaggtctc agtggagacc aaatggggca gatcgagaag 360 attttcaagg tagtttaccc agtcgacgat caccacttca aagtcattct ccactatggc 420 acacttgtta tcgacggagt aactcctaat atgattgatt actttggtcg cccgtatgag 480 ggcatcgcag tgtttgatgg caaaaagatc accgtaacag gaacgttgtg gaatgggaac 540 aagataatcg acgagagatt gataaatcca gacgggtcac tcctgttcag ggttacaatt 600 aacggcgtca caggatggag actctgtgaa cgaatactgg ccacaaattt ttcactcctg 660 aagcaggccg gagacgtgga ggaaaaccca gggcccgtga gcaagggcga ggagctgttc 720 accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 780 gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc 840 accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg 900 cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 960 cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 1020 cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 1080 gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 1140 aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc 1200 cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc 1260 ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc 1320 aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 1380 atcactctcg gcatggacga gctgtacaag ggaggaggaa gcccgaagaa gaagagaaag 1440 gtctaa 1446 <210> 276 <211> 1446 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 276 ttacaccttc ctcttcttct tggggctgcc gccgcccttg tacagctcgt ccatgcccag 60 ggtgatgccg gcggcggtca cgaactccag cagcaccatg tggtccctct tctcgttggg 120 gtccttgctc agggcgctct gggtgctcag gtagtggttg tcgggcagca gcacggggcc 180 gtcgccgatg ggggtgttct gctggtagtg gtcggccagc tgcacgctgc cgtcctcgat 240 gttgtgcctg atcttgaagt tcaccttgat gccgttcttc tgcttgtcgg ccatgatgta 300 cacgttgtgg ctgttgtagt tgtactccag cttgtggccc aggatgttgc cgtcctcctt 360 gaagtcgatg cccttcagct cgatcctgtt caccagggtg tcgccctcga acttcacctc 420 ggccctggtc ttgtagttgc cgtcgtcctt gaagaagatg gtcctctcct gcacgtagcc 480 ctcgggcatg gcgctcttga agaagtcgtg ctgcttcatg tggtcggggt acctgctgaa 540 gcactgcacg ccgtaggtca gggtggtcac cagggtgggc cagggcacgg gcagcttgcc 600 ggtggtgcag atgaacttca gggtcagctt gccgtaggtg gcgtcgccct cgccctcgcc 660 gctcacgctg aacttgtggc cgttcacgtc gccgtccagc tccaccagga tgggcaccac 720 gccggtgaac agctcctcgc ccttgctcac ggggccgggg ttctcctcca cgtcgccggc 780 ctgcttcagc aggctgaagt tggtggccag gatcctctcg cacagcctcc agccggtcac 840 gccgttgatg gtcaccctga acagcaggct gccgtcgggg ttgatcagcc tctcgtcgat 900 gatcttgttg ccgttccaca gggtgccggt cacggtgatc ttcttgccgt cgaacacggc 960 gatgccctcg tagggcctgc cgaagtagtc gatcatgttg ggggtcacgc cgtcgatcac 1020 cagggtgccg tagtgcagga tcaccttgaa gtggtggtcg tccacggggt acaccacctt 1080 gaaaatcttc tcgatctggc ccatctggtc gccgctcagg ccctcgtagg ggatgatcac 1140 gtggatgtcg atcttcaggc cgttctcgcc gctcagcacg atcctctgga tgggggtcac 1200 gctcacgccc aggttctgga acaggctgct cacgccgccc tgctccagca cctggtccag 1260 gttgtagccg gcggtctgcc tccagtcgcc cacgaagtcc tccagggtga acacggcctc 1320 ctcgaagctg cacttctcct ccatgcactc cctctccagg ttgccctgca cgaactcctc 1380 cagcttgccg ctgttgtacc tcttgggcct gttcaggatc ttgttggcgt tctcgtggtc 1440 caggaa 1446 <210> 277 <211> 3570 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 277 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc tcttaggtca gtgaagagaa gaacaaaaag 180 cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc 240 cctgtttcca cagtttttct tgatcatgaa aacgccaaca aaattctgaa tcggccaaag 300 aggtataatt caggtaaatt ggaagagttt gttcaaggga accttgagag agaatgtatg 360 gaagaaaagt gtagttttga agaagcacga gaagtttttg aaaacactga aagaacaact 420 gaattttgga agcagtatgt tgatggagat cagtgtgagt ccaatccatg tttaaatggc 480 ggcagttgca aggatgacat taattcctat gaatgttggt gtccctttgg atttgaagga 540 aagaactgtg aattagatgt aacatgtaac attaagaatg gcagatgcga gcagttttgt 600 aaaaatagtg ctgataacaa ggtggtttgc tcctgtactg agggatatcg acttgcagaa 660 aaccagaagt cctgtgaacc agcagtgcca tttccatgtg gaagagtttc tgtttcacaa 720 acttctaagc tcacccgtgc tgagactgtt tttcctgatg tggactatgt aaattctact 780 gaagctgaaa ccattttgga taacatcact caaagcaccc aatcatttaa tgacttcact 840 cgggttgttg gtggagaaga tgccaaacca ggtcaattcc cttggcaggt tgttttgaat 900 ggtaaagttg atgcattctg tggaggctct atcgttaatg aaaaatggat tgtaactgct 960 gcccactgtg ttgaaactgg tgttaaaatt acagttgtcg caggtgaaca taatattgag 1020 gagacagaac atacagagca aaagcgaaat gtgattcgaa ttattcctca ccacaactac 1080 aatgcagcta ttaataagta caaccatgac attgcccttc tggaactgga cgaaccctta 1140 gtgctaaaca gctacgttac acctatttgc attgctgaca aggaatacac gaacatcttc 1200 ctcaaatttg gatctggcta tgtaagtggc tggggaagag tcttccacaa agggagatca 1260 gctttagttc ttcagtacct tagagttcca cttgttgacc gagccacatg tcttctatct 1320 acaaagttca ccatctataa caacatgttc tgtgctggct tccatgaagg aggtagagat 1380 tcatgtcaag gagatagtgg gggaccccat gttactgaag tggaagggac cagtttctta 1440 actggaatta ttagctgggg tgaagagtgt gcaatgaaag gcaaatatgg aatatatacc 1500 aaggtatccc ggtatgtcaa ctggattaag gaaaaaacaa agctcactta acctcgactg 1560 tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg 1620 aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga 1680 gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg 1740 aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag gcggaaagaa 1800 ccagctgggg ctctaggggg tatccccaaa aaacctccca cacctccccc tgaacctgaa 1860 acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 1920 ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 1980 tggtttgtcc aaactcatca atgtatctta tcatgtctgt taggtgagct tagtcttttc 2040 ttttatccaa ttcacgtagc gagagacctt cgtatagatg ccatatttcc ccttcatcgc 2100 acattcctcc ccccaactta ttatcccggt caagaaactt gttccttcga cttcagtgac 2160 gtgtggtcca cctgaatcac cttggcatga gtcgcgaccg ccctcgtgaa acccagcaca 2220 aaacatgtta ttgtaaatcg taaatttcgt ggacagaaga caggtcgctc tatcgaccaa 2280 cgggacgcgc aaatattgca gaacgagggc tgatcgacct ttgtggaaga cccgccccca 2340 cccactcaca tatccgctcc caaatttcaa gaagatattt gtatattctt tatcggctat 2400 acaaatcggg gtaacatagg agttaagtac gagtggctcg tccagctcca ggagggctat 2460 atcatggttg tacttgttta tagcggcatt ataattgtga tggggtatga tcctgataac 2520 attccttttc tgttcagtat gctcagtttc ttcaatgttg tgttcgccag ccacgaccgt 2580 aatcttaacc cccgtctcga cacagtgtgc ggccgttaca atccactttt cattgactat 2640 ggagccccca caaaacgcgt cgacttttcc gttgagcacc acctgccatg gaaattggcc 2700 aggtttagcg tcctcgcccc cgacaaccct agtaaagtca ttaaatgact gtgtggattg 2760 tgttatatta tcaagaatcg tttcggcttc agtagagtta acgtagtcca catcgggaaa 2820 aactgtctcg gcccttgtca actttgatgt ctgggacaca cttacccgac cgcacgggaa 2880 gggcaccgcc ggttcacagc tcttttgatt ctcagcgagc cggtagccct cagtgcaact 2940 acacacaact ttgttgtcgg cggaattttt acagaattgc tcgcatcgtc catttttaat 3000 gttgcaggtg acgtccaact cgcagttttt tccttcaaaa ccaaaagggc accaacactc 3060 gtaggaattt atatcgtctt tacaactccc cccattcaga catggattag attcgcattg 3120 gtccccatcg acatattgct tccagaactc agtggtccgt tctgtattct caaacacctc 3180 gcgcgcttct tcaaaactgc atttttcctc catacactct cgctccaagt tcccttgcac 3240 gaattcttca agctttcctg agttatacct tttaggccgg ttaagtatct tattcgcgtt 3300 ttcgtggtcc agaaaaactg tggaaacagg gagagaaaaa ccacacaaca tatttaaaga 3360 ttgatgaaga caactaactg taatatgctg ctttttgttc ttctcttcac tgacctaaga 3420 gatctaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 3480 tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag 3540 cgagcgagcg cgcagagagg gagtggccaa 3570 <210> 278 <211> 3636 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 278 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc tctgattatt tggattaaaa acaaagactt 180 tcttaagaga tgtaaaattt tcatgatgtt ttcttttttg ctaaaactaa agaattattc 240 ttttacattt cagtttttct tgatcatgaa aacgccaaca aaattctgaa tcggccaaag 300 aggtataatt caggtaaatt ggaagagttt gttcaaggga accttgagag agaatgtatg 360 gaagaaaagt gtagttttga agaagcacga gaagtttttg aaaacactga aagaacaact 420 gaattttgga agcagtatgt tgatggagat cagtgtgagt ccaatccatg tttaaatggc 480 ggcagttgca aggatgacat taattcctat gaatgttggt gtccctttgg atttgaagga 540 aagaactgtg aattagatgt aacatgtaac attaagaatg gcagatgcga gcagttttgt 600 aaaaatagtg ctgataacaa ggtggtttgc tcctgtactg agggatatcg acttgcagaa 660 aaccagaagt cctgtgaacc agcagtgcca tttccatgtg gaagagtttc tgtttcacaa 720 acttctaagc tcacccgtgc tgagactgtt tttcctgatg tggactatgt aaattctact 780 gaagctgaaa ccattttgga taacatcact caaagcaccc aatcatttaa tgacttcact 840 cgggttgttg gtggagaaga tgccaaacca ggtcaattcc cttggcaggt tgttttgaat 900 ggtaaagttg atgcattctg tggaggctct atcgttaatg aaaaatggat tgtaactgct 960 gcccactgtg ttgaaactgg tgttaaaatt acagttgtcg caggtgaaca taatattgag 1020 gagacagaac atacagagca aaagcgaaat gtgattcgaa ttattcctca ccacaactac 1080 aatgcagcta ttaataagta caaccatgac attgcccttc tggaactgga cgaaccctta 1140 gtgctaaaca gctacgttac acctatttgc attgctgaca aggaatacac gaacatcttc 1200 ctcaaatttg gatctggcta tgtaagtggc tggggaagag tcttccacaa agggagatca 1260 gctttagttc ttcagtacct tagagttcca cttgttgacc gagccacatg tcttctatct 1320 acaaagttca ccatctataa caacatgttc tgtgctggct tccatgaagg aggtagagat 1380 tcatgtcaag gagatagtgg gggaccccat gttactgaag tggaagggac cagtttctta 1440 actggaatta ttagctgggg tgaagagtgt gcaatgaaag gcaaatatgg aatatatacc 1500 aaggtctccc ggtatgtcaa ctggattaag gaaaaaacaa agctcactgt cagcggatgg 1560 agactgttca agaagatcag ctaacctcga ctgtgccttc tagttgccag ccatctgttg 1620 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 1680 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 1740 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 1800 cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg gggtatcccc 1860 aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 1920 taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 1980 aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 2040 ttatcatgtc tgttaggaaa tcttcttaaa cagccgccag ccgctcacgg tgagcttagt 2100 cttttctttt atccaattca cgtagcgaga gaccttcgta tagatgccat atttcccctt 2160 catcgcacat tcctcccccc aacttattat cccggtcaag aaacttgttc cttcgacttc 2220 agtgacgtgt ggtccacctg aatcaccttg gcatgagtcg cgaccgccct cgtgaaaccc 2280 agcacaaaac atgttattgt aaatcgtaaa tttcgtggac agaagacagg tcgctctatc 2340 gaccaacggg acgcgcaaat attgcagaac gagggctgat cgacctttgt ggaagacccg 2400 cccccaccca ctcacatatc cgctcccaaa tttcaagaag atatttgtat attctttatc 2460 ggctatacaa atcggggtaa cataggagtt aagtacgagt ggctcgtcca gctccaggag 2520 ggctatatca tggttgtact tgtttatagc ggcattataa ttgtgatggg gtatgatcct 2580 gataacattc cttttctgtt cagtatgctc agtttcttca atgttgtgtt cgccagccac 2640 gaccgtaatc ttaacccccg tctcgacaca gtgtgcggcc gttacaatcc acttttcatt 2700 gactatggag cccccacaaa acgcgtcgac ttttccgttg agcaccacct gccatggaaa 2760 ttggccaggt ttagcgtcct cgcccccgac aaccctagta aagtcattaa atgactgtgt 2820 ggattgtgtt atattatcaa gaatcgtttc ggcttcagta gagttaacgt agtccacatc 2880 gggaaaaact gtctcggccc ttgtcaactt tgatgtctgg gacacactta cccgaccgca 2940 cgggaagggc accgccggtt cacagctctt ttgattctca gcgagccggt agccctcagt 3000 gcaactacac acaactttgt tgtcggcgga atttttacag aattgctcgc atcgtccatt 3060 tttaatgttg caggtgacgt ccaactcgca gttttttcct tcaaaaccaa aagggcacca 3120 acactcgtag gaatttatat cgtctttaca actcccccca ttcagacatg gattagattc 3180 gcattggtcc ccatcgacat attgcttcca gaactcagtg gtccgttctg tattctcaaa 3240 cacctcgcgc gcttcttcaa aactgcattt ttcctccata cactctcgct ccaagttccc 3300 ttgcacgaat tcttcaagct ttcctgagtt atacctttta ggccggttaa gtatcttatt 3360 cgcgttttcg tggtccagaa aaactgaaat gtaaaagaat aattctttag ttttagcaaa 3420 aaagaaaaca tcatgaaaat tttacatctc ttaagaaagt ctttgttttt aatccaaata 3480 atcagagatc taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 3540 gctcactgag gccgcccggg caaagcccgg gcgtcgggcg acctttggtc gcccggcctc 3600 agtgagcgag cgagcgcgca gagagggagt ggccaa 3636 <210> 279 <211> 3615 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 279 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc tcttaggtca gtgaagagaa gaacaaaaag 180 cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc 240 cctgtttcca cagtttttct tgatcatgaa aacgccaaca aaattctgaa tcggccaaag 300 aggtataatt caggtaaatt ggaagagttt gttcaaggga accttgagag agaatgtatg 360 gaagaaaagt gtagttttga agaagcagta ttcactttgg aggactttgt cggtgactgg 420 aggcaaaccg ctggttataa tctcgaccaa gtactggaac agggcggggt aagttccctc 480 tttcagaatt tgggtgtaag cgtcacacca atccagcgga ttgtgttgtc tggagagaac 540 ggactcaaaa ttgacatcca tgttatcatt ccatatgaag gtctcagtgg agaccaaatg 600 gggcagatcg agaagatttt caaggtagtt tacccagtcg acgatcacca cttcaaagtc 660 attctccact atggcacact tgttatcgac ggagtaactc ctaatatgat tgattacttt 720 ggtcgcccgt atgagggcat cgcagtgttt gatggcaaaa agatcaccgt aacaggaacg 780 ttgtggaatg ggaacaagat aatcgacgag agattgataa atccagacgg gtcactcctg 840 ttcagggtta caattaacgg cgtcacagga tggagactct gtgaacgaat actggccaca 900 aatttttcac tcctgaagca ggccggagac gtggaggaaa acccagggcc cgtgagcaag 960 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 1020 ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 1080 ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 1140 ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 1200 ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 1260 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 1320 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 1380 aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg 1440 aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag 1500 cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc 1560 cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 1620 gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagggagg aggaagcccg 1680 aagaagaaga gaaaggtcta acctcgactg tgccttctag ttgccagcca tctgttgttt 1740 gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 1800 aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 1860 tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg 1920 tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg tatccccaaa 1980 aaacctccca cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa 2040 cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa 2100 taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta 2160 tcatgtctgt tacaccttcc tcttcttctt ggggctgccg ccgcccttgt acagctcgtc 2220 catgcccagg gtgatgccgg cggcggtcac gaactccagc agcaccatgt ggtccctctt 2280 ctcgttgggg tccttgctca gggcgctctg ggtgctcagg tagtggttgt cgggcagcag 2340 cacggggccg tcgccgatgg gggtgttctg ctggtagtgg tcggccagct gcacgctgcc 2400 gtcctcgatg ttgtgcctga tcttgaagtt caccttgatg ccgttcttct gcttgtcggc 2460 catgatgtac acgttgtggc tgttgtagtt gtactccagc ttgtggccca ggatgttgcc 2520 gtcctccttg aagtcgatgc ccttcagctc gatcctgttc accagggtgt cgccctcgaa 2580 cttcacctcg gccctggtct tgtagttgcc gtcgtccttg aagaagatgg tcctctcctg 2640 cacgtagccc tcgggcatgg cgctcttgaa gaagtcgtgc tgcttcatgt ggtcggggta 2700 cctgctgaag cactgcacgc cgtaggtcag ggtggtcacc agggtgggcc agggcacggg 2760 cagcttgccg gtggtgcaga tgaacttcag ggtcagcttg ccgtaggtgg cgtcgccctc 2820 gccctcgccg ctcacgctga acttgtggcc gttcacgtcg ccgtccagct ccaccaggat 2880 gggcaccacg ccggtgaaca gctcctcgcc cttgctcacg gggccggggt tctcctccac 2940 gtcgccggcc tgcttcagca ggctgaagtt ggtggccagg atcctctcgc acagcctcca 3000 gccggtcacg ccgttgatgg tcaccctgaa cagcaggctg ccgtcggggt tgatcagcct 3060 ctcgtcgatg atcttgttgc cgttccacag ggtgccggtc acggtgatct tcttgccgtc 3120 gaacacggcg atgccctcgt agggcctgcc gaagtagtcg atcatgttgg gggtcacgcc 3180 gtcgatcacc agggtgccgt agtgcaggat caccttgaag tggtggtcgt ccacggggta 3240 caccaccttg aaaatcttct cgatctggcc catctggtcg ccgctcaggc cctcgtaggg 3300 gatgatcacg tggatgtcga tcttcaggcc gttctcgccg ctcagcacga tcctctggat 3360 gggggtcacg ctcacgccca ggttctggaa caggctgctc acgccgccct gctccagcac 3420 ctggtccagg ttgtagccgg cggtctgcct ccagtcgccc acgaagtcct ccagggtgaa 3480 cacggcctcc tcgaagctgc acttctcctc catgcactcc ctctccaggt tgccctgcac 3540 gaactcctcc agcttgccgc tgttgtacct cttgggcctg ttcaggatct tgttggcgtt 3600 ctcgtggtcc aggaa 3615 <210> 280 <211> 3636 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 280 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc tcttaggtca gtgaagagaa gaacaaaaag 180 cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc 240 cctgtttcca cagtttttct tgatcatgaa aacgccaaca aaattctgaa tcggccaaag 300 aggtataatt caggtaaatt ggaagagttt gttcaaggga accttgagag agaatgtatg 360 gaagaaaagt gtagttttga agaagcacga gaagtttttg aaaacactga aagaacaact 420 gaattttgga agcagtatgt tgatggagat cagtgtgagt ccaatccatg tttaaatggc 480 ggcagttgca aggatgacat taattcctat gaatgttggt gtccctttgg atttgaagga 540 aagaactgtg aattagatgt aacatgtaac attaagaatg gcagatgcga gcagttttgt 600 aaaaatagtg ctgataacaa ggtggtttgc tcctgtactg agggatatcg acttgcagaa 660 aaccagaagt cctgtgaacc agcagtgcca tttccatgtg gaagagtttc tgtttcacaa 720 acttctaagc tcacccgtgc tgagactgtt tttcctgatg tggactatgt aaattctact 780 gaagctgaaa ccattttgga taacatcact caaagcaccc aatcatttaa tgacttcact 840 cgggttgttg gtggagaaga tgccaaacca ggtcaattcc cttggcaggt tgttttgaat 900 ggtaaagttg atgcattctg tggaggctct atcgttaatg aaaaatggat tgtaactgct 960 gcccactgtg ttgaaactgg tgttaaaatt acagttgtcg caggtgaaca taatattgag 1020 gagacagaac atacagagca aaagcgaaat gtgattcgaa ttattcctca ccacaactac 1080 aatgcagcta ttaataagta caaccatgac attgcccttc tggaactgga cgaaccctta 1140 gtgctaaaca gctacgttac acctatttgc attgctgaca aggaatacac gaacatcttc 1200 ctcaaatttg gatctggcta tgtaagtggc tggggaagag tcttccacaa agggagatca 1260 gctttagttc ttcagtacct tagagttcca cttgttgacc gagccacatg tcttctatct 1320 acaaagttca ccatctataa caacatgttc tgtgctggct tccatgaagg aggtagagat 1380 tcatgtcaag gagatagtgg gggaccccat gttactgaag tggaagggac cagtttctta 1440 actggaatta ttagctgggg tgaagagtgt gcaatgaaag gcaaatatgg aatatatacc 1500 aaggtctccc ggtatgtcaa ctggattaag gaaaaaacaa agctcactgt cagcggatgg 1560 agactgttca agaagatcag ctaacctcga ctgtgccttc tagttgccag ccatctgttg 1620 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 1680 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 1740 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 1800 cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg gggtatcccc 1860 aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 1920 taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 1980 aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 2040 ttatcatgtc tgttaggaaa tcttcttaaa cagccgccag ccgctcacgg tgagcttagt 2100 cttttctttt atccaattca cgtagcgaga gaccttcgta tagatgccat atttcccctt 2160 catcgcacat tcctcccccc aacttattat cccggtcaag aaacttgttc cttcgacttc 2220 agtgacgtgt ggtccacctg aatcaccttg gcatgagtcg cgaccgccct cgtgaaaccc 2280 agcacaaaac atgttattgt aaatcgtaaa tttcgtggac agaagacagg tcgctctatc 2340 gaccaacggg acgcgcaaat attgcagaac gagggctgat cgacctttgt ggaagacccg 2400 cccccaccca ctcacatatc cgctcccaaa tttcaagaag atatttgtat attctttatc 2460 ggctatacaa atcggggtaa cataggagtt aagtacgagt ggctcgtcca gctccaggag 2520 ggctatatca tggttgtact tgtttatagc ggcattataa ttgtgatggg gtatgatcct 2580 gataacattc cttttctgtt cagtatgctc agtttcttca atgttgtgtt cgccagccac 2640 gaccgtaatc ttaacccccg tctcgacaca gtgtgcggcc gttacaatcc acttttcatt 2700 gactatggag cccccacaaa acgcgtcgac ttttccgttg agcaccacct gccatggaaa 2760 ttggccaggt ttagcgtcct cgcccccgac aaccctagta aagtcattaa atgactgtgt 2820 ggattgtgtt atattatcaa gaatcgtttc ggcttcagta gagttaacgt agtccacatc 2880 gggaaaaact gtctcggccc ttgtcaactt tgatgtctgg gacacactta cccgaccgca 2940 cgggaagggc accgccggtt cacagctctt ttgattctca gcgagccggt agccctcagt 3000 gcaactacac acaactttgt tgtcggcgga atttttacag aattgctcgc atcgtccatt 3060 tttaatgttg caggtgacgt ccaactcgca gttttttcct tcaaaaccaa aagggcacca 3120 acactcgtag gaatttatat cgtctttaca actcccccca ttcagacatg gattagattc 3180 gcattggtcc ccatcgacat attgcttcca gaactcagtg gtccgttctg tattctcaaa 3240 cacctcgcgc gcttcttcaa aactgcattt ttcctccata cactctcgct ccaagttccc 3300 ttgcacgaat tcttcaagct ttcctgagtt atacctttta ggccggttaa gtatcttatt 3360 cgcgttttcg tggtccagaa aaactgtgga aacagggaga gaaaaaccac acaacatatt 3420 taaagattga tgaagacaac taactgtaat atgctgcttt ttgttcttct cttcactgac 3480 ctaagagatc taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 3540 gctcactgag gccgcccggg caaagcccgg gcgtcgggcg acctttggtc gcccggcctc 3600 agtgagcgag cgagcgcgca gagagggagt ggccaa 3636 <210> 281 <211> 1954 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 281 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 60 acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc 120 caactccatc actaggggtt cctggagggg tggagtcgtg ataggtcagt gaagagaaga 180 acaaaaagca gcatattaca gttagttgtc ttcatcaatc tttaaatatg ttgtgtggtt 240 tttctctccc tgtttccaca gtttttcttg atcatgaaaa cgccaacaaa attctgaatc 300 ggccaaagag gtataattca ggtaaattgg aagagtttgt tcaagggaac cttgagagag 360 aatgtatgga agaaaagtgt agttttgaag aagcacgaga agtttttgaa aacactgaaa 420 gaacaactga attttggaag cagtatgttg atggagatca gtgtgagtcc aatccatgtt 480 taaatggcgg cagttgcaag gatgacatta attcctatga atgttggtgt ccctttggat 540 ttgaaggaaa gaactgtgaa ttagatgtaa catgtaacat taagaatggc agatgcgagc 600 agttttgtaa aaatagtgct gataacaagg tggtttgctc ctgtactgag ggatatcgac 660 ttgcagaaaa ccagaagtcc tgtgaaccag cagtgccatt tccatgtgga agagtttctg 720 tttcacaaac ttctaagctc acccgtgctg agactgtttt tcctgatgtg gactatgtaa 780 attctactga agctgaaacc attttggata acatcactca aagcacccaa tcatttaatg 840 acttcactcg ggttgttggt ggagaagatg ccaaaccagg tcaattccct tggcaggttg 900 ttttgaatgg taaagttgat gcattctgtg gaggctctat cgttaatgaa aaatggattg 960 taactgctgc ccactgtgtt gaaactggtg ttaaaattac agttgtcgca ggtgaacata 1020 atattgagga gacagaacat acagagcaaa agcgaaatgt gattcgaatt attcctcacc 1080 acaactacaa tgcagctatt aataagtaca accatgacat tgcccttctg gaactggacg 1140 aacccttagt gctaaacagc tacgttacac ctatttgcat tgctgacaag gaatacacga 1200 acatcttcct caaatttgga tctggctatg taagtggctg gggaagagtc ttccacaaag 1260 ggagatcagc tttagttctt cagtacctta gagttccact tgttgaccga gccacatgtc 1320 ttctatctac aaagttcacc atctataaca acatgttctg tgctggcttc catgaaggag 1380 gtagagattc atgtcaagga gatagtgggg gaccccatgt tactgaagtg gaagggacca 1440 gtttcttaac tggaattatt agctggggtg aagagtgtgc aatgaaaggc aaatatggaa 1500 tatataccaa ggtatcccgg tatgtcaact ggattaagga aaaaacaaag ctcacttaac 1560 ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 1620 gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 1680 ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 1740 ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 1800 ggaaagaacc agctggggct ctagggggta tccccactag tccactccct ctctgcgcgc 1860 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 1920 ggcctcagtg agcgagcgag cgcgcagaga ggga 1954 <210> 282 <211> 2359 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 282 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 60 acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc 120 caactccatc actaggggtt cctggagggg tggagtcgtg acctaggtcg tctccggctc 180 tgctttttcc aggggtgtgt ttcgccgaga agcacgtaag agttttatgt tttttcatct 240 ctgcttgtat ttttctagta atggaagcct ggtattttaa aatagttaaa ttttccttta 300 gtgctgattt ctagattatt attactgttg ttgttgttat tattgtcatt atttgcatct 360 gagaactagg tcagtgaaga gaagaacaaa aagcagcata ttacagttag ttgtcttcat 420 caatctttaa atatgttgtg tggtttttct ctccctgttt ccacagtttt tcttgatcat 480 gaaaacgcca acaaaattct gaatcggcca aagaggtata attcaggtaa attggaagag 540 tttgttcaag ggaaccttga gagagaatgt atggaagaaa agtgtagttt tgaagaagca 600 cgagaagttt ttgaaaacac tgaaagaaca actgaatttt ggaagcagta tgttgatgga 660 gatcagtgtg agtccaatcc atgtttaaat ggcggcagtt gcaaggatga cattaattcc 720 tatgaatgtt ggtgtccctt tggatttgaa ggaaagaact gtgaattaga tgtaacatgt 780 aacattaaga atggcagatg cgagcagttt tgtaaaaata gtgctgataa caaggtggtt 840 tgctcctgta ctgagggata tcgacttgca gaaaaccaga agtcctgtga accagcagtg 900 ccatttccat gtggaagagt ttctgtttca caaacttcta agctcacccg tgctgagact 960 gtttttcctg atgtggacta tgtaaattct actgaagctg aaaccatttt ggataacatc 1020 actcaaagca cccaatcatt taatgacttc actcgggttg ttggtggaga agatgccaaa 1080 ccaggtcaat tcccttggca ggttgttttg aatggtaaag ttgatgcatt ctgtggaggc 1140 tctatcgtta atgaaaaatg gattgtaact gctgcccact gtgttgaaac tggtgttaaa 1200 attacagttg tcgcaggtga acataatatt gaggagacag aacatacaga gcaaaagcga 1260 aatgtgattc gaattattcc tcaccacaac tacaatgcag ctattaataa gtacaaccat 1320 gacattgccc ttctggaact ggacgaaccc ttagtgctaa acagctacgt tacacctatt 1380 tgcattgctg acaaggaata cacgaacatc ttcctcaaat ttggatctgg ctatgtaagt 1440 ggctggggaa gagtcttcca caaagggaga tcagctttag ttcttcagta ccttagagtt 1500 ccacttgttg accgagccac atgtcttcta tctacaaagt tcaccatcta taacaacatg 1560 ttctgtgctg gcttccatga aggaggtaga gattcatgtc aaggagatag tgggggaccc 1620 catgttactg aagtggaagg gaccagtttc ttaactggaa ttattagctg gggtgaagag 1680 tgtgcaatga aaggcaaata tggaatatat accaaggtat cccggtatgt caactggatt 1740 aaggaaaaaa caaagctcac ttaacctcga ctgtgccttc tagttgccag ccatctgttg 1800 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 1860 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 1920 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 1980 cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg gggtatcccc 2040 cttaggtggt tatattattg atatattttt ggtatctttg atgacaataa tgggggattt 2100 tgaaagctta gctttaaatt tcttttaatt aaaaaaaaat gctaggcaga atgactcaaa 2160 ttacgttgga tacagttgaa tttattacgg tctcataggg cctgcctgct cgaccatgct 2220 atactaaaaa ttaaaagtgt actagtccac tccctctctg cgcgctcgct cgctcactga 2280 ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 2340 gcgagcgcgc agagaggga 2359 <210> 283 <211> 2925 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 283 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc tgattttgaa agcttagctt taaatttctt 180 ttaattaaaa aaaaatgcta ggcagaatga ctcaaattac gttggataca gttgaattta 240 ttacggtctc atagggcctg cctgctcgac catgctatac taaaaattaa aagtgtgtgt 300 tactaatttt ataaatggag tttccattta tatttacctt tatttcttat ttaccattgt 360 cttagtagat atttacaaac atgacagaaa cactaaatct tgagtttgaa tgcacagata 420 taaacactta acgggtttta aaaataataa tgttggtgaa aaaatataac tttgagtgta 480 gcagagagga accattgcca ccttcagatt ttcctgtaac gatcgggaac tggcatcttc 540 agggagtagc ttaggtcagt gaagagaaga acaaaaagca gcatattaca gttagttgtc 600 ttcatcaatc tttaaatatg ttgtgtggtt tttctctccc tgtttccaca gtttttcttg 660 atcatgaaaa cgccaacaaa attctgaatc ggccaaagag gtttcttgat catgaaaacg 720 ccaacaaaat tctgaatcgg ccaaagaggt ataattcagg taaattggaa gagtttgttc 780 aagggaacct tgagagagaa tgtatggaag aaaagtgtag ttttgaagaa gcacgagaag 840 tttttgaaaa cactgaaaga acaactgaat tttggaagca gtatgttgat ggagatcagt 900 gtgagtccaa tccatgttta aatggcggca gttgcaagga tgacattaat tcctatgaat 960 gttggtgtcc ctttggattt gaaggaaaga actgtgaatt agatgtaaca tgtaacatta 1020 agaatggcag atgcgagcag ttttgtaaaa atagtgctga taacaaggtg gtttgctcct 1080 gtactgaggg atatcgactt gcagaaaacc agaagtcctg tgaaccagca gtgccatttc 1140 catgtggaag agtttctgtt tcacaaactt ctaagctcac ccgtgctgag actgtttttc 1200 ctgatgtgga ctatgtaaat tctactgaag ctgaaaccat tttggataac atcactcaaa 1260 gcacccaatc atttaatgac ttcactcggg ttgttggtgg agaagatgcc aaaccaggtc 1320 aattcccttg gcaggttgtt ttgaatggta aagttgatgc attctgtgga ggctctatcg 1380 ttaatgaaaa atggattgta actgctgccc actgtgttga aactggtgtt aaaattacag 1440 ttgtcgcagg tgaacataat attgaggaga cagaacatac agagcaaaag cgaaatgtga 1500 ttcgaattat tcctcaccac aactacaatg cagctattaa taagtacaac catgacattg 1560 cccttctgga actggacgaa cccttagtgc taaacagcta cgttacacct atttgcattg 1620 ctgacaagga atacacgaac atcttcctca aatttggatc tggctatgta agtggctggg 1680 gaagagtctt ccacaaaggg agatcagctt tagttcttca gtaccttaga gttccacttg 1740 ttgaccgagc cacatgtctt ctatctacaa agttcaccat ctataacaac atgttctgtg 1800 ctggcttcca tgaaggaggt agagattcat gtcaaggaga tagtggggga ccccatgtta 1860 ctgaagtgga agggaccagt ttcttaactg gaattattag ctggggtgaa gagtgtgcaa 1920 tgaaaggcaa atatggaata tataccaagg tatcccggta tgtcaactgg attaaggaaa 1980 aaacaaagct cacttaacct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 2040 ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 2100 tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 2160 gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 2220 ctctatggct tctgaggcgg aaagaaccag ctggggctct agggggtatc cccgtgagat 2280 cgcccatcgg tataatgatt tgggagaaca acatttcaaa ggcctgtaag ttataatgct 2340 gaaagcccac ttaatatttc tggtagtatt agttaaagtt ttaaaacacc tttttccacc 2400 ttgagtgtga gaattgtaga gcagtgctgt ccagtagaaa tgtgtgcatt gacagaaaga 2460 ctgtggatct gtgctgagca atgtggcagc cagagatcac aaggctatca agcactttgc 2520 acatggcaag tgtaactgag aagcacacat tcaaataata gttaatttta attgaatgta 2580 tctagccatg tgtggctagt agctcctttc ctggagagag aatctggagc ccacatctaa 2640 cttgttaagt ctggaatctt attttttatt tctggaaagg tctatgaact atagttttgg 2700 gggcagctca cttactaact tttaatgcaa taagaatctc atggtatctt gagaacatta 2760 ttttgtctct ttgtagatct aggaacccct agtgatggag ttggccactc cctctctgcg 2820 cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg 2880 cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaa 2925 <210> 284 <211> 3477 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 284 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc ttagcctctg gcaaaatgaa gtgggtaacc 180 tttctcctcc tcctcttcgt ctccggctct gctttttcca ggggtgtgtt tcgccgagaa 240 gcacgtaaga gttttatgtt ttttcatctc tgcttgtatt tttctagtaa tggaagcctg 300 gtattttaaa atagttaaat tttcctttag tgctgatttc tagattatta ttactgttgt 360 tgttgttatt attgtcatta tttgcatctg agaaccctta ggtggttata ttattgatat 420 atttttggta tctttgatga caataatggg ggattttgaa agcttagctt taaatttctt 480 ttaattaaaa aaaaatgcta ggcagaatga ctcaaattac gttggataca gttgaattta 540 ttacggtctc atagggcctg cctgctcgac catgctatac taaaaattaa aagtgtgtgt 600 tactaatttt ataaatggag tttccattta tatttacctt tatttcttat ttaccattgt 660 cttagtagat atttacaaac atgacagaaa cactaaatct tgagtttgaa tgcacagata 720 taaacactta acgggtttta aaaataataa tgttggtgaa aaaatataac tttgagtgta 780 gcagagagga accattgcca ccttcagatt ttcctgtaac gatcgggaac tggcatcttc 840 agggagtagc ttaggtcagt gaagagaaga acaaaaagca gcatattaca gttagttgtc 900 ttcatcaatc tttaaatatg ttgtgtggtt tttctctccc tgtttccaca gtttttcttg 960 atcatgaaaa cgccaacaaa attctgaatc ggccaaagag gtataattca ggtaaattgg 1020 aagagtttgt tcaagggaac cttgagagag aatgtatgga agaaaagtgt agttttgaag 1080 aagcacgaga agtttttgaa aacactgaaa gaacaactga attttggaag cagtatgttg 1140 atggagatca gtgtgagtcc aatccatgtt taaatggcgg cagttgcaag gatgacatta 1200 attcctatga atgttggtgt ccctttggat ttgaaggaaa gaactgtgaa ttagatgtaa 1260 catgtaacat taagaatggc agatgcgagc agttttgtaa aaatagtgct gataacaagg 1320 tggtttgctc ctgtactgag ggatatcgac ttgcagaaaa ccagaagtcc tgtgaaccag 1380 cagtgccatt tccatgtgga agagtttctg tttcacaaac ttctaagctc acccgtgctg 1440 agactgtttt tcctgatgtg gactatgtaa attctactga agctgaaacc attttggata 1500 acatcactca aagcacccaa tcatttaatg acttcactcg ggttgttggt ggagaagatg 1560 ccaaaccagg tcaattccct tggcaggttg ttttgaatgg taaagttgat gcattctgtg 1620 gaggctctat cgttaatgaa aaatggattg taactgctgc ccactgtgtt gaaactggtg 1680 ttaaaattac agttgtcgca ggtgaacata atattgagga gacagaacat acagagcaaa 1740 agcgaaatgt gattcgaatt attcctcacc acaactacaa tgcagctatt aataagtaca 1800 accatgacat tgcccttctg gaactggacg aacccttagt gctaaacagc tacgttacac 1860 ctatttgcat tgctgacaag gaatacacga acatcttcct caaatttgga tctggctatg 1920 taagtggctg gggaagagtc ttccacaaag ggagatcagc tttagttctt cagtacctta 1980 gagttccact tgttgaccga gccacatgtc ttctatctac aaagttcacc atctataaca 2040 acatgttctg tgctggcttc catgaaggag gtagagattc atgtcaagga gatagtgggg 2100 gaccccatgt tactgaagtg gaagggacca gtttcttaac tggaattatt agctggggtg 2160 aagagtgtgc aatgaaaggc aaatatggaa tatataccaa ggtatcccgg tatgtcaact 2220 ggattaagga aaaaacaaag ctcacttaac ctcgactgtg ccttctagtt gccagccatc 2280 tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 2340 ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 2400 gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg 2460 ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc agctggggct ctagggggta 2520 tccccgtgag atcgcccatc ggtataatga tttgggagaa caacatttca aaggcctgta 2580 agttataatg ctgaaagccc acttaatatt tctggtagta ttagttaaag ttttaaaaca 2640 cctttttcca ccttgagtgt gagaattgta gagcagtgct gtccagtaga aatgtgtgca 2700 ttgacagaaa gactgtggat ctgtgctgag caatgtggca gccagagatc acaaggctat 2760 caagcacttt gcacatggca agtgtaactg agaagcacac attcaaataa tagttaattt 2820 taattgaatg tatctagcca tgtgtggcta gtagctcctt tcctggagag agaatctgga 2880 gcccacatct aacttgttaa gtctggaatc ttatttttta tttctggaaa ggtctatgaa 2940 ctatagtttt gggggcagct cacttactaa cttttaatgc aataagaatc tcatggtatc 3000 ttgagaacat tattttgtct ctttgtagta ctgaaacctt atacatgtga agtaaggggt 3060 ctatacttaa gtcacatctc caaccttagt aatgttttaa tgtagtaaaa aaatgagtaa 3120 ttaatttatt tttagaaggt caatagtatc atgtattcca aataacagag gtatatggtt 3180 agaaaagaaa caattcaaag gacttatata atatctagcc ttgacaatga ataaatttag 3240 agagtagttt gcctgtttgc ctcatgttca taaatctatt gacacatatg tgcatctgca 3300 cttcagcatg gtagaagtcc atattcagat ctaggaaccc ctagtgatgg agttggccac 3360 tccctctctg cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc 3420 gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaa 3477 <210> 285 <211> 2476 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 285 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc taagtatatt agagcgagtc tttctgcaca 180 cagatcacct ttcctatcaa ccccactagc ctctggcaaa atgaagtggg taacctttct 240 cctcctcctc ttcgtctccg gctctgcttt ttccaggggt gtgtttcgcc gagaagcacg 300 taagagtttt atgttttttc atctctgctt gtatttttct agtaatggaa gcctggtatt 360 ttaaaatagt taaattttcc tttagtgctg atttctagat tattattact gttgttgttg 420 ttattattgt cattatttgc atctgagaac ctttttcttg atcatgaaaa cgccaacaaa 480 attctgaatc ggccaaagag gtataattca ggtaaattgg aagagtttgt tcaagggaac 540 cttgagagag aatgtatgga agaaaagtgt agttttgaag aagcacgaga agtttttgaa 600 aacactgaaa gaacaactga attttggaag cagtatgttg atggagatca gtgtgagtcc 660 aatccatgtt taaatggcgg cagttgcaag gatgacatta attcctatga atgttggtgt 720 ccctttggat ttgaaggaaa gaactgtgaa ttagatgtaa catgtaacat taagaatggc 780 agatgcgagc agttttgtaa aaatagtgct gataacaagg tggtttgctc ctgtactgag 840 ggatatcgac ttgcagaaaa ccagaagtcc tgtgaaccag cagtgccatt tccatgtgga 900 agagtttctg tttcacaaac ttctaagctc acccgtgctg agactgtttt tcctgatgtg 960 gactatgtaa attctactga agctgaaacc attttggata acatcactca aagcacccaa 1020 tcatttaatg acttcactcg ggttgttggt ggagaagatg ccaaaccagg tcaattccct 1080 tggcaggttg ttttgaatgg taaagttgat gcattctgtg gaggctctat cgttaatgaa 1140 aaatggattg taactgctgc ccactgtgtt gaaactggtg ttaaaattac agttgtcgca 1200 ggtgaacata atattgagga gacagaacat acagagcaaa agcgaaatgt gattcgaatt 1260 attcctcacc acaactacaa tgcagctatt aataagtaca accatgacat tgcccttctg 1320 gaactggacg aacccttagt gctaaacagc tacgttacac ctatttgcat tgctgacaag 1380 gaatacacga acatcttcct caaatttgga tctggctatg taagtggctg gggaagagtc 1440 ttccacaaag ggagatcagc tttagttctt cagtacctta gagttccact tgttgaccga 1500 gccacatgtc ttctatctac aaagttcacc atctataaca acatgttctg tgctggcttc 1560 catgaaggag gtagagattc atgtcaagga gatagtgggg gaccccatgt tactgaagtg 1620 gaagggacca gtttcttaac tggaattatt agctggggtg aagagtgtgc aatgaaaggc 1680 aaatatggaa tatataccaa ggtatcccgg tatgtcaact ggattaagga aaaaacaaag 1740 ctcacttaac ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 1800 tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 1860 ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 1920 gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 1980 cttctgaggc ggaaagaacc agctggggct ctagggggta tcccccttag gtggttatat 2040 tattgatata tttttggtat ctttgatgac aataatgggg gattttgaaa gcttagcttt 2100 aaatttcttt taattaaaaa aaaatgctag gcagaatgac tcaaattacg ttggatacag 2160 ttgaatttat tacggtctca tagggcctgc ctgctcgacc atgctatact aaaaattaaa 2220 agtgtgtgtt actaatttta taaatggagt ttccatttat atttaccttt atttcttatt 2280 taccattgtc ttagtagata tttacaaaca tgacagaaac actaaagatc taggaacccc 2340 tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgcccggg 2400 caaagcccgg gcgtcgggcg acctttggtc gcccggcctc agtgagcgag cgagcgcgca 2460 gagagggagt ggccaa 2476 <210> 286 <211> 4175 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 286 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc taagtatatt agagcgagtc tttctgcaca 180 cagatcacct ttcctatcaa ccccactagc ctctggcaaa atgaagtggg taacctttct 240 cctcctcctc ttcgtctccg gctctgcttt ttccaggggt gtgtttcgcc gagaagcacg 300 taagagtttt atgttttttc atctctgctt gtatttttct agtaatggaa gcctggtatt 360 ttaaaatagt taaattttcc tttagtgctg atttctagat tattattact gttgttgttg 420 ttattattgt cattatttgc atctgagaac ctttttcttg atcatgaaaa cgccaacaaa 480 attctgaatc ggccaaagag gtataattca ggtaaattgg aagagtttgt tcaagggaac 540 cttgagagag aatgtatgga agaaaagtgt agttttgaag aagcacgaga agtttttgaa 600 aacactgaaa gaacaactga attttggaag cagtatgttg atggagatca gtgtgagtcc 660 aatccatgtt taaatggcgg cagttgcaag gatgacatta attcctatga atgttggtgt 720 ccctttggat ttgaaggaaa gaactgtgaa ttagatgtaa catgtaacat taagaatggc 780 agatgcgagc agttttgtaa aaatagtgct gataacaagg tggtttgctc ctgtactgag 840 ggatatcgac ttgcagaaaa ccagaagtcc tgtgaaccag cagtgccatt tccatgtgga 900 agagtttctg tttcacaaac ttctaagctc acccgtgctg agactgtttt tcctgatgtg 960 gactatgtaa attctactga agctgaaacc attttggata acatcactca aagcacccaa 1020 tcatttaatg acttcactcg ggttgttggt ggagaagatg ccaaaccagg tcaattccct 1080 tggcaggttg ttttgaatgg taaagttgat gcattctgtg gaggctctat cgttaatgaa 1140 aaatggattg taactgctgc ccactgtgtt gaaactggtg ttaaaattac agttgtcgca 1200 ggtgaacata atattgagga gacagaacat acagagcaaa agcgaaatgt gattcgaatt 1260 attcctcacc acaactacaa tgcagctatt aataagtaca accatgacat tgcccttctg 1320 gaactggacg aacccttagt gctaaacagc tacgttacac ctatttgcat tgctgacaag 1380 gaatacacga acatcttcct caaatttgga tctggctatg taagtggctg gggaagagtc 1440 ttccacaaag ggagatcagc tttagttctt cagtacctta gagttccact tgttgaccga 1500 gccacatgtc ttctatctac aaagttcacc atctataaca acatgttctg tgctggcttc 1560 catgaaggag gtagagattc atgtcaagga gatagtgggg gaccccatgt tactgaagtg 1620 gaagggacca gtttcttaac tggaattatt agctggggtg aagagtgtgc aatgaaaggc 1680 aaatatggaa tatataccaa ggtatcccgg tatgtcaact ggattaagga aaaaacaaag 1740 ctcacttaac ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 1800 tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 1860 ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 1920 gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 1980 cttctgaggc ggaaagaacc agctggggct ctagggggta tcccccttag gtggttatat 2040 tattgatata tttttggtat ctttgatgac aataatgggg gattttgaaa gcttagcttt 2100 aaatttcttt taattaaaaa aaaatgctag gcagaatgac tcaaattacg ttggatacag 2160 ttgaatttat tacggtctca tagggcctgc ctgctcgacc atgctatact aaaaattaaa 2220 agtgtgtgtt actaatttta taaatggagt ttccatttat atttaccttt atttcttatt 2280 taccattgtc ttagtagata tttacaaaca tgacagaaac actaaatctt gagtttgaat 2340 gcacagatat aaacacttaa cgggttttaa aaataataat gttggtgaaa aaatataact 2400 ttgagtgtag cagagaggaa ccattgccac cttcagattt tcctgtaacg atcgggaact 2460 ggcatcttca gggagtagct taggtcagtg aagagaagaa caaaaagcag catattacag 2520 ttagttgtct tcatcaatct ttaaatatgt tgtgtggttt ttctctccct gtttccacag 2580 acaagagtga gatcgcccat cggtataatg atttgggaga acaacatttc aaaggcctgt 2640 aagttataat gctgaaagcc cacttaatat ttctggtagt attagttaaa gttttaaaac 2700 acctttttcc accttgagtg tgagaattgt agagcagtgc tgtccagtag aaatgtgtgc 2760 attgacagaa agactgtgga tctgtgctga gcaatgtggc agccagagat cacaaggcta 2820 tcaagcactt tgcacatggc aagtgtaact gagaagcaca cattcaaata atagttaatt 2880 ttaattgaat gtatctagcc atgtgtggct agtagctcct ttcctggaga gagaatctgg 2940 agcccacatc taacttgtta agtctggaat cttatttttt atttctggaa aggtctatga 3000 actatagttt tgggggcagc tcacttacta acttttaatg caataagatc catggtatct 3060 tgagaacatt attttgtctc tttgtagtac tgaaacctta tacatgtgaa gtaaggggtc 3120 tatacttaag tcacatctcc aaccttagta atgttttaat gtagtaaaaa aatgagtaat 3180 taatttattt ttagaaggtc aatagtatca tgtattccaa ataacagagg tatatggtta 3240 gaaaagaaac aattcaaagg acttatataa tatctagcct tgacaatgaa taaatttaga 3300 gagtagtttg cctgtttgcc tcatgttcat aaatctattg acacatatgt gcatctgcac 3360 ttcagcatgg tagaagtcca tattcctttg cttggaaagg caggtgttcc cattacgcct 3420 cagagaatag ctgacgggaa gaggctttct agatagttgt atgaaagata tacaaaatct 3480 cgcaggtata cacaggcatg atttgctggt tgggagagcc acttgcctca tactgaggtt 3540 tttgtgtctg cttttcagag tcctgattgc cttttcccag tatctccaga aatgctcata 3600 cgatgagcat gccaaattag tgcaggaagt aacagacttt gcaaagacgt gtgttgccga 3660 tgagtctgcc gccaactgtg acaaatccct tgtgagtacc ttctgatttt gtggatctac 3720 tttcctgctt tctggaactc tgtttcaaag ccaatcatga ctccatcact taaggccccg 3780 ggaacactgt ggcagagggc agcagagaga ttgataaagc cagggtgatg ggaattttct 3840 gtgggactcc atttcatagt aattgcagaa gctacaatac actcaaaaag tctcaccaca 3900 tgactgccca aatgggagct tgacagtgac agtgacagta gatatgccaa agtggatgag 3960 ggaaagacca caagagctaa accctgtaaa aagaactgta ggcaactaag gaatgcagag 4020 agaaagatct aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 4080 ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 4140 gtgagcgagc gagcgcgcag agagggagtg gccaa 4175 <210> 287 <211> 3675 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 287 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctagatc taagtatatt agagcgagtc tttctgcaca 180 cagatcacct ttcctatcaa ccccactagc ctctggcaaa atgaagtggg taacctttct 240 cctcctcctc ttcgtctccg gctctgcttt ttccaggggt gtgtttcgcc gagaagcacg 300 taagagtttt atgttttttc atctctgctt gtatttttct agtaatggaa gcctggtatt 360 ttaaaatagt taaattttcc tttagtgctg atttctagat tattattact gttgttgttg 420 ttattattgt cattatttgc atctgagaac ctttttcttg atcatgaaaa cgccaacaaa 480 attctgaatc ggccaaagag gtataattca ggtaaattgg aagagtttgt tcaagggaac 540 cttgagagag aatgtatgga agaaaagtgt agttttgaag aagcacgaga agtttttgaa 600 aacactgaaa gaacaactga attttggaag cagtatgttg atggagatca gtgtgagtcc 660 aatccatgtt taaatggcgg cagttgcaag gatgacatta attcctatga atgttggtgt 720 ccctttggat ttgaaggaaa gaactgtgaa ttagatgtaa catgtaacat taagaatggc 780 agatgcgagc agttttgtaa aaatagtgct gataacaagg tggtttgctc ctgtactgag 840 ggatatcgac ttgcagaaaa ccagaagtcc tgtgaaccag cagtgccatt tccatgtgga 900 agagtttctg tttcacaaac ttctaagctc acccgtgctg agactgtttt tcctgatgtg 960 gactatgtaa attctactga agctgaaacc attttggata acatcactca aagcacccaa 1020 tcatttaatg acttcactcg ggttgttggt ggagaagatg ccaaaccagg tcaattccct 1080 tggcaggttg ttttgaatgg taaagttgat gcattctgtg gaggctctat cgttaatgaa 1140 aaatggattg taactgctgc ccactgtgtt gaaactggtg ttaaaattac agttgtcgca 1200 ggtgaacata atattgagga gacagaacat acagagcaaa agcgaaatgt gattcgaatt 1260 attcctcacc acaactacaa tgcagctatt aataagtaca accatgacat tgcccttctg 1320 gaactggacg aacccttagt gctaaacagc tacgttacac ctatttgcat tgctgacaag 1380 gaatacacga acatcttcct caaatttgga tctggctatg taagtggctg gggaagagtc 1440 ttccacaaag ggagatcagc tttagttctt cagtacctta gagttccact tgttgaccga 1500 gccacatgtc ttctatctac aaagttcacc atctataaca acatgttctg tgctggcttc 1560 catgaaggag gtagagattc atgtcaagga gatagtgggg gaccccatgt tactgaagtg 1620 gaagggacca gtttcttaac tggaattatt agctggggtg aagagtgtgc aatgaaaggc 1680 aaatatggaa tatataccaa ggtatcccgg tatgtcaact ggattaagga aaaaacaaag 1740 ctcacttaac ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 1800 tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 1860 ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 1920 gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 1980 cttctgaggc ggaaagaacc agctggggct ctagggggta tcccccttag gtggttatat 2040 tattgatata tttttggtat ctttgatgac aataatgggg gattttgaaa gcttagcttt 2100 aaatttcttt taattaaaaa aaaatgctag gcagaatgac tcaaattacg ttggatacag 2160 ttgaatttat tacggtctca tagggcctgc ctgctcgacc atgctatact aaaaattaaa 2220 agtgtgtgtt actaatttta taaatggagt ttccatttat atttaccttt atttcttatt 2280 taccattgtc ttagtagata tttacaaaca tgacagaaac actaaatctt gagtttgaat 2340 gcacagatat aaacacttaa cgggttttaa aaataataat gttggtgaaa aaatataact 2400 ttgagtgtag cagagaggaa ccattgccac cttcagattt tcctgtaacg atcgggaact 2460 ggcatcttca gggagtagct taggtcagtg aagagaagaa caaaaagcag catattacag 2520 ttagttgtct tcatcaatct ttaaatatgt tgtgtggttt ttctctccct gtttccacag 2580 acaagagtga gatcgcccat cggtataatg atttgggaga acaacatttc aaaggcctgt 2640 aagttataat gctgaaagcc cacttaatat ttctggtagt attagttaaa gttttaaaac 2700 acctttttcc accttgagtg tgagaattgt agagcagtgc tgtccagtag aaatgtgtgc 2760 attgacagaa agactgtgga tctgtgctga gcaatgtggc agccagagat cacaaggcta 2820 tcaagcactt tgcacatggc aagtgtaact gagaagcaca cattcaaata atagttaatt 2880 ttaattgaat gtatctagcc atgtgtggct agtagctcct ttcctggaga gagaatctgg 2940 agcccacatc taacttgtta agtctggaat cttatttttt atttctggaa aggtctatga 3000 actatagttt tgggggcagc tcacttacta acttttaatg caataagatc catggtatct 3060 tgagaacatt attttgtctc tttgtagtac tgaaacctta tacatgtgaa gtaaggggtc 3120 tatacttaag tcacatctcc aaccttagta atgttttaat gtagtaaaaa aatgagtaat 3180 taatttattt ttagaaggtc aatagtatca tgtattccaa ataacagagg tatatggtta 3240 gaaaagaaac aattcaaagg acttatataa tatctagcct tgacaatgaa taaatttaga 3300 gagtagtttg cctgtttgcc tcatgttcat aaatctattg acacatatgt gcatctgcac 3360 ttcagcatgg tagaagtcca tattcctttg cttggaaagg caggtgttcc cattacgcct 3420 cagagaatag ctgacgggaa gaggctttct agatagttgt atgaaagata tacaaaatct 3480 cgcaggtata cacaggcatg atttgctggt tgggagagcc acttagatct aggaacccct 3540 agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc 3600 aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag 3660 agagggagtg gccaa 3675 <210> 288 <400> 288 000 <210> 289 <400> 289 000 <210> 290 <400> 290 000 <210> 291 <400> 291 000 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <400> 300 nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 301 <400> 301 000 <210> 302 <400> 302 000 <210> 303 <400> 303 000 <210> 304 <400> 304 000 <210> 305 <400> 305 000 <210> 306 <400> 306 000 <210> 307 <400> 307 000 <210> 308 <400> 308 000 <210> 309 <400> 309 000 <210> 310 <400> 310 000 <210> 311 <400> 311 000 <210> 312 <400> 312 000 <210> 313 <400> 313 000 <210> 314 <400> 314 000 <210> 315 <400> 315 000 <210> 316 <400> 316 000 <210> 317 <400> 317 000 <210> 318 <400> 318 000 <210> 319 <400> 319 000 <210> 320 <400> 320 000 <210> 321 <400> 321 000 <210> 322 <400> 322 000 <210> 323 <400> 323 000 <210> 324 <400> 324 000 <210> 325 <400> 325 000 <210> 326 <400> 326 000 <210> 327 <400> 327 000 <210> 328 <400> 328 000 <210> 329 <400> 329 000 <210> 330 <400> 330 000 <210> 331 <400> 331 000 <210> 332 <400> 332 000 <210> 333 <400> 333 000 <210> 334 <400> 334 000 <210> 335 <400> 335 000 <210> 336 <400> 336 000 <210> 337 <400> 337 000 <210> 338 <400> 338 000 <210> 339 <400> 339 000 <210> 340 <400> 340 000 <210> 341 <400> 341 000 <210> 342 <400> 342 000 <210> 343 <400> 343 000 <210> 344 <400> 344 000 <210> 345 <400> 345 000 <210> 346 <400> 346 000 <210> 347 <400> 347 000 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <400> 369 000 <210> 370 <400> 370 000 <210> 371 <400> 371 000 <210> 372 <400> 372 000 <210> 373 <400> 373 000 <210> 374 <400> 374 000 <210> 375 <400> 375 000 <210> 376 <400> 376 000 <210> 377 <400> 377 000 <210> 378 <400> 378 000 <210> 379 <400> 379 000 <210> 380 <400> 380 000 <210> 381 <400> 381 000 <210> 382 <400> 382 000 <210> 383 <400> 383 000 <210> 384 <400> 384 000 <210> 385 <400> 385 000 <210> 386 <400> 386 000 <210> 387 <400> 387 000 <210> 388 <400> 388 000 <210> 389 <400> 389 000 <210> 390 <400> 390 000 <210> 391 <400> 391 000 <210> 392 <400> 392 000 <210> 393 <400> 393 000 <210> 394 <400> 394 000 <210> 395 <400> 395 000 <210> 396 <400> 396 000 <210> 397 <400> 397 000 <210> 398 <400> 398 000 <210> 399 <400> 399 000 <210> 400 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 400 guuuuagagc uaugcuguuu ug 22 <210> 401 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 401 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugcuuuu 80 <210> 402 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 402 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugc 76 <210> 403 <400> 403 000 <210> 404 <400> 404 000 <210> 405 <400> 405 000 <210> 406 <400> 406 000 <210> 407 <400> 407 000 <210> 408 <400> 408 000 <210> 409 <400> 409 000 <210> 410 <400> 410 000 <210> 411 <400> 411 000 <210> 412 <400> 412 000 <210> 413 <400> 413 000 <210> 414 <400> 414 000 <210> 415 <400> 415 000 <210> 416 <400> 416 000 <210> 417 <400> 417 000 <210> 418 <400> 418 000 <210> 419 <400> 419 000 <210> 420 <400> 420 000 <210> 421 <400> 421 000 <210> 422 <400> 422 000 <210> 423 <400> 423 000 <210> 424 <400> 424 000 <210> 425 <400> 425 000 <210> 426 <400> 426 000 <210> 427 <400> 427 000 <210> 428 <400> 428 000 <210> 429 <400> 429 000 <210> 430 <400> 430 000 <210> 431 <400> 431 000 <210> 432 <400> 432 000 <210> 433 <400> 433 000 <210> 434 <400> 434 000 <210> 435 <400> 435 000 <210> 436 <400> 436 000 <210> 437 <400> 437 000 <210> 438 <400> 438 000 <210> 439 <400> 439 000 <210> 440 <400> 440 000 <210> 441 <400> 441 000 <210> 442 <400> 442 000 <210> 443 <400> 443 000 <210> 444 <400> 444 000 <210> 445 <400> 445 000 <210> 446 <400> 446 000 <210> 447 <400> 447 000 <210> 448 <400> 448 000 <210> 449 <400> 449 000 <210> 450 <400> 450 000 <210> 451 <400> 451 000 <210> 452 <400> 452 000 <210> 453 <400> 453 000 <210> 454 <400> 454 000 <210> 455 <400> 455 000 <210> 456 <400> 456 000 <210> 457 <400> 457 000 <210> 458 <400> 458 000 <210> 459 <400> 459 000 <210> 460 <400> 460 000 <210> 461 <400> 461 000 <210> 462 <400> 462 000 <210> 463 <400> 463 000 <210> 464 <400> 464 000 <210> 465 <400> 465 000 <210> 466 <400> 466 000 <210> 467 <400> 467 000 <210> 468 <400> 468 000 <210> 469 <400> 469 000 <210> 470 <400> 470 000 <210> 471 <400> 471 000 <210> 472 <400> 472 000 <210> 473 <400> 473 000 <210> 474 <400> 474 000 <210> 475 <400> 475 000 <210> 476 <400> 476 000 <210> 477 <400> 477 000 <210> 478 <400> 478 000 <210> 479 <400> 479 000 <210> 480 <400> 480 000 <210> 481 <400> 481 000 <210> 482 <400> 482 000 <210> 483 <400> 483 000 <210> 484 <400> 484 000 <210> 485 <400> 485 000 <210> 486 <400> 486 000 <210> 487 <400> 487 000 <210> 488 <400> 488 000 <210> 489 <400> 489 000 <210> 490 <400> 490 000 <210> 491 <400> 491 000 <210> 492 <400> 492 000 <210> 493 <400> 493 000 <210> 494 <400> 494 000 <210> 495 <400> 495 000 <210> 496 <400> 496 000 <210> 497 <400> 497 000 <210> 498 <400> 498 000 <210> 499 <400> 499 000 <210> 500 <211> 9 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 500 ctggaccga 9 <210> 501 <211> 9 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 501 tcggtccag 9 <210> 502 <211> 9 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 502 tcggtccag 9 <210> 503 <400> 503 000 <210> 504 <400> 504 000 <210> 505 <400> 505 000 <210> 506 <400> 506 000 <210> 507 <400> 507 000 <210> 508 <400> 508 000 <210> 509 <400> 509 000 <210> 510 <400> 510 000 <210> 511 <400> 511 000 <210> 512 <400> 512 000 <210> 513 <400> 513 000 <210> 514 <400> 514 000 <210> 515 <400> 515 000 <210> 516 <400> 516 000 <210> 517 <400> 517 000 <210> 518 <400> 518 000 <210> 519 <400> 519 000 <210> 520 <400> 520 000 <210> 521 <400> 521 000 <210> 522 <400> 522 000 <210> 523 <400> 523 000 <210> 524 <400> 524 000 <210> 525 <400> 525 000 <210> 526 <400> 526 000 <210> 527 <400> 527 000 <210> 528 <400> 528 000 <210> 529 <400> 529 000 <210> 530 <400> 530 000 <210> 531 <400> 531 000 <210> 532 <400> 532 000 <210> 533 <400> 533 000 <210> 534 <400> 534 000 <210> 535 <400> 535 000 <210> 536 <400> 536 000 <210> 537 <400> 537 000 <210> 538 <400> 538 000 <210> 539 <400> 539 000 <210> 540 <400> 540 000 <210> 541 <400> 541 000 <210> 542 <400> 542 000 <210> 543 <400> 543 000 <210> 544 <400> 544 000 <210> 545 <400> 545 000 <210> 546 <400> 546 000 <210> 547 <400> 547 000 <210> 548 <400> 548 000 <210> 549 <400> 549 000 <210> 550 <400> 550 000 <210> 551 <400> 551 000 <210> 552 <400> 552 000 <210> 553 <400> 553 000 <210> 554 <400> 554 000 <210> 555 <400> 555 000 <210> 556 <400> 556 000 <210> 557 <400> 557 000 <210> 558 <400> 558 000 <210> 559 <400> 559 000 <210> 560 <400> 560 000 <210> 561 <400> 561 000 <210> 562 <400> 562 000 <210> 563 <400> 563 000 <210> 564 <400> 564 000 <210> 565 <400> 565 000 <210> 566 <400> 566 000 <210> 567 <400> 567 000 <210> 568 <400> 568 000 <210> 569 <400> 569 000 <210> 570 <400> 570 000 <210> 571 <400> 571 000 <210> 572 <400> 572 000 <210> 573 <400> 573 000 <210> 574 <400> 574 000 <210> 575 <400> 575 000 <210> 576 <400> 576 000 <210> 577 <400> 577 000 <210> 578 <400> 578 000 <210> 579 <400> 579 000 <210> 580 <400> 580 000 <210> 581 <400> 581 000 <210> 582 <400> 582 000 <210> 583 <400> 583 000 <210> 584 <400> 584 000 <210> 585 <400> 585 000 <210> 586 <400> 586 000 <210> 587 <400> 587 000 <210> 588 <400> 588 000 <210> 589 <400> 589 000 <210> 590 <400> 590 000 <210> 591 <400> 591 000 <210> 592 <400> 592 000 <210> 593 <400> 593 000 <210> 594 <400> 594 000 <210> 595 <400> 595 000 <210> 596 <400> 596 000 <210> 597 <400> 597 000 <210> 598 <400> 598 000 <210> 599 <400> 599 000 <210> 600 <211> 7 <212> PRT <213> Simian virus 40 <400> 600 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 601 <211> 7 <212> PRT <213> Simian virus 40 <400> 601 Pro Lys Lys Lys Arg Arg Val 1 5 <210> 602 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Nucleoplasmin bipartite NLS sequence" <400> 602 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 603 <400> 603 000 <210> 604 <400> 604 000 <210> 605 <400> 605 000 <210> 606 <400> 606 000 <210> 607 <400> 607 000 <210> 608 <400> 608 000 <210> 609 <400> 609 000 <210> 610 <400> 610 000 <210> 611 <400> 611 000 <210> 612 <400> 612 000 <210> 613 <400> 613 000 <210> 614 <400> 614 000 <210> 615 <400> 615 000 <210> 616 <400> 616 000 <210> 617 <400> 617 000 <210> 618 <400> 618 000 <210> 619 <400> 619 000 <210> 620 <400> 620 000 <210> 621 <400> 621 000 <210> 622 <400> 622 000 <210> 623 <400> 623 000 <210> 624 <400> 624 000 <210> 625 <400> 625 000 <210> 626 <400> 626 000 <210> 627 <400> 627 000 <210> 628 <400> 628 000 <210> 629 <400> 629 000 <210> 630 <400> 630 000 <210> 631 <400> 631 000 <210> 632 <400> 632 000 <210> 633 <400> 633 000 <210> 634 <400> 634 000 <210> 635 <400> 635 000 <210> 636 <400> 636 000 <210> 637 <400> 637 000 <210> 638 <400> 638 000 <210> 639 <400> 639 000 <210> 640 <400> 640 000 <210> 641 <400> 641 000 <210> 642 <400> 642 000 <210> 643 <400> 643 000 <210> 644 <400> 644 000 <210> 645 <400> 645 000 <210> 646 <400> 646 000 <210> 647 <400> 647 000 <210> 648 <400> 648 000 <210> 649 <400> 649 000 <210> 650 <400> 650 000 <210> 651 <400> 651 000 <210> 652 <400> 652 000 <210> 653 <400> 653 000 <210> 654 <400> 654 000 <210> 655 <400> 655 000 <210> 656 <400> 656 000 <210> 657 <400> 657 000 <210> 658 <400> 658 000 <210> 659 <400> 659 000 <210> 660 <400> 660 000 <210> 661 <400> 661 000 <210> 662 <400> 662 000 <210> 663 <400> 663 000 <210> 664 <400> 664 000 <210> 665 <400> 665 000 <210> 666 <400> 666 000 <210> 667 <400> 667 000 <210> 668 <400> 668 000 <210> 669 <400> 669 000 <210> 670 <400> 670 000 <210> 671 <400> 671 000 <210> 672 <400> 672 000 <210> 673 <400> 673 000 <210> 674 <400> 674 000 <210> 675 <400> 675 000 <210> 676 <400> 676 000 <210> 677 <400> 677 000 <210> 678 <400> 678 000 <210> 679 <400> 679 000 <210> 680 <400> 680 000 <210> 681 <400> 681 000 <210> 682 <400> 682 000 <210> 683 <400> 683 000 <210> 684 <400> 684 000 <210> 685 <400> 685 000 <210> 686 <400> 686 000 <210> 687 <400> 687 000 <210> 688 <400> 688 000 <210> 689 <400> 689 000 <210> 690 <400> 690 000 <210> 691 <400> 691 000 <210> 692 <400> 692 000 <210> 693 <400> 693 000 <210> 694 <400> 694 000 <210> 695 <400> 695 000 <210> 696 <400> 696 000 <210> 697 <400> 697 000 <210> 698 <400> 698 000 <210> 699 <400> 699 000 <210> 700 <211> 461 <212> PRT <213> Homo sapiens <400> 700 Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn 35 40 45 Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys 50 55 60 Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn 65 70 75 80 Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln 85 90 95 Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile 100 105 110 Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys 115 120 125 Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe 130 135 140 Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly 145 150 155 160 Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe 165 170 175 Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala 180 185 190 Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu 195 200 205 Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe 210 215 220 Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp 225 230 235 240 Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile 245 250 255 Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly 260 265 270 Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu 275 280 285 His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn 290 295 300 Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu 305 310 315 320 Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile 325 330 335 Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr 340 345 350 Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val 355 360 365 Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg 370 375 380 Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His 385 390 395 400 Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val 405 410 415 Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly 420 425 430 Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser 435 440 445 Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr 450 455 460 <210> 701 <211> 415 <212> PRT <213> Homo sapiens <400> 701 Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg 1 5 10 15 Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe 20 25 30 Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly 35 40 45 Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp 50 55 60 Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys 65 70 75 80 Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu 85 90 95 Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr 100 105 110 Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val 115 120 125 Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr 130 135 140 Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu 145 150 155 160 Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn 165 170 175 Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe 180 185 190 Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly 195 200 205 Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu 210 215 220 Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu 225 230 235 240 Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His 245 250 255 His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu 260 265 270 Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile 275 280 285 Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser 290 295 300 Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala 305 310 315 320 Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys 325 330 335 Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly 340 345 350 Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro 355 360 365 His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser 370 375 380 Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys 385 390 395 400 Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr 405 410 415 <210> 702 <211> 415 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 702 Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg 1 5 10 15 Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe 20 25 30 Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly 35 40 45 Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp 50 55 60 Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys 65 70 75 80 Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu 85 90 95 Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr 100 105 110 Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val 115 120 125 Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr 130 135 140 Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu 145 150 155 160 Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn 165 170 175 Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe 180 185 190 Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly 195 200 205 Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu 210 215 220 Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu 225 230 235 240 Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His 245 250 255 His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu 260 265 270 Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile 275 280 285 Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser 290 295 300 Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala 305 310 315 320 Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys 325 330 335 Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly 340 345 350 Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro 355 360 365 His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser 370 375 380 Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys 385 390 395 400 Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr 405 410 415 <210> 703 <211> 4104 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 703 atggataaga agtactcaat cgggctggat atcggaacta attccgtggg ttgggcagtg 60 atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa caccgataga 120 cacagcatca agaaaaatct catcggagcc ctgctgtttg actccggcga aaccgcagaa 180 gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa tcgcatctgc 240 tatctgcaag agatcttttc gaacgaaatg gcaaaggtcg acgacagctt cttccaccgc 300 ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc tatctttgga 360 aacatcgtcg acgaagtggc gtaccacgaa aagtacccga ccatctacca tctgcggaag 420 aagttggttg actcaactga caaggccgac ctcagattga tctacttggc cctcgcccat 480 atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga taactccgac 540 gtggataagc ttttcattca actggtgcag acctacaacc aactgttcga agaaaaccca 600 atcaatgcta gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc gaagtcgcgg 660 cgcctcgaaa acctgatcgc acagctgccg ggagagaaaa agaacggact tttcggcaac 720 ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga cctggccgag 780 gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa tttgctggca 840 caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc ggacgcaatc 900 ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct tagcgcctcg 960 atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc gctcgtgaga 1020 cagcaactgc ctgaaaagta caaggagatc ttcttcgacc agtccaagaa tgggtacgca 1080 gggtacatcg atggaggcgc tagccaggaa gagttctata agttcatcaa gccaatcctg 1140 gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga tctgctccgg 1200 aaacagagaa cctttgacaa cggatccatt ccccaccaga tccatctggg tgagctgcac 1260 gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg ggaaaagatc 1320 gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg cggcaattcg 1380 cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa tttcgaggaa 1440 gttgtggata agggagcttc ggcacaaagc ttcatcgaac gaatgaccaa cttcgacaag 1500 aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata cttcactgtc 1560 tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc ggcctttctg 1620 tccggagaac agaagaaagc aattgtcgat ctgctgttca agaccaaccg caaggtgacc 1680 gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc agtggaaatc 1740 agcggggtgg aggacagatt caacgcttcg ctgggaacct atcatgatct cctgaagatc 1800 atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga agatatcgtc 1860 ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa gacctacgct 1920 catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac tggttggggc 1980 cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa aactatcctg 2040 gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcaattgat ccacgacgac 2100 agcctgacct ttaaggagga catccaaaaa gcacaagtgt ccggacaggg agactcactc 2160 catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat tctgcaaact 2220 gtgaaggtgg tcgacgagct ggtgaaggtc atgggacggc acaaaccgga gaatatcgtg 2280 attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaaaaactc ccgcgaaagg 2340 atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa agagcacccg 2400 gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca aaatggacgg 2460 gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga cgtggaccac 2520 atcgttccac agtcctttct gaaggatgac tcgatcgata acaaggtgtt gactcgcagc 2580 gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa gaagatgaag 2640 aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt tgacaatctc 2700 actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat caaacggcag 2760 ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcttggactc ccgcatgaac 2820 actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac cctgaaaagc 2880 aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga aatcaacaac 2940 taccatcacg cgcatgacgc atacctcaac gctgtggtcg gtaccgccct gatcaaaaag 3000 taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga cgtgaggaag 3060 atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt cttttactca 3120 aacatcatga actttttcaa gactgaaatt acgctggcca atggagaaat caggaagagg 3180 ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg cagggacttc 3240 gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa aaccgaagtg 3300 caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga caagctcatt 3360 gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc gactgtcgca 3420 tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaaaaagct caaatccgtc 3480 aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa cccgattgat 3540 ttcctcgagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa actccccaag 3600 tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc cggagaactc 3660 caaaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta tcttgcttcg 3720 cactacgaaa aactcaaagg gtcaccggaa gataacgaac agaagcagct tttcgtggag 3780 cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc aaagcgcgtg 3840 atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca tagagataag 3900 ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa cctgggagcc 3960 ccagccgcct tcaagtactt cgatactact atcgatcgca aaagatacac gtccaccaag 4020 gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga aactaggatc 4080 gatctgtcgc agctgggtgg cgat 4104 <210> 704 <211> 4140 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 704 atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg atgggcagtc 60 atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa cacagacaga 120 cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga aacagcagaa 180 gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa cagaatctgc 240 tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt cttccacaga 300 ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc gatcttcgga 360 aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca cctgagaaag 420 aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc actggcacac 480 atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga caacagcgac 540 gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga agaaaacccg 600 atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag caagagcaga 660 agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact gttcggaaac 720 ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga cctggcagaa 780 gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa cctgctggca 840 cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag cgacgcaatc 900 ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct gagcgcaagc 960 atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc actggtcaga 1020 cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa cggatacgca 1080 ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa gccgatcctg 1140 gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga cctgctgaga 1200 aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg agaactgcac 1260 gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag agaaaagatc 1320 gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag aggaaacagc 1380 agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa cttcgaagaa 1440 gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa cttcgacaag 1500 aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata cttcacagtc 1560 tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc ggcattcctg 1620 agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag aaaggtcaca 1680 gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag cgtcgaaatc 1740 agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct gctgaagatc 1800 atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga agacatcgtc 1860 ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa gacatacgca 1920 cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac aggatgggga 1980 agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa gacaatcctg 2040 gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg agacagcctg 2160 cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat cctgcagaca 2220 gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga aaacatcgtc 2280 atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa ggaacacccg 2400 gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca gaacggaaga 2460 gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga cgtcgaccac 2520 atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa gaagatgaag 2640 aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt cgacaacctg 2700 acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat caagagacag 2760 ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag cagaatgaac 2820 acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac actgaagagc 2880 aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga aatcaacaac 2940 taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact gatcaagaag 3000 tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga cgtcagaaag 3060 atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt cttctacagc 3120 aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat cagaaagaga 3180 ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg aagagacttc 3240 gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa gacagaagtc 3300 cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga caagctgatc 3360 gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc gacagtcgca 3420 tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct gaagagcgtc 3480 aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa cccgatcgac 3540 ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa gctgccgaag 3600 tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc aggagaactg 3660 cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta cctggcaagc 3720 cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct gttcgtcgaa 3780 cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag caagagagtc 3840 atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca cagagacaag 3900 ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa cctgggagca 3960 ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac aagcacaaag 4020 gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga aacaagaatc 4080 gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag aaaggtctag 4140 <210> 705 <211> 4501 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 705 gggucccgca gucggcgucc agcggcucug cuuguucgug ugugugucgu ugcaggccuu 60 auucggaucc gccaccaugg acaagaagua cagcaucgga cuggacaucg gaacaaacag 120 cgucggaugg gcagucauca cagacgaaua caaggucccg agcaagaagu ucaagguccu 180 gggaaacaca gacagacaca gcaucaagaa gaaccugauc ggagcacugc uguucgacag 240 cggagaaaca gcagaagcaa caagacugaa gagaacagca agaagaagau acacaagaag 300 aaagaacaga aucugcuacc ugcaggaaau cuucagcaac gaaauggcaa aggucgacga 360 cagcuucuuc cacagacugg aagaaagcuu ccuggucgaa gaagacaaga agcacgaaag 420 acacccgauc uucggaaaca ucgucgacga agucgcauac cacgaaaagu acccgacaau 480 cuaccaccug agaaagaagc uggucgacag cacagacaag gcagaccuga gacugaucua 540 ccuggcacug gcacacauga ucaaguucag aggacacuuc cugaucgaag gagaccugaa 600 cccggacaac agcgacgucg acaagcuguu cauccagcug guccagacau acaaccagcu 660 guucgaagaa aacccgauca acgcaagcgg agucgacgca aaggcaaucc ugagcgcaag 720 acugagcaag agcagaagac uggaaaaccu gaucgcacag cugccgggag aaaagaagaa 780 cggacuguuc ggaaaccuga ucgcacugag ccugggacug acaccgaacu ucaagagcaa 840 cuucgaccug gcagaagacg caaagcugca gcugagcaag gacacauacg acgacgaccu 900 ggacaaccug cuggcacaga ucggagacca guacgcagac cuguuccugg cagcaaagaa 960 ccugagcgac gcaauccugc ugagcgacau ccugagaguc aacacagaaa ucacaaaggc 1020 accgcugagc gcaagcauga ucaagagaua cgacgaacac caccaggacc ugacacugcu 1080 gaaggcacug gucagacagc agcugccgga aaaguacaag gaaaucuucu ucgaccagag 1140 caagaacgga uacgcaggau acaucgacgg aggagcaagc caggaagaau ucuacaaguu 1200 caucaagccg auccuggaaa agauggacgg aacagaagaa cugcugguca agcugaacag 1260 agaagaccug cugagaaagc agagaacauu cgacaacgga agcaucccgc accagaucca 1320 ccugggagaa cugcacgcaa uccugagaag acaggaagac uucuacccgu uccugaagga 1380 caacagagaa aagaucgaaa agauccugac auucagaauc ccguacuacg ucggaccgcu 1440 ggcaagagga aacagcagau ucgcauggau gacaagaaag agcgaagaaa caaucacacc 1500 guggaacuuc gaagaagucg ucgacaaggg agcaagcgca cagagcuuca ucgaaagaau 1560 gacaaacuuc gacaagaacc ugccgaacga aaagguccug ccgaagcaca gccugcugua 1620 cgaauacuuc acagucuaca acgaacugac aaaggucaag uacgucacag aaggaaugag 1680 aaagccggca uuccugagcg gagaacagaa gaaggcaauc gucgaccugc uguucaagac 1740 aaacagaaag gucacaguca agcagcugaa ggaagacuac uucaagaaga ucgaaugcuu 1800 cgacagcguc gaaaucagcg gagucgaaga cagauucaac gcaagccugg gaacauacca 1860 cgaccugcug aagaucauca aggacaagga cuuccuggac aacgaagaaa acgaagacau 1920 ccuggaagac aucguccuga cacugacacu guucgaagac agagaaauga ucgaagaaag 1980 acugaagaca uacgcacacc uguucgacga caaggucaug aagcagcuga agagaagaag 2040 auacacagga uggggaagac ugagcagaaa gcugaucaac ggaaucagag acaagcagag 2100 cggaaagaca auccuggacu uccugaagag cgacggauuc gcaaacagaa acuucaugca 2160 gcugauccac gacgacagcc ugacauucaa ggaagacauc cagaaggcac aggucagcgg 2220 acagggagac agccugcacg aacacaucgc aaaccuggca ggaagcccgg caaucaagaa 2280 gggaauccug cagacaguca aggucgucga cgaacugguc aaggucaugg gaagacacaa 2340 gccggaaaac aucgucaucg aaauggcaag agaaaaccag acaacacaga agggacagaa 2400 gaacagcaga gaaagaauga agagaaucga agaaggaauc aaggaacugg gaagccagau 2460 ccugaaggaa cacccggucg aaaacacaca gcugcagaac gaaaagcugu accuguacua 2520 ccugcagaac ggaagagaca uguacgucga ccaggaacug gacaucaaca gacugagcga 2580 cuacgacguc gaccacaucg ucccgcagag cuuccugaag gacgacagca ucgacaacaa 2640 gguccugaca agaagcgaca agaacagagg aaagagcgac aacgucccga gcgaagaagu 2700 cgucaagaag augaagaacu acuggagaca gcugcugaac gcaaagcuga ucacacagag 2760 aaaguucgac aaccugacaa aggcagagag aggaggacug agcgaacugg acaaggcagg 2820 auucaucaag agacagcugg ucgaaacaag acagaucaca aagcacgucg cacagauccu 2880 ggacagcaga augaacacaa aguacgacga aaacgacaag cugaucagag aagucaaggu 2940 caucacacug aagagcaagc uggucagcga cuucagaaag gacuuccagu ucuacaaggu 3000 cagagaaauc aacaacuacc accacgcaca cgacgcauac cugaacgcag ucgucggaac 3060 agcacugauc aagaaguacc cgaagcugga aagcgaauuc gucuacggag acuacaaggu 3120 cuacgacguc agaaagauga ucgcaaagag cgaacaggaa aucggaaagg caacagcaaa 3180 guacuucuuc uacagcaaca ucaugaacuu cuucaagaca gaaaucacac uggcaaacgg 3240 agaaaucaga aagagaccgc ugaucgaaac aaacggagaa acaggagaaa ucgucuggga 3300 caagggaaga gacuucgcaa cagucagaaa gguccugagc augccgcagg ucaacaucgu 3360 caagaagaca gaaguccaga caggaggauu cagcaaggaa agcauccugc cgaagagaaa 3420 cagcgacaag cugaucgcaa gaaagaagga cugggacccg aagaaguacg gaggauucga 3480 cagcccgaca gucgcauaca gcguccuggu cgucgcaaag gucgaaaagg gaaagagcaa 3540 gaagcugaag agcgucaagg aacugcuggg aaucacaauc auggaaagaa gcagcuucga 3600 aaagaacccg aucgacuucc uggaagcaaa gggauacaag gaagucaaga aggaccugau 3660 caucaagcug ccgaaguaca gccuguucga acuggaaaac ggaagaaaga gaaugcuggc 3720 aagcgcagga gaacugcaga agggaaacga acuggcacug ccgagcaagu acgucaacuu 3780 ccuguaccug gcaagccacu acgaaaagcu gaagggaagc ccggaagaca acgaacagaa 3840 gcagcuguuc gucgaacagc acaagcacua ccuggacgaa aucaucgaac agaucagcga 3900 auucagcaag agagucaucc uggcagacgc aaaccuggac aagguccuga gcgcauacaa 3960 caagcacaga gacaagccga ucagagaaca ggcagaaaac aucauccacc uguucacacu 4020 gacaaaccug ggagcaccgg cagcauucaa guacuucgac acaacaaucg acagaaagag 4080 auacacaagc acaaaggaag uccuggacgc aacacugauc caccagagca ucacaggacu 4140 guacgaaaca agaaucgacc ugagccagcu gggaggagac ggaggaggaa gcccgaagaa 4200 gaagagaaag gucuagcuag ccaucacauu uaaaagcauc ucagccuacc augagaauaa 4260 gagaaagaaa augaagauca auagcuuauu caucucuuuu ucuuuuucgu ugguguaaag 4320 ccaacacccu gucuaaaaaa cauaaauuuc uuuaaucauu uugccucuuu ucucugugcu 4380 ucaauuaaua aaaaauggaa agaaccucga gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500 a 4501 <210> 706 <211> 2802 <212> DNA <213> Homo sapiens <400> 706 accactttca caatctgcta gcaaaggtta tgcagcgcgt gaacatgatc atggcagaat 60 caccaggcct catcaccatc tgccttttag gatatctact cagtgctgaa tgtacagttt 120 ttcttgatca tgaaaacgcc aacaaaattc tgaatcggcc aaagaggtat aattcaggta 180 aattggaaga gtttgttcaa gggaaccttg agagagaatg tatggaagaa aagtgtagtt 240 ttgaagaagc acgagaagtt tttgaaaaca ctgaaagaac aactgaattt tggaagcagt 300 atgttgatgg agatcagtgt gagtccaatc catgtttaaa tggcggcagt tgcaaggatg 360 acattaattc ctatgaatgt tggtgtccct ttggatttga aggaaagaac tgtgaattag 420 atgtaacatg taacattaag aatggcagat gcgagcagtt ttgtaaaaat agtgctgata 480 acaaggtggt ttgctcctgt actgagggat atcgacttgc agaaaaccag aagtcctgtg 540 aaccagcagt gccatttcca tgtggaagag tttctgtttc acaaacttct aagctcaccc 600 gtgctgagac tgtttttcct gatgtggact atgtaaattc tactgaagct gaaaccattt 660 tggataacat cactcaaagc acccaatcat ttaatgactt cactcgggtt gttggtggag 720 aagatgccaa accaggtcaa ttcccttggc aggttgtttt gaatggtaaa gttgatgcat 780 tctgtggagg ctctatcgtt aatgaaaaat ggattgtaac tgctgcccac tgtgttgaaa 840 ctggtgttaa aattacagtt gtcgcaggtg aacataatat tgaggagaca gaacatacag 900 agcaaaagcg aaatgtgatt cgaattattc ctcaccacaa ctacaatgca gctattaata 960 agtacaacca tgacattgcc cttctggaac tggacgaacc cttagtgcta aacagctacg 1020 ttacacctat ttgcattgct gacaaggaat acacgaacat cttcctcaaa tttggatctg 1080 gctatgtaag tggctgggga agagtcttcc acaaagggag atcagcttta gttcttcagt 1140 accttagagt tccacttgtt gaccgagcca catgtcttcg atctacaaag ttcaccatct 1200 ataacaacat gttctgtgct ggcttccatg aaggaggtag agattcatgt caaggagata 1260 gtgggggacc ccatgttact gaagtggaag ggaccagttt cttaactgga attattagct 1320 ggggtgaaga gtgtgcaatg aaaggcaaat atggaatata taccaaggta tcccggtatg 1380 tcaactggat taaggaaaaa acaaagctca cttaatgaaa gatggatttc caaggttaat 1440 tcattggaat tgaaaattaa cagggcctct cactaactaa tcactttccc atcttttgtt 1500 agatttgaat atatacattc tatgatcatt gctttttctc tttacagggg agaatttcat 1560 attttacctg agcaaattga ttagaaaatg gaaccactag aggaatataa tgtgttagga 1620 aattacagtc atttctaagg gcccagccct tgacaaaatt gtgaagttaa attctccact 1680 ctgtccatca gatactatgg ttctccacta tggcaactaa ctcactcaat tttccctcct 1740 tagcagcatt ccatcttccc gatcttcttt gcttctccaa ccaaaacatc aatgtttatt 1800 agttctgtat acagtacagg atctttggtc tactctatca caaggccagt accacactca 1860 tgaagaaaga acacaggagt agctgagagg ctaaaactca tcaaaaacac tactcctttt 1920 cctctaccct attcctcaat cttttacctt ttccaaatcc caatccccaa atcagttttt 1980 ctctttctta ctccctctct cccttttacc ctccatggtc gttaaaggag agatggggag 2040 catcattctg ttatacttct gtacacagtt atacatgtct atcaaaccca gacttgcttc 2100 cgtagtggag acttgctttt cagaacatag ggatgaagta aggtgcctga aaagtttggg 2160 ggaaaagttt ctttcagaga gttaagttat tttatatata taatatatat ataaaatata 2220 taatatacaa tataaatata tagtgtgtgt gtatgcgtgt gtgtagacac acacgcatac 2280 acacatataa tggaagcaat aagccattct aagagcttgt atggttatgg aggtctgact 2340 aggcatgatt tcacgaaggc aagattggca tatcattgta actaaaaaag ctgacattga 2400 cccagacata ttgtactctt tctaaaaata ataataataa tgctaacaga aagaagagaa 2460 ccgttcgttt gcaatctaca gctagtagag actttgagga agaattcaac agtgtgtctt 2520 cagcagtgtt cagagccaag caagaagttg aagttgccta gaccagagga cataagtatc 2580 atgtctcctt taactagcat accccgaagt ggagaagggt gcagcaggct caaaggcata 2640 agtcattcca atcagccaac taagttgtcc ttttctggtt tcgtgttcac catggaacat 2700 tttgattata gttaatcctt ctatcttgaa tcttctagag agttgctgac caactgacgt 2760 atgtttccct ttgtgaatta ataaactggt gttctggttc at 2802 <210> 707 <400> 707 000 <210> 708 <400> 708 000 <210> 709 <400> 709 000 <210> 710 <400> 710 000 <210> 711 <400> 711 000 <210> 712 <400> 712 000 <210> 713 <400> 713 000 <210> 714 <400> 714 000 <210> 715 <400> 715 000 <210> 716 <400> 716 000 <210> 717 <400> 717 000 <210> 718 <400> 718 000 <210> 719 <400> 719 000 <210> 720 <400> 720 000 <210> 721 <400> 721 000 <210> 722 <400> 722 000 <210> 723 <400> 723 000 <210> 724 <400> 724 000 <210> 725 <400> 725 000 <210> 726 <400> 726 000 <210> 727 <400> 727 000 <210> 728 <400> 728 000 <210> 729 <400> 729 000 <210> 730 <400> 730 000 <210> 731 <400> 731 000 <210> 732 <400> 732 000 <210> 733 <400> 733 000 <210> 734 <400> 734 000 <210> 735 <400> 735 000 <210> 736 <400> 736 000 <210> 737 <400> 737 000 <210> 738 <400> 738 000 <210> 739 <400> 739 000 <210> 740 <400> 740 000 <210> 741 <400> 741 000 <210> 742 <400> 742 000 <210> 743 <400> 743 000 <210> 744 <400> 744 000 <210> 745 <400> 745 000 <210> 746 <400> 746 000 <210> 747 <400> 747 000 <210> 748 <400> 748 000 <210> 749 <400> 749 000 <210> 750 <400> 750 000 <210> 751 <400> 751 000 <210> 752 <400> 752 000 <210> 753 <400> 753 000 <210> 754 <400> 754 000 <210> 755 <400> 755 000 <210> 756 <400> 756 000 <210> 757 <400> 757 000 <210> 758 <400> 758 000 <210> 759 <400> 759 000 <210> 760 <400> 760 000 <210> 761 <400> 761 000 <210> 762 <400> 762 000 <210> 763 <400> 763 000 <210> 764 <400> 764 000 <210> 765 <400> 765 000 <210> 766 <400> 766 000 <210> 767 <400> 767 000 <210> 768 <400> 768 000 <210> 769 <400> 769 000 <210> 770 <400> 770 000 <210> 771 <400> 771 000 <210> 772 <400> 772 000 <210> 773 <400> 773 000 <210> 774 <400> 774 000 <210> 775 <400> 775 000 <210> 776 <400> 776 000 <210> 777 <400> 777 000 <210> 778 <400> 778 000 <210> 779 <400> 779 000 <210> 780 <400> 780 000 <210> 781 <400> 781 000 <210> 782 <400> 782 000 <210> 783 <400> 783 000 <210> 784 <400> 784 000 <210> 785 <400> 785 000 <210> 786 <400> 786 000 <210> 787 <400> 787 000 <210> 788 <400> 788 000 <210> 789 <400> 789 000 <210> 790 <400> 790 000 <210> 791 <400> 791 000 <210> 792 <400> 792 000 <210> 793 <400> 793 000 <210> 794 <400> 794 000 <210> 795 <400> 795 000 <210> 796 <400> 796 000 <210> 797 <400> 797 000 <210> 798 <400> 798 000 <210> 799 <400> 799 000 <210> 800 <211> 6 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 800 aauaaa 6 <210> 801 <211> 6 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 801 uauaaa 6 <210> 802 <211> 6 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 802 akuaaa 6 <210> 803 <400> 803 000 <210> 804 <400> 804 000 <210> 805 <400> 805 000 <210> 806 <400> 806 000 <210> 807 <400> 807 000 <210> 808 <400> 808 000 <210> 809 <400> 809 000 <210> 810 <400> 810 000 <210> 811 <400> 811 000 <210> 812 <400> 812 000 <210> 813 <400> 813 000 <210> 814 <400> 814 000 <210> 815 <400> 815 000 <210> 816 <400> 816 000 <210> 817 <400> 817 000 <210> 818 <400> 818 000 <210> 819 <400> 819 000 <210> 820 <400> 820 000 <210> 821 <400> 821 000 <210> 822 <400> 822 000 <210> 823 <400> 823 000 <210> 824 <400> 824 000 <210> 825 <400> 825 000 <210> 826 <400> 826 000 <210> 827 <400> 827 000 <210> 828 <400> 828 000 <210> 829 <400> 829 000 <210> 830 <400> 830 000 <210> 831 <400> 831 000 <210> 832 <400> 832 000 <210> 833 <400> 833 000 <210> 834 <400> 834 000 <210> 835 <400> 835 000 <210> 836 <400> 836 000 <210> 837 <400> 837 000 <210> 838 <400> 838 000 <210> 839 <400> 839 000 <210> 840 <400> 840 000 <210> 841 <400> 841 000 <210> 842 <400> 842 000 <210> 843 <400> 843 000 <210> 844 <400> 844 000 <210> 845 <400> 845 000 <210> 846 <400> 846 000 <210> 847 <400> 847 000 <210> 848 <400> 848 000 <210> 849 <400> 849 000 <210> 850 <400> 850 000 <210> 851 <400> 851 000 <210> 852 <400> 852 000 <210> 853 <400> 853 000 <210> 854 <400> 854 000 <210> 855 <400> 855 000 <210> 856 <400> 856 000 <210> 857 <400> 857 000 <210> 858 <400> 858 000 <210> 859 <400> 859 000 <210> 860 <400> 860 000 <210> 861 <400> 861 000 <210> 862 <400> 862 000 <210> 863 <400> 863 000 <210> 864 <400> 864 000 <210> 865 <400> 865 000 <210> 866 <400> 866 000 <210> 867 <400> 867 000 <210> 868 <400> 868 000 <210> 869 <400> 869 000 <210> 870 <400> 870 000 <210> 871 <400> 871 000 <210> 872 <400> 872 000 <210> 873 <400> 873 000 <210> 874 <400> 874 000 <210> 875 <400> 875 000 <210> 876 <400> 876 000 <210> 877 <400> 877 000 <210> 878 <400> 878 000 <210> 879 <400> 879 000 <210> 880 <400> 880 000 <210> 881 <400> 881 000 <210> 882 <400> 882 000 <210> 883 <400> 883 000 <210> 884 <400> 884 000 <210> 885 <400> 885 000 <210> 886 <400> 886 000 <210> 887 <400> 887 000 <210> 888 <400> 888 000 <210> 889 <400> 889 000 <210> 890 <400> 890 000 <210> 891 <400> 891 000 <210> 892 <400> 892 000 <210> 893 <400> 893 000 <210> 894 <400> 894 000 <210> 895 <400> 895 000 <210> 896 <400> 896 000 <210> 897 <400> 897 000 <210> 898 <400> 898 000 <210> 899 <400> 899 000 <210> 900 <400> 900 000 <210> 901 <400> 901 000 <210> 902 <400> 902 000 <210> 903 <400> 903 000 <210> 904 <400> 904 000 <210> 905 <400> 905 000 <210> 906 <400> 906 000 <210> 907 <400> 907 000 <210> 908 <400> 908 000 <210> 909 <400> 909 000 <210> 910 <400> 910 000 <210> 911 <400> 911 000 <210> 912 <400> 912 000 <210> 913 <400> 913 000 <210> 914 <400> 914 000 <210> 915 <400> 915 000 <210> 916 <400> 916 000 <210> 917 <400> 917 000 <210> 918 <400> 918 000 <210> 919 <400> 919 000 <210> 920 <400> 920 000 <210> 921 <400> 921 000 <210> 922 <400> 922 000 <210> 923 <400> 923 000 <210> 924 <400> 924 000 <210> 925 <400> 925 000 <210> 926 <400> 926 000 <210> 927 <400> 927 000 <210> 928 <400> 928 000 <210> 929 <400> 929 000 <210> 930 <400> 930 000 <210> 931 <400> 931 000 <210> 932 <400> 932 000 <210> 933 <400> 933 000 <210> 934 <400> 934 000 <210> 935 <400> 935 000 <210> 936 <400> 936 000 <210> 937 <400> 937 000 <210> 938 <400> 938 000 <210> 939 <400> 939 000 <210> 940 <400> 940 000 <210> 941 <400> 941 000 <210> 942 <400> 942 000 <210> 943 <400> 943 000 <210> 944 <400> 944 000 <210> 945 <400> 945 000 <210> 946 <400> 946 000 <210> 947 <400> 947 000 <210> 948 <400> 948 000 <210> 949 <400> 949 000 <210> 950 <400> 950 000 <210> 951 <400> 951 000 <210> 952 <400> 952 000 <210> 953 <400> 953 000 <210> 954 <400> 954 000 <210> 955 <400> 955 000 <210> 956 <400> 956 000 <210> 957 <400> 957 000 <210> 958 <400> 958 000 <210> 959 <400> 959 000 <210> 960 <400> 960 000 <210> 961 <400> 961 000 <210> 962 <400> 962 000 <210> 963 <400> 963 000 <210> 964 <400> 964 000 <210> 965 <400> 965 000 <210> 966 <400> 966 000 <210> 967 <400> 967 000 <210> 968 <400> 968 000 <210> 969 <400> 969 000 <210> 970 <400> 970 000 <210> 971 <400> 971 000 <210> 972 <400> 972 000 <210> 973 <400> 973 000 <210> 974 <400> 974 000 <210> 975 <400> 975 000 <210> 976 <400> 976 000 <210> 977 <400> 977 000 <210> 978 <400> 978 000 <210> 979 <400> 979 000 <210> 980 <400> 980 000 <210> 981 <400> 981 000 <210> 982 <400> 982 000 <210> 983 <400> 983 000 <210> 984 <400> 984 000 <210> 985 <400> 985 000 <210> 986 <400> 986 000 <210> 987 <400> 987 000 <210> 988 <400> 988 000 <210> 989 <400> 989 000 <210> 990 <400> 990 000 <210> 991 <400> 991 000 <210> 992 <400> 992 000 <210> 993 <400> 993 000 <210> 994 <400> 994 000 <210> 995 <400> 995 000 <210> 996 <400> 996 000 <210> 997 <400> 997 000 <210> 998 <400> 998 000 <210> 999 <400> 999 000 <210> 1000 <400> 1000 000 <210> 1001 <400> 1001 000 <210> 1002 <400> 1002 000 <210> 1003 <400> 1003 000 <210> 1004 <400> 1004 000 <210> 1005 <400> 1005 000 <210> 1006 <400> 1006 000 <210> 1007 <400> 1007 000 <210> 1008 <400> 1008 000 <210> 1009 <400> 1009 000 <210> 1010 <400> 1010 000 <210> 1011 <400> 1011 000 <210> 1012 <400> 1012 000 <210> 1013 <400> 1013 000 <210> 1014 <400> 1014 000 <210> 1015 <400> 1015 000 <210> 1016 <400> 1016 000 <210> 1017 <400> 1017 000 <210> 1018 <400> 1018 000 <210> 1019 <400> 1019 000 <210> 1020 <400> 1020 000 <210> 1021 <400> 1021 000 <210> 1022 <400> 1022 000 <210> 1023 <400> 1023 000 <210> 1024 <400> 1024 000 <210> 1025 <400> 1025 000 <210> 1026 <400> 1026 000 <210> 1027 <400> 1027 000 <210> 1028 <400> 1028 000 <210> 1029 <400> 1029 000 <210> 1030 <400> 1030 000 <210> 1031 <400> 1031 000 <210> 1032 <400> 1032 000 <210> 1033 <400> 1033 000 <210> 1034 <400> 1034 000 <210> 1035 <400> 1035 000 <210> 1036 <400> 1036 000 <210> 1037 <400> 1037 000 <210> 1038 <400> 1038 000 <210> 1039 <400> 1039 000 <210> 1040 <400> 1040 000 <210> 1041 <400> 1041 000 <210> 1042 <400> 1042 000 <210> 1043 <400> 1043 000 <210> 1044 <400> 1044 000 <210> 1045 <400> 1045 000 <210> 1046 <400> 1046 000 <210> 1047 <400> 1047 000 <210> 1048 <400> 1048 000 <210> 1049 <400> 1049 000 <210> 1050 <400> 1050 000 <210> 1051 <400> 1051 000 <210> 1052 <400> 1052 000 <210> 1053 <400> 1053 000 <210> 1054 <400> 1054 000 <210> 1055 <400> 1055 000 <210> 1056 <400> 1056 000 <210> 1057 <400> 1057 000 <210> 1058 <400> 1058 000 <210> 1059 <400> 1059 000 <210> 1060 <400> 1060 000 <210> 1061 <400> 1061 000 <210> 1062 <400> 1062 000 <210> 1063 <400> 1063 000 <210> 1064 <400> 1064 000 <210> 1065 <400> 1065 000 <210> 1066 <400> 1066 000 <210> 1067 <400> 1067 000 <210> 1068 <400> 1068 000 <210> 1069 <400> 1069 000 <210> 1070 <400> 1070 000 <210> 1071 <400> 1071 000 <210> 1072 <400> 1072 000 <210> 1073 <400> 1073 000 <210> 1074 <400> 1074 000 <210> 1075 <400> 1075 000 <210> 1076 <400> 1076 000 <210> 1077 <400> 1077 000 <210> 1078 <400> 1078 000 <210> 1079 <400> 1079 000 <210> 1080 <400> 1080 000 <210> 1081 <400> 1081 000 <210> 1082 <400> 1082 000 <210> 1083 <400> 1083 000 <210> 1084 <400> 1084 000 <210> 1085 <400> 1085 000 <210> 1086 <400> 1086 000 <210> 1087 <400> 1087 000 <210> 1088 <400> 1088 000 <210> 1089 <400> 1089 000 <210> 1090 <400> 1090 000 <210> 1091 <400> 1091 000 <210> 1092 <400> 1092 000 <210> 1093 <400> 1093 000 <210> 1094 <400> 1094 000 <210> 1095 <400> 1095 000 <210> 1096 <400> 1096 000 <210> 1097 <400> 1097 000 <210> 1098 <400> 1098 000 <210> 1099 <400> 1099 000 <210> 1100 <400> 1100 000 <210> 1101 <400> 1101 000 <210> 1102 <400> 1102 000 <210> 1103 <400> 1103 000 <210> 1104 <400> 1104 000 <210> 1105 <400> 1105 000 <210> 1106 <400> 1106 000 <210> 1107 <400> 1107 000 <210> 1108 <400> 1108 000 <210> 1109 <400> 1109 000 <210> 1110 <400> 1110 000 <210> 1111 <400> 1111 000 <210> 1112 <400> 1112 000 <210> 1113 <400> 1113 000 <210> 1114 <400> 1114 000 <210> 1115 <400> 1115 000 <210> 1116 <400> 1116 000 <210> 1117 <400> 1117 000 <210> 1118 <400> 1118 000 <210> 1119 <400> 1119 000 <210> 1120 <400> 1120 000 <210> 1121 <400> 1121 000 <210> 1122 <400> 1122 000 <210> 1123 <400> 1123 000 <210> 1124 <400> 1124 000 <210> 1125 <400> 1125 000 <210> 1126 <400> 1126 000 <210> 1127 <400> 1127 000 <210> 1128 <400> 1128 000 <210> 1129 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 1129 gaguccgagc agaagaagaa 20 <210> 1130 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 1130 gacccccucc accccgccuc 20

Claims (143)

  1. 다음을 투여하는 단계를 포함하고, 이에 의해 인자 IX 핵산을 세포 또는 세포들의 집단에 도입시키는, 인자 IX 핵산을 세포 또는 세포들의 집단에 도입하는 방법:
    i) 인자 IX 단백질 코딩 서열을 포함하는 핵산 구조체;
    ii) RNA-가이드 DNA 결합제; 및
    iii) 다음에서 선택된 서열을 포함하는 가이드 RNA (gRNA):
    a) 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 및 33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    b) 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 및 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드;
    c) 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 서열;
    d) 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    e) 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드;
    f) 서열 번호: 34-97로 구성된 그룹에서 선택된 서열;
    g) 서열 번호: 98-119로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    h) 서열 번호: 98-119로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드; 및
    i) 서열 번호: 120-163으로 구성된 그룹에서 선택된 서열; 및
    j) 표 2, 표 7 및 표 8의 서열 번호들로 구성된 그룹에서 선택된 서열.
  2. 다음을 투여하는 단계를 포함하고, 이에 의해 세포 또는 세포들의 집단에서 인자 IX를 발현시키는, 세포 또는 세포들의 집단에서 인자 IX를 발현시키는 방법:
    i) 인자 IX 단백질 코딩 서열을 포함하는 핵산 구조체;
    ii) RNA-가이드 DNA 결합제; 및
    iii) 다음에서 선택된 서열을 포함하는 가이드 RNA (gRNA):
    a) 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 및 33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    b) 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 및 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드;
    c) 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 서열;
    d) 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    e) 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드;
    f) 서열 번호: 34-97로 구성된 그룹에서 선택된 서열;
    g) 서열 번호: 98-119로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    h) 서열 번호: 98-119로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드; 및
    i) 서열 번호: 120-163으로 구성된 그룹에서 선택된 서열;
    j) 표 2, 표 7 및 표 8의 서열 번호들로 구성된 그룹에서 선택된 서열.
  3. 청구항 1 또는 2에 있어서, 투여는 시험관내인, 방법.
  4. 청구항 1-3 중 어느 한 항에 있어서, gRNA는 다음에서 선택된 서열을 포함하는 가이드 서열을 포함하는, 방법:
    a) 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    b) 서열 번호: 2, 8, 13, 19, 28, 29, 31, 32, 33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드;
    c) 서열 번호: 34, 40, 45, 51, 60, 61, 63, 64, 65, 66, 72, 77, 83, 92, 93, 95, 96, 및 97로 구성된 그룹에서 선택된 서열;
    d) 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열;
    e) 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드; 및
    f) 서열 번호: 34-97로 구성된 그룹에서 선택된 서열.
  5. 청구항 1-4 중 어느 한 항에 있어서, 핵산 구조체는 핵산 벡터 및/또는 지질 나노입자에 투여되는, 방법.
  6. 청구항 1-5 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제는 Cas9 또는 Cas9를 인코딩하는 핵산인, 방법.
  7. 청구항 1-6 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제는 RNA-가이드 DNA 결합제를 인코딩하는 핵산인, 방법.
  8. 청구항 7에 있어서, RNA-가이드 DNA 결합제를 인코딩하는 핵산은 mRNA인, 방법.
  9. 청구항 8에 있어서, mRNA는 변형된 mRNA인, 방법.
  10. 청구항 1-9 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제 및/또는 gRNA는 핵산 벡터 및/또는 지질 나노입자에 투여되는, 방법.
  11. 청구항 5-10 중 어느 한 항에 있어서, 핵산 벡터는 바이러스 벡터인, 방법.
  12. 청구항 11에 있어서, 바이러스 벡터는 아데노 관련 바이러스 (AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 렌티바이러스 벡터로 구성된 그룹에서 선택되는, 방법.
  13. 청구항 12에 있어서, AAV 벡터는 AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV-DJ, 및 AAV2/8로 구성된 그룹에서 선택되는, 방법.
  14. 청구항 13 또는 14에 있어서, 바이러스 벡터는 AAV 벡터인, 방법.
  15. 청구항 1-14 중 어느 한 항에 있어서, 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는 순차적으로, 임의의 순서로 및/또는 임의의 조합으로 투여되는, 방법.
  16. 청구항 1-14 중 어느 한 항에 있어서, 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는, 개별적으로 또는 임의의 조합으로, 동시에 투여되는, 방법.
  17. 청구항 1-16 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제, 또는 조합된 RNA-가이드 DNA 결합제 및 gRNA는, 핵산 구조체 투여 이전에 투여되는, 방법.
  18. 청구항 1-17 중 어느 한 항에 있어서, 핵산 구조체는 gRNA 및/또는 RNA-가이드 DNA 결합제 투여 이전에 투여되는, 방법.
  19. 청구항 1-18 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제는 Cas 뉴클레아제인, 방법.
  20. 청구항 19에 있어서, Cas 뉴클레아제는 클래스 2 Cas 뉴클레아제인, 방법.
  21. 청구항 19 또는 20에 있어서, Cas 뉴클레아제는 Cas9인, 방법.
  22. 청구항 21에 있어서, Cas 뉴클레아제는 S. 피오게네스 Cas9 뉴클레아제인, 방법.
  23. 청구항 19-22 중 어느 한 항에 있어서, Cas 뉴클레아제는 부위-특이적 DNA 결합 활성을 가지는, 방법.
  24. 청구항 19-23 중 어느 한 항에 있어서, Cas 뉴클레아제는 닉카제인, 방법.
  25. 청구항 19-23 중 어느 한 항에 있어서, Cas 뉴클레아제는 클리브아제 (cleavase)인 방법.
  26. 청구항 19-23 중 어느 한 항에 있어서, Cas 뉴클레아제는 닉카제 또는 클리브아제 활성을 가지지 않는, 방법.
  27. 청구항 1-26 중 어느 한 항에 있어서, 핵산 구조체는 양방향 핵산 구조체인, 방법.
  28. 전술한 청구항 중 어느 한 항에 있어서, 핵산 구조체는 상동성-독립적 공여자 구조체인, 방법.
  29. 청구항 1-28 중 어느 한 항에 있어서, 핵산 구조체는 단일-가닥 또는 이중-가닥인, 방법.
  30. 청구항 1-29 중 어느 한 항에 있어서, 핵산 구조체는 단일-가닥 DNA 또는 이중-가닥 DNA인, 방법.
  31. 청구항 1-30 중 어느 한 항에 있어서, 양방향 구조체는 인자 IX 단백질의 발현을 구동시키는 프로모터를 포함하지 않는, 방법.
  32. 청구항 1-31 중 어느 한 항에 있어서, 세포 또는 세포들의 집단은 이종 신호 펩티드를 가진 인자 IX를 발현하는, 방법.
  33. 청구항 32에 있어서, 세포 또는 세포들의 집단은 알부민 신호 펩티드를 가진 인자 IX를 발현하는, 방법.
  34. 청구항 1-33 중 어느 한 항에 있어서, 세포 또는 세포들의 집단은 인자 IX 신호 펩티드를, 선택적으로 이종 펩티드와 조합하여 가지는 인자 IX를 발현하는, 방법.
  35. 청구항 1-34 중 어느 한 항에 있어서, 세포 또는 세포들의 집단은 간 세포 이거나 이를 포함하는, 방법.
  36. 청구항 35에 있어서, 간 세포는 헤파토사이트인, 방법.
  37. 청구항 1-36 중 어느 한 항에 있어서, 핵산은 야생형 인자 IX 단백질을 인코딩하는, 방법.
  38. 청구항 1-36 중 어느 한 항에 있어서, 핵산은 돌연변이체 인자 IX 단백질을 인코딩하는, 방법.
  39. 청구항 38에 있어서, 핵산은 돌연변이 R338L을 가지는 인자 IX 단백질을 인코딩하는, 방법.
  40. 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체를 세포 또는 세포들의 집단에 투여하는 단계를 포함하고, 이에 의해 세포 또는 세포들의 집단에서 인자 IX를 발현시키는, 인자 IX 핵산을 세포 또는 세포들의 집단에 도입하는 방법.
  41. 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체를 세포 또는 세포들의 집단에 투여하는 단계를 포함하고, 이에 의해 세포 또는 세포들의 집단에서 인자 IX를 발현시키는, 인자 IX를 세포 또는 세포들의 집단에서 발현시키는 방법.
  42. 청구항 40 또는 41에 있어서, 양방향 핵산 구조체는 다음을 포함하는, 방법:
    a) 인자 IX에 대한 코딩 서열을 포함하는 제 1 세그먼트; 및
    b) 인자 IX의 코딩 서열의 역 상보체를 포함하는 제 2 세그먼트,
    이 때 구조체는 인자 IX의 발현을 구동시키는 프로모터를 포함하지 않음.
  43. 청구항 27-42 중 어느 한 항에 있어서, 양방향 핵산 구조체는 인자 IX에 대한 코딩 서열의 상류에 스플라이스 수용체를 포함하는, 방법.
  44. 청구항 40-43 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제를, 예를 들어, RNA-가이드 DNA 결합제를 인코딩하는 핵산으로서 투여하는 단계를 추가로 포함하는, 방법.
  45. 청구항 40-44 중 어느 한 항에 있어서, gRNA를 투여하는 단계를 추가로 포함하는, 방법.
  46. 청구항 40-45 중 어느 한 항에 있어서, 양방향 핵산 구조체는 핵산 벡터 및/또는 지질 나노입자에 투여되는, 방법.
  47. 청구항 40-46 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제는 핵산 벡터 및/또는 지질 나노입자에 투여되는, 방법.
  48. 청구항 40-47 중 어느 한 항에 있어서, gRNA는 핵산 벡터 및/또는 지질 나노입자에 투여되는, 방법.
  49. 청구항 46-48 중 어느 한 항에 있어서, 핵산 벡터는 바이러스 벡터인, 방법.
  50. 청구항 49에 있어서, 바이러스 벡터는 아데노 관련 바이러스 (AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 렌티바이러스 벡터로 구성된 그룹에서 선택되는, 방법.
  51. 청구항 50에 있어서, AAV 벡터는 AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV-DJ, 및 AAV2/8로 구성된 그룹에서 선택되는, 방법.
  52. 청구항 50 또는 51에 있어서, 바이러스 벡터는 AAV 벡터인, 방법.
  53. 청구항 40-52 중 어느 한 항에 있어서, 양방향 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는 순차적으로, 임의의 순서로 및/또는 임의의 조합으로 투여되는, 방법.
  54. 청구항 40-52 중 어느 한 항에 있어서, 양방향 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는, 임의의 조합으로, 동시에 투여되는, 방법.
  55. 청구항 40-53 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제, 또는 조합된 RNA-가이드 DNA 결합제 및 gRNA는, 양방향 핵산 구조체 투여 이전에 투여되는, 방법.
  56. 청구항 40-53 중 어느 한 항에 있어서, 양방향 핵산 구조체는 gRNA 및/또는 RNA-가이드 DNA 결합제 투여 이전에 투여되는, 방법.
  57. 청구항 40-56 중 어느 한 항에 있어서, 양방향 핵산 구조체, RNA-가이드 DNA 결합제, 및 gRNA는, 임의의 조합으로, 서로 간에 한시간 이내에 투여되는, 방법.
  58. 청구항 40-57 중 어느 한 항에 있어서, 양방향 구조체는 인자 IX 단백질의 발현을 구동시키는 프로모터를 포함하지 않는, 방법.
  59. 청구항 40-58 중 어느 한 항에 있어서, 양방향 구조체는 단일-가닥 또는 이중-가닥인, 방법.
  60. 청구항 40-59 중 어느 한 항에 있어서, 핵산 구조체는 단일-가닥 DNA 또는 이중-가닥 DNA인, 방법.
  61. 청구항 40-60 중 어느 한 항에 있어서, gRNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열 또는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함하는, 방법.
  62. 다음을 투여하는 단계를 포함하고, 이에 의해 인자 IX 핵산을 세포 또는 세포들의 집단에 도입시키는, 인자 IX 핵산을 세포 또는 세포들의 집단에 도입하는 방법:
    i) 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체;
    ii) RNA-가이드 DNA 결합제; 및
    iii) 세이프 하버 유전자좌를 표적하는 서열을 포함하는 가이드 RNA (gRNA).
  63. 다음을 투여하는 단계를 포함하고, 이에 의해 세포 또는 세포들의 집단에서 인자 IX를 발현시키는, 세포 또는 세포들의 집단에서 인자 IX를 발현시키는 방법:
    i) 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체;
    ii) RNA-가이드 DNA 결합제; 및
    iii) 세포 또는 세포들의 집단에서 세이프 하버 유전자좌를 표적하는 서열을 포함하는 가이드 RNA (gRNA).
  64. 청구항 62 또는 63에 있어서, 투여는 시험관내인, 방법.
  65. 청구항 62 또는 63에 있어서, 투여는 생체내인, 방법.
  66. 청구항 62-65 중 어느 한 항에 있어서, gRNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열 또는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함하는, 방법.
  67. 세포에서 인자 IX를 발현함에 사용하기 위한, 다음을 포함하는 조성물:
    i) 인자 IX 단백질 코딩 서열을 포함하는 핵산 구조체;
    ii) RNA-가이드 DNA 결합제; 및
    iii) 서열 번호: 2-33으로 구성된 그룹에서 선택된 가이드 서열 또는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함하는 가이드 RNA (gRNA).
  68. 청구항 40-67 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제는 RNA-가이드 DNA 결합제를 인코딩하는 핵산인, 방법 또는 조성물.
  69. 청구항 40-68 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제는 Cas 뉴클레아제인, 방법 또는 조성물.
  70. 청구항 69에 있어서, Cas 뉴클레아제는 Cas 뉴클레아제를 인코딩하는 핵산인, 방법 또는 조성물.
  71. 청구항 40-69 중 어느 한 항에 있어서, RNA-가이드 DNA 결합제는 Cas 뉴클레아제를 인코딩하는 mRNA인, 방법 또는 조성물.
  72. 청구항 71에 있어서, mRNA는 변형된 mRNA인, 방법 또는 조성물.
  73. 청구항 69-72 중 어느 한 항에 있어서, Cas 뉴클레아제는 클래스 2 Cas 뉴클레아제인, 방법 또는 조성물.
  74. 청구항 69-73 중 어느 한 항에 있어서, Cas 뉴클레아제는 Cas9인, 방법 또는 조성물.
  75. 청구항 69-74 중 어느 한 항에 있어서, Cas 뉴클레아제는 S. 피오게네스 뉴클레아제, S. 아우레우스 뉴클레아제, C. 제주니 뉴클레아제, S. 써모필루스 뉴클레아제, N. 메닌기티디스 뉴클레아제, 및 이의 변이체로 구성된 그룹에서 선택되는, 방법 또는 조성물.
  76. 청구항 75에 있어서, Cas 뉴클레아제는 S. 피오게네스 Cas9 뉴클레아제 또는 이의 변이체인, 방법 또는 조성물.
  77. 청구항 69-76 중 어느 한 항에 있어서, Cas 뉴클레아제는 부위-특이적 DNA 결합 활성을 가지는, 방법 또는 조성물.
  78. 청구항 69-77 중 어느 한 항에 있어서, Cas 뉴클레아제는 닉카제인, 방법 또는 조성물.
  79. 청구항 69-77 중 어느 한 항에 있어서, Cas 뉴클레아제는 클리브아제 (cleavase)인 방법 또는 조성물.
  80. 청구항 69-77 중 어느 한 항에 있어서, Cas 뉴클레아제는 닉카제 또는 클리브아제 활성을 가지지 않는, 방법 또는 조성물.
  81. 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체를 포함하는, 세포 또는 세포들의 집단에서 인자 IX를 발현함에 사용하기 위한 조성물.
  82. 전술한 임의의 청구항의 방법에 의해 또는 조성물을 사용하여 제조된 숙주 세포.
  83. 청구항 82에 있어서, 숙주 세포는 간 세포인, 숙주 세포.
  84. 청구항 82 또는 83에 있어서, 숙주 세포는 비-분할 세포 유형인, 숙주 세포.
  85. 청구항 82-84 중 어느 한 항에 있어서, 숙주 세포는 양방향 구조체에 의해 인코딩되는 인자 IX 폴리펩티드를 발현하는, 숙주 세포.
  86. 청구항 82-85 중 어느 한 항에 있어서, 숙주 세포는 헤파토사이트인, 숙주 세포.
  87. 전술한 청구항 중 어느 한 항에 있어서, gRNA는 서열 번호: 401을 포함하는, 방법, 조성물 또는 숙주 세포.
  88. 인자 IX 결핍증을 가진 개체에게 다음을 투여하는 단계를 포함하고, 이에 의해 개체에서 인자 IX 단백질을 발현시키는, 인자 IX 결핍증의 치료 방법:
    i) 인자 IX 단백질 코딩 서열을 포함하는 양방향 핵산 구조체;
    ii) RNA-가이드 DNA 결합제 또는 RNA-가이드 DNA 결합제를 인코딩하는 서열; 및
    iii) 세이프 하버 유전자좌를 표적하는 서열을 포함하는 가이드 RNA (gRNA).
  89. 청구항 88에 있어서, 치료적 유효량의 인자 IX 단백질을 발현시키는 단계를 포함하는, 방법.
  90. 청구항 88 또는 89에 있어서, 개체에서 치료적 유효 수준의 순환 인자 IX 응고 활성을 구현하는 단계를 포함하는, 방법.
  91. 청구항 88 내지 90 중 어느 한 항에 있어서, 개체는 인간인, 방법.
  92. 청구항 88 내지 91 중 어느 한 항에 있어서, 정상의 최소한 약 1%, 예를 들어, 정상의 최소한 약 5%의 순환 FIX 활성 또는 FIX 단백질 수준을 구현하는 단계를 추가로 포함하는, 방법.
  93. 청구항 88 내지 92 중 어느 한 항에 있어서, 순환 FIX 활성 또는 FIX 단백질 수준은 정상의 약 150% 미만인, 방법.
  94. 청구항 88 내지 93 중 어느 한 항에 있어서, 정상의 최소한 약 1% 내지 약 150%의 순환 FIX 활성 또는 FIX 단백질 수준을 구현하는 단계를 추가로 포함하는, 방법.
  95. 청구항 88 내지 94 중 어느 한 항에 있어서, 개체의 기준 FIX 활성에 비해 정상 FIX 활성의 최소한 약 1%의 FIX 활성 증가를 구현하는 단계를 추가로 포함하는, 방법.
  96. 청구항 88 내지 95 중 어느 한 항에 있어서, 개체의 기준 FIX 활성에 비해 정상 FIX 활성의 최소한 약 50%의 FIX 활성 증가를 구현하는 단계를 추가로 포함하는, 방법.
  97. 청구항 88 내지 96 중 어느 한 항에 있어서, 개체에서 계속되는 지속 효과, 예를 들어, 최소한 1 개월, 2 개월, 6 개월, 1 년, 또는 2 년의 효과를 구현하는 단계를 추가로 포함하는, 방법.
  98. 청구항 88 내지 97 중 어느 한 항에 있어서, 양방향 핵산 구조체 투여 후 개체의 순환 알부민 수준은 최소한 1 개월, 2 개월, 6 개월, 또는 1 년간 정상인, 방법.
  99. 청구항 88 내지 99 중 어느 한 항에 있어서, 개체의 순환 알부민 수준은 양방향 핵산 구조체 투여 후 4 주차에서 유지되는, 방법.
  100. 청구항 88 내지 99 중 어느 한 항에 있어서, 개체의 순환 알부민 수준은 일시적으로 떨어진 다음 정상으로 되돌아가는, 방법.
  101. 청구항 88 내지 100 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열의 최소한 17, 18, 19, 또는 20개 연속 뉴클레오티드를 포함하는, 방법.
  102. 청구항 88 내지 101 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열에 최소한 95%, 90%, 85%, 80%, 또는 75% 동일한 서열을 포함하는, 방법.
  103. 청구항 88 내지 102 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 2-33으로 구성된 그룹에서 선택된 서열을 포함하는, 방법.
  104. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 401 또는 402를 포함하는, 방법, 조성물, 또는 숙주 세포.
  105. 전술한 청구항 중 어느 한 항에 있어서, 인자 IX는 인간 인자 IX인, 방법, 조성물, 또는 숙주 세포.
  106. 전술한 청구항 중 어느 한 항에 있어서, 인자 IX는 재조합 인간 인자 IX인, 방법, 조성물, 또는 숙주 세포.
  107. 전술한 청구항 중 어느 한 항에 있어서, 인자 IX는 인자 IX의 기능항진 변이체인, 방법, 조성물, 또는 숙주 세포.
  108. 전술한 청구항 중 어느 한 항에 있어서, 인자 IX는 R338에서 치환을 포함하는 인간 인자 IX 변이체인, 방법, 조성물, 또는 숙주 세포.
  109. 개체의 인자 IX 결핍증 치료를 위한, 전술한 청구항 중 어느 한 항의 조성물 또는 구조체의 용도.
  110. 개체의 혈우병 B 치료를 위한, 전술한 청구항 중 어느 한 항의 조성물 또는 구조체의 용도.
  111. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 2의 핵산 서열을 포함하는, 방법, 및 조성물.
  112. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 3의 핵산 서열을 포함하는, 방법, 및 조성물.
  113. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 4의 핵산 서열을 포함하는, 방법, 및 조성물.
  114. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 5의 핵산 서열을 포함하는, 방법, 및 조성물.
  115. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 6의 핵산 서열을 포함하는, 방법, 및 조성물.
  116. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 7의 핵산 서열을 포함하는, 방법, 및 조성물.
  117. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 8의 핵산 서열을 포함하는, 방법, 및 조성물.
  118. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 9의 핵산 서열을 포함하는, 방법, 및 조성물.
  119. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 10의 핵산 서열을 포함하는, 방법, 및 조성물.
  120. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 11의 핵산 서열을 포함하는, 방법, 및 조성물.
  121. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 12의 핵산 서열을 포함하는, 방법, 및 조성물.
  122. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 13의 핵산 서열을 포함하는, 방법, 및 조성물.
  123. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 14의 핵산 서열을 포함하는, 방법, 및 조성물.
  124. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 15의 핵산 서열을 포함하는, 방법, 및 조성물.
  125. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 16의 핵산 서열을 포함하는, 방법, 및 조성물.
  126. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 17의 핵산 서열을 포함하는, 방법, 및 조성물.
  127. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 18의 핵산 서열을 포함하는, 방법, 및 조성물.
  128. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 19의 핵산 서열을 포함하는, 방법, 및 조성물.
  129. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 20의 핵산 서열을 포함하는, 방법, 및 조성물.
  130. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 21의 핵산 서열을 포함하는, 방법, 및 조성물.
  131. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 22의 핵산 서열을 포함하는, 방법, 및 조성물.
  132. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 23의 핵산 서열을 포함하는, 방법, 및 조성물.
  133. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 24의 핵산 서열을 포함하는, 방법, 및 조성물.
  134. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 25의 핵산 서열을 포함하는, 방법, 및 조성물.
  135. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 26의 핵산 서열을 포함하는, 방법, 및 조성물.
  136. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 27의 핵산 서열을 포함하는, 방법, 및 조성물.
  137. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 28의 핵산 서열을 포함하는, 방법, 및 조성물.
  138. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 29의 핵산 서열을 포함하는, 방법, 및 조성물.
  139. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 30의 핵산 서열을 포함하는, 방법, 및 조성물.
  140. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 31의 핵산 서열을 포함하는, 방법, 및 조성물.
  141. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 32의 핵산 서열을 포함하는, 방법, 및 조성물.
  142. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 33의 핵산 서열을 포함하는, 방법, 및 조성물.
  143. 전술한 청구항 중 어느 한 항에 있어서, 가이드 RNA는 서열 번호: 2-5, 10-17, 21-27, 및 29-33으로 구성된 그룹에서 선택된 핵산 서열을 포함하는, 방법 및 조성물.
KR1020217014834A 2018-10-18 2019-10-18 인자 ix의 발현을 위한 조성물 및 방법 KR20210102881A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862747509P 2018-10-18 2018-10-18
US62/747,509 2018-10-18
US201962829009P 2019-04-03 2019-04-03
US62/829,009 2019-04-03
US201962829621P 2019-04-04 2019-04-04
US62/829,621 2019-04-04
US201962840352P 2019-04-29 2019-04-29
US62/840,352 2019-04-29
PCT/US2019/057090 WO2020082046A2 (en) 2018-10-18 2019-10-18 Compositions and methods for expressing factor ix

Publications (1)

Publication Number Publication Date
KR20210102881A true KR20210102881A (ko) 2021-08-20

Family

ID=68732041

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217014834A KR20210102881A (ko) 2018-10-18 2019-10-18 인자 ix의 발현을 위한 조성물 및 방법

Country Status (15)

Country Link
US (1) US20200289628A1 (ko)
EP (1) EP3867380A2 (ko)
JP (1) JP2022512731A (ko)
KR (1) KR20210102881A (ko)
CN (1) CN113260701A (ko)
AU (1) AU2019360270A1 (ko)
BR (1) BR112021007301A2 (ko)
CA (1) CA3116331A1 (ko)
CO (1) CO2021006365A2 (ko)
IL (1) IL282238A (ko)
MX (1) MX2021004277A (ko)
PH (1) PH12021550846A1 (ko)
SG (1) SG11202103734PA (ko)
TW (1) TW202027799A (ko)
WO (1) WO2020082046A2 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7460643B2 (ja) 2018-10-16 2024-04-02 ブルーアレル, エルエルシー 遺伝子へのdnaの標的化挿入のための方法
AU2020289581A1 (en) * 2019-06-07 2021-11-18 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
CA3232470A1 (en) 2021-10-27 2023-05-04 Leah SABIN Compositions and methods for expressing factor ix for hemophilia b therapy
CN118251491A (zh) 2021-10-28 2024-06-25 瑞泽恩制药公司 用于敲除C5的CRISPR/Cas相关方法及组合物
WO2023150620A1 (en) 2022-02-02 2023-08-10 Regeneron Pharmaceuticals, Inc. Crispr-mediated transgene insertion in neonatal cells
WO2023212677A2 (en) 2022-04-29 2023-11-02 Regeneron Pharmaceuticals, Inc. Identification of tissue-specific extragenic safe harbors for gene therapy approaches
WO2023220603A1 (en) 2022-05-09 2023-11-16 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2023235726A2 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Crispr interference therapeutics for c9orf72 repeat expansion disease
WO2023235725A2 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Crispr-based therapeutics for c9orf72 repeat expansion disease
WO2024026474A1 (en) 2022-07-29 2024-02-01 Regeneron Pharmaceuticals, Inc. Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle
WO2024040222A1 (en) 2022-08-19 2024-02-22 Generation Bio Co. Cleavable closed-ended dna (cedna) and methods of use thereof
WO2024073606A1 (en) 2022-09-28 2024-04-04 Regeneron Pharmaceuticals, Inc. Antibody resistant modified receptors to enhance cell-based therapies
US20240182561A1 (en) 2022-11-04 2024-06-06 Regeneron Pharmaceuticals, Inc. Calcium voltage-gated channel auxiliary subunit gamma 1 (cacng1) binding proteins and cacng1-mediated delivery to skeletal muscle
US20240173426A1 (en) 2022-11-14 2024-05-30 Regeneron Pharmaceuticals, Inc. Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4770999A (en) 1985-04-22 1988-09-13 Genetics Institute, Inc. High yield production of active Factor IX
US4994371A (en) 1987-08-28 1991-02-19 Davie Earl W DNA preparation of Christmas factor and use of DNA sequences
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
FR2638643B1 (fr) 1988-11-09 1991-04-12 Transgene Sa Sequence d'adn codant pour le facteur ix humain ou une proteine analogue, vecteur d'expression, cellules transformees, procede de preparation du facteur ix et produits obtenus correspondants
US5378825A (en) 1990-07-27 1995-01-03 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs
ATE515510T1 (de) 1991-12-24 2011-07-15 Isis Pharmaceuticals Inc Durch dna-abschnitte unterbrochene modifizierte oligonukleotide
ES2316148T3 (es) 1994-03-23 2009-04-01 Ohio University Acidos nucleicos compactados y su suministro a celulas.
GB9408717D0 (en) 1994-05-03 1994-06-22 Biotech & Biolog Scien Res DNA sequences
US6169169B1 (en) 1994-05-19 2001-01-02 Dako A/S PNA probes for detection of Neisseria gonorrhoeae and Chlamydia trachomatis
WO1999003496A1 (en) 1997-07-21 1999-01-28 The University Of North Carolina At Chapel Hill Factor ix antihemophilic factor with increased clotting activity
EP2423307A1 (en) 2006-06-19 2012-02-29 Catalyst Biosciences, Inc. Modified coagulation factor IV polypeptides and use thereof for treatment
WO2009131632A1 (en) 2008-04-14 2009-10-29 Sangamo Biosciences, Inc. Linear donor constructs for targeted integration
CN102159722B (zh) 2008-08-22 2014-09-03 桑格摩生物科学股份有限公司 用于靶向单链切割和靶向整合的方法和组合物
WO2011100058A1 (en) 2010-02-09 2011-08-18 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
EA030650B1 (ru) 2013-03-08 2018-09-28 Новартис Аг Липиды и липидные композиции для доставки активных агентов
CN116083487A (zh) * 2013-05-15 2023-05-09 桑格摩生物治疗股份有限公司 用于治疗遗传病状的方法和组合物
CA2931637C (en) * 2013-12-09 2023-10-10 Sangamo Biosciences, Inc. Methods and compositions for treating hemophilia
US10059655B2 (en) 2013-12-19 2018-08-28 Novartis Ag Lipids and lipid compositions for the delivery of active agents
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
JP6778175B2 (ja) 2014-07-16 2020-10-28 ノバルティス アーゲー 脂質ナノ粒子ホスト中に核酸を封入する方法
US9963710B2 (en) 2014-12-23 2018-05-08 Syngenta Participations Ag Methods and compositions for identifying and enriching for cells comprising site specific genomic modifications
CA2978314A1 (en) 2015-03-03 2016-09-09 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
WO2017004279A2 (en) 2015-06-29 2017-01-05 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
EP3371305A1 (en) * 2015-11-06 2018-09-12 Crispr Therapeutics AG Materials and methods for treatment of glycogen storage disease type 1a
CA3004349A1 (en) * 2015-11-23 2017-06-01 Sangamo Therapeutics, Inc. Methods and compositions for engineering immunity
CA3006618A1 (en) * 2015-12-01 2017-06-08 Crispr Therapeutics Ag Materials and methods for treatment of alpha-1 antitrypsin deficiency
WO2017136794A1 (en) 2016-02-03 2017-08-10 Massachusetts Institute Of Technology Structure-guided chemical modification of guide rna and its applications
TWI773666B (zh) 2016-03-30 2022-08-11 美商英特利亞醫療公司 Crispr/cas 組分之脂質奈米粒子調配物
CN110291198A (zh) 2016-12-08 2019-09-27 因特利亚治疗公司 经修饰的指导rna
GB2566453B (en) 2017-09-12 2021-01-13 Univ Of Northumbria At Newcastle Impactor for aerosol component collection
IL311278A (en) 2017-09-29 2024-05-01 Intellia Therapeutics Inc Polynucleotides, preparations, and methods for genome editing
CN111727251A (zh) * 2017-11-21 2020-09-29 克里斯珀医疗股份公司 用于治疗常染色体显性色素性视网膜炎的材料和方法
BR112021002332A2 (pt) * 2018-08-10 2021-05-11 Logicbio Therapeutics, Inc. terapia gênica não-disruptiva para o tratamento de mma
JP7460643B2 (ja) 2018-10-16 2024-04-02 ブルーアレル, エルエルシー 遺伝子へのdnaの標的化挿入のための方法

Also Published As

Publication number Publication date
JP2022512731A (ja) 2022-02-07
BR112021007301A2 (pt) 2021-07-27
TW202027799A (zh) 2020-08-01
CA3116331A1 (en) 2020-04-23
WO2020082046A2 (en) 2020-04-23
MX2021004277A (es) 2021-09-08
SG11202103734PA (en) 2021-05-28
CN113260701A (zh) 2021-08-13
AU2019360270A1 (en) 2021-05-27
WO2020082046A3 (en) 2020-08-13
EP3867380A2 (en) 2021-08-25
PH12021550846A1 (en) 2021-12-06
IL282238A (en) 2021-05-31
US20200289628A1 (en) 2020-09-17
CO2021006365A2 (es) 2021-08-19

Similar Documents

Publication Publication Date Title
KR20210102881A (ko) 인자 ix의 발현을 위한 조성물 및 방법
KR20210102883A (ko) 알부민 좌위로부터 트랜스진을 발현하기 위한 조성물 및 방법
KR20210102882A (ko) 핵산 구조체 및 사용 방법
KR20200093635A (ko) 변형된 폐쇄된 말단 dna (cedna)를 사용한 유전자 편집
KR20180069054A (ko) 간-특이적 작제물인, 인자 viii 발현 카세트 및 이의 사용 방법
CN113227385A (zh) 核酸分子及其用于非病毒基因疗法的用途
KR20210102209A (ko) 알파-1 항트립신 결핍증을 치료하기 위한 조성물 및 방법
KR20210096088A (ko) 전이유전자 전달용 조성물 및 방법
CN117178959A (zh) 包括人源化凝血因子12基因座的非人动物
KR20220062079A (ko) 지질 나노입자에 의해 전달되는 CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
KR20230003478A (ko) 비-바이러스성 dna 벡터 및 고셰 치료제 발현을 위한 이의 용도
CN117642173A (zh) 用于诱导对基因递送靶媒剂的免疫耐受性的方法和试剂盒
CN112533645A (zh) 通过因子viii的表达改善临床参数
US20230149563A1 (en) Compositions and methods for expressing factor ix for hemophilia b therapy
RU2811724C2 (ru) РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
US20240002839A1 (en) Crispr sam biosensor cell lines and methods of use thereof
KR20240055835A (ko) 치료용 단백질의 발현을 위한 간 특이적 발현 카세트, 벡터 및 이들의 용도
WO2023172926A1 (en) Precise excisions of portions of exons for treatment of duchenne muscular dystrophy